[ Meeting ] 1월 - PAR엔 Zeroshot 안써도 될듯

1. 평가지표 확실히 !

mA(mean Accuracy)

Accuracy

Precision

Recall

실제 Positive 중에서 모델이 얼마나 Positive로 예측했는지의 비율(False Negative(잘못 예측한 Negative 속성)을 얼마나 줄였는지 나타냄)

F1-Score

2. LLM-PAR, CLIP 무슨 모델이든 정확도 조금 손해보더라도 cost 대비 성능 향상 목표로 하기

넵..!

3. LLM 모델은 자연어 뭐 사용했는지 알아보기

4. LLM 부분을 1bit로 하게끔 할 수 있다면 그걸 사용하면 내 모델이 더 빨라질거다(PAR에는 많은 랭귀지가 필요하지 않을 수 있기 때문)

교수님 천재..

-> 모델 메모리 사용량이 대폭 줄고, 계산량도 크게 감소할 수 있음

하지만 1비트 양자화는 모델 accuracy에 영향 줄 수 있음 -> 성능 저하 어느 정도인지 실험으로 검증해야 할 필요 있음
자연어 모델에 1비트 양자화 적용하는 경우, 이론적으로 모델이 매우 빠르고 메모리 효율적일 수 있지만, 성능 저하가 너무 커지지 않도록 하려면 파인튜닝이나 다른 최적화 방법 고려해야 함
먼저 1비트 양자화 적용한 후, 성능 평가 통해 어떤 정도의 정확도를 유지할 수 있는지 파악하고, 필요한 경우 성능 개선 방법 찾아야 함

5. (ppt에 나온 각 모델)인퍼런스할 때 어디서 bottle neck 생기는지 살펴보기

LLM-PAR과 PromptPAR 모델 해당 논문에서 bottle neck에 대한 정보는 찾아볼 수 없었지만 추론을 해보자면, 이 모델들은 Transformer 기반 모델로, 일반적으로 큰 모델을 사용하기에 인퍼런스 시 모델 로딩과 메모리 관리에서 bottle neck 생길 수 있음
LLM-PAR과 PromptPAR 모델은 높은 FLOPs와 메모리 대역폭 요구할 수 있음 -> CPU나 GPU 성능에 의존하게 됨
인퍼런스 중에는 필요한 데이터를 메모리로 불러오는 과정에서 디스크 I/O가 bottle neck 일으킬 수 있음(특히 대규모 데이터셋 사용하는 경우, 데이터 불러오는 속도나 데이터 전송 속도가 제한적일 수 있음)

-> bottle neck 줄이려면 모델 압축, 연산 최적화, 메모리 관리 최적화, 병렬화 등을 고려해야 함

6. 실시간 보행자 탐지하려면 어느 정도 성능 필요한지 알아보기

[1] Muhammad Dany Alfikri and Rafael Kaliski, “Real-Time Pedestrian Detection on IoT Edge Devices: A Lightweight Deep Learning Approach” IEEE, 2024.

inference speed: 147 milliseconds
fps: 2.3 frames per second
FLOPS(Floating Point Operations per Second): 초당 수행되는 부동 소수점 연산 양. FLOPS 많으면 컴퓨팅 자원 더 많이 소모 -> 비용 증가

CLIP, TinyCLIP 인퍼런스 시간 체크 (0)	2025.03.18
[ Meeting ] 3월 1주차 - 일단 서버 돌려 ~~ (0)	2025.03.08
Real-Time Pedestrian Detection on IoT EdgeDevices: A Lightweight Deep Learning Approach 논문 리뷰 (0)	2025.03.07
Model Quantization and Hardware Acceleration for VisionTransformers: A Comprehensive Survey 논문 리뷰 (0)	2025.02.08
Pedestrian Attribute Recognition: A New Benchmark Dataset and A LargeLanguage Model Augmented Framework 논문 리뷰 (0)	2025.01.15

damiai