
1. 사전학습된 모델에 분류 헤드 추가해서 먼저 실험해보고 사전학습 되지 않은 모델 실험하는 거 괜찮은 듯.
2. 근데 LLM/CLIP은 뭐 쓸 건지? 아마 저 모델은 학습시킬 때 너무 커서 내가 제공받은 서버에서 안돌아갈 수 있음 -> 경량 모델 찾아본 거 있나?
-> 경량 모델은 있는데 깊게 찾아보진 않았다. 찾아보고 적당한 모델에 헤드 붙여 실험하는 방향으로 해보겠다.

3. PAR 작업에 1-bit 양자화해서 실험하는 게 결과적으로 의미있는 작업이 되는 건지 궁금하긴 하다. classification에 1-bit 양자화하는 연구는 아직 많지 않은 것 같다. 이 경우 지금 LLM/CLIP 이런 모델들 사용해서 이미지 한 장을 떨궈보거나 할 때 인퍼런스 시간이나 이런 걸 측정해볼 수 있으니 대강 시간이 얼마나 걸리는지, 이 작업이 의미있는 결과를 낼 수 있을지 빨리 감을 잡아야 할 거 같다.

4. 나중에 CCTV상에서 작동하는 것 등을 고려하면 임베디드 장치에서 실험한다는 아이디어 좋다. Jetson nano 얼마? 대략 이십얼마. 괜찮넹.
5. 트랜스포머나 LLM기반은 아니지만 Tiny YOLOv3 이용해 성능보다 인퍼런스 속도나 메모리 성능을 고려해 최선의 결과를 보인 연구(2024)가 있었음 -> 오. 그럼 일단 서버 돌려보자고 ~! 시간 좀 쓰라궁 ,,!!
역시 교수님은 딱보면 아신다.. 시간 많이 써야겠ㄷㅏ 🥹.
'Capstone' 카테고리의 다른 글
| [ Meeting ] 3월 2주차 - 인퍼런스 시간, Paper (0) | 2025.03.19 |
|---|---|
| CLIP, TinyCLIP 인퍼런스 시간 체크 (0) | 2025.03.18 |
| [ Meeting ] 1월 - PAR엔 Zeroshot 안써도 될듯 (0) | 2025.03.07 |
| Real-Time Pedestrian Detection on IoT EdgeDevices: A Lightweight Deep Learning Approach 논문 리뷰 (0) | 2025.03.07 |
| Model Quantization and Hardware Acceleration for VisionTransformers: A Comprehensive Survey 논문 리뷰 (0) | 2025.02.08 |