[ Meeting ] 5월 4주차 - 그래도 Quantization ..!

1. 경량화된 모델 vs. 양자화 모델

2. DeiT를 굳이 써야하는 이유?

DeiT 써서 TinyCLIP보다 눈에 띄게 좋은 성능이 나올까?

흠냠냐.. 압도적 이점은 없어서 설득력이 떨어지긴 한다

3. 원래 목표는 양자화 실험인데 왜 방향 바꾸려 하나?

시간 없다고 원래 하려던 실험을 안 하는 건 아쉬움 -> 처음 목표 지켜보자

프로젝트 원래 목표:

4. Intel ViT 모델 다른 사람들은 쓰는데 왜 못 써?

해당 모델은 INT8 양자화된 ViT 모델
transformers에서 불러오면 로딩 에러 발생 -> PyTorch가 INT8 per-channel 양자화 지원 안 해서 생긴 문제일 수 있음
다른 사람들은 ONNX나 CoreML 등 다른 프레임워크에서 활용했을 가능성 높음
Neural Compressor 기반으로 ONNX로 변환 시도
아니면 ONNX Runtime만으로 추론 전용 코드 구성 (파인튜닝 포기)

5. 4bit CLIP, 8bit CLIP 등 서치

GGUF?

GGUF = GGML Unified Format

단점: PyTorch로 직접 불러와서 파인튜닝은 어려움. 추론 전용에 가까움

Pre-Quantized ResNet 모델들

apple/coreml-resnet-50

하지만

MSP60K 보행자 세부 속성 탐지 작업은 텍스트 없어도 되는 순수 Vision 모델 -> ResNet 기반도 가능하지만

이미지 인코더에서 얻은 벡터로 분류기 따로 파인튜닝해야 함

CLIP FP32(Baseline Model)

전체 탐지 시도 이미지 수: 9998
속성 탐지 성공 이미지 수: 657
탐지 성공률: 6.57%

MSP60K degrade 이미지 데이터셋에서 실험 결과

스레시홀드 0.25

Int8 실험

스레시홀드 0.05..

0.25는 하나도 탐지안되고 0.1은 달랑 wearing hat 하나 ^^

베이스라인과 같은 사진에서 하나도 탐지 안됨..

속도

sample_msp 데이터셋 1000장에 대해

"wearing hat" 하나 속성에 대해,

[ Presentation ] 보행자 속성 인식을 위한 CLIP Image Encoder 양자화 적용 가능성 탐색 (1)	2025.06.04
[ Meeting ] 5월 3주차 - use pre-quantization model (0)	2025.05.20
[ Meeting ] 5월 2주차 - 정밀도 낮추기 실험 (0)	2025.05.12
이쯤에서 다시 보는 목표 (0)	2025.05.09
[ Meeting ] 5월 1주차 - Baseline 측정(PyTorch FP32) (0)	2025.05.05

damiai