Visual Intelligence (3) 썸네일형 리스트형 YOLO 이상행동 탐지 프로젝트 흐름 YOLO 이상행동 탐지 프로젝트 흐름 1. 데이터 준비문제정의입력: CCTV 연속 프레임(1920×1080)출력: 프레임마다 이상행동 사람 박스 + 레이블(normal, fall, crawl 등)레이블링 단위 결정프레임 단위로 박스 + 클래스YOLO 포맷으로 정리images/train, images/vallabels/train, labels/val레이블 파일 형식(한 줄이 한 박스): 1 0.52 0.63 0.18 0.30 → class_id=1, 중심과 크기는 정규화 좌표데이터 불균형 확인normal이 90% 이상, fall · crawl 매우 적음 -> Focal Loss 적용 이유 2. Training구조 선택모델: YOLOv5s -> 실시간 처리 위해 경량 모델 선택, 큰 모델보다 작은 모델 + .. [ 논문 리뷰 피드백 ] 2월 - Synthetic Text Captions 논문 리뷰할 때는 주장과 근거가 명확한지 본다방법론과 이론 증명, 실험, 평가가 잘 되어 있는지 본다그에 따른 증거가 정확한지 본다논문 리딩할 때도 해서 보자 Table 1에서 나온 논문의 abstract 정도 읽어보고 현재 논문과 뭐가 얼마나 어떻게 다른지 확인하기 1. Wen & Li (2021):• Training Dynamics: Wen & Li는 training dynamics에 대해 다룹니다. 이들은 contrastive learning의 훈련 동역학을 설명하며, ReLU 네트워크를 사용하여 sparse features를 학습하는 과정을 이론적으로 제시합니다. 2. Nakada et al. (2023):• Training Dynamics: Nakada et al.는 training dynam.. Theoretical Analysis of Contrastive Learning in Vision-Language Model Pre-Training: The Role of Synthetic Text Captions for Feature Alignment 논문 리뷰 1. Abstract• Vision-Language Models (VLMs)은 이미지와 텍스트의 상호작용 이해하고 생성하는 데 사용됨 이 논문은 contrastive learning 활용해 이런 모델들이 어떻게 훈련되는지 이론적으로 분석함• synthetic text captions이 image-text feature alignment에 미치는 영향 강조함 웹에서 수집된 텍스트 데이터는 종종 noisy하고 spurious correlations (잘못된 상관관계) 포함할 수 있음 -> 모델 성능 저하 이끌 수 있음• 이 연구는 nonlinear activation functions 사용한 모델 훈련에서 발생하는 동적 과정 다룸 synthetic text captions이 어떻게 모델 성능 .. PREV 1 NEXT