https://arxiv.org/pdf/2409.15740
Introduction:
인공지능은 일상 생활에서 점점 더 중요해지고 있고 특히 교통 및 안전 분야에서 중요한 역할 함
이 논문은 보행자 탐지가 중요한 교통 시스템에서 어떻게 딥러닝을 활용해 보행자를 실시간으로 탐지하는지 다룸
기존 클라우드 기반 시스템은 latency, 제한된 데이터 전송 속도, 차량에 탑재된 장치가 필요하다는 문제점이 있었음
-> 엣지 서버 활용하면 이런 문제 해결할 수 있음
엣지 서버는 제한된 처리 성능 가지고 있어, 경량화된 딥러닝 모델 사용하는 게 좋음
Research Contributions:
엣지 장치인 Nvidia Jetson Nano에서 실시간 보행자 탐지가 가능한 경량화된 DL 모델 설계함
이 모델은 낮은 대역폭 환경에서 효율적으로 작동함
MQTT 사용해 데이터 전송함
다른 모델들과 비교했을 때, 계산 성능과 메모리를 3배 적게 사용하면서 비슷한 정확도 달성함
Related Works:
보행자 탐지는 크게 수작업으로 특성 추출하는 방법과 딥러닝 기반 방법으로 나눠짐
수작업 방법은 더 많은 계산 자원과 파라미터 튜닝 필요로 함
딥러닝(CNN)은 실시간 애플리케이션에 더 적합하고 유연함
System Model and Methods:
제안된 모델은 교차로에 설치된 AI 카메라에서 작동함
이 카메라는 보행자가 도로 건너는 이미지 캡쳐한 후 엣지 디바이스에서 실시간 처리함
모델은 YOLOv3 Tiny 기반으로 함
MobileNetV2를 백본으로 사용해 최적화됨
다중 스케일 탐지와 MQTT 프로토콜 활용해 실시간 통신 지원함
Deep Learning Model:
2-stage 탐지 시스템 사용
첫 번째 단계: 객체 탐지(보행자 좌표 찾기)
두 번째 단계: 자세 추정(보행자 방향 예측)
이 모델은 YOLOv3 Tiny 기반
network depth 줄여 속도 최적화하면서 정확도 유지할 수 있음
Simulation Setup and Results:



Crowdhuman 데이터셋 사용해 실험한 결과, 78%의 정확도로 다른 모델들보다 더 빠른 추론 시간을 보였음
Faster RCNN, EfficientNet 모델보다 뛰어난 실시간 성능 보였음
또한 메모리 사용이 적어 IoT 엣지 디바이스에서 적합하게 사용할 수 있음



Conclusion:
최적화된 모델 통해 실시간 보행자 탐지 가능함
높은 정확도와 빠른 처리 속도 제공 -> 자원 제한된 환경에서도 효율적으로 사용할 수 있다는 것을 보여줌