Real-Time Pedestrian Detection on IoT EdgeDevices: A Lightweight Deep Learning Approach 논문 리뷰

Introduction:

인공지능은 일상 생활에서 점점 더 중요해지고 있고 특히 교통 및 안전 분야에서 중요한 역할 함

이 논문은 보행자 탐지가 중요한 교통 시스템에서 어떻게 딥러닝을 활용해 보행자를 실시간으로 탐지하는지 다룸

기존 클라우드 기반 시스템은 latency, 제한된 데이터 전송 속도, 차량에 탑재된 장치가 필요하다는 문제점이 있었음

-> 엣지 서버 활용하면 이런 문제 해결할 수 있음

엣지 서버는 제한된 처리 성능 가지고 있어, 경량화된 딥러닝 모델 사용하는 게 좋음

Research Contributions:

엣지 장치인 Nvidia Jetson Nano에서 실시간 보행자 탐지가 가능한 경량화된 DL 모델 설계함

이 모델은 낮은 대역폭 환경에서 효율적으로 작동함

MQTT 사용해 데이터 전송함

다른 모델들과 비교했을 때, 계산 성능과 메모리를 3배 적게 사용하면서 비슷한 정확도 달성함

Related Works:

보행자 탐지는 크게 수작업으로 특성 추출하는 방법과 딥러닝 기반 방법으로 나눠짐

수작업 방법은 더 많은 계산 자원과 파라미터 튜닝 필요로 함

딥러닝(CNN)은 실시간 애플리케이션에 더 적합하고 유연함

System Model and Methods:

제안된 모델은 교차로에 설치된 AI 카메라에서 작동함

이 카메라는 보행자가 도로 건너는 이미지 캡쳐한 후 엣지 디바이스에서 실시간 처리함

모델은 YOLOv3 Tiny 기반으로 함

MobileNetV2를 백본으로 사용해 최적화됨

다중 스케일 탐지와 MQTT 프로토콜 활용해 실시간 통신 지원함

Deep Learning Model:

2-stage 탐지 시스템 사용

첫 번째 단계: 객체 탐지(보행자 좌표 찾기)

두 번째 단계: 자세 추정(보행자 방향 예측)

이 모델은 YOLOv3 Tiny 기반

network depth 줄여 속도 최적화하면서 정확도 유지할 수 있음

Simulation Setup and Results:

Crowdhuman 데이터셋 사용해 실험한 결과, 78%의 정확도로 다른 모델들보다 더 빠른 추론 시간을 보였음

Faster RCNN, EfficientNet 모델보다 뛰어난 실시간 성능 보였음

또한 메모리 사용이 적어 IoT 엣지 디바이스에서 적합하게 사용할 수 있음

Conclusion:
최적화된 모델 통해 실시간 보행자 탐지 가능함

높은 정확도와 빠른 처리 속도 제공 -> 자원 제한된 환경에서도 효율적으로 사용할 수 있다는 것을 보여줌

[ Meeting ] 3월 1주차 - 일단 서버 돌려 ~~ (0)	2025.03.08
[ Meeting ] 1월 - PAR엔 Zeroshot 안써도 될듯 (0)	2025.03.07
Model Quantization and Hardware Acceleration for VisionTransformers: A Comprehensive Survey 논문 리뷰 (0)	2025.02.08
Pedestrian Attribute Recognition: A New Benchmark Dataset and A LargeLanguage Model Augmented Framework 논문 리뷰 (0)	2025.01.15
Pedestrian Attribute Recognition via CLIP basedPrompt Vision-Language Fusion 논문 리뷰 (0)	2025.01.12

damiai