논문 리뷰 3

[논문 리뷰] MediaPipe Hands: On-device Real-time Hand Tracking

0. Abstract이전 논문 리뷰에서는 뎁스 카메라를 사용한 Hand Pose Estimation을 살펴봤습니다. 구글 개발자들은 이 논문에서 단일 카메라만의 RGB 데이터를 사용한 방법을 제시하고 있습니다. 이들이 제시한 모델은 손바닥 탐지기와 손 관절 랜드마크 모델, 이렇게 두 가지로 구성되어 있습니다. 손바닥 탐지기는 손의 바운딩 박스를 탐지하고, 손 관절 랜드마크 모델은 MediaPipe 프레임워크를 사용하는 모델입니다.1. Introduction현존하는 Hand Pose Estimation 모델은 실시간 처리를 하기엔 너무 무겁기 때문에 하드웨어의 성능에 많이 의존하고 있죠. 저자들은 이 제약을 없애고 모바일 기기에서 실시간 처리를 가능하게 하고자 합니다.2. Architecture자, 그러면..

논문 리뷰 2024.12.09

[논문 리뷰] A survey on 3D hand pose estimation: Cameras, methods, and datasets

“디스, 디스”. 제가 몇 개월 전 친구들이랑 일본에 여행을 갔을 때 식당에서 가장 많이 들었던 말입니다. 그런데 “디스”라고만 하지 않고 굉장히 다급한 손가락질을 하면서 말하죠. 이처럼 손은 없어선 안 되는 중요한 친구입니다. 물건을 집는 것부터 누군가의 의사소통 수단이 되기도 합니다.Hand Pose Estimation은 컴퓨터가 사람의 손가락 관절의 위치를 추측하는 것입니다. 이를 통해 제스처를 인식해 인간-컴퓨터 상호작용을 할 수도 있기 때문에 가상현실(Virtual Reality; VR), 증강현실(Augmented Reality; AR) 등 다양한 분야에서 매우 중요한 태스크 중 하나입니다. 제스처를 완벽하게 인식할 수 있다면 토니 스타크처럼 자유자재로 인터페이스를 조작할 수도 있죠.“아니 저..

논문 리뷰 2024.12.04

[논문 리뷰] Jaywalking detection and localization in street scene videos using fine-tuned convolutional neural networks

CCTV가 발명되고 영상에서 다양한 이상(anomaly)를 탐지하는 기술은 크게 발전했다. 그러나 영상 데이터의 증가로 full-time으로 사용하기 어렵고 정확한 예측이 힘들다는 단점이 존재한다. 이 논문에서는 영상 이상 탐지(video anomaly detection) 기술과 변형된 InceptionV3 모델을 사용해 CCTV 데이터에서 무단횡단을 탐지하는 자동화 시스템을 구현하고 있다.1. 이전 연구와 비교과거에도 무단횡단을 탐지하고자 하는 여러 성공적인 시도가 있었지만, 언급된 연구들은 2011년에 발표된 것으로 최신화가 필요하다. 또한 자동차 시점의 데이터만 사용하고 있어 일상적인 상황에서 무단횡단을 탐지하는 데 적합하지 않은 시점이다.비교적 최근(2019년)에 ISOCC에서 발표된 논문 중 서..

논문 리뷰 2024.09.10