DOI QR코드

DOI QR Code

Automatic hand gesture area extraction and recognition technique using FMCW radar based point cloud and LSTM

FMCW 레이다 기반의 포인트 클라우드와 LSTM을 이용한 자동 핸드 제스처 영역 추출 및 인식 기법

  • Seung-Tak Ra (Dept. Electronic Engineering, Hanbat National University) ;
  • Seung-Ho Lee (Dept. Electronic Engineering, Hanbat National University)
  • Received : 2023.11.28
  • Accepted : 2023.12.15
  • Published : 2023.12.31

Abstract

In this paper, we propose an automatic hand gesture area extraction and recognition technique using FMCW radar-based point cloud and LSTM. The proposed technique has the following originality compared to existing methods. First, unlike methods that use 2D images as input vectors such as existing range-dopplers, point cloud input vectors in the form of time series are intuitive input data that can recognize movement over time that occurs in front of the radar in the form of a coordinate system. Second, because the size of the input vector is small, the deep learning model used for recognition can also be designed lightly. The implementation process of the proposed technique is as follows. Using the distance, speed, and angle information measured by the FMCW radar, a point cloud containing x, y, z coordinate format and Doppler velocity information is utilized. For the gesture area, the hand gesture area is automatically extracted by identifying the start and end points of the gesture using the Doppler point obtained through speed information. The point cloud in the form of a time series corresponding to the viewpoint of the extracted gesture area is ultimately used for learning and recognition of the LSTM deep learning model used in this paper. To evaluate the objective reliability of the proposed technique, an experiment calculating MAE with other deep learning models and an experiment calculating recognition rate with existing techniques were performed and compared. As a result of the experiment, the MAE value of the time series point cloud input vector + LSTM deep learning model was calculated to be 0.262 and the recognition rate was 97.5%. The lower the MAE and the higher the recognition rate, the better the results, proving the efficiency of the technique proposed in this paper.

본 논문에서는 FMCW 레이다 기반의 포인트 클라우드와 LSTM을 이용한 자동 핸드 제스처 영역 추출 및 인식 기법을 제안한다. 제안한 기법은 기존의 방식과 다른 다음과 같은 독창성이 있다. 첫 번째, 기존의 range-doppler 등의 2D 이미지를 입력 벡터로 하는 방식과 다르게 시계열 형태의 포인트 클라우드 입력 벡터는 레이다 전방에서 발생하는 시간에 따른 움직임을 좌표계 형태로 인식할 수 있는 직관적인 입력 데이터이다. 두 번째, 입력 벡터의 크기가 작기 때문에 인식에 쓰이는 딥러닝 모델도 가볍게 설계할 수 있다. 제안하는 기법의 수행 과정은 다음과 같다. FMCW 레이다로 측정된 거리, 속도, 각도 정보를 활용해 x, y, z 좌표 형식과 도플러 속도 정보를 포함한 포인트 클라우드를 활용한다. 제스처 영역은 속도 정보를 통해 얻어진 도플러 포인트를 이용하여 제스처의 시작과 끝 지점을 파악해 자동으로 핸드 제스처 영역을 추출하게 된다. 추출된 제스처 영역의 시점에 해당하는 시계열 형태의 포인트 클라우드는 최종적으로 본 논문에서 사용한 LSTM 딥러닝 모델의 학습 및 인식에 활용되게 된다. 제안하는 기법의 객관적인 신뢰성을 평가하기 위해 다른 딥러닝 모델들과 MAE를 산출하는 실험과 기존 기법들과 인식률을 산출하는 실험을 수행하여 비교하였다. 실험 결과, 시계열 형태의 포인트 클라우드 입력 벡터 + LSTM 딥러닝 모델의 MAE 값이 0.262, 인식률이 97.5%로 산출되었다. MAE는 낮을수록, 인식률은 높을수록 우수한 결과를 나타내므로 본 논문에서 제안한 기법의 효율성이 입증되었다.

Keywords

Acknowledgement

This work was supported by the National Research Foundation of Korea(NRF) grant funded by the Korea government(MSIT)(No. NRF-2022R1F1A1066371) This results was supported by "Regional Innovation Strategy (RIS)" through the National Research Foundation of Korea(NRF) funded by the Ministry of Education(MOE)(2021RIS-004) This research was supported by the MSIT (Ministry of Science and ICT), Korea, under the ICAN (ICT Challenge and Advanced Network of HRD) program (IITP-2022-RS-2022-00156212) supervised by the IITP (Institute of Information & Communications Technology Planning & Evaluation)

References

  1. Mitra, Sushmita, and Tinku Acharya. "Gesture recognition: A survey." IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews) 37.3, 311-324, 2007. DOI: 10.1109/TSMCC.2007.893280
  2. Molchanov, Pavlo, et al. "Multi-sensor system for driver's hand-gesture recognition." 2015 11th IEEE international conference and workshops on automatic face and gesture recognition (FG). Vol.1. IEEE, 2015. DOI: 10.1109/FG.2015.7163132
  3. Franceschini, S., et al. "Hand gesture recognition via radar sensors and convolutional neural networks." 2020 IEEE Radar Conference (RadarConf20). IEEE, 2020. DOI: 10.1109/RadarConf2043947.2020.9266565
  4. Wu, Qisong, and Dixian Zhao. "Dynamic hand gesture recognition using FMCW radar sensor for driving assistance." 2018 10th International Conference on Wireless Communications and Signal Processing (WCSP). IEEE, 2018. DOI: 10.1109/WCSP.2018.8555642
  5. Skaria, Sruthy, et al. "Hand-gesture recognition using two-antenna Doppler radar with deep convolutional neural networks." IEEE Sensors Journal 19.8, 3041-3048, 2019. DOI: 10.1109/JSEN.2019.2892073
  6. Yu, Yong, et al. "A review of recurrent neural networks: LSTM cells and network architectures." Neural computation 31.7, 1235-1270, 2019. DOI: 10.1162/neco_a_01199
  7. Shen, Zhipeng, et al. "SeriesNet: a generative time series forecasting model." 2018 international joint conference on neural networks (IJCNN). IEEE, 2018. DOI: 10.1109/IJCNN.2018.8489522
  8. Hazra, Souvik, and Avik Santra. "Short-range radar-based gesture recognition system using 3D CNN with triplet loss." IEEE Access 7:125623-125633, 2019. DOI: 10.1109/ACCESS.2019.2938725