• 제목/요약/키워드: Keypoint

검색결과 80건 처리시간 0.028초

고정익 무인항공기(드론)를 이용한 노천광산 지형측량 기술의 현장실증 (On-site Demonstration of Topographic Surveying Techniques at Open-pit Mines using a Fixed-wing Unmanned Aerial Vehicle (Drone))

  • 이성재;최요순
    • 터널과지하공간
    • /
    • 제25권6호
    • /
    • pp.527-533
    • /
    • 2015
  • 본 연구에서는 고정익 무인항공기(드론, SenseFly eBee)를 이용하여 국내 대규모 석회석 노천광산에 대한 지형측량을 수행하였다. 비행고도 300 m, 비행속도 12 m/s 조건으로 약 30분간 자동모드 비행을 수행한 결과 현장에서 총 288장의 항공사진을 촬영할 수 있었다. 특이점 추출이 불가능한 37장의 항공사진을 제외한 251장의 항공사진 자료들을 보정하고, 정합한 결과 7 cm 해상도의 정사영상과 수치표면모델 자료를 생성할 수 있었다. 4곳의 지상기준점에 대하여 고정밀 위성측정시스템를 이용하여 측정한 위치 좌표와 고정익 무인항공기 사진측량시스템을 이용하여 추출한 위치 좌표를 비교한 결과 평균 제곱근 오차가 15 cm 내외로 분석되었다. 고정익 무인항공기는 회전익 무인항공기에 비해 상대적으로 비행시간이 길어 넓은 영역의 신속한 지형측량이 가능하므로 대규모 노천광산 현장에서 효과적으로 활용될 수 있을 것이다.

온라인 TCG 게임에의 현실 카드 적용 방안 연구 (A Study on Applying Real Card to Online Trading Card Game)

  • 박종일;김수홍
    • 한국게임학회 논문지
    • /
    • 제12권4호
    • /
    • pp.45-51
    • /
    • 2012
  • 상호작용 증강현실 인터페이스는 실세계에 가상 정보를 혼합하여 사용자의 인식을 증강시킬 수 있으며 사용자에게 실세계에서 이용되는 오브제를 가상 게임에 그대로 제공함으로써 현실과 가상 환경을 자연스럽게 연계할 수 있다. 우리는 실생활과 가상 게임 환경과의 이음새 없는 환경을 위해 TCG(Trading Card Game; 이하 TCG로 약칭) 게임에 실제 카드를 적용하는 방안을 연구하였다. 스마트 폰 카메라를 통해 인식된 카드를 가상의 TCG 게임 인터페이스로 사용한다. 기존 연구에 비해 보다 빠르고 스케일, 방향, 포즈, 회전에 무관하게 실 카드를 인식하기 위해 2 단계 이미지 키포인트 추출/매칭 방법(Two Phases Image eyPoint Extraction/Matching Method)을 스마트폰 환경에서 개발하고 이것을 가상 TCG 게임 시스템에 실험적으로 적용하였다. 이와 같은 창의적인 시도는 현실과 가상 환경을 자연스럽게 연결하여 게임에의 몰입감과 현실감을 배가시킬 것이다.

강도영상과 거리영상에 의한 건물 스캐닝 점군간 3차원 정합 실험 (Experiment for 3D Coregistration between Scanned Point Clouds of Building using Intensity and Distance Images)

  • 전민철;어양담;한동엽;강남기;편무욱
    • 대한원격탐사학회지
    • /
    • 제26권1호
    • /
    • pp.39-45
    • /
    • 2010
  • 본 연구는 지상라이다 자료의 점군간 자동정합을 위해 인접한 두 점군 자료와 함께 획득되는 2차원의 강도영상 자료로부터, 2개 영상에서 동시에 관측되는 특징점들을 이용하여 SIFT 알고리즘에 의해 공액점을 선정하였다. 또한 매칭 오류점 배제를 위해 RANSAC 알고리즘을 적용하여 정합 정확도 향상을 도모하였다. 두 점군간의 변환식 매개변수인 3차원 회전변환 각과 수직/수평 이동량을 계산, 그 결과를 기존 수작업에 의한 결과와 비교하였다. 건국대학교 이과대학 건물을 대상으로 실험한 결과, 자동매칭을 통한 변환매개변수와 수작업으로 한 변환매개변수의 차이는 X, Y, Z, 방향으로 각각 0.011m, 0.008m, 0.052m로서 자동정합 자료의 활용이 가능하다고 판단하였다.

AlphaPose를 활용한 LSTM(Long Short-Term Memory) 기반 이상행동인식 (LSTM(Long Short-Term Memory)-Based Abnormal Behavior Recognition Using AlphaPose)

  • 배현재;장규진;김영훈;김진평
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권5호
    • /
    • pp.187-194
    • /
    • 2021
  • 사람의 행동인식(Action Recognition)은 사람의 관절 움직임에 따라 어떤 행동을 하는지 인식하는 것이다. 이를 위해서 영상처리에 활용되는 컴퓨터 비전 태스크를 활용하였다. 사람의 행동인식은 딥러닝과 CCTV를 결합한 안전사고 대응서비스로서 안전관리 현장 내에서도 적용될 수 있다. 기존연구는 딥러닝을 활용하여 사람의 관절 키포인트 추출을 통한 행동인식 연구가 상대적으로 부족한 상태이다. 또한 안전관리 현장에서 작업자를 지속적이고 체계적으로 관리하기 어려운 문제점도 있었다. 본 논문에서는 이러한 문제점들을 해결하기 위해 관절 키포인트와 관절 움직임 정보만을 이용하여 위험 행동을 인식하는 방법을 제안하고자 한다. 자세추정방법(Pose Estimation)의 하나인 AlphaPose를 활용하여 신체 부위의 관절 키포인트를 추출하였다. 추출된 관절 키포인트를 LSTM(Long Short-Term Memory) 모델에 순차적으로 입력하여 연속적인 데이터로 학습을 하였다. 행동인식 정확률을 확인한 결과 "누워있기(Lying Down)" 행동인식 결과의 정확도가 높음을 확인할 수 있었다.

무인점포 이상행동 인식을 위한 유전 알고리즘 기반 자세 추정 모델 최적화 (Optimization of Pose Estimation Model based on Genetic Algorithms for Anomaly Detection in Unmanned Stores)

  • 이상협;박장식
    • 한국산업융합학회 논문집
    • /
    • 제26권1호
    • /
    • pp.113-119
    • /
    • 2023
  • In this paper, we propose an optimization of a pose estimation deep learning model for recognition of abnormal behavior in unmanned stores using radio frequencies. The radio frequency use millimeter wave in the 30 GHz to 300 GHz band. Due to the short wavelength and strong straightness, it is a frequency with less grayness and less interference due to radio absorption on the object. A millimeter wave radar is used to solve the problem of personal information infringement that may occur in conventional CCTV image-based pose estimation. Deep learning-based pose estimation models generally use convolution neural networks. The convolution neural network is a combination of convolution layers and pooling layers of different types, and there are many cases of convolution filter size, number, and convolution operations, and more cases of combining components. Therefore, it is difficult to find the structure and components of the optimal posture estimation model for input data. Compared with conventional millimeter wave-based posture estimation studies, it is possible to explore the structure and components of the optimal posture estimation model for input data using genetic algorithms, and the performance of optimizing the proposed posture estimation model is excellent. Data are collected for actual unmanned stores, and point cloud data and three-dimensional keypoint information of Kinect Azure are collected using millimeter wave radar for collapse and property damage occurring in unmanned stores. As a result of the experiment, it was confirmed that the error was moored compared to the conventional posture estimation model.

MediaPipe를 활용한 춤동작 피드백 시각화 시스템 (Visualization System for Dance Movement Feedback using MediaPipe)

  • 김현서;정재영;최봉준;문미경
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.217-224
    • /
    • 2024
  • K-POP의 가파른 성장세에 따라 댄스 콘텐츠 산업이 확산되는 추세이다. 최근 SNS의 보급이 증가하면서 자신의 댄스 영상을 촬영하고 공유하기도 한다. 그러나 춤을 처음 접하는 댄스 초보자들은 동영상을 보며 혼자서 춤을 출 때, 객관적인 피드백을 받기 어려워 춤동작을 습득하기 쉽지 않다. 본 논문에서는 MediaPipe를 활용하여 안무 영상과 사용자의 춤 영상을 비교하고 올바르게 동작을 따라 하고 있는지 검출해 주는 시스템에 대해 기술한다. 본 연구에서는 웹캠이나 카메라로 촬영한 사용자 영상과 안무 영상 간의 춤동작 유사도를 코사인 유사도와 COCO OKS를 활용해 계산하여 사용자에게 색상 지표(Color Map)를 기반으로 한 피드백을 주는 방식을 제안한다. 본 시스템을 통해 사용자의 춤동작에 대한 객관적인 피드백을 시각적으로 받을 수 있으며 초보자들도 정확한 춤동작을 습득할 수 있을 것으로 기대한다.

모션 인식을 위한 2D 자세 추정 알고리듬의 이미지 전처리 및 얼굴 가림에 대한 영향도 분석 (Investigation of image preprocessing and face covering influences on motion recognition by a 2D human pose estimation algorithm)

  • 노은솔;이사랑;홍석무
    • 한국산학기술학회논문지
    • /
    • 제21권7호
    • /
    • pp.285-291
    • /
    • 2020
  • 제조 산업에서 인력은 로봇으로 대체되지만 전문 기술은 데이터 변환이 어려워 산업용 로봇에 적용이 불가능하다. 이는 비전 기반의 모션 인식 방법으로 데이터 확보가 가능하나 이미지 데이터에 따라 판단 값이 달라질 수 있다. 따라서 본 연구는 비전 방법을 사용해 사람의 자세를 추정 시 영향을 미치는 인자를 고려해 정확성 향상 방법을 찾고자 한다. 비전 방법 중 OpenPose의 3가지 모델 MPII, COCO 및 COCO + foot을 사용했으며, CNN(Convolutional Neural Networks)을 사용한 OpenPose 구조에서 얼굴 가림 및 이미지 전처리에 미치는 영향을 확인하고자 액세서리의 유무, 이미지 크기 및 필터링을 매개 변수로 설정했다. 각 매개 변수 별 이미지 데이터를 3 가지 모델에 적용해 실제 값과 예측 값 사이 거리 오차와 PCK (Percentage of correct Keypoint)로 영향도를 판단했다. 그 결과 COCO + foot 모델은 3 가지 매개 변수에 대한 민감도가 가장 낮았다. 또한 이미지 크기는 50% (원본 3024 × 4032에서 1512 × 2016로 축소) 이상 비율이 가장 적절하며, MPII 모델만 emboss 필터링을 적용할 때 거리 오차 평균이 최대 60pixel 감소되어 향상된 결과를 얻었다.

Lightening of Human Pose Estimation Algorithm Using MobileViT and Transfer Learning

  • Kunwoo Kim;Jonghyun Hong;Jonghyuk Park
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권9호
    • /
    • pp.17-25
    • /
    • 2023
  • 본 논문에서는 매개변수가 더 적고, 빠르게 추정 가능한 MobileViT 기반 모델을 통해 사람 자세 추정 과업을 수행할 수 있는 모델을 제안한다. 기반 모델은 합성곱 신경망의 특징과 Vision Transformer의 특징이 결합한 구조를 통해 경량화된 성능을 입증한다. 본 연구에서 주요 매커니즘이 되는 Transformer는 그 기반의 모델들이 컴퓨터 비전 분야에서도 합성곱 신경망 기반의 모델들 대비 더 나은 성능을 보이며, 영향력이 커지게 되었다. 이는 사람 자세 추정 과업에서도 동일한 상황이며, Vision Transformer기반의 ViTPose가 COCO, OCHuman, MPII 등 사람 자세 추정 벤치마크에서 모두 최고 성능을 지키고 있는 것이 그 적절한 예시이다. 하지만 Vision Transformer는 매개변수의 수가 많고 상대적으로 많은 연산량을 요구하는 무거운 모델 구조를 가지고 있기 때문에, 학습에 있어 사용자에게 많은 비용을 야기시킨다. 이에 기반 모델은 Vision Transformer가 많은 계산량을 요구하는 부족한 Inductive Bias 계산 문제를 합성곱 신경망 구조를 통한 Local Representation으로 극복하였다. 최종적으로, 제안 모델은 MS COCO 사람 자세 추정 벤치마크에서 제공하는 Validation Set으로 ViTPose 대비 각각 5분의 1과 9분의 1만큼의 3.28GFLOPs, 972만 매개변수를 나타내었고, 69.4 Mean Average Precision을 달성하여 상대적으로 우수한 성능을 보였다.

Building Dataset of Sensor-only Facilities for Autonomous Cooperative Driving

  • Hyung Lee;Chulwoo Park;Handong Lee;Junhyuk Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.21-30
    • /
    • 2024
  • 본 논문에서는 자율협력주행 인프라를 위해 제작된 8가지 센서 전용 시설물들에 대해 라이다로 취득한 포인트 클라우드 데이터로부터 시설물들의 특징을 추출하여 샘플 데이터셋으로 구축하는 방법을 제안한다. 고휘도 반사지가 부착된 8가지 센서 전용 시설물들과 데이터 취득 시스템을 개발했고, 취득된 포인트 클라우드 데이터로부터 일정한 측정 거리 내에 위치한 시설물들의 특징을 추출하기 위해 포인트 대상의 DBSCAN 방법과 반사강도 대상의 OTSU 방법을 응용하여 추려낸 포인트들에 원통형 투영법을 적용했다. 3차원 포인트 좌표, 2차원 투영 좌표, 그리고 반사강도 등을 해당 시설물의 특징으로 설정했고, 정답 레이블과 함께 데이터셋으로 제작했다. 라이다로 취득한 데이터를 기반으로 구축된 시설물 데이터셋의 효용 가능성을 확인하기 위해서 기본적인 CNN 모델을 선정하여 학습 후 테스트를 진행하여 대략 90% 이상의 정확도를 보여 시설물 인식 가능성을 확인했다. 지속적인 실험을 통해 제시한 데이터셋 구축을 위한 특징 추출 알고리즘의 개선 및 성능 향상과 더불어 이에 적합한 자율협력주행을 위한 센서 전용 시설물을 인식할 수 있는 전용 모델을 개발할 예정이다.

저화질 안면 이미지의 화질 개선를 통한 안면 특징점 검출 모델의 성능 향상 (Enhancing the performance of the facial keypoint detection model by improving the quality of low-resolution facial images)

  • 이경욱;이예진;박종혁
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.171-187
    • /
    • 2023
  • 저화소의 감시카메라와 같은 촬영 장비를 통해 사람의 얼굴을 인식할 경우, 화질이 낮아 얼굴을 포착하기 어렵다는 문제점이 있다. 이렇게, 사람의 얼굴을 인식하기 어렵다면 범죄용의자나 실종자를 특정해내지 못하는 등의 문제가 발생할 수 있다. 기존 이미지 속 안면 인식에 관한 연구들에서는 정제된 데이터셋을 사용하였기 때문에 다양한 환경에서의 성능을 가늠하기 어렵다는 한계가 존재한다. 이에, 본 논문에서는 저화질 이미지에서 안면 인식 성능이 떨어지는 문제를 해결하기 위해 다양한 환경을 고려한 저화질 안면 이미지에 대해 화질 개선을 수행하여 고화질 이미지를 생성한 뒤, 안면 특징점 검출의 성능 향상시키는 방법을 제안한다. 제안 방법의 현실 적용 가능성을 확인하기 위해 전체 이미지에서 사람이 상대적으로 작게 나타나는 데이터셋을 선정하여 실험을 수행하였다. 또한 마스크 착용 상황을 고려한 안면 이미지 데이터셋을 선정하여, 현실 문제로의 확장 가능성을 탐구하였다. 안면 이미지의 화질을 개선하여 특징점 검출 모델의 성능을 측정한 결과, 개선 후 안면의 검출 여부는 마스크를 착용하지 않은 이미지의 경우 평균 3.47배, 마스크를 착용한 경우 평균 9.92배로 성능 향상을 확인할 수 있었다. 안면 특징점에 대한 RMSE는 마스크를 착용한 이미지의 경우 평균 8.49배 감소, 마스크를 착용하지 않은 경우 평균 2.02배 감소한 것을 확인할 수 있었다. 이에, 화질 개선을 통해 저화질로 포착된 안면 이미지에 대한 인식률을 높여 제안 방법의 활용 가능성을 확인할 수 있었다.