• Title/Summary/Keyword: Keypoint

Search Result 80, Processing Time 0.025 seconds

Correction of Rotated Region in Medical Images Using SIFT Features (SIFT 특징을 이용한 의료 영상의 회전 영역 보정)

  • Kim, Ji-Hong;Jang, Ick-Hoon
    • Journal of Korea Multimedia Society
    • /
    • v.18 no.1
    • /
    • pp.17-24
    • /
    • 2015
  • In this paper, a novel scheme for correcting rotated region in medical images using SIFT(Scale Invariant Feature Transform) algorithm is presented. Using the feature extraction function of SIFT, the rotation angle of rotated object in medical images is calculated as follows. First, keypoints of both reference and rotated medical images are extracted by SIFT. Second, the matching process is performed to the keypoints located at the predetermined ROI(Region Of Interest) at which objects are not cropped or added by rotating the image. Finally, degrees of matched keypoints are calculated and the rotation angle of the rotated object is determined by averaging the difference of the degrees. The simulation results show that the proposed scheme has excellent performance for correcting the rotated region in medical images.

도로 위 숫자 및 기호 인식을 위한 광각렌즈 기반 Camera Calibration 연구

  • Gang, Jin-Gyu;Hong, Hyeong-Gil;Hoang, Toan Minh;Vokhidov, Husan;Park, Gang-Ryeong;Jo, Hyeong-O
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1406-1407
    • /
    • 2015
  • 본 논문에서는 도로 위 숫자 및 기호인식에 적합한 Calibration Model에 대하여 연구하였다. 기존에 제시된 Geometric Transform, Fisheye Projection, Caltech Toolbox 기반 방법으로 얻은 Calibration Model의 성능을 비교하였다. Geometric Transform은 Fisheye Distortion Correction에 부적합한 결과를 얻었고, Fisheye Projection은 성능은 좋으나 시스템에 사용할 Camera Lens의 Specification을 모르기 때문에 이를 예측해야 하는 단점이 있다. 마지막으로 Caltech Tool box 기반 방법은 Calibration을 위한 Keypoint를 수동으로 지정하다 보니까 이로 인한 오차가 존재하게 된다. Calibration을 시도 할 때마다 결과에 차이가 있었으며, Calibration 결과의 측면에서 Fisheye Projection이 가시적으로 가장 좋은 결과를 나타냈다.

Pedestrian Recognition of Crosswalks Using Foot Estimation Techniques Based on HigherHRNet (HigherHRNet 기반의 발추정 기법을 통한 횡단보도 보행자 인식)

  • Jung, Kyung-Min;Han, Joo-Hoon;Lee, Hyun
    • IEMEK Journal of Embedded Systems and Applications
    • /
    • v.16 no.5
    • /
    • pp.171-177
    • /
    • 2021
  • It is difficult to accurately extract features of pedestrian because the pedestrian is photographed at a crosswalk using a camera positioned higher than the pedestrian. In addition, it is more difficult to extract features when a part of the pedestrian's body is covered by an umbrella or parasol or when the pedestrian is holding an object. Representative methods to solve this problem include Object Detection, Instance Segmentation, and Pose Estimation. Among them, this study intends to use the Pose Estimation method. In particular, we intend to increase the recognition rate of pedestrians in crosswalks by maintaining the image resolution through HigherHRNet and applying the foot estimation technique. Finally, we show the superiority of the proposed method by applying and analyzing several data sets covered by body parts to the existing method and the proposed method.

Implementation of Deep CNN denoiser for Reducing Over blur (Over blur를 감소시킨 Deep CNN 구현)

  • Lee, Sung-Hun;Lee, Kwang-Yeob;Jung, Jun-Mo
    • Journal of IKEEE
    • /
    • v.22 no.4
    • /
    • pp.1242-1245
    • /
    • 2018
  • In this paper, we have implemented a network that overcomes the over-blurring phenomenon that occurs when removing Gaussian noise. In the conventional filtering method, blurring of the original image is performed to remove noise, thereby eliminating high frequency components such as edges and corners. We propose a network that reducing over blurring while maintaining denoising performance by adding denoised high frequency components to denoisers based on CNN.

Construction of Dynamic Image Animation Network for Style Transformation Using GAN, Keypoint and Local Affine (GAN 및 키포인트와 로컬 아핀 변환을 이용한 스타일 변환 동적인 이미지 애니메이션 네트워크 구축)

  • Jang, Jun-Bo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.497-500
    • /
    • 2022
  • High-quality images and videos are being generated as technologies for deep learning-based image style translation and conversion of static images into dynamic images have developed. However, it takes a lot of time and resources to manually transform images, as well as professional knowledge due to the difficulty of natural image transformation. Therefore, in this paper, we study natural style mixing through a style conversion network using GAN and natural dynamic image generation using the First Order Motion Model network (FOMM).

Character Animation Generation from Motion Video Analysis (동작 비디오 분석을 통한 캐릭터 애니메이션 생성)

  • Im, Ye-Seul;Park, Jong-Seung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.517-520
    • /
    • 2021
  • 본 논문에서는 동작 비디오를 분석하고 이를 3차원 캐릭터 애니메이션으로 생성하는 방법을 제시한다. 비디오에서의 사람의 동작 인식에서는 OpenPose를 사용하여 사람의 몸 keypoints를 추적해 2차원 위치 좌표로 얻는다. 3차원 캐릭터 애니메이션으로 생성하기 위해 Deep-Learning을 사용하여 2차원 위치 좌표를 3차원 위치 좌표로 변경한다. 캐릭터 스켈레톤에 적용하기 위해 3차원 위치 좌표를 회전값으로 변환하고 그 회전값을 캐릭터 스켈레톤 좌표에 맞게 변환한다. 비디오의 사람의 동작과 유사한 3차원 캐릭터 애니메이션을 생성하는 방법을 제안하고 적용 결과를 제시한다.

3D Human Keypoint Detection With RGB and Depth Image (RGB 이미지와 Depth 이미지를 이용한 3D 휴먼 키포인트 탐지)

  • Jeong, Keunseok;Lee, Yegi;Yoon, Kyoungro
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.239-241
    • /
    • 2021
  • 2019 발생한 COVID-19로 인하여 전 세계 사람들의 여가 활동이 제한되면서 건강관리를 위해 홈 트레이닝에 많은 관심을 기울이고 있다. 뿐만 아니라 최근 컴퓨팅 기술의 발전에 따라 사람의 행동을 눈으로 직접 판단했던 작업을 컴퓨터가 키포인트 탐지를 통해 인간의 행동을 이해하려는 많은 연구가 진행되고 있다. 이에 따라 본 논문은 Azure Kinect를 이용하여 촬영한 RGB 이미지와 Depth 이미지를 이용하여 3D 키포인트를 추정한다. RGB 이미지는 2D 키포인트 탐지기를 이용하여 2차원 공간에서의 좌표를 탐지한다. 앞서 탐지한 2D 좌표를 Depth 이미지에 투영하여 추출한 3D 키포인트의 깊이 값을 이용하여 3D 키포인트 탐지에 대한 연구 개발하였다.

  • PDF

Remote Sensing Image Registration using Structure Extraction and Keypoint Filtering (구조물 검출 네트워크 및 특징점 필터링을 이용한 원격 탐사 영상 정합)

  • Sung, Jun-Young;Lee, Woo-Ju;Oh, Seoung-Jun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.300-304
    • /
    • 2020
  • 본 논문에서는 원격 탐사 영상 정합에서 정확도는 유지하면서 특징점 매칭 (Matching) 복잡도를 줄이기 위해 입력 영상을 전처리하는 구조물 검출 네트워크를 이용한 원격 탐사 영상 정합 방법을 제안한다. 영상 정합의 기존 방법은 입력 영상에서 특징점을 추출하고 설명자 (Descriptor)를 생성한다. 본 논문에서 제안하는 방법은 입력 영상에서 특징점 매칭에 영향을 미치는 구조물만 추출하여 새로운 영상을 만들어 특징점을 추출한다. 추출된 특징점은 필터링 (Filtering)을 거쳐 원본 영상에 매핑 (Mapping)되어 설명자를 생성하여 특징점 매칭 속도를 향상시킨다. 또한 구조물 검출 네트워크에서 학습 영상과 시험 영상의 특성의 차이로 생기는 성능 저하 문제를 개선하기 위해 히스토그램 매핑 기법을 이용한다. 아리랑 3 호가 획득한 원격 탐사 영상에 대한 실험을 통해 제안하는 방법은 정확도를 유지하면서 계산 시간을 SURF 보다 87.5%, SIFT 보다 92.6% 감소시킬 수 있다.

  • PDF

Keypoint-based Korean sign language recognition for guiding airport facilities (공항 내 시설 안내 서비스를 위한 마커리스 한국 수어 인식 기술)

  • Park, Han-Mu;Jeong, Yoon Young
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.476-478
    • /
    • 2020
  • 공항은 다양한 시설들이 혼재되어 있는 복합 공간으로 원하는 장소로 이동하기 위해서는 지도나 표지판뿐만 아니라 유·무인 안내 서비스를 이용하는 것이 필수적이다. 그러나 이러한 시설 안내 서비스는 이용객의 대다수를 차지하는 비장애인을 기준으로 설계되어 있는 것이 대부분이며, 특히 청각장애인은 음성 언어인 한국어를 통한 의사소통이 어려워 이러한 안내 서비스의 사각 지대에 놓여있다고 볼 수 있다. 본 논문에서는 청각장애인을 대상으로 공항 내 시설 위치 안내 서비스를 제공하는 키오스크를 구현하기 위해 마커리스(makerless) 한국 수어 인식 기술을 적용하는 방법을 제안한다. 기존의 알고리즘들이 수어를 인식하기 위해 사용자의 신체에 마커(marker)를 부착하거나 사용에 제약이 있는 깊이, 자기장 센서 등을 활용한 데 반해, 특징점 기반의 인식 기술은 별도의 마커 없이 RGB 영상만을 활용하여 수어를 인식하기 때문에 사용자의 편의성을 극대화할 수 있는 방법이다. 영상 기반의 마커리스 수어 인식 기술을 위치 안내 키오스크에 적용함으로써 청각장애인이 다른 사람의 도움 없이 공항 시설을 쉽고 안전하게 이용할 수 있도록 지원할 수 있으며, 나아가 배리어프리 (barrier-free) 공항을 구현하는 데에 큰 도움이 될 수 있을 것으로 기대된다.

  • PDF

Dance Movement Guide System using MediaPipe (MediaPipe를 활용한 춤동작 가이드 시스템)

  • Hyeonseo Kim;Jaeyeung Jeong;Mikyeong Moon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.355-356
    • /
    • 2023
  • K-POP의 가파른 성장세에 따라 댄스 콘텐츠 산업이 확산되는 추세이다. 최근 SNS의 보급이 증가하면서 자신의 댄스 영상을 촬영하고 공유하기도 한다. 그러나 초보자들은 자신의 동작이 어떻게 보이는지 평가하는 데 어려움을 겪어 춤동작을 습득하기 쉽지 않다. 본 논문에서는 MediaPipe를 활용하여 안무 영상과 사용자의 춤영상을 비교하고 올바르게 동작을 따라 하고 있는지 검출해 주는 시스템에 대해 기술한다. 본 시스템을 통해 사용자의 춤동작에 대한 피드백을 받을 수 있으며 초보자들도 정확한 춤동작을 연습할 수 있을 것으로 기대한다.

  • PDF