• Title/Summary/Keyword: 공간 매칭

Search Result 324, Processing Time 0.023 seconds

인공지능 기반 3차원 공간 복원 최신 기술 동향

  • Im, Seong-Hun
    • Broadcasting and Media Magazine
    • /
    • v.25 no.2
    • /
    • pp.17-26
    • /
    • 2020
  • 최근 스마트폰에서의 증강현실, 미적 효과의 증대(예, 라이브 포커싱) 등의 어플리케이션을 제공하기 위해 모바일 기기에서의 3차원 공간 복원 기술에 대한 관심이 증가하고 있다. 소비자들의 요구에 발 맞춰 최근 스마트폰 제조사는 모든 플래그십 모델에 다중 카메라 및 뎁스 센서(거리 측정 센서)를 탑재하는 추세이다. 본 고에서는 모바일 폰에 탑재되고 있는 대표적인 세 축의 뎁스 추정(공간 복원) 방식에 대해 간단히 살펴보고, 최근 심층학습(Deep learning)의 등장으로 기술 발전의 새로운 국면에 접어 든 다중 시점 매칭(Multi-view stereo) 방법에 대해 소개하고자 한다. 심층 신경망이 재조명 받은 2012년 전까지 주류 연구 방향이었던 전통 기하학 기반의 방법에 대한 소개를 시작으로 심층 신경망기반의 방법론으로의 발전된 형태를 살펴본다. 또한, 신경망기반의 방법론은 크게 3 세대로 나누어 각 세대별 특징에 대해 자세히 살펴보고, 다양한 데이터에 대한 실험 결과를 통해 세대별 공간 복원 결과를 비교 분석한다.

Korean Phoneme Recognition Using Self-Organizing Feature Map (SOFM 신경회로망을 이용한 한국어 음소 인식)

  • 전용구
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1993.06a
    • /
    • pp.233-237
    • /
    • 1993
  • 본 논문에서는 패턴 매칭 방법에 근거하여 인식 단위가 음소인 음소 기반 인식 시스템을 구성하였다. 선택한 신경망 구조는 생물학적 신경망인 코호넨(T. Kohonen)의 SOFM(Self-Organizing Feature Map)으로 패턴 매칭 과정 중 cluster로 사용하였다. SOFM 신경망은 신호 공간에 대해서 최적의 국소(局所) 해부적 사사에 의한 자기 조직화 과정을 수행하며, 그 결과 인식 문제에 있어서 상당히 높은 정확도를 나타낸다. 따라서 SOFM 신경망은 음소 인식에도 효과적으로 응용될 수 있다. 또한 음소 인식 시스템의 성능 향상을 위해 K-means 클러스터링 알고리즘이 결합된 학습 알고리즘을 제안하였다. 제안된 음소 인식 시스템의 성능을 평가하기 위해, 먼저, 우리말 음소들을 모음, 파열음, 마찰음, 파찰음, 유음 및 비음, 종성의 6개 음소군으로 분류하고 각 음소군에 대한 특징 지도를 구성하여 labeler의 기능을 수행하게 하였다. 화자 종속 인식실험 결과 87.2%의 인식률을 보였으며 제안한 학습법의 빠른 수렴성과 인식률 향상을 확인하였다.

  • PDF

Automatic Registration of Optical and Radar Satellite Imagery Using Patch Matching (패치 정합에 의한 광학 및 레이다 위성영상의 자동 등록)

  • 강성봉;김기열;유복모;유환희
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2003.04a
    • /
    • pp.334-339
    • /
    • 2003
  • 위성 영상의 활용범위가 확대되면서 다양한 위성 센서로부터 위성영상이 제공되고 있다. 특히 최근에는 이기종 센서로부터 서로 다른 시간과 분광정보를 가진 영상의 자동 등록이 영상자료 분석을 위해 필요한 기술로 인식되고 있다. 본 연구에서는 Kompsat 영상과 Radarsat 영상을 이용하여 두 영상에서 공통으로 존재하는 패치(Patch)를 추출하고 그 패치의 중심점을 찾아 매칭하는 방법에 기초를 둔 자동영상 등록 기법을 제시하였다. 밝기 값분석을 통해 패치를 추출하고 추출된 패치를 모폴로지(Morphology)기법과 잡음요소 제거 기법을 적용하여 패치에 포함된 잡음을 제거하였으며, 비용함수를 이용한 패치 매칭과 변환함수를 이용하여 자동영상등록을 실시하였다.

  • PDF

Categorization of Aspect view direction for 3D object′s Pose Estimation (3차원 물체의 자세정보 추출을 위한 측면 측정방향군의 범주화)

  • 이재영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.508-510
    • /
    • 2001
  • 3차원 물체의 인식과 공간 정보를 추출해 내는 것이 물체인식의 주요 목적이다. 본 논문에서는 평면의 표면을 갖는 기하학적 물체들을 인식하는데 인공신경망이 적용 가능함이 조사되었다. 물체인식을 위한 모델들은 CAD모델들로부터 자동적으로 추출되며, 획득된 물체의 영상과 일치하는 물체의 국면(aspect)과의 매칭은 조건만족 인경신경망을 이용하여 매칭-오차를 최소화시키는 방법을 처리되었다. 인식된 물체의 국면이 어느 방향에서 획득되었는지에 대한 정보(Aspect's view direction)는 검색된 가시 평면들의 분포로부터 추출됨을 ART와 같은 인공신경망을 이용하여 실시간으로 복원할 수 있음을 보였다. 대표적이 측정방향과 이 측정방향으로부터의 편차들을 한 범주에 넣고 학습을 통해 정확한 측정방향 정보들을 구하며, 획득된 3차원 물체의 영상들에 따라 자동적으로 측정방향범주 들이 추가되도록 한다.

  • PDF

Image Extraction Method in 3D Space for Game Player's Face Detection (게임 사용자 얼굴 검출을 위한 3D 공간 영상 추출 기법)

  • Yoo, Chae-Gon;Jung, Chang-Sung;Hwang, Chi-Jung
    • Journal of Korea Game Society
    • /
    • v.1 no.1
    • /
    • pp.49-54
    • /
    • 2001
  • 본 논문에서는 복잡한 랜덤 배경 하에서 위치하고 있는 게임 플레이어의 얼굴 영상을 스테레오 매칭을 이용하여 배경과 분리하여 추출할 수 있는 방법에 대하여 기술한다. 사람과의 상호 작용이 필요한 게임일수록 사람의 동작이나 각 부위에 대한 인식이 필요하다. 이 방법은 게임 이외에도 보안 시스템, 의류 시뮬레이션, 3D 모델링 그리고 로보틱스와 같은 분야에 적용될 수 있다. 스테레오 매칭에 관해서는 많은 연구가 있어왔으며, 기본적으로 영역기반 방법과 특징기반 방법으로 분류될 수 있다. 본 논문의 제안 방법 에서는 영역기반 방법으로 처리를 시작하고, 다단계 크기의 윈도우를 적용하여 물체의 경계선을 찾는 작업을 진행한다. 각 윈도우 크기에 대하여 유사성 커브가 생성되며, 이 값은 물체의 경계선을 판별하는 특징으로 사용된다. 전단계에서 생성된 코어스(coarse) 영역은 유사성 커브 방식에 의하여 머지 작업을 거치며, 최종적으로 대상 물체의 영상을 추출하게 된다.

  • PDF

Automatic Attendance Check System Using Face Recognition In A Masked Environment (마스크를 착용한 환경에서 얼굴 인식을 활용한 자동 출석체크 시스템)

  • Kim, Young-Kook;Lim, Chae-Hyun;Son, Min-Ji;Kim, Myung-Ho
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.23-26
    • /
    • 2020
  • 본 논문에서는 CCTV를 통해 얻은 영상에서 얼굴을 인식하여 자동으로 출석 여부를 체크하는 시스템을 소개한다. 이 시스템은 CNN을 바탕으로 RetinaFace 모델을 사용하여 얼굴을 탐지하고, 탐지된 얼굴을 ArcFace 모델로 R512의 목표 공간으로 임베딩한다. 기존 데이터베이스에 등록된 얼굴과 CCTV를 통해 얻은 얼굴들의 임베딩 벡터 사이의 Angular Cosine Distance를 측정하여 동일 인물인지 판단하는 매칭 알고리즘을 제안한다. 실험을 통해 두 모델을 동시에 사용할 최적의 환경을 파악하고, 마스크 착용으로 얼굴의 하단부가 가려지는 폐색 문제에 더욱 효과적으로 대응하여 매칭 성능을 높이는 방법을 제안한다.

  • PDF

Particle-Based Sound Matching and Synthesis for Efficient and Realistic Foam Sound Generation (효율적이고 사실적인 거품 사운드 생성을 위한 입자 기반 사운드 매칭과 합성)

  • YoungChan Shin;Jong-Hyun Kim
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.01a
    • /
    • pp.357-360
    • /
    • 2023
  • 본 논문에서는 거품 입자의 물리적 속성을 활용하여 가상 시뮬레이션 장면에 맞는 거품 사운드를 합성하고 사운드의 물리적 현상을 기반으로 사운드의 크기를 효율적으로 제어할 수 있는 기법을 제안한다. 현실에서는 사운드의 근원지와 청중의 위치 관계에 따라 사운드 크기의 차이가 나타타는 것을 쉽게 관찰할 수 있다. 본 논문에서는 이 문제를 효율적으로 풀어내기 위해 복잡한 3차원 유체의 움직임을 분석하는 게 아닌, 2차원으로 투영된 입자의 유동을 분석하여 사운드를 합성하고 제어하는 방식을 소개한다. 우리의 방법은 거품 사운드의 크기를 효율적으로 조절할 수 있도록 스크린 공간에서 계산된 거품 입자의 속도와 위치를 활용하여 청중의 위치 관계 및 사운드의 방향성을 확인하고, 이를 통해 거품 사운드를 사실적으로 합성하였다.

  • PDF

Matching for Cylinder Shape in Point Cloud Using Random Sample Consensus (Random Sample Consensus를 이용한 포인트 클라우드 실린더 형태 매칭)

  • Jin, YoungHoon
    • Journal of KIISE
    • /
    • v.43 no.5
    • /
    • pp.562-568
    • /
    • 2016
  • Point cloud data can be expressed in a specific coordinate system of a data set with a large number of points, to represent any form that generally has different characteristics in the three-dimensional coordinate space. This paper is aimed at finding a cylindrical pipe in the point cloud of the three-dimensional coordinate system using RANSAC, which is faster than the conventional Hough Transform method. In this study, the proposed cylindrical pipe is estimated by combining the results of parameters based on two mathematical models. The two kinds of mathematical models include a sphere and line, searching the sphere center point and radius in the cylinder, and detecting the cylinder with straightening of center. This method can match cylindrical pipe with relative accuracy; furthermore, the process is rapid except for normal estimation and segmentation. Quick cylinders matching could benefit from laser scanning and reverse engineering construction sectors that require pipe real-time estimates.

A Method of Image Matching by 2D Alignment of Unit Block based on Comparison between Block Content (단위블록의 색공간 내용비교 기반 2차원 블록정렬을 이용한 이미지 매칭방법)

  • Jang, Chul-Jin;Cho, Hwan-Gue
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.8
    • /
    • pp.611-615
    • /
    • 2009
  • Due to the popular use of digital camera, a great number of photos are taken at every usage of camera. It is essential to reveal relationship between photos to manage digital photos efficiently. We propose a method that tessellates image into unit blocks and applies 2D alignment to extend content-based similar region from seed block pair having high similarity. Through an alignment, we can get a block region scoring best matching value on whole image. The method can distinguish whether photos are sharing the same object or background. Our result is less sensitive to transition or pause change of objects. In experiment, we show how our alignment method is applied to real photo and necessities for further research like photo clustering and massive photo management.

Co-registration Between PAN and MS Bands Using Sensor Modeling and Image Matching (센서모델링과 영상매칭을 통한 PAN과 MS 밴드간 상호좌표등록)

  • Lee, Chang No;Oh, Jae Hong
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.39 no.1
    • /
    • pp.13-21
    • /
    • 2021
  • High-resolution satellites such as Kompsat-3 and CAS-500 include optical cameras of MS (Multispectral) and PAN (Panchromatic) CCD (Charge Coupled Device) sensors installed with certain offsets. The offsets between the CCD sensors produce geometric discrepancy between MS and PAN images because a ground target is imaged at slightly different times for MS and PAN sensors. For precise pan-sharpening process, we propose a co-registration process consisting the physical sensor modeling and image matching. The physical sensor model enables the initial co-registration and the image matching is carried out for further refinement. An experiment with Kompsat-3 images produced RMSE (Root Mean Square Error) 0.2pixels level of geometric discrepancy between MS and PAN images.