• Title/Summary/Keyword: 컴퓨터 비전 기술

Search Result 410, Processing Time 0.028 seconds

The Design of Indoor Navigation using AR (AR을 활용한 실내 내비게이션의 설계)

  • Kim, Myung Seong;Kim, Seong Jo;Kim, Dong Hyun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.129-132
    • /
    • 2019
  • 본 기술의 발달에 따라 실내 공간이 점차 대형화되면서 실내공간은 복잡해졌으며, 이로 인해 원하는 장소를 찾기가 어려워졌다. 4차 산업혁명에 힘입어 앞서 언급한 문제들을 해결하기 위해 실내 내비게이션을 도입하려는 시도가 활발히 이루어지고 있다. 실내 내비게이션의 기술들로는 Wi-Fi, Bluetooth, Beacon, RFID, UWB 등이 있지만, 실내 건물 구조 특성상 여러 장애물들에 의해 신호 정보의 오차가 심하여 사용하기에 어려움이 있다. 이러한 문제점을 해결하기 위해 스마트폰에 내장된 IMU 센서 및 카메라 센서를 이용하여 동시적 위치 인식 및 지도 작성을 하는 SLAM 알고리즘으로 실내 내비게이션을 구현하고, 사용자가 보다 쉽게 길을 찾을 수 있게 접근성이 높은 스마트폰과 AR을 이용하여 어플리케이션을 설계하였다.

  • PDF

MMA: Multi-modal Message Aggregation for Korean VQA (MMA: 한국어 시각적 질의응답을 위한 멀티 모달 메시지 통합)

  • Park, Sungjin;Park, Chanjun;Seo, Jaehyung;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.468-472
    • /
    • 2020
  • 시각적 질의응답(Visual Question Answering, VQA)은 주어진 이미지에 연관된 다양한 질문에 대한 올바른 답변을 예측하는 기술이다. 해당 기술은 컴퓨터 비전-자연어 처리 연구분야에서 활발히 연구가 진행되고 있으며, 질문의 의도를 정확히 파악하고, 주어진 이미지에서 관련 단서 정보를 찾는 것이 중요하다. 또한, 서로 이질적인 특성을 지닌 정보(이미지 객체, 객체 위치, 질문)를 통합하는 과정도 중요하다. 본 논문은 질문의 의도에 알맞은 정보를 효율적으로 사용하기 위해 멀티 모달 입력 이미지 객체, 객체 위치, 질문)에 대한 Multi-modal Message Aggregation (MMA) 제안하며 이를 통해 한국어 시각적 질의응답 KVQA에서 다른 모델보다 더 좋은 성능을 확인하였다.

  • PDF

Natural Hand Detection and Tracking (자연스러운 손 추출 및 추적)

  • Kim, Hye-Jin;Kwak, Keun-Chang;Kim, Do-Hyung;Bae, Kyung-Sook;Yoon, Ho-Sub;Chi, Su-Young
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.148-153
    • /
    • 2006
  • 인간-컴퓨터 상호작용(HCI) 기술은 과거 컴퓨터란 어렵고 소수의 숙련자만이 다루는 것이라는 인식을 바꾸어 놓았다. HCI 는 컴퓨터 사용자인 인간에게 거부감 없이 수용되기 위해 인간과 컴퓨터가 조화를 이루는데 많은 성과를 거두어왔다. 컴퓨터 비전에 기반을 두고 인간과 컴퓨터의 상호작용을 위하여 사용자 의도 및 행위 인식 연구들이 많이 행해져 왔다. 특히 손을 이용한 제스처는 인간과 인간, 인간과 컴퓨터 그리고 최근에 각광받고 있는 인간과 로봇의 상호작용에 중요한 역할을 해오고 있다. 본 논문에서 제안하는 손 추출 및 추적 알고리즘은 비전에 기반한 호출자 인식과 손 추적 알고리즘을 병행한 자연스러운 손 추출 및 추적 알고리즘이다. 인간과 인간 사이의 상호간의 주의집중 방식인 호출 제스처를 인식하여 기반하여 사용자가 인간과 의사소통 하는 것과 마찬가지로 컴퓨터/로봇의 주의집중을 끌도록 하였다. 또한 호출 제스처에 의해서 추출된 손동작을 추적하는 알고리즘을 개발하였다. 호출 제스처는 카메라 앞에 존재할 때 컴퓨터/로봇의 사용자가 자신에게 주의를 끌 수 있는 자연스러운 행동이다. 호출 제스처 인식을 통해 복수의 사람이 존재하는 상황 하에서 또한 원거리에서도 사용자는 자신의 의사를 전달하고자 함을 컴퓨터/로봇에게 알릴 수 있다. 호출 제스처를 이용한 손 추출 방식은 자연스러운 손 추출을 할 수 있도록 한다. 현재까지 알려진 손 추출 방식은 피부색을 이용하고 일정 범위 안에 손이 존재한다는 가정하에 이루어져왔다. 이는 사용자가 제스처를 하기 위해서는 특정 자세로 고정되어 있어야 함을 의미한다. 그러나 호출 제스처를 통해 손을 추출하게 될 경우 서거나 앉거나 심지어 누워있는 상태 등 자연스러운 자세에서 손을 추출할 수 있게 되어 사용자의 불편함을 해소 할 수 있다. 손 추적 알고리즘은 자연스러운 상황에서 획득된 손의 위치 정보를 추적하도록 고안되었다. 제안한 알고리즘은 색깔정보와 모션 정보를 융합하여 손의 위치를 검출한다. 손의 피부색 정보는 신경망으로 다양한 피부색 그룹과 피부색이 아닌 그룹을 학습시켜 얻었다. 손의 모션 정보는 연속 영상에서 프레임간에 일정 수준 이상의 차이를 보이는 영역을 추출하였다. 피부색정보와 모션정보로 융합된 영상에서 블랍 분석을 하고 이를 민쉬프트로 추적하여 손을 추적하였다. 제안된 손 추출 및 추적 방법은 컴퓨터/로봇의 사용자가 인간과 마주하듯 컴퓨터/로봇의 서비스를 받을 수 있도록 하는데 주목적을 두고 있다.

  • PDF

A machine-vision based inspection system for non-transparent and high-reflectance substrate (머신 비전을 이용한 불투명/고반사율 기판 검사 시스템)

  • Yeo, Kyeong-Min;Seo, Jung-Woo;Lee, Suk-Won;Yi, June-Ho
    • Annual Conference of KIPS
    • /
    • 2010.04a
    • /
    • pp.369-372
    • /
    • 2010
  • 평판 디스플레이(flat panel display)의 크기가 커짐에 따라 다양한 기판을 이용한 제조 방법이 개발되고 있다. 디스플레이 제조 공정 중 기판의 결함을 찾아서 분류하는 검사 시스템은 최종 제품의 품질을 결정하는 매우 중요한 부분이다. 본 연구는 머신비전 기술을 이용하여 불투명하고 반사율이 높은 기판 표면의 결함을 찾아내고, 이 결함을 스크래치(scratch), 흑결함(dark defect), 백결함(white defect)으로 분류하는 장치를 구현하는데 목적이 있다. 이를 구현하기 위해 본 논문에서는 정밀 스테이지(stage)와 라인 카메라(line CCD camera)을 이용한 광학계를 활용하여 검사 시스템을 구현하였다. 구축된 시스템을 이용하여 취득한 이미지를 12 개의 영역으로 등분하여 각각의 국부 영역에 대한 문턱값 연산(thresholding)을 적용함으로써 조명의 불균일을 의한 검출 에러율을 획기적으로 낮추었다. 간단한 컴퓨터비전 알고리듬의 채용으로도 검사 시스템의 구현이 가능함을 보였다.

Optical Design of a Reflecting Omnidirectional Vision System for Long-wavelength Infrared Light (원적외선용 반사식 전방위 비전 시스템의 광학 설계)

  • Ju, Yun Jae;Jo, Jae Heung;Ryu, Jae Myung
    • Korean Journal of Optics and Photonics
    • /
    • v.30 no.2
    • /
    • pp.37-47
    • /
    • 2019
  • A reflecting omnidirectional optical system with four spherical and aspherical mirrors, for use with long-wavelength infrared light (LWIR) for night surveillance, is proposed. It is designed to include a collecting pseudo-Cassegrain reflector and an imaging inverse pseudo-Cassegrain reflector, and the design process and performance analysis is reported in detail. The half-field of view (HFOV) and F-number of this optical system are $40-110^{\circ}$ and 1.56, respectively. To use the LWIR imaging, the size of the image must be similar to that of the microbolometer sensor for LWIR. As a result, the size of the image must be $5.9mm{\times}5.9mm$ if possible. The image size ratio for an HFOV range of $40^{\circ}$ to $110^{\circ}$ after optimizing the design is 48.86%. At a spatial frequency of 20 lp/mm when the HFOV is $110^{\circ}$, the modulation transfer function (MTF) for LWIR is 0.381. Additionally, the cumulative probability of tolerance for the LWIR at a spatial frequency of 20 lp/mm is 99.75%. As a result of athermalization analysis in the temperature range of $-32^{\circ}C$ to $+55^{\circ}C$, we find that the secondary mirror of the inverse pseudo-Cassegrain reflector can function as a compensator, to alleviate MTF degradation with rising temperature.

유비쿼터스 현황과 전망-국민소득 2만달러의 대한민국 비전 u-IT서비스를 구현하자

  • Korea Venture Business Association
    • Venture DIGEST
    • /
    • s.56
    • /
    • pp.18-19
    • /
    • 2004
  • 유비쿼터스 시대가 열리게 되면 자동차, 가정, 실외 등의 다양한 공간에서의 IT 활용이 늘어나고 네트워크에 연결되는 컴퓨터 사용자의 수도 늘어나는 등 IT산업의 규모와 범위는 더욱 커지게 될 전망이다. 물론 이런 유비쿼터스 네트워크를 구축하기 위해서는 정보기술(IT)의 고도화가 전제돼야 한다.

  • PDF

Recent Trends of 3D Reconstruction Technology (3차원 복원 기술 동향)

  • Chu, Chang-U;Park, Ji-Yeong;Kim, Ho-Won;Park, Jeong-Cheol;Im, Seong-Jae;Gu, Bon-Gi
    • Electronics and Telecommunications Trends
    • /
    • v.22 no.4 s.106
    • /
    • pp.1-11
    • /
    • 2007
  • 3차원 복원 기술은 실세계에 존재하는 물체의 3차원 형상과 표면의 색상을 디지털화하는 기술이다. 일반적으로 가상현실, 게임, 애니메이션 등의 컴퓨터 그래픽스에 기반한 응용에서는 숙련된 디자이너가 수작업으로 3차원 모델을 제작하는데, 이는 시간이 많이 소요되고, 디자이너의 숙련도에 따라서 품질의 차이가 많은 단점이 있다. 뿐만 아니라 실세계에 존재하는 물체를 모델링할 때는 일일이 측정을 하는 과정을 거쳐야 하는 단점이 있다. 3차원 복원 기술은 이에 대한 대안으로 연구되고 있는 기술로써, 이미 많은 응용 분야에서 활용되고 있을 뿐만 아니라 새로운 서비스가 꾸준히 창출되고 있는 기술이다. 본 고에서는 3차원 복원 기술을 분류하고, 컴퓨터 비전 분야의 주연구 대상인 영상분석을 통한 3차원 복원 기술에 대해 설명한다. 또한, 3차원 복원 기술의 응용 사례와 상용화된 제품에 대해 설명하고, 향후 발전 방향을 제시한다.

Rotation Transformation Invariant Texture Classification for Object Recognition of Surveillance Camera Image (감시 카메라 영상의 객체 인식을 위한 회전 변화에 강인한 질감 분류)

  • Kim, Won-Hee;Park, Seong-Mo;Kim, Jong-Nam
    • Annual Conference of KIPS
    • /
    • 2009.04a
    • /
    • pp.171-172
    • /
    • 2009
  • 질감 분류 기술은 패턴인식과 컴퓨터 비전 분야에서 널리 사용되는 기술로서, 최근 들어서는 감시 카메라 시스템에서의 정확한 객체 인식을 위한 회전 변화에 강인한 질감 분류 연구가 진행되고 있다. 본 논문에서는 순환 가보 웨이블렛 필터를 이용한 회전 변환에 강인한 질감 분류 방법을 제안한다. 제안하는 방법은 순환 가보 웨이블렛 필터링된 영상에서 전역 및 지역 특징 벡터를 계산하고 특징 벡터의 차이를 이용한 유사도 측정 판별식으로 질감 분류를 수행한다. Brodatz 질감 앨범을 이용한 실험에서 기존의 방법들보다 2~6% 향상된 질감 분류 비율을 확인할 수 있었다. 제안하는 방법은 질감 기반 객체 인식에 관련된 응용 분야에서 유용하게 사용될 수 있다.

컴퓨터 비전기술을 이용한 작업 측정 방법의 개선과 ERP응용에 관한 연구

  • 이형곤;심억수;박진우;이정철
    • Proceedings of the Korean Society of Precision Engineering Conference
    • /
    • 2004.05a
    • /
    • pp.226-226
    • /
    • 2004
  • 최근 들어 치열한 경쟁 환경이 도래하면서, ERP라는 패키지로 대변되는 기업의 정보시스템이 지원하는 기업의 핵심 활동(critical activities)들도 그만큼 방대해졌다. 여기서, ERP를 비롯한 정보시스템의 기본 자원이라 할 수 있는 정보(information)의 정확하고도 즉각적인 입력이 매우 중요한 문제로 부각되고 있으며, 특히, 방대한 시스템의 운영에 따라 모든 정보흐름에 대한 검증 및 통제가 어려워졌기 때문에 이를 필터링 하는데 기준을 제공하는 표준(standard)정보의 중요성이 다시금 강조되고 있다.(중략)

  • PDF

C Programming Lab Using Educational Robot Software (교육용 로봇 소프트웨어를 활용한 C 프로그래밍 실습)

  • Park, Sangsoo
    • Annual Conference of KIPS
    • /
    • 2013.11a
    • /
    • pp.1643-1645
    • /
    • 2013
  • 기호, 키워드 및 문법을 기반으로 하는 C 프로그래밍 언어는 처음 접하는 컴퓨터 전공 및 비전공 학생들이 개념을 이해하는데 어려움을 겪는 경우가 많다. 최근 다양한 교육용 로봇이 보급되면서 보다 손쉽게 프로그래밍을 습득할 수 있는 그래픽 기반의 프로그래밍 방식이 제안되고 있다. 본 논문에서는 이러한 그래픽 기반의 프로그래밍 방식을 C 프로그래밍 실습에 활용하는 방법을 기술하고 그 효용성에 대해 분석한다.