• 제목/요약/키워드: virtual object recognition

검색결과 65건 처리시간 0.019초

가상세계에서의 온톨로지 기반 객체 인식 기법 (Ontology-Based Recognition Mechanism for Objects in Cyber World)

  • 정근재;박종희
    • 한국콘텐츠학회논문지
    • /
    • 제9권4호
    • /
    • pp.45-54
    • /
    • 2009
  • 가상세계는 현실과 같이 구축된 세계로 에이전트와 가상환경으로 구성된다. 에이전트는 가상환경에 존재하는 객체와 환경 요소들을 지각하고, 인식하여 상황을 판단하며 자율적으로 활동한다. 이러한 에이전트는 마치 사람이 행동하는 것과 같은 느낌과 친숙함을 주며 실수도 하고 엉뚱한 행동을 해서 새로운 상황을 만든다. 이런 상황들은 개체, 관계, 그리고 활동들의 개념들에 의해 구성되어지고 에이전트는 이러한 개념들을 인식함으로써 상황들을 파악한다. 본 논문에서는 가상세계에 존재하는 객체들의 가장 중요한 특징인 모양을 표현하고 인식하는 방법을 제안한다. 구체적으로 다양한 모양들을 기본적인 모양들과 그들 사이의 공간관계들로 나타낸다. 기본적인 공간관계를 표현하기 위하여 거리, 방위, 방향을 이용한다. 기초적인 신호 처리를 생략하기 위해 객체는 능동적으로 자신의 정보를 에이전트에게 메시지로 전달하며 가상 세계에 대한 지식베이스로 온톨로지를 이용한다. 에이전트는 객체로부터 전달되어지는 메시지의 정보를 온톨로지 상의 스키마 정보와 인스턴스 정보와 비교하여 객체를 인식한다.

Atrous Convolution과 Grad-CAM을 통한 손 끝 탐지 (Fingertip Detection through Atrous Convolution and Grad-CAM)

  • 노대철;김태영
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제25권5호
    • /
    • pp.11-20
    • /
    • 2019
  • 딥러닝 기술의 발전으로 가상 현실이나 증강 현실 응용에서 사용하기 적절한 사용자 친화적 인터페이스에 관한 연구가 활발히 이뤄지고 있다. 본 논문은 사용자의 손을 이용한 인터페이스를 지원하기 위하여 손 끝 좌표를 추적하여 가상의 객체를 선택하거나, 공중에 글씨나 그림을 작성하는 행위가 가능하도록 딥러닝 기반 손 끝 객체 탐지 방법을 제안한다. 입력 영상에서 Grad-CAM으로 해당 손 끝 객체의 대략적인 부분을 잘라낸 후, 잘라낸 영상에 대하여 Atrous Convolution을 이용한 합성곱 신경망을 수행하여 손 끝의 위치를 찾는다. 본 방법은 객체의 주석 전처리 과정을 별도로 요구하지 않으면서 기존 객체 탐지 알고리즘 보다 간단하고 구현하기에 쉽다. 본 방법을 검증하기 위하여 Air-Writing 응용을 구현한 결과 평균 81%의 인식률과 76 ms 속도로 허공에서 지연 시간 없이 부드럽게 글씨 작성이 가능하여 실시간으로 활용 가능함을 알 수 있었다.

용접접합부의 형상계측을 위한 주사형 시각센서의 설계에 관한 연구 (A Study on Design of Visual Sensor Using Scanning Beam for Shape Recognition of Weld Joint.)

  • 배강열
    • Journal of Welding and Joining
    • /
    • 제21권2호
    • /
    • pp.102-110
    • /
    • 2003
  • A visual sensor consisted of polygonal mirror, laser, and CCD camera was proposed to measure the distance to the weld joint for recognizing the joint shape. To scan the laser beam of the sensor onto an object, 8-facet polygonal mirror was used as the rotating mirror. By locating the laser and the camera at axi-symmetrical positions around the mirror, the synchronized-scan condition could be satisfied even when the mirror was set to rotate through one direction continuously, which could remove the inertia effect of the conventional oscillating-mirror methods. The mathematical modelling of the proposed sensor with the optical triangulation method made it possible to derive the relation between the position of an image on the camera and the one of a laser light on the object. Through the geometrical simulation of the proposed sensor with the principal of reflection and virtual image, the optical path of a laser light could be predicted. The position and direction of the CCD camera were determined based on the Scheimpflug's condition to fit the focus of any image reflected from an object within the field of view. The results of modelling and simulation revealed that the proposed visual sensor could be used to recognize the weld joint and its vicinity located within the range of the field of view and the resolution. (Received February 19, 2003)

딥러닝 기반 달 표면 모사 환경 실시간 객체 인식 및 매칭 시스템 개발 (Development of System for Real-Time Object Recognition and Matching using Deep Learning at Simulated Lunar Surface Environment)

  • 나종호;공준호;이수득;신휴성
    • 터널과지하공간
    • /
    • 제33권4호
    • /
    • pp.281-298
    • /
    • 2023
  • 달 현지 탐사를 위해 무인 이동체에 대한 연구가 지속적으로 이루어져 있으며 달 지상 관심 지역의 정확한 위치 및 맵핑을 위한 실시간 정보화 작업이 요구되고 있다. 딥러닝 영상 처리 분석 기술을 실제 로버에 적용하기 위해 소프트웨어의 통합과 최적화에 대한 연구가 필요하며 본 연구에서는 가상의 달 기지 건설현장의 영상을 실시간 분석하여 핵심 객체의 공간 정보를 자동으로 수치화하는 방안에 대한 기초 연구가 진행되었다. 본 연구를 통해 이미 구축된 영역 분할 기반 객체 인식 알고리즘을 경계 상자 기반 객체 인식알고리즘으로 변경하여 객체 인식 정확도 및 추론 속도를 개선하는 작업이 이루어졌으며, 대용량 데이터 기반 객체 매칭 학습을 위해 Batch Hard Triplet Mining 기법을 도입하고, 학습 및 추론에 대한 최적화 연구가 수행되었다. 또한 개선된 객체 인식 및 동일 객체 매칭 소프트웨어를 통합하고, 입력 이미지 내 동일 객체 자동 매칭을 시각화하는 소프트웨어를 개발하였으며, 위성 모사 촬영 영상 내 객체를 학습 데이터로, 이동체 촬영 영상 내 객체를 추론 데이터로 사용하여 동일 객체 매칭의 학습 및 추론이 이루어졌다. 본 연구의 결과는 이동체의 연속 촬영 영상을 기반 3차원 공간 정보를 구현 및 관심 공간 내 객체 위치 설정에 활용할 수 있을 것으로 사료되며, 향후 달 기지 건설 현장에서의 영상 기반 시공 모니터링 및 제어를 위한 자동 현장 및 주요 대상물 공간 정보 구축 시스템과의 연계에 기여할 것으로 기대된다.

스테레오 카메라를 이용한 이동객체의 실시간 추적과 거리 측정 시스템 (Real-time moving object tracking and distance measurement system using stereo camera)

  • 이동석;이동욱;김수동;김태준;유지상
    • 방송공학회논문지
    • /
    • 제14권3호
    • /
    • pp.366-377
    • /
    • 2009
  • 본 논문에서는 스테레오 카메라로부터 획득된 좌우 영상을 이용하여 3차원 공간좌표(x, y, z)를 획득하고, 이를 이용하여 제어되는 가상공간을 통하여 사용자에게 현실감을 제공하는 실시간 시스템을 구현한다. 일반적으로 관심영역의 변이를 추정할 때 관심영역내의 모든 화소(pixel)의 변이를 추정하지만, 제안한 시스템에서는 관심영역의 2차원 중심좌표(x, y)만을 변이추정에 사용하여 실시간으로 변이를 추정한다. 추정된 변이로부터 깊이정보(depth)를 구하여 관심영역의 3차원 공간좌표를 획득한다. 시스템은 손을 관심영역으로 설정하여 실시간으로 손의 움직임 정보를 획득하고, 가상공간(virtual space)에 적용하여 사용자가 가상공간을 조작할 수 있도록 한다. 실험을 통해 제안하는 실시간 시스템이 150cm 거리(distance) 내에서의 깊이측정 시 0.68cm의 평균오차를 가지고 손동작 인식률은 90%이상 보이는 것을 검증하였다.

VR기반 모션인식을 이용한 실시간 전략 체스 게임 (Real-time VR Strategy Chess Game using Motion Recognition)

  • 김영광;윤여송;오태경;황보영환;황정희
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권1호
    • /
    • pp.1-7
    • /
    • 2017
  • 요즘은 다향한 IT 기술의 융합을 통해 구현되는 가상현실 기술은 사용자의 체험영역을 확대하고 물리적인 에너지와 각종 비용을 절감하는 기술로 주목을 받고 있다. 본 연구에서는 가상현실 기술을 활용한 가상훈련시스템의 몰입감과 상호작용 제공을 통한 학습효과가 높은 분야를 대상으로 연구하고자 한다. 가상현실 시스템의 국내외 현황에 대해 알아보고 국내 가상훈련 시스템의 수요를 분석하여 나아가야 할 발전 방향에 대해서 연구하고자 한다. 가상현실 기기들의 사용현황에 대해서 가상훈련수요를 고려한 사업의 로드맵을 구축하고자 한다.

소형 마커를 이용한 손가락 터치 기반 감각형 증강현실 상호작용 방안 (Tangible AR Interaction based on Fingertip Touch Using Small-Sized Markers)

  • 정호균;박형준
    • 한국CDE학회논문집
    • /
    • 제18권5호
    • /
    • pp.374-383
    • /
    • 2013
  • Various interaction techniques have been studied for providing the feeling of touch and improve immersion in augmented reality (AR) environments. Tangible AR interaction exploiting two types (product-type and pointer-type) of simple objects has earned great interest for cost-effective design evaluation of digital handheld products. When the sizes of markers attached to the objects are kept big to obtain better marker recognition, the pointer-type object frequently and significantly occludes the product-type object, which deteriorates natural visualization and level of immersion in an AR environment. In this paper, in order to overcome such problems, we propose tangible AR interaction using fingertip touch combined with small-sized markers. The proposed approach facilitates the use of convex polygons to recover the boundaries of AR markers which are partially occluded. It also properly enlarges the pattern area of each AR marker to reduce the sizes of AR markers without sacrificing the quality of marker detection. We empirically verified the quality of the proposed approach, and applied it in the process of design evaluation of digital products. From experimental results, we found that the approach is comparably accurate enough to be applied to the design evaluation process and tangible enough to provide a pseudo feeling of manipulating virtual products with human hands.

A Case Study on Digital Interactive Training Content <Tamagotchi> and <Peridot>

  • DongHee Choi;Jeanhun Chung
    • International journal of advanced smart convergence
    • /
    • 제12권4호
    • /
    • pp.306-313
    • /
    • 2023
  • Having pet is one of the activities people living in modern society do to relieve stress and find peace of mind. Currently, the object of companion animals has moved beyond being a real 'living entity' and has developed to a stage where the animal's upbringing process can be enjoyed in a virtual space by being programmed in digital content. This paper studies detailed elements such as character design, interaction, and realism of 'Tamagotchi (1996)', which can be said to be the beginning of digital training content, and 'Peridot (2023)', a recently introduced augmented reality-based training content. The point was that it was training content using portable electronic devices. However, while the environment in the electronic device in which Tamagotchi's character exists was a simple black and white screen, the environment in which Peridot's character operates has been changed to the real world projected on the screen based on augmented reality. Mutual communication with characters in Tamagotchi remained a response to pressing buttons, but in Peridot, it has advanced to the point where you can pet the characters by touching the smartphone screen. In addition, through object and step recognition, it was confirmed that the sense of reality had become more realistic, with toys thrown by users on the screen bouncing off real objects. We hope that this research material will serve as a useful reference for the development of digital training content to be developed in the near future.

Novel View Generation Using Affine Coordinates

  • Sengupta, Kuntal;Ohya, Jun
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1997년도 Proceedings International Workshop on New Video Media Technology
    • /
    • pp.125-130
    • /
    • 1997
  • In this paper we present an algorithm to generate new views of a scene, starting with images from weakly calibrated cameras. Errors in 3D scene reconstruction usually gets reflected in the quality of the new scene generated, so we seek a direct method for reprojection. In this paper, we use the knowledge of dense point matches and their affine coordinate values to estimate the corresponding affine coordinate values in the new scene. We borrow ideas from the object recognition literature, and extend them significantly to solve the problem of reprojection. Unlike the epipolar line intersection algorithms for reprojection which requires at least eight matched points across three images, we need only five matched points. The theory of reprojection is used with hardware based rendering to achieve fast rendering. We demonstrate our results of novel view generation from stereopairs for arbitrary locations of the virtual camera.

  • PDF

적외선 카메라 영상에서의 마스크 R-CNN기반 발열객체검출 (Object Detection based on Mask R-CNN from Infrared Camera)

  • 송현철;강민식;김태은
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권6호
    • /
    • pp.1213-1218
    • /
    • 2018
  • 최근 비전분야에 소개된 Mask R-CNN은 객체 인스턴스 세분화를위한 개념적으로 간단하고 유연하며 일반적인 프레임 워크를 제시한다. 이 논문에서는 열적외선 카메라로부터 획득한 열감지영상에서 발열체인 인스턴스에 대해 발열부위의 세그멘테이션 마스크를 생성하는 동시에 이미지 내의 오브젝트 발열부분을 효율적으로 탐색하는 알고리즘을 제안한다. Mask R-CNN 기법은 바운딩 박스 인식을 위해 기존 브랜치와 병렬로 객체 마스크를 예측하기 위한 브랜치를 추가함으로써 Faster R-CNN을 확장한 알고리즘이다. Mask R-CNN은 훈련이 간단하고 빠르게 실행하는 고속 R-CNN에 추가된다. 더욱이, Mask R-CNN은 다른 작업으로 일반화하기 용이하다. 본 연구에서는 이 R-CNN기반 적외선 영상 검출알고리즘을 제안하여 RGB영상에서 구별할 수 없는 발열체를 탐지하였다. 실험결과 Mask R-CNN에서 변별하지 못하는 발열객체를 성공적으로 검출하였다.