• 제목/요약/키워드: computer model calibration

검색결과 88건 처리시간 0.027초

장면 전환에서의 물체 추적을 통한 모델기반추적 방법 연구 (The Model based Tracking using the Object Tracking method in the Sequence Scene)

  • 김세훈;황중원;김기상;최형일
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.775-778
    • /
    • 2008
  • 증강현실은 가상현실의 한 분야로 실제 환경에 가장 사물을 합성하여 원래의 환경에 존재하는 사물처럼 보이도록 하는 컴퓨터 그래픽 기법이다. 증강현실은 가상의 공간과 사물만을 대상으로 하는 기존의 가상현실과 달리 현실세계 기반위에 가상의 사물을 합성하여 현실세계 만으로는 얻기 어려운 부가적인 정보를 보강해 제공할 수 있는 특징을 가지고 있다. 실세계 기반위에 가상의 사물의 합성을 구현하는데 있어 중요하게 여겨지는 기반 기술인 레지스트레이션 방법이 있다. 레지스트레이션 방법은 실사영상과 3차원 그래픽 객체의 위치와 방향을 결정하는 방법으로서, 모델기반추적과 Move-Matching방법이 사용되고 있다. 본 논문에서는 모델기반추적방법에 대하여 물체 추적을 통한 물체의 정보와 색상 분포를 이용하여 각 장면간의 물체 추적을 통하여 전환되는 장면에서의 모델을 통해 상대적 좌표계를 생성하는 방법에 대하여 연구하였다.

  • PDF

모바일 기기에서의 얼굴 특징점 및 선형 보간법 기반 시선 추적 (Gaze Detection Based on Facial Features and Linear Interpolation on Mobile Devices)

  • 고유진;박강령
    • 한국멀티미디어학회논문지
    • /
    • 제12권8호
    • /
    • pp.1089-1098
    • /
    • 2009
  • 최근에 인간컴퓨터 상호작용 분야에서 사용자의 시선 위치를 파악하여 더욱 편리한 입력 장치를 개발하고자 하는 연구가 많이 진행되고 있다. 기존의 대부분 연구들은 큰 모니터를 사용하는 컴퓨터 환경에서 시선 추적 시스템을 개발하였다. 최근 이동단말기의 사용 증대로 이동 중에 시선 추적에 의한 단말기 제어의 필요성이 증대되고 있다. 이에 본 연구에서는 이동형 컴퓨터 (Ultra-Mobile PC) 및 컴퓨터 내장 카메라를 이용하여 사용자의 얼굴을 추적하고, 얼굴내의 특징점의 위치를 능동외관모델 (Active Appearance Model)을 기반으로 추적하는 연구를 수행하였다. 본 논문의 독창성은 기존 연구와는 달리 소형 화면을 가지는 이동 단말기에서 사용자의 시선 위치를 추적할 수 있는 방법을 제안한 점과 정밀한 얼굴 특징점 검출을 위하여 능동외관모델을 사용한 점이다. 또한 사용자의 초기 캘리브레이션시 얻어진 특징값을 기반으로, 입력 특징값들을 정규화 함으로써, Z거리에 따라 시선 위치 정확도가 영향을 받지 않는다는 점이다. 실험결과, 약 1.77도의 시선 오차를 발생하였으나, 추가적인 얼굴 움직임에 의한 마우스 움직임 기능으로 이러한 시선 오차는 더욱 줄일 수 있음을 알 수 있었다.

  • PDF

한 장의 영상으로부터 선분의 중점 정보를 이용한 3차원 모델의 재구성 (Reconstruction of a 3D Model using the Midpoints of Line Segments in a Single Image)

  • 박영섭;류승택;조성동;윤경현
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권4호
    • /
    • pp.168-176
    • /
    • 2005
  • 본 논문에서는 모델 기반으로 한 장의 사진으로부터 중점 정보를 포함한 선분을 이용하여 물체를 3차원 재구성하는 방법을 제안한다. 미리 정의된 다면체를 원시기하모델로 사용하며 한 장의 영상으로부터 복원을 시도하였다. 미리 정의된 다면체 모델을 원시기하모델로 사용하며 사용자가 원시기하모델(primitive)의 각 대응점(correspondence point)을 사진에 매핑 시키는 것으로서 3차원 재구성이 수행된다. 기존의 모델기반 3차원 재구성은 카메라 파라미터들을 복원하거나 반복(iteration)을 통한 오차최소화 기법을 사용하였다. 하지만 본 논문은 원시기하모델에 포함되어 있는 선분들과 그 선분들의 중점 정보로부터 선분을 3차원 복원하며 복원된 선분들로부터 원시기하모델을 재구성하는 방법을 제안한다. 이러한 방법은 선분을 복원하는 단계에서 요구되는 최소한의 카메라 파라미터(focal length) 만으로 원시기하모델을 재구성 할 수 있다.

A Novel Two-Stage Training Method for Unbiased Scene Graph Generation via Distribution Alignment

  • Dongdong Jia;Meili Zhou;Wei WEI;Dong Wang;Zongwen Bai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권12호
    • /
    • pp.3383-3397
    • /
    • 2023
  • Scene graphs serve as semantic abstractions of images and play a crucial role in enhancing visual comprehension and reasoning. However, the performance of Scene Graph Generation is often compromised when working with biased data in real-world situations. While many existing systems focus on a single stage of learning for both feature extraction and classification, some employ Class-Balancing strategies, such as Re-weighting, Data Resampling, and Transfer Learning from head to tail. In this paper, we propose a novel approach that decouples the feature extraction and classification phases of the scene graph generation process. For feature extraction, we leverage a transformer-based architecture and design an adaptive calibration function specifically for predicate classification. This function enables us to dynamically adjust the classification scores for each predicate category. Additionally, we introduce a Distribution Alignment technique that effectively balances the class distribution after the feature extraction phase reaches a stable state, thereby facilitating the retraining of the classification head. Importantly, our Distribution Alignment strategy is model-independent and does not require additional supervision, making it applicable to a wide range of SGG models. Using the scene graph diagnostic toolkit on Visual Genome and several popular models, we achieved significant improvements over the previous state-of-the-art methods with our model. Compared to the TDE model, our model improved mR@100 by 70.5% for PredCls, by 84.0% for SGCls, and by 97.6% for SGDet tasks.

딥러닝 모델과 Kinect 카메라를 이용한 실시간 관절 애니메이션 제작 및 표출 시스템 구축에 관한 연구 (Real-Time Joint Animation Production and Expression System using Deep Learning Model and Kinect Camera)

  • 김상준;이유진;박구만
    • 방송공학회논문지
    • /
    • 제26권3호
    • /
    • pp.269-282
    • /
    • 2021
  • 증강현실과 가상현실 같은 3차원 콘텐츠 보급이 증가함에 따라 실시간 컴퓨터 애니메이션 기술의 중요성이 높아지고 있다. 하지만 컴퓨터 애니메이션 제작 과정은 대부분 수작업 혹은 마커를 부착하는 모션캡쳐 방식으로 이루어져 있다. 때문에 사실적인 영상을 얻기 위해서는 숙련된 전문가에게도 매우 오랜 시간이 필요하다. 이러한 문제점을 해결하기 위해 최근에는 딥러닝 모델과 센서를 기반으로 하는 애니메이션 제작 시스템과 알고리즘이 나오고 있다. 이에 본 논문에서는 딥러닝과 Kinect 카메라 기반 FBX 형식의 애니메이션 제작 시스템에서 자연스러운 인체 움직임을 구현하는 4가지 방법에 대해 연구했다. 각 방법은 환경적 특성과 정확도를 고려하여 선택된다. 첫 번째 방법은 Kinect 카메라를 사용한다. 두 번째 방법은 Kinect 카메라와 보정 알고리즘을 사용한다. 세 번째 방법은 딥러닝 모델을 사용한다. 네 번째 방법은 딥러닝 모델과 Kinect를 사용한다. 제안 방법을 오차와 처리 속도를 실험한 결과, 네 번째 딥러닝 모델과 Kinect를 동시에 사용하는 방법이 다른 방법에 비해 가장 좋은 결과를 보였다.

증강현실 기반의 물체 인식을 통한 게임형 인지 재활 시스템 (Game-type Recognition Rehabilitation System based on Augmented Reality through Object Understanding)

  • 임명재;정희웅;이기영
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.93-98
    • /
    • 2011
  • 본 논문은 마커 기반의 증강현실 시스템을 이용하여 사용자의 지능 개발을 위한 게임형 인지 재활 시스템을 제안한다. 기존의 인지 재활은 타인의 도움을 받거나 키보드나, 마우스 조작을 필요로 하는 불편을 해소 하고자, 마커 카드 제어만을 통해 진행 되는 방식을 적용하였다. 이를 위해 카메라를 통해 얻은 영상의 보정을 위한 영상처리 과정과 마커 검출 및 증강 표현이 가능하도록 하였다. 제시된 완성 모형의 회전을 통해 전체 형태를 확인하고, 멀티 마커의 조합을 통해서 원하는 오브젝트 완성이 가능하며, 대화형 방식으로 처리되어 사용자에게 흥미와 치료에 대한 집중도를 증진할 수 있도록 하였다.

Physical Properties Analysis of Mango using Computer Vision

  • Yimyam, Panitnat;Chalidabhongse, Thanarat;Sirisomboon, Panmanas;Boonmung, Suwanee
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.746-750
    • /
    • 2005
  • This paper describes image processing techniques that can detect, segment, and analyze the mango's physical properties such as size, shape, surface area, and color from images. First, images of mangoes taken by a digital camera are analyzed and segmented. The segmentation is done based on constructed hue model of the sample mangoes. Some morphological and filtering techniques are then applied to clean noises before fitting spline curve on the mango boundary. From the clean segmented image, the mango projected area can be computed. The shape of the mango is then analyzed using some structuring models. Color is also spatially analyzed and indexed in the database for future classification. To obtain the surface area, the mango is peeled. The scanned image of its peels is then segmented and filtered using similar approach. With calibration parameters, the surface area could then be computed. We employed the system to evaluate physical properties of a mango cultivar called "Nam Dokmai". There were sixty mango samples in three various sizes graded by an experienced farmer's eyes and hands. The results show the techniques could be a good alternative and more feasible method for grading mango comparing to human's manual grading.

  • PDF

GPS 코드 기반 정밀시각비교기법의 대류층 천정지연모델 분석 (Analysis of Tropospheric Zenith Path Delay of GPS Code Based Precise Time Comparison Technique)

  • 유동희;양성훈;도재철;이창복
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권12호
    • /
    • pp.61-69
    • /
    • 2012
  • 본 논문은 국제원자시(TAI)를 생성하고 세계협정시(UTC)를 결정하기 위해 GPS에서 전달되는 코드를 기반으로 한 시각비교 기법에 대한 연구 결과이다. 시각비교를 위한 국제표준 양식으로 CGGTTS가 사용되고 있는데, CGGTTS 표준은 시각용 GPS 수신기에서만 제공되고 측지용 GPS 수신기에서는 RINEX 형식으로 위성의 정보를 제공한다. 측지용 수신기를 시각비교용으로 사용하기 위해 ROB에서는 RINEX 형식의 데이터를 이용해서 CGGTTS 형식으로 변환하는 r2cggtts 프로그램을 제공하고 TAI link에 참여하는 전 세계 시각비교 연구실들은 해당 프로그램을 통해 GPS 코드 신호에 의한 시각비교 자료를 BIPM에 주기적으로 전송한다. 본 논문에서는 위성으로부터 수신기까지 코드 신호가 전달될 때 발생하는 오류 요소들과 그 보상 방법을 간단히 소개한다. 오류요소 중 대류층 지연에 대해 자세히 소개하고 기존 프로그램에 적용된 NATO 모델과 현재 가장 널리 사용되고 있는 Saastamoinen 모델을 비교 분석한다.

격자기반의 개념적 수문모형의 개발 (Development of Grid-Based Conceptual Hydrologic Model)

  • 김병식;윤선규;양동민;권현한
    • 한국수자원학회논문집
    • /
    • 제43권7호
    • /
    • pp.667-679
    • /
    • 2010
  • 분포형 수문모형은 컴퓨터 하드웨어의 급속한 발전과 GIS를 이용한 수문지리공간정보에의 접근성 및 활용성 증가에 따라 근래에 많은 발전을 이루게 되었다. 하지만 물리기반의 분포형 수문모형은 입력자료 구축 및 모형구동에 많은 시간과 노력이 필요하며 수문자료가 불충분한 미계측 유역에서는 모형의 구축이 어렵다는 한계점을 지니고 있다. 이에 본 논문에서는 개념적 격자 물수지 기법을 이용한 개념적 분포형 수문모형 S-RAT을 개발하였다. S-RAT 모형은 집중형 수문모형의 자료구축의 간편성과 분포형 수문모형의 공간적 유출해석 능력을 동시에 만족할 수 있으며 격자기반 레이더강우자료를 활용할 수 있다. 또한 전처리과정 및 유역의 지형자료 추출 기능을 탑재함으로 상용 GIS 분석 도구들에 대한 의존성이 없는 장점을가진다. 본 논문에서는 도시유역인 중랑천 유역과 산지유역인 내린천 유역 적용을 통해 S-RAT 모형의 유출모의능력 및 매개변수의 시공간적 전이성을 확인하였으며 지상강우와 레이더강우의 입력 자료로써의 활용성을 확인하였다.

다중 키넥트 센서 기반의 운동 자세 추정 시스템 설계 및 구현 (Design and Development of the Multiple Kinect Sensor-based Exercise Pose Estimation System)

  • 조용주;박경신
    • 한국정보통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.558-567
    • /
    • 2017
  • 본 연구에서는 다수의 키넥트 센서를 이용하여 효율적인 실시간 운동 자세 추정 시스템을 설계하고 개발하였다. 이 시스템은 정면과 측면에 키넥트 센서를 사용하여, 한 개로 추적이 어려웠던 사용자의 특정 자세 (예를 들어, 무릎컬 또는 런지)를 보다 정확하게 측정하고 인식하는 것을 목적으로 한다. 그리고 추후 다양한 자세를 지원할 수 있도록 확장 가능하고 모듈화 된 방법으로 설계되었다. 이 시스템은 여러 클라이언트와 유니티 3D 서버로 구성된다. 클라이언트는 키넥트 골격 데이터를 처리하여 서버로 전송한다. 서버는 다중 키넥트를 보정하고, 각도와 거리를 기반으로 한 특징 값 추출하며 여러 대의 키넥트로부터 계산된 특징 값의 가중 평균을 사용하여 자세 인식 모델을 기반으로 자세 추정 알고리즘을 적용한다. 본 논문은 다중 키넥트 센서를 이용한 인간 운동 자세 추정 시스템의 설계 및 구현 방법을 제시하고, 체험형 유니티 3D 운동 게임에 적용한 예시를 설명한다.