• 제목/요약/키워드: camera pose

검색결과 271건 처리시간 0.023초

항공 초분광 원격탐사 실험 기반 선박 스펙트럼 분석 및 탐지 (Spectrum Analysis and Detection of Ships Based on Aerial Hyperspectral Remote Sensing Experiments)

  • 박재진;박경애;김태성;이문진
    • 한국지구과학회지
    • /
    • 제45권3호
    • /
    • pp.214-223
    • /
    • 2024
  • 최근 해상 교통량 증가 및 연안 중심의 레저활동으로 인해 다양한 해양사고가 발생하고 있다. 그 중 선박사고는 인명 및 재산 피해를 유발할 뿐만 아니라 기름 및 위험·유해물질 유출을 동반한 해양 오염사고로 이어질 가능성이 크다. 따라서 해양사고 대비 및 대응을 위한 지속적인 선박 모니터링이 필요하다. 본 연구에서는 해상 선박 모니터링 체계 구축을 위한 초분광 원격탐사 기반의 항공 실험 수행 및 선박탐지 결과를 제시하였다. 한반도 서해 궁평항 인근 해역을 대상으로 초분광 항공관측을 수행하였으며, 사전에 다양한 선박 갑판에 대한 분광 라이브러리를 구축하였다. 탐지 방법으로는 spectral correlation similarity (SCS) 기법을 사용하였으며 초분광 영상과 선박 스펙트럼 사이의 공간 유사도 분포를 분석하였다. 그 결과 초분광 영상에 존재하는 총 15개의 선박을 탐지하였으며 최대 유사도에 기반한 선박 갑판의 색상도 분류하였다. 탐지 선박들은 고해상도 digital mapping camera (DMC) 영상과의 매칭을 통해 검증하였다. 본 연구는 해상 선박탐지를 위한 항공 초분광 센서 활용의 기초로서 향후 원격탐사 기반의 선박 모니터링 시스템에 주요 역할을 할 것으로 기대된다.

입술정보를 이용한 입술모양의 기하학적 보정 (Geometric Correction of Lips Using Lip Information)

  • 황동국;박희정;전병민
    • 한국통신학회논문지
    • /
    • 제29권6C호
    • /
    • pp.834-841
    • /
    • 2004
  • 화자의 입술영상에는 카메라와 화자의 위치나 자세로 인하여 정상적인 입술이 기하학적으로 변환될 수 있다. 이러한 변환은 본래 입술위상의 기하학적 정보를 변경시킨다. 따라서 기하학적으로 변환된 입술모양을 보정하는데 부분적인 입술위상정보를 사용함으로써 전체 입술정보를 개선하고자, 본 논문에서는 입술모양의 기하학적 보정 기법을 제안한다. 제안한 기법은 특징결정 단계와 보정 단계로 구성된다. 특징결정 단계에서는 원영상과 목표영상의 입술모델에 따라 원영상의 특징점과 특징을 추출하고 목표영상의 특징점과 특징을 결정한다. 보정단계에서는 이전 단계에서 추출한 정보를 기반으로 영상을 부분영상으로 분할하고 사상 후 보정된 영상을 통합한다. 실험영상은 6개의 한국어 단모음 발음에 대한 동영상 프레임이고 알고리즘 평가를 위하여 입술의 좌우 대칭성을 활용한다. 실험 결과, 윗입술보다는 아랫입술의 보정률, 입술의 움직임이 작은 발음보다는 움직임이 큰 발음의 보정률이 높게 개선되었다.

수중 구조물 진단용 원격 조종 로봇의 자세 제어를 위한 비전 기반 센서 융합 (Vision-based Sensor Fusion of a Remotely Operated Vehicle for Underwater Structure Diagnostication)

  • 이재민;김곤우
    • 제어로봇시스템학회논문지
    • /
    • 제21권4호
    • /
    • pp.349-355
    • /
    • 2015
  • Underwater robots generally show better performances for tasks than humans under certain underwater constraints such as. high pressure, limited light, etc. To properly diagnose in an underwater environment using remotely operated underwater vehicles, it is important to keep autonomously its own position and orientation in order to avoid additional control efforts. In this paper, we propose an efficient method to assist in the operation for the various disturbances of a remotely operated vehicle for the diagnosis of underwater structures. The conventional AHRS-based bearing estimation system did not work well due to incorrect measurements caused by the hard-iron effect when the robot is approaching a ferromagnetic structure. To overcome this drawback, we propose a sensor fusion algorithm with the camera and AHRS for estimating the pose of the ROV. However, the image information in the underwater environment is often unreliable and blurred by turbidity or suspended solids. Thus, we suggest an efficient method for fusing the vision sensor and the AHRS with a criterion which is the amount of blur in the image. To evaluate the amount of blur, we adopt two methods: one is the quantification of high frequency components using the power spectrum density analysis of 2D discrete Fourier transformed image, and the other is identifying the blur parameter based on cepstrum analysis. We evaluate the performance of the robustness of the visual odometry and blur estimation methods according to the change of light and distance. We verify that the blur estimation method based on cepstrum analysis shows a better performance through the experiments.

스테레오 비전 기술을 이용한 도로 표지판의 3차원 추적 (Three Dimensional Tracking of Road Signs based on Stereo Vision Technique)

  • 최창원;최성인;박순용
    • 제어로봇시스템학회논문지
    • /
    • 제20권12호
    • /
    • pp.1259-1266
    • /
    • 2014
  • Road signs provide important safety information about road and traffic conditions to drivers. Road signs include not only common traffic signs but also warning information regarding unexpected obstacles and road constructions. Therefore, accurate detection and identification of road signs is one of the most important research topics related to safe driving. In this paper, we propose a 3-D vision technique to automatically detect and track road signs in a video sequence which is acquired from a stereo vision camera mounted on a vehicle. First, color information is used to initially detect the sign candidates. Second, the SVM (Support Vector Machine) is employed to determine true signs from the candidates. Once a road sign is detected in a video frame, it is continuously tracked from the next frame until it is disappeared. The 2-D position of a detected sign in the next frame is predicted by the 3-D motion of the vehicle. Here, the 3-D vehicle motion is acquired by using the 3-D pose information of the detected sign. Finally, the predicted 2-D position is corrected by template-matching of the scaled template of the detected sign within a window area around the predicted position. Experimental results show that the proposed method can detect and track many types of road signs successfully. Tracking comparisons with two different methods are shown.

증강 책을 위한 적응형 키프레임 기반 트래킹 (Adaptive Keyframe-Based Tracking for Augmented Books)

  • 유재상;조규성;양현승
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권4호
    • /
    • pp.502-506
    • /
    • 2010
  • 증강 책(Augmented book)이란, 컴퓨터 그래픽 기술로 생성된 3D 물체, 동영상, 소리영상과 같은 멀티미디어 요소들을 증강현실 기술을 이용하여 실제 책에 증강시킨 책을 말한다. 증강 책은 책을 읽는 독자들에게 흥미를 유발시키고, 책에 좀 더 몰입할 수 있도록 하여, 교육 및 엔터테인먼트 효과를 증대시키는 것이 목적이다. 증강 책을 위한 기술은 크게 페이지 인식 그리고 페이지 트래킹으로 나눌 수 있는데, 본 논문에서는 페이지가 인식된 후, 정교한 페이지 트래킹을 위한 카메라의 6 자유도 자세를 추정하기 위해 적응형 키프레임 기반 페이지 트래킹 기술을 제안한다. 페이지가 인식된 이후에는 트래킹을 위해 가장 알맞은 키프레임을 선정한 후 coarse-to-fine의 두 단계에 걸쳐 트래킹을 수행하였다. 결과적으로 본 논문에서 제안된 트래킹 방법은 시점 변화와 조명 변화에 좀 더 강인하고 실시간성을 보장한다.

다중퍼셉트론을 이용한 자동차 번호판의 최적 입출력 노드의 비율 결정에 관한 연구 (Recognition of characters on car number plate and best recognition ratio among their layers using Multi-layer Perceptron)

  • 이의철;이왕헌
    • 한국전자통신학회논문지
    • /
    • 제11권1호
    • /
    • pp.73-80
    • /
    • 2016
  • 자동차 번호판 인식은 뺑소니차량의 추적이나 교통량의 측정, 교통사고의 조사 및 차량의 증가에 따른 차량범죄의 추적에 이용되고 있다. 실제 적용되는 교통 환경에서는 눈이나 비 그리고 주야간의 조명 변화에 따라서 입력되는 영상에 외란의 영향을 받기 쉬우며, 또한 영상을 촬영하는 순간의 차량의 직진방향과 카메라가 보는 방향에 따라서 동일한 번호판에 대해서도 기하학적으로 변형된 영상이 입력되게 된다. 본 연구에서는 이러한 카메라를 이용한 번호판 인식 환경의 문제를 해결하는 방법으로 호모그래피를 이용하여 기하학적으로 변형된 영상을 원래의 영상으로 변환하는 방법과 투영 히스토그램을 이용한 문자의 분리 방법을 제안하였다. 분리된 영상은 다중 퍼셉트론방법을 이용하여 문자와 숫자를 인식하였고 특히 최적한 입력, 은닉, 출력 층의 비율을 실험을 통하여 도출 하였다.

딥 러닝 기반 휴먼 모션 디노이징 (Deep Learning-Based Human Motion Denoising)

  • 김성욱;임현승;김종민
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1295-1301
    • /
    • 2019
  • 본 논문에서는 어텐션 기법을 적용한 양방향 순환신경망을 이용하여 새로운 휴먼 모션 디노이징 방법을 제안한다. 본 방법을 이용하면, 단일 3D 깊이 센서 카메라에서 캡처된 노이즈가 포함된 사람의 움직임이 잘 교정된 자연스러운 움직임으로 자동 조정된다. 양방향 순환신경망에 어텐션 기법을 도입하면, 입력으로 들어온 움직임을 인코딩할 때 여러 자세 중에 더 중요한 자세가 있는 프레임에 더 높은 어텐션 가중치를 부여함으로써, 다른 딥 러닝 네트워크와 비교해 더 나은 최적화 결과와 더 높은 정확도를 보인다. 실험을 통해 본 논문에서 제시한 방법이 다양한 스타일의 움직임과 노이즈를 효과적으로 처리함을 확인하였으며, 제시한 방법은 모션 캡처 후처리 단계의 애플리케이션으로 충분히 사용 가능할 것으로 기대된다.

동적 윤곽선 모델을 이용한 PC 카메라 영상에서의 얼굴 윤곽선 추출 (Facial Contour Extraction in PC Camera Images using Active Contour Models)

  • 김영원;전병환
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 추계 종합학술대회 논문집
    • /
    • pp.633-638
    • /
    • 2005
  • 얼굴 추출은 휴먼 인터페이스와 생체 인식 및 보안을 위해 매우 중요한 분야이다. 본 논문에서는 동영상에서 얼굴의 윤곽선을 추출하기 위해, DCM(Dilation of Color and Motion)필터와 동적 윤곽선 모델(Active Contour Model) 적용한다. 먼저, 본 논문에서 제안된 DCM 필터는 모폴로지의 팽창 연산이 적용된 얼굴 색상영상과 차영상을 결합하고 이를 다시 팽창한 것으로 동영상에서 복잡한 배경을 제거하고 얼굴 영역을 검출하기 위해 사용된다. 동적 윤곽선 모델은 초기 곡선에 영향을 많이 받으므로, 얼굴과 눈, 입의 기하학적인 비율을 이용하여 회전정도를 구한 후, 이를 이용하여 초기 곡선을 자동으로 설정한다. 에지가 약한 부분에서의 윤곽선 추출을 위해, 스네이크의 영상에너지로 에지영상과 밝기영상을 함께 사용하였다. 복잡한 배경이 있는 실내 환경에서 총 5명으로부터 양 눈이 보이는 다양한 헤드 포즈 영상을 25장씩 샘플링하여 총 125장에 대해 실험한 결과, 얼굴 윤곽선의 평균 추출률은 98.1%, 평균 처리시간은 0.2초로 나타났다.

  • PDF

동해안 군사시설보호구역 주변 향호 연안역을 대상으로 무인항공사진측량에 관한 예비 연구 (A Preliminary Study on UAV Photogrammetry for the Hyanho Coast Near the Military Reservation Zone, Eastern Coast of Korea)

  • 김백운;윤공현;장태수;박장준;김성필
    • Ocean and Polar Research
    • /
    • 제39권2호
    • /
    • pp.159-168
    • /
    • 2017
  • To evaluate the accuracy of UAV photogrammetry for Hyangho coast, eastern coast of Korea, we conducted a field experiment wherein UAV photogrammetry test was repeated three times. Since the Haygho coast is located within a military reservation zone, it was necessary to obtain permission to gain access to the beach and to have sensitive aerial photographs showing military facilities inspected and cropped. The standard deviation of the UAV shooting position between the three tests was less than 1 m, but repeatability of footprint on the ground was low due to wind-driven variability of the UAV pose. Self-calibrating bundle adjustment(SCBA) of implementing non-metric camera calibration was failed in one test. In two tests, the vertical error was twice as large as the pixel size except for those areas that were subject to security inspection and cropping. Given the problems that can arise with regard to the repeatability of the shooting area as well as the possibility of failure with regard to SCBA, we strongly recommend that UAV photogrammetry in coastal areas needs to be repeated at least twice.

한 영상으로부터 3개의 소실 점들만을 사용한 매개 변수의 재구성 (Reconstruction of parametrized model using only three vanishing points from a single image)

  • 최종수;윤용인
    • 한국통신학회논문지
    • /
    • 제29권3C호
    • /
    • pp.419-425
    • /
    • 2004
  • 본 논문은 카메라로 찍은 투사 사영(Perspective Projection)의 한 영상으로부터 물체의 크기와 위치를 계산하기 위해서 3 개의 소실 점만을 사용해서 계산하는 새로운 방법을 제안한다. 우리의 접근 방법은 투사 사영의 영상으로부터 초점 거리(Focal Length), 회전 행렬(Rotation Matrix) 등의 정보들 없이 3개의 소실 점만을 가지고 계산하는 방법이다. 물체는 꼭지점(vertices)의 좌표가 크기 벡터 v 의 선형 함수로서 표현할 수 있는 다각형으로써 모델이 된다는 것을 가정한다. 이 재구성의 입력은 영상에서 특징 점과 모델에서 특징 점 사이 대응점의 집합으로 표현할 수 있다. 이 매개 변수 모델의 각각 크기를 최적화하기 위해서, 재구성의 최적화는 동일하게 매개 변수 공간을 샘플링에 의한 최적화기에 대하여 다중 시작점(multiple starting points)을 발생하는 다중 시작(multi-start) 방법을 가지는 표준 비선형 최적화 기법을 효과적으로 해결할 수가 있다.