• 제목/요약/키워드: 카메라 캘리브레이션 3D computer vision

검색결과 6건 처리시간 0.018초

개선된 화질의 영상을 이용한 열화상 카메라 캘리브레이션 (Calibration of Thermal Camera with Enhanced Image)

  • 김주오;이덕우
    • 한국산학기술학회논문지
    • /
    • 제22권4호
    • /
    • pp.621-628
    • /
    • 2021
  • 본 논문에서는 3개의 시점을 가진 열화상 카메라의 캘리브레이션을 수행하는 방법을 제안하고, 카메라의 내부 파라미터 추정 및 그 결과의 정확도를 파악하기 위해 역투영 오류값을 제시한다. 3개의 시점을 가진 카메라는 일반 카메라와 다르게 각 시점마다 겹치는 영상이 존재하지 않고, 획득한 영상의 화질은 일반 카메랄 획득한 영상보다 낮다. 카메라 캘리브레이션은 3차원 실제 영상의 좌표 정보 또는 카메라와 목표물체 사이의 거리를 계산하기 전에 반드시 수행되어야 하는 작업이다. 카메라 캘리브레이션 작업을 통해 얻는 것은 카메라의 내부 및 외부 파라미터이며 내부 파라미터는 카메라의 초점거리, 비대칭계수, 이미지 중심점으로 구성되어 있고, 외부 파라미터는 사용되는 카메라들 사이 또는 사용되는 카메라의 상대적 위치인 회전행렬과 변위벡터로 구성되어 있다. 본 논문에서는 열화상 카메라의 캘리브레이션을 수행하는 방법을 제안하며, 열화상 카메라의 캘리브레이션 수행을 위해 온도에 반응하는 열상 체커보드를 활용한다. 캘리브레이션이 안정적으로 수행되기 위해 본 논문에서는 심층 학습 기반 촬영대상 물체의 화질을 개선하여 코너 추출의 정확도를 높인 후 캘리브레이션 파라미터 계산을 수행하고, 개선된 화질의 영상이 캘리브레이션을 개선한 결과를 제시한다.

헬스케어를 위한 영상기반 기절동작 인식시스템 개발 (Development of a Vision Based Fall Detection System For Healthcare)

  • 소인미;강선경;김영운;이지근;정성태
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권6호
    • /
    • pp.279-287
    • /
    • 2006
  • 이 논문은 스테레오 영상을 이용하여 응급상황을 인식하기 위하여 기절 동작을 인식하는 방법을 제안한다. 사람의 다양한 동작에서 학습과 인식에 필요한 영상 정보를 추출하기 위하여 3차원 정보를 사용하였고, 인식 알고리즘으로는 HMM을 이용하였다. 두 대의 카메라 영상에서 각각 배경을 생성한 다음에 배경 영상과 입력 영상의 차이를 이용하여 움직임 객체를 추출하였다. 그리고 움직임 객체를 포함하는 사각형을 생성한 다음 두 카메라의 캘리브레이션 정보를 이용하여 3차원 정보를 추출하였다. 3차원 공간상에서의 사각형의 너비와 높이의 변화량과 사각형 중심점 위치의 변화량 각각에 대하여 동작 인식률을 실험하였다. 실험 결과 너비와 높이의 특징 값을 이용하는 것보다 중심점의 3차원 위치 변화량을 이용하는 것이 높은 인식률을 보였다.

  • PDF

스테레오 비전을 기반으로 한 3차원 입력 장치 (Stereo Vision Based 3D Input Device)

  • 윤상민;김익재;안상철;고한석;김형곤
    • 대한전자공학회논문지SP
    • /
    • 제39권4호
    • /
    • pp.429-441
    • /
    • 2002
  • 본 논문은 실시간으로 3차원 공간상에서의 움직임 정보를 추출할 수 있는 입력 장치를 제안한다. 제안하는 3차원 입력 장치는 스테레오 카메라의 기하학적 구조와 색상, 움직임, 형태상의 특성을 이용하여 복잡한 환경에서 사전 카메라 캘리브레이션 없이 3차원 움직임 정보를 추출할 수 있다. 움직임 추출을 위해서 perspepctive projection 행렬과 perspective distortion 행렬을 이용한 스테레오 카메라의 기하학적 특성을 이용하며, 효과적인 좌우 영상의 특징점 추적 및 추출을 위해 색상 변환(Color transform)과 UPC(Unmatched Pixel Count) 및 이산 칼만 필터(Discrete Kalman Filter)의 효과적인 결합으로 이루어진 MAWUPC(Motion Adaptive Weighted Pixel Count)과 PCA(Principal Component Analysis)로 구성된 알고리즘을 제안한다. 추출된 3차원 공간상에서의 움직임은 가상환경에서의 가상 물체를 제어하거나 사용자 시점의 이동을 나타내는 인터페이스로 사용한다. 스테레오 비전을 이용한 입력 장치는 선으로 연결되지 않기 때문에 사용자가 가상환경에서 작업하기가 편리하며 몰입감을 높일 수 있는 등 보다 효율적인 상호작용을 가능하게 해준다.

색상패턴 추적을 이용한 실시간 증강영상 시스템 (A Real-time Augmented Video System using Chroma-Pattern Tracking)

  • 박성춘;남승진;오주현;박창섭
    • 방송공학회논문지
    • /
    • 제7권1호
    • /
    • pp.2-9
    • /
    • 2002
  • 최근에 TV 방송에서 가상스튜디오나 가상캐릭터와 같은 가상현실(VR: Virtual Reality) 기술이 자주 사용되고 있으며 증강현실 (AR: Augmented Reality) 기술에 대한 관심도 높아지고 있다. 본 논문에서는 증강현실 기술을 방송에 응용한 가상스크린 시스템에 대해 소개한다. 가상스크린 시스템은 움직이는 색상패턴 패널을 추적하여 실시간으로 그 위에 동영상을 합성하는 증강영상 시스템이다. KBS 기술연구소에서는 가상스크린 시스템을 개발하고 'K-비전'이라 이름지었다. 이 시스템은 사용자가 들고 움직이는 패널에 동영상이나 그래픽 영상 등을 보여줄 수 있는데, 보여지는 모든 영상은 카메라의 움직임과 패널의 움직임에 따라 정확하게 입혀진다. 패널 추적을 위하여 블럽 분석(blob analysis)이나 특징 추적(feature tracking)과 같은 영상처리 기술을 이용한다. K-비전은 모든 타입의 카메라와 사용 가능하며. 특별한 부가장치가 필요하지 않다. 센서를 부착하지 않아도 되고. 캘리브레이션(calibration) 과정 또한 필요하지 않다. K-비전은 선거개표 방송. 다큐멘터리, 오락 프로그램 등 생방송 프로그램에서 활용한다.

움직이는 평면거울을 이용한 3차원 물체 복원 (3D Reconstruction using a Moving Planar Mirror)

  • 장경호;이동훈;정순기
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1543-1550
    • /
    • 2004
  • 영상 열을 이용한 3차원 구조 복원 기법은 기하학 기반의 전통적인 3차원 모델링 기법의 대안으로 복잡한 대규모 장면을 쉽고 빠르게 모델링 할 수 있는 효과적인 수단이다. 이러한 모델은 모션을 통한 구조 복원기법을 통해 주로 얻어진다. 그러나 모션을 통한 구조복원 기법은 매우 복잡한 기하학 구조와 현란한 컬러를 포함한 물체의 경우, 적용하기에 어려움이 있다. 이러한 어려움을 해결하기 위해, 본 논문에서는 움직이는 평면거울 기반의 새로운 물체 복원 기법을 제안한다. 본 기법은 장면에 포함된 기하구조의 암묵적인 단서를 이용하는 대신 장면 속에 기하학적 단서 즉, 거울의 위치 정보를 강제로 삽입하여 가상 카메라의 위치 정보를 추출한다 구해진 가상 카메라의 위치 정보를 통해 장면의 복잡도에 무관한 3차원 기하 구조를 복원할 수 있다. 이를 위해 먼저 복원하고자 하는 장면을 포함한 평면거울의 영상 열을 포착한다. 다음으로 거울의 위치 정보를 이용하여 가상 카메라의 내, 외부 파라미터를 추정한다. 구해진 카메라 파라미터는 거울의 위치 정보 추출 시 발생하는 에러를 포함하고 있기 때문에 영상 열에 존재하는 코너점들의 대응관계를 이용하여 재 보정한다 마지막으로 구해진 가상 카메라의 내부 및 외부 파라미터 정보를 통해 3차원의 구조를 복원한다 본 논문에서 제안한 알고리즘을 다양한 영상을 통해 실험한 결과 신뢰할만한 구조 복원이 가능하였다.

합성곱 신경망 기반 맨하탄 좌표계 추정 (Estimation of Manhattan Coordinate System using Convolutional Neural Network)

  • 이진우;이현준;김준호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제23권3호
    • /
    • pp.31-38
    • /
    • 2017
  • 본 논문에서는 도심 영상에 대해 맨하탄 좌표계를 추정하는 합성곱 신경망(Convolutional Neural Network) 기반의 시스템을 제안한다. 도심 영상에서 맨하탄 좌표계를 추정하는 것은 영상 조정, 3차원 장면 복원 등 컴퓨터 그래픽스 및 비전 문제 해결의 기본이 된다. 제안하는 합성곱 신경망은 GoogLeNet[1]을 기반으로 구성한다. 합성곱 신경망을 훈련하기 위해 구글 스트리트 뷰 API로 영상을 수집하고 기존 캘리브레이션 방법으로 맨하탄 좌표계를 계산하여 데이터셋을 생성한다. 장면마다 새롭게 합성곱 신경망을 학습해야하는 PoseNet[2]과 달리, 본 논문에서 제안하는 시스템은 장면의 구조를 학습하여 맨하탄 좌표계를 추정하기 때문에 학습되지 않은 새로운 장면에 대해서도 맨하탄 좌표계를 추정한다. 제안하는 방법은 학습에 참여하지 않은 구글 스트리트 뷰 영상을 검증 데이터로 테스트하였을 때 $3.157^{\circ}$의 중간 오차로 맨하탄 좌표계를 추정하였다. 또한, 동일 검증 데이터에 대해 제안하는 방법이 기존 맨하탄 좌표계 추정 알고리즘[3]보다 더 낮은 중간 오차를 보이는 것을 확인하였다.