• 제목/요약/키워드: 3차원 방송

검색결과 582건 처리시간 0.023초

입체 영상 재현을 위한 Dual Stream MPEG-4 인코더 분석 및 설계 (Analysis and Design of Dual Stream MPEG-4 Encoder for Stereo Image)

  • 나인순;민수흥;조동섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.205-208
    • /
    • 2002
  • 출판, 영화, 방송, 인터넷 등 멀티미디어 정보통신 분야에서는 새로운 영상 매체인 3차원 입체 영상 및 가상현실을 차세대 영상정보의 현실감 부여와 정보전달의 리얼리티를 제공하기 위해 다양한 기술들이 활발히 연구되고 있다. 또한 현대의 정보 통신 분야는 방송, 통신 및 컴퓨터가 통합되고, 무선과 유선이 융합되는 새로운 정보 통신 기술로 진화하고 있다. 이러한 변화의 영향으로 영상 서비스에 대한 기술 개발 경향도 영상 정보의 효율적인 전달 및 저장이라는 기존의 동영상 압축 표준이 갖는 기능 이외에, 보다 더 향상된 기능을 제공하는 방향으로 나아가고 있다. MPEG-4는 현재 각광받고 있는 인터넷 등의 멀티미디어 서비스에 있어서 필수적인 핵심기술이다. 본 논문에서는 MPEG-4 표준을 기반으로 하여, Dual 스트림이 입력되는 멀티미디어 데이터 즉, 입체 영상 재현을 위한 데이터를 효율적으로 인코딩하는 방식을 제안하고, 이에 대한 인코더를 분석, 설계하였다. 제안하는 방식은 MPEG-4를 이용한 입체영상 관련 응용에 적용될 수 있다.

  • PDF

경계영역 정확도 향상을 위한 영상분할 기반 스테레오 매칭 (Image Segment-Based Stereo Matching for Improving Boundary Accuracy)

  • 문지훈;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 추계학술대회
    • /
    • pp.63-66
    • /
    • 2015
  • 3차원 영상을 생성하기 위해 스테레오 매칭을 통해 깊이 정보를 획득한다. 이때 발생하는 경계영역과 텍스처가 부족한 부분의 깊이정보 부정확성 문제를 해결하기 위해 영상 분할 기반 스테레오 매칭 방법을 제안한다. 일반적으로 사용하는 윈도우 기반 스테레오 매칭 결과를 기반으로 분할된 영상 내에서 최적의 변위 값을 재 할당함으로서 깊이정보의 정확성을 향상시킬 수 있다. Mean-shift는 참조 영상에서 화소 간 평균값 차이가 최대가 되는 영역들을 반복적으로 찾는다. 유사한 평균값을 갖는 영역들을 기반으로 영상을 분할하는 것을 Mean-shift를 이용한 영상분할 이라고 한다. 분할된 영상은 각 영역을 대표하는 패치 구조를 가지고 있어 참조 영상에 포함되어있는 잡음에 강인한 특성을 지닌다. 스테레오 매칭을 통해 화소별로 변위 값을 할당해주는 대신, 분할된 영상을 이용하여 각 분할 영역에 동일한 변위 값을 할당한다. 분할된 영상에 동일한 변위 정보를 할당할 경우 객체와 배경의 경계영역에서 잘못된 변위 값이 할당되는 경우가 발생한다. 이러한 경계 영역의 변위정보 부정확성을 보완하기 위해 화소의 기울기 항을 비용 값 계산 과정에 추가하여 단점을 보완한다. 최종 비용 값 계산을 통해 획득한 초기 변위 지도에 중간 값 필터를 적용하여 분류된 영역에 동일한 변위 값을 할당한다. 제안한 방법을 적용하여 경계영역의 정확도가 향상된 최종 변위 지도를 획득한다.

  • PDF

원형 샘플 화소와 호모그래피 예측을 이용한 반자동 카메라 캘리브레이션 방법 (Semi-auto Calibration Method Using Circular Sample Pixel and Homography Estimation)

  • 신동원;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 추계학술대회
    • /
    • pp.67-70
    • /
    • 2015
  • 최근 깊이 영상 기반 렌더링 방법을 이용하여 제작된 3차원 컨텐츠가 우리의 눈을 즐겁게 해주고 있다. 이러한 깊이 영상 기반 렌더링에서는 필연적으로 색상 카메라와 깊이 카메라 간의 시점 차이가 발생한다. 따라서 두 시점을 일치시키는 전처리 과정으로서 카메라 파라미터가 중요한 역할을 수행한다. 카메라 파라미터를 획득하는 과정으로 카메라 캘리브레이션이 수행된다. 널리 사용되는 기존의 카메라 캘리브레이션 방법은 평면의 체스보드 패턴을 여러 자세로 촬영한 다음 패턴 특징점을 손으로 직접 선택해야하는 불편함이 따른다. 따라서 본 논문에서는 이 문제를 해결하기 위해 원형 샘플 화소 검사와 호모그래피 예측을 이용한 반자동 카메라 캘리브레이션을 제안한다. 제안하는 방법은 먼저 FAST 코너 검출 알고리즘을 이용하여 패턴 특징점의 후보를 영상으로부터 추출한다. 다음으로 원형 샘플 화소를 검사하여 후보군의 크기를 줄인다. 그리고 호모그래피 예측을 통해 손실된 패턴 특징점을 보완하는 완전한 패턴 특징점군을 획득한다. 마지막으로 화소 정확성 향상을 통해 실수 단위의 정확성을 가지는 패턴 특징점의 위치를 획득한다. 실험을 통해 제안하는 방법이 기존의 방법과 비교하여 카메라 파라미터의 정확성은 유지하고 수작업의 불편함을 해소할 수 있음을 확인했다.

  • PDF

인조 데이터셋 구축 시스템과 오브젝트 배치 구조에 따른 검출률 분석 (Analysis of detection rate according to the artificial dataset construction system and object arrangement structure)

  • 김상준;이유진;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.74-77
    • /
    • 2021
  • 최근 딥러닝을 이용하여 객체 인식 학습을 위한 데이터셋을 구축하는데 있어 시간과 인력을 단축하기 위해 인조 데이터를 생성하는 연구가 진행되고 있다. 하지만 실제 환경과 관계없이 임의의 배경에 배치되어 구축된 데이터셋으로 학습된 네트워크를 실제 환경으로 구성된 데이터셋으로 테스트할 경우 인식률이 저조하다. 이에 본 논문에서는 실제 배경 이미지에 객체 이미지를 합성하고, 다양성을 위해 3차원으로 회전하여 증강하는 인조 데이터셋 생성 시스템을 제안한다. 제안된 방법으로 구축된 인조 데이터셋으로 학습한 네트워크와 실제 데이터셋으로 학습된 네트워크의 인식률을 비교한 결과, 인조 데이터셋의 성능이 실제 데이터셋의 성능보다 2% 낮았지만, 인조 데이터셋을 구축하는 시간이 실제 데이터셋을 구축하는 시간보다 약 11배 빨라 시간적으로 효율적인 데이터셋 구축 시스템임을 증명하였다.

  • PDF

VCM을 위한 PCA 기반 피처 맵 압축 방법 (A PCA-based feature map compression method applied to video coding for machines)

  • 박승진;이민훈;최한솔;김민섭;오승준;김연희;도지훈;정세윤;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.27-29
    • /
    • 2021
  • 인공지능 기반 머신 비전 응용이 증가함에 따라 사람이 아닌 기계에서 소비되는 영상 정보를 전송하는 요구가 발생하고 있다. 일반적으로 영상 정보를 전송할 때는 전송 비용을 고려하여 정보를 압축하며 기존 영상 압축 방법은 사람의 시각 인지적 특성을 반영하여 설계되었다. 따라서 기존 영상 압축 방법은 기계에서 소비되는 영상 정보를 압축하는 방법으로 적절하지 않다고 판단하여 2019년 7월, 기계를 위한 영상 부호화 기술의 표준화가 시작되었다. 본 논문에서는 머신 비전 태스크 중, 객체 탐지를 수행하는 네트워크의 피처 맵을 압축하는 방법을 제안한다. 제안하는 방법은 피처 맵의 채널 간 중복성을 제거하기 위해 PCA 기반의 변환을 적용하여 피처 맵의 차원을 축소하며 특히 해상도 계층 구조를 갖는 네트워크의 피처 맵을 압축하기 위해 각 해상도 계층간 변환 기저를 예측하여 추가로 압축률을 높인다. 제안하는 방법을 적용하여 객체 탐지 결과의 큰 성능 하락 없이 약 92.3%에 데이터양 감소를 달성하였다.

  • PDF

공간 도메인 기반 캡슐화 방안 (Spatial domain-based encapsulation scheme)

  • 이상민;남귀중;이성배;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.818-820
    • /
    • 2022
  • 포인트 클라우드 데이터는 자율 주행 기술, 가상 현실 및 증강 현실에서 사용될 3차원 미디어 중 하나로 각광 받고 있다. 국제 표준화 기구인 MPEG(Moving Picture Expert Group)에서는 포인트 클라우드 데이터의 효율적인 압축을 위해 G-PCC(Geometry-based Point Cloud Compression) 및 V-PCC(Video-based Point Cloud Compression)의 표준화를 진행 중에 있다. 그 중, G-PCC는 본래 단일 프레임의 압축을 수행하는 정지 영상 압축 방식이지만, LiDAR(Light Detection And Ranging) 센서를 통해 획득된 동적 포인트 클라우드 프레임에 대한 압축의 필요성이 대두됨에 따라 G-PCC 그룹에서는 Inter-EM(Exploratory Model)을 신설하여 LiDAR 포인트 클라우드 프레임의 압축에 관한 연구를 시작하였다. Inter-EM의 압축 비트스트림은 G-PCC 비트스트림과 마찬가지로 효과적인 전송 및 소비를 위해 미디어 저장 포맷인 ISOBMFF(ISO-based Media File Format)으로 캡슐화될 수 있다. 이때, 포인트 클라우드 프레임들은 자율 주행 등의 서비스에 사용하기 위해 시간 도메인뿐만 아니라 공간 도메인을 기반으로도 소비될 수 있어야 하지만, 공간 도메인을 기반으로 콘텐츠를 임의 접근하여 소비하는 방식은 기존 2D 영상의 시간 도메인 기반 소비방식과 차이로 인해 기존에 논의된 G-PCC 캡슐화 방안만으로는 지원이 제한된다. 이에, 본 논문에서는 G-PCC 콘텐츠를 공간 도메인에 따라 소비하기 위한 ISOBMFF 캡슐화 방안에 대한 파일 포맷을 제안하고자 한다.

  • PDF

윤곽선 기반 메쉬 최적화를 이용한 효율적인 스테레오 영상 데이터 표현 (Efficient Data Representation of Stereo Images Using Edge-based Mesh Optimization)

  • 박일권;변혜란
    • 방송공학회논문지
    • /
    • 제14권3호
    • /
    • pp.322-331
    • /
    • 2009
  • 본 논문은 윤곽선 기반 메쉬 최적화를 이용한 스테레오 영상의 효율적인 데이터 표현 방법을 제안한다. 스테레오 영상에 대한 메쉬 기반 2차원 워핑은 주로 제어점 선택과 선택된 제어점들의 시차 정보 추정 성능에 의존한다. 따라서 제안된 방법은 제어점 선택을 위하여 강한 윤곽선과 객체의 경계선만으로 구성된 특징 지도를 생성하고 이를 기반으로 격자형 메쉬를 생성한다. 또한, 지역단위로 2차원 워핑을 수행하며 목적영상과의 오차를 최소로 하는 제어점의 위치를 반복적으로 추정하게 된다. 최적화된 제어점 위치를 찾기 위한 반복적 2차원 워핑 과정은 많은 계산 시간을 요구하기 때문에 이를 개선하기 위하여 입력된 스테레오 영상은 수평 시차만 존재하고 최적의 제어점 위치는 객체의 경계선을 포함한 윤곽선 위에 존재함을 가정한다. 따라서 제안한 윤곽선 기반 워핑 방법은 수평선 위에 윤곽선만을 따라 반복적으로 최적화된 제어점 위치를 탐색한다. 본 논문의 실험에서는 스테레오 영상에 대하여 제어점 수에 따른 신호에 대한 잡음비(PSNR)를 측정하여 기존 방법과 제안한 방법의 품질을 비교 하였다. 뿐만 아니라 최적의 메쉬 생성을 위한 수행시간을 비교하여 평가하였다. 실험 결과를 통하여 제안한 방법은 적은 수의 제어점을 이용하여 품질의 저하를 줄이고 빠르게 최적의 메쉬를 생성함으로써 효율적인 스테레오 영상 표현 방법을 제공하였다.

GLONASS 측위를 위한 위성좌표 산출 정확도 향상 방안 (Accuracy Analysis of GLONASS Orbit Determination Strategies for GLONASS Positioning)

  • 이호석;박관동;김혜인
    • 한국측량학회지
    • /
    • 제28권6호
    • /
    • pp.573-578
    • /
    • 2010
  • 위성항법시스템에서 정확한 위성궤도결정 기술은 측위 정확도 향상의 필수적인 조건이다. 이 연구에서는 GLONASS의 방송궤도력과 4차 Runge-Kutta 수치적분법을 이용하여 위성좌표를 결정하였으며, 적분간격과 적분시간에 따른 위성궤도의 정확도를 비교하였다. 적분간격에 따른 위성궤도 정확도분석결과, 적분간격이 l초일 때와 300초일 때의 3차원 RMS 오자의 차이가 3cm에 불과한 반면 처리시간은 100배 이상 향상되었다. 적분시간에 따른 위성좌표의 3차원 RMS 오차는 적분시간이 30분, 150분, 300분일 때 각각 8.3m, 187.3m, 661.5m로 나타났으며, 이를 통해 적분시간을 짧게 할수록 정확도가 향상되는 것을 확인하였다. 따라서 이 연구에서는 GLONASS 측위를 위한 위성좌표 결정의 정확도 향상을 위해 적분시간을 최소화할 수 있는 Forward와 Backward 적분을 적용하는 방안을 제안하였으며, 이와 같은 방법을 사용할 경우 5m이하의 위성좌표 산출 정확도를 확보할 수 있다.

방송 축구 영상으로부터 3차원 애니메이션 변환을 위한 축구 선수 동작 인식 (Pose Recognition of Soccer Players for Three Dimensional Animation)

  • 장원철;남시욱;김재희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(4)
    • /
    • pp.33-36
    • /
    • 2000
  • To create a more realistic soccer game derived from TV images, we are developing an image synthesis system that generates 3D image sequence from TV images. We propose the method for the team and the pose recognition of players in TV images. The representation includes camera calibration method, team recognition method and pose recognition method. To find the location of a player on the field, a field model is constructed and a player's field position is transformed by 4-feature points. To recognize the team information of players, we compute RGB mean values and standard deviations of a player in TV images. Finally, to recognize pose of a player, this system computes the velocity and the ratio of player(height/width). Experimental results are included to evaluate the performance of the team and the pose recognition.

  • PDF

FPGA와 GPU를 이용한 스테레오/다시점 변환 시스템 (Stereo-To-Multiview Conversion System Using FPGA and GPU Device)

  • 신홍창;이진환;이광순;허남호
    • 방송공학회논문지
    • /
    • 제19권5호
    • /
    • pp.616-626
    • /
    • 2014
  • 본 논문에서는 FPGA와 GPU를 이용한 실시간 스테레오 다시점 변환 시스템을 소개한다. 해당 시스템은 이종의 연산장치를 이용하며 그에 따라 크게 두 부분으로 나뉜다. 첫 번째 부분은 변이 추출 부분으로서 실시간 계산을 위해 FPGA기반으로 구현되었다. 기본적으로 DP(Dynamic programming) 기반의 스테레오 정합 방법을 통해 초기 변이 영상이 계산되며, 후처리를 통해 개선된다. 개선된 변이 영상은 USB3.0과 PCI-express를 통해 GPU 장치로 전송된다. 스테레오 입력 영상이 GPU장치로도 전송되면, 변이 영상의 변이 값을 이용하여 중간 시점에서의 영상을 합성한다. 생성된 시점 영상들은 무안경 다시점 3차원 디스플레이의 특성에 맞게 하나의 영상으로 화소 또는 부분화소 단위로 재배치되는 시점 다중화 과정을 거쳐 최종적으로 4K 무안경 다시점 디스플레이에 실시간으로 재생된다. 스테레오 정합을 제외한 나머지 연산은 모두 GPU에서 병렬처리된다