• Title/Summary/Keyword: Immersive Video

Search Result 130, Processing Time 0.024 seconds

3DoF+ 비디오 부호화를 위한 깊이 매핑 기법 (A Depth Mapping Method for 3DoF+ Video Coding)

  • 박지훈;이준성;박도현;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.295-296
    • /
    • 2020
  • 3DoF+ 비디오 부호화 표준을 개발하고 있는 MPEG-I 비주얼 그룹은 표준화 과정에서 참조 SW 코덱인 TMIV(Test Model for Immersive Video)를 개발하고 있다. TMIV 는 제한된 공간에서 동시에 여러 위치에서 획득한 뷰(view)의 텍스처(texture) 비디오와 깊이(depth) 비디오를 효율적으로 압축하여 임의 시점의 뷰 렌더링(rendering)을 제공한다. TMIV 에서 수행되는 깊이 비디오의 비트 심도 스케일링 및 압축은 깊이 정보의 손실을 발생하며 이는 렌더링(rendering)된 임의 시점 비디오의 화질 저하를 야기한다. 본 논문에서는 보다 효율적인 깊이 비디오 압축을 위한 히스토그램 등화(histogram equalization) 기반의 구간별(piece-wise) 깊이 매핑 기법을 제안한다. 실험결과 제안기법은 자연 영상(natural sequence)의 End-to-End 부호화 성능에서 평균적으로 3.1%의 비트율 절감이 있음을 확인하였다.

  • PDF

16K 초고화질 360도 영상에서의 사용자 시점 기반 타일 스트리밍 성능 검증 (Performance Analysis of Viewport-dependent Tiled Streaming on 16K Ultra High-quality 360-degree Video)

  • 정종범;이순빈;김인애;류은석
    • 인터넷정보학회논문지
    • /
    • 제22권3호
    • /
    • pp.1-8
    • /
    • 2021
  • 가상 현실 공간에서 head-mounted display(HMD)를 통한 실감형 미디어를 제공하기 위해서는 초고화질 및 초고해상도의 전방위 360도 영상 전송이 필요하고, 이는 높은 대역폭 및 연산량을 요구한다. 이를 극복하기 위해 360도 영상에 대한 타일 기반 분할 기법을 사용하여 사용자 시점 기반 선택적 스트리밍 기법이 사용될 수 있다. 본 논문은 16K 초고화질 360도 영상 및 종래에 널리 쓰이는 4K 360도 영상에서의 사용자 시점 기반 타일 스트리밍 기법의 성능 평가를 소개한다. 16K 초고화질 360도 영상에 타일 스트리밍 기법을 적용하였을 때, 영상 전체 부호화 및 전송 방법 대비 42.47%의 bjotegaard delta rate(BD-rate) 절감을 확인하였고, 4K 360도 영상 타일 스트리밍 시 26.41%의 BD-rate 절감이 이루어지는 것을 확인하였다. 따라서, 타일 스트리밍이 초고해상도 영상에 더 효율적임을 확인하였다.

얼굴 인식 기술을 활용한 실감형 인터랙티브 콘텐츠의 구현 - (르네마그리트 특별전) AR포토존을 중심으로 (Implementation of Immersive Interactive Content Using Face Recognition Technology - (Exhibition of ReneMagritte) Focused on 'ARPhotoZone')

  • 이은진;성정환
    • 한국게임학회 논문지
    • /
    • 제20권5호
    • /
    • pp.13-20
    • /
    • 2020
  • 딥러닝의 발전에 따른 생체 인식 기술은 새로운 형태의 콘텐츠를 생산해 낼 수 있게 하였다. 특히 얼굴 인식 기술의 경우 편의성·비강제성 면에서 몰입감을 줄 수 있지만, 대부분의 상용 콘텐츠는 어플리케이션 영역에만 그치는 한계성을 가진다. 따라서 본 논문은 이를 극복하여 실시간 비디오 피드를 기반으로 얼굴 인식 기술을 활용할 수 있는 실감형 인터렉티브 콘텐츠를 구현하고자 한다. 고해상도의 그래픽을 위해 Unity 엔진을 사용하여 제작되었고 그 과정에서 얼굴인식 성능 저하와 프레임 드랍(Frame Drop) 현상이 발생하여 추가적으로 Dlib 툴킷을 사용하고, 얼굴인식 이미지의 해상도를 조절함으로 해당 문제를 해결했다.

3-DTIP: 깊이 데이터 기반 3차원 입체 TIP (3-DTIP: 3-D Stereoscopic Tour-Into-Picture Based on Depth Map)

  • 조철용;김제동;정다운;길종인;이광훈;김만배
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2009년도 정보 및 제어 심포지움 논문집
    • /
    • pp.28-30
    • /
    • 2009
  • This paper describes a 3-DTIP(3-D Tour Into Picture) using depth map for a Korean classical painting being composed of persons and landscape. Unlike conventional TIP methods providing 2-D image or video, our proposed TIP can provide users with 3-D stereoscopic contents. Navigating inside a picture provides more realistic and immersive perception. The method firstly makes depth map. Input data consists of foreground object, background image, depth map, foreground mask. Firstly we separate foreground object and background, make each of their depth map. Background is decomposed into polygons and assigned depth value to each vertexes. Then a polygon is decomposed into many triangles. Gouraud shading is used to make a final depth map. Navigating into a picture uses OpenGL library. Our proposed method was tested on "Danopungjun" and "Muyigido" that are famous paintings made in Chosun Dynasty. The stereoscopic video was proved to deliver new 3-D perception better than 2-D video.

  • PDF

Design of Synchronization and T-STD Model for 3DTV Service over Hybrid Networks

  • Yun, Kugjin;Cheong, Won-Sik;Lee, Gwangsoon;Li, Xiaorui;Kim, Kyuheon
    • ETRI Journal
    • /
    • 제38권5호
    • /
    • pp.838-846
    • /
    • 2016
  • The objective of digital broadcasting has evolved from providing a plain video service to offering a realistic visual experience. Technologies such as 3DTV and UHDTV have been suggested to achieve this new objective by providing an immersive and stereoscopic visual experience. However, owing to the high bandwidth requirements of such services, the broadcasting industry has faced a challenge to find a new transport mechanism for overcoming the bandwidth limitation. The standardization organizations, the Advanced Television Systems Committee, Digital Video Broadcasting, and Telecommunications Technology Association, have been working on the integration of broadcasting and a broadband network (IP) to resolve the bandwidth issue of realistic video services. This paper introduces a frame-level timeline synchronization and transport system target decoder model for providing a stable 3DTV service over a hybrid network. The experimental results indicate that the proposed technologies can be successfully adopted as a reference model in a broadcast-broadband hybrid 3DTV service and other IP-associated hybrid broadcasting services.

시선에 따른 영상 음향 정위 일치에 관한 연구 (Study on the Localization Concordance of Video and Audio)

  • 이규원;최해근;박소연;박구만;김성권
    • 한국전자통신학회논문지
    • /
    • 제13권6호
    • /
    • pp.1293-1300
    • /
    • 2018
  • $360^{\circ}$ 영상은 많은 영상정보를 담고 있어 유용하나, 눈에 보이는 물체의 방향과 그 물체의 소리가 들려오는 방향이 다른 경우 시청자에게 피로도를 느끼게 하여 감각적 이질감이 증대되어 그 활용도가 떨어지고 있다. 이에 본 논문에서는 $360^{\circ}$ 영상에서 시선에 따른 음향 정위가 얼마나 일치하는지를 백분율로 나타내는 기준을 제안하며, 제시한 영상 음향 정위 일치율을 이용하여 몰입도를 증대시키는 $360^{\circ}$ 영상의 제작 가능성을 제시한다. 제안한 영상 음향 정위 일치율은, 입체음향 콘텐츠 제작, 재생 솔루션의 정위 성능을 측정, 평가에 유용하고, 더욱 실감성 높은 시스템을 제작하는데 기여할 것으로 기대한다.

음원 데이터를 활용한 3D 애니메이션 카메라 아웃포커싱 표현 연구 (A Study on Sound Synchronized Out-Focusing Techniques for 3D Animation)

  • 이준상;이임건
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권2호
    • /
    • pp.57-65
    • /
    • 2014
  • 3D 애니메이션에서 사운드 효과는 몰입감을 증대시키는 주요한 요인이다. 특히 사운드와 영상 사이의 상호작용은 의미의 전달을 극명하게 만드는 하나의 표현방식으로 영상제작에서 여러 가지 방식으로 응용된다. 사운드와 영상의 상호 작용 중에 아웃포커싱 기법은 실사 영상과 3D 애니메이션에서 많이 사용하는 기법으로 정지된 물체에 역동성을 가미할 수 있는 표현 방법이다. 그러나 실사촬영과는 달리 3D 애니메이션의 경우 뮤직비디오나 폭파 장면등에 아웃포커싱을 구현하는 것은 까다로운 작업이다. 더욱이 음원의 리듬에 동기화된 영상효과를 표현하기 위해서는 키프레임 조작을 수동으로 해야 하므로 매우 번거롭다. 본 연구는 음원데이터를 활용하여 영상과 이상적인 결합을 살펴보고 카메라의 피사계 심도를 음원에 동기화시켜 장면을 아웃포커싱하는 새로운 제작 기법을 제안한다.

VVenC 기반 MPEG MIV 프레임워크 검증 (Verification Test on VVenC based MPEG MIV Framework)

  • 오관정;정준영;이광순;서정일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.67-69
    • /
    • 2021
  • 인공 지능, 사물 인터넷, 클라우드 컴퓨팅, 빅데이터, 모바일을 중심으로 시작된 4차 산업혁명은 최근 메타버스(Metaverse)시대로 자연스럽게 확장되어 가고 있다. 메타버스 시대의 핵심 기술인 VR(Virtual Reality)/AR(Augmented Reality)/MR(Mixed Reality)과 이를 디스플레이 하기 위한 HMD(Head Mounted Display)나 글래스(glass) 장치들은 사용자에게 고품질 영상뿐만 아니라 3차원 공간에 대한 6DoF(Degrees of Freedom)급의 자유도를 제공해야 한다. 이에 발맞춰 MPEG에서는 최근 실사 및 CG(Computer Graphics)로 제작된 다시점 텍스쳐 및 깊이 영상에 대한 효과적인 압축 방법을 찾기 위한 MIV(MPEG Immersive Video) 표준화를 진행중이다. 본 논문은 최신 2차원 압축 표준인 VVC(Verstitle Video Coding)를 기반으로 MPEG MIV 1.0 표준 프레임워크를 검증해본다. 특히 높은 압축율에 비해 복잡도가 높은 VVC 표준의 특성을 고려하여 HHI에서 개발한 최적화 코덱인 VVenC를 이용하여 압축 효율과 복잡도 관점에서 MIV 표준 활용을 위한 최적의 솔루션을 찾고자 한다.

  • PDF

실감형 360도 영상 필터링 성능 평가를 위한 강인성 지표에 관한 연구 (A Study on Robustness Indicators for Performance Evaluation of Immersive 360-degree Video Filtering)

  • 장세영;유인재;이재청;박병찬;김영모;김석윤
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.437-438
    • /
    • 2020
  • 국내 실감형 콘텐츠 시장은 전년도비 42.9%의 연평균 성장률을 보이며 2020년에는 약 5조 7,271억원의 규모에 이를 것으로 전망된다. 특히 2018년 기점으로 하드웨어보다는 콘텐츠 시장이 확대되었다. 최근 실감형 콘텐츠의 유통이 본격적으로 시작됨에 따라 저작권 침해 사례들이 나타나고 있으나 시장의 저변확대 측면에서 그렇게 주목받지 못하고 있다. 실감형 저작물을 제작하는 업체가 주로 소기업이고, 제작하는 비용이 고비용인 점을 고려할 때 저작권 보호 기술인 필터링 기술이 절대적으로 요구되고 있다. 필터링 기술의 성능 평가할 기준인 강인성 지표가 미정립 된 상태이다. 따라서 본 논문에서는 특정 기술에 종속되지 않는 실감형 360도 영상 콘텐츠 강인성 지표를 제안한다.

  • PDF

몰입형 문화유산 현장 교육을 위한 VST-HMD 기반 XR 체험 프레임워크 제안 (A Proposal of VST-HMD based XR Experience Framework for Immersive Cultural Heritage Site Education)

  • 권오양;유정민
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.397-400
    • /
    • 2020
  • 본 논문에서는 문화유산 현장에서의 몰입형 교육을 위한 VST(Video See-through) 방식의 HMD(Head Mounted Display) 기반 XR(eXtended Reality) 체험 프레임워크를 제안한다. 매장문화재적 요소가 강한 문화유산 현장의 경우 실물이 남아있지 않아 교육 및 체험 측면에서 흥미로운 정보 전달이 어렵다. 최근 모바일 기기의 대중적인 확산에 따라 이를 이용해 문화유산 현장에 소실된 문화유산을 AR(Augmented Reality)로 복원 및 시각화하거나 관련 정보를 제공하는 연구들이 이루어졌으며, 나아가 OST(Optical See-through) 방식의 안경형 AR 디스플레이를 활용하는 사례들도 등장했다. 그러나 이러한 연구들은 기기의 특성으로 인해 몰입감과 사용성 측면에서 한계점을 보였으며, 단순히 소실된 문화유산의 복원된 모습을 정적으로 시각화하는 것에 그쳐 문화유산 현장에 내재된 동적인 역사 스토리를 재현한다는 측면에서 부족한 점이 있었다. 본 논문에서는 문화유산 현장에서 VST-HMD를 이용하여 AR 기반의 정적 문화유산 시각화뿐만 아니라 VR(Virtual Reality) 기반의 동적 역사 스토리 애니메이션을 제공하는 XR 체험 프레임워크를 제안하여 더욱 몰입감 있고 만족스러운 문화유산 교육을 제공하는 방안에 대해 검토한다.

  • PDF