• Title/Summary/Keyword: Video-conference

Search Result 2,926, Processing Time 0.028 seconds

Phase-only Hologram Video Compression Method Using Deep Learning-Based Restoration Network (딥러닝 기반의 복원 네트워크을 사용한 위상 홀로그램 비디오 압축 방법)

  • Kim, Woosuk;Kang, Ji-Won;Oh, Kwan-Jung;Kim, Jin-Woong;Kim, Dong-Wook;Seo, Young-Ho
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.93-94
    • /
    • 2021
  • 본 연구는 딥러닝 기반의 복원 모델을 사용하여, 비디오 압축을 통해 변질된 위상 홀로그램의 화질을 복원하는 방법을 제안한다. 압축 효율을 위해 위상 홀로그램의 해상도를 감소시킨 후 압축한다. 원래의 해상도로 되돌린 홀로그램을 딥러닝 모델을 사용하여 복원한다. 복원된 위상 홀로그램은 원본 홀로그램을 압축한 것보다 동일한 BPP에서 더 높은 PSNR을 보인다.

  • PDF

Wide-baseline LightField Synthesis from monocular video (단안비디오로부터 광폭 베이스라인을 갖는 라이트필드 합성기법)

  • Baek, Hyungsun;Park, In Kyu
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.95-96
    • /
    • 2021
  • 본 논문에서는 단안비디오 입력으로부터 각 SAI(sub-aperture image)간의 넓은 기준선을 갖는 라이트필드 합성기법을 제안한다. 기존의 라이트필드 영상은 취득의 어려움에 의해 규모가 작고 특정 물체위주로 구성되어 있어 컴퓨터 비전 및 그래픽스 분야의 최신 딥러닝 기법들을 라이트필드 분야에 적용하기 어렵다는 문제를 갖고 있다. 이러한 문제점들을 해결하기 위해 사실적 렌더링 기반의 가상환경상에서 실제환경과 유사함을 갖는 데이터를 취득하였다. 생성한 데이터셋을 이용하여 기존의 새로운 시점을 생성하는 기법 중 하나인 다중 평면 영상(Multi Plane Image) 기반 합성기법을 통해 라이트필드 영상을 합성한다. 제안하는 네트워크는 단안비디오의 연속된 두개의 프레임으로부터 MPI 추정하는 네트워크와 입력영상의 깊이 정보를 추정하는 네트워크로 구성되어 있다.

  • PDF

Implementation of a stereoscopic video web platform through A-Frame-based HMD devices (A-Frame 기반의 HMD 기기를 통한 stereoscopic 비디오 웹 플랫폼 구현)

  • Kim, Jiwon;Jeon, Soohyun;Kim, Dongho
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.253-255
    • /
    • 2021
  • 근래에 메타버스가 크게 주목을 받으면서 VR 영상의 퀄리티가 중요해졌다. VR 실사 영상의 경우 HMD 로 시청할 때 모노 및 스테레오 환경으로 입체감을 느끼게 한다. 하지만 스테레오스코픽 비디오의 경우 제작자가 스테레오스코픽으로 촬영하지 않으면 제공하기 어렵다는 단점이 있다. 본 논문에서는 이를 해결하기 위해 RVS 를 Client 단에서 활용하여 제공하는 방식을 고려, 모든 장치에서 스테레오스코픽을 시청할 수 있는 웹 플랫폼을 aframe 프레임워크를 사용하여 제작하고, PC HMD 등 HMD 에서 웹 플랫폼 접근 시 생기는 제한을 해결하는 방법도 같이 서술한다.

  • PDF

Intra Prediction Using Multiple Models Based on Fully Connected Layer (완전연결계층 기반의 다중 모델을 이용한 화면내 예측)

  • Kim, Minjae;Moon, Gihwa;Park, Dohyeon;Kwon, Hyoungjin;Kim, Jae-Gon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.355-356
    • /
    • 2021
  • 딥러닝 기술과 하드웨어의 발전으로 다양한 분야에서 인공신경망과 관련한 연구가 활발히 진행되고 있다. 비디오 코덱 부분에서도 딥러닝 기술을 적용하는 부호화 기술이 많이 연구되고 있다. 본 논문은 최근 완료된 VVC 에 채택된 신경망 기반의 기술인 MIP(Matrix Weighted Intra Prediction)를 확장하여 보다 깊은 계층의 모델로 학습된 새로운 화면내 예측 모델을 제안한다. 기존 VVC 의 MIP 의 성능과 비교하기 위하여 기존 MIP 모델과 제안하는 다중완전연결계층(Fully Connected Layer) 화면내 예측 모델을 HEVC(High Efficiency Video Coding)에 적용하여 그 성능을 비교하였다. 실험결과 제안기법은 VVC MIP 대비 0.08 BD-rate 성능 향상을 보였다.

  • PDF

Improved CCLM by Considering Neighboring Pixel Information (주변 화소 정보를 추가로 고려한 CCLM 의 예측 성능 향상 방법)

  • Lee, Jeehwan;Kim, Bumyoon;Jeon, Byeungwoo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.357-358
    • /
    • 2021
  • 본 논문에서는 VVC(Versatile Video Coding)의 색차 채널을 위한 화면 내 예측 모드 중 하나인 CCLM (Cross-Component Linear Model) 모드의 부호화 성능을 향상시킬 수 있는 방법을 제안하였다. 기존의 CCLM 모드는 예측과정에서 대응 휘도 영역의 화소로만 색차 블록의 예측자를 생성하기 때문에 현재 색차 블록과 그 주변의 참조 화소와의 연관성을 고려하지 않는 문제점이 있다. 본 논문에서는 참조 화소를 사용하는 예측 모드를 유도하여 예측자를 생성한 후 기존 CCLM 을 통해 생성된 예측자와 가중 결합하는 방법을 제안함으로써 문제점을 극복하고 부호화 성능의 향상을 가져오고자 한다. 실험 결과 제안 방법은 기존 VVC 방법 대비 BDBR 측면에서 Y(0.10%), Cb(-0.22%), Cr(-0.22%)의 결과를 얻을 수 있었다.

  • PDF

Analysis for the Number of Luma Blocks Corresponding to DM Chroma Block (DM 모드로 부호화된 색차블록에 대응하는 휘도 블록의 개수에 대한 분석)

  • Lee, Yujin;Kim, Bumyoon;Jeon, Byeungwoo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.359-360
    • /
    • 2021
  • 본 논문에서는 차세대 비디오 부호화 기술인 VVC (Versatile Video Coding)의 색차 성분 화면 내 예측 기술인 DM (Derived Mode) 가 분할 구조가 이중 트리일 때 색차 블록에 대응하는 휘도 블록을 선택하는 기존 방식의 효율성을 분석하기 위해 색차 블록에 대응하는 휘도 영역 내 휘도 블록의 개수를 측정하였다. 실험 결과, 하나의 색차 블록에 대응하는 휘도 영역 내에 평균적으로 4.408 개의 휘도 블록이 존재함을 확인하였다. 따라서 DM 을 통한 부호화 시 대응하는 휘도 영역 내 복수개의 휘도 블록을 고려하여, 유도되는 최적의 예측 모드를 잘 선정하는 방법에 대한 연구가 필요하다.

  • PDF

Content Aware Patch Level Geometry Scaling for TMIV (TMIV 를 위한 콘텐츠 적응형 패치 레벨 기하정보 스케일링)

  • Kakli, Muhammad Umer;Jeong, Jun Young;Lee, Gwangsoon;Seo, Jeongil
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.73-74
    • /
    • 2021
  • This paper presents a scheme to downscale the patches in geometry atlas based upon its contents for MPEG Immersive Video (MIV). In proposed scheme, the geometric contents of a patch is analyzed across the intra period, and a decision is made, whether to downscale a patch or not. The patches containing homogeneous information is downscaled by half, while the patches having salient information about the object such as edges are retained. Experimental results show that the bitrate saving is achieved by incorporating the patch level downscaling.

  • PDF

Drawing of Aesthetic Mesure in User Video (사용자 영상에서 미도값의 추출)

  • Shin, Seong-Yoon;Kang, Oh-Hyung;Kim, Hyung-Jin;Jang, Dai-Hyun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.340-341
    • /
    • 2021
  • In this paper, Aesthetic Measure measurements were performed on user images. Aesthetic Measure refers to the sensibility that our sensory organs are stimulated from outside to produce sensations or perceptions. Using this Aesthetic Measure, the problem of color harmony and disharmony treated as emotion was calculated numerically.

  • PDF

A Study on the Core Fun Factors and Activation of ARG Game (ARG 게임의 핵심 재미 요소와 활성화에 관한 연구)

  • Chang, Hae-Jung;Kim, Hyo-Nam
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.01a
    • /
    • pp.61-64
    • /
    • 2021
  • 최근에 들어서 VR, AR 등 '현실'을 기반으로 하는 장르가 주목을 받고 있다. 그 중에서도 ARG 장르가 존재하는데, 우리가 살고 있는 현실 세계에서 가상의 이야기들을 마치 실존하는 것처럼 꾸며 놓고 관객 혹은 플레이어들이 스스로 단서를 찾아 스토리의 끝을 매듭짓는 것이 목표인 장르이다. ARG 장르는 그 자체가 게임이 될 수 있고, 메인 게임 장르의 세부적인 요인으로 작용할 수도 있는 매력적인 장르이다. 본 논문에서는 ARG 게임에 대한 세부적인 분석과 인식 조사를 진행하여, 그 결과를 바탕으로 해당 장르를 보편화 시킬 수 있는 방법을 제시한다.

  • PDF

Comparison of Deep Learning Loss Function Performance for Medical Video Biomarker Extraction (의료 영상 바이오마커 추출을 위한 딥러닝 손실함수 성능 비교)

  • Seo, Jin-beom;Cho, Young-bok
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.72-74
    • /
    • 2021
  • The deep learning process currently utilized in various fields consists of data preparation, data preprocessing, model generation, model learning, and model evaluation. In the process of model learning, the loss function compares the value of the model with the actual value and outputs the difference. In this paper, we analyze various loss functions used in the deep learning model for biomarker extraction, which measure the degree of loss of neural network output values, and try to find the best loss function through experiments.

  • PDF