Search | Korea Science

Next-generation loudspeaker layout for Ultra High Definition (UHD) Digital TV (초고선명 디지털 TV 를 위한 차세대 라우드스피커 레이아웃)

Lee, Young Woo;Kim, Sunmin
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2011.07a
- /
- pp.57-60
- /
- 2011
본 논문에서는 초고선명 디지털 TV 를 위한 차세대 멀티채널 사운드 시스템의 최적의 라우드스피커 레이아웃을 도출하기 위해 다양한 라우드스피커 배치 환경에서 인지 관점의 오디오 음질 주관평가를 실시하였다. NHK 22.2 채널 시스템, ITU-R BS.775-2 표준의 7.1 채널 시스템과, 실감 음향에 가장 중요한 역할을 하는 Top Layer 라우드스피커에 중점을 두고 다양한 신규 레이아웃 구성들을 비교하였으며, 스튜디오에서 믹싱된 컨텐츠와 B-format 레코딩을 멀티채널로 생성한 컨텐츠를 이용하여 주관 평가를 실시하였다. 주관 평가 결과, Top Layer 에 3 개의 라우드스피커를 가지는 10.2 채널 라우드스피커 레이아웃이 평가에서 사용된 전체적인 오디오 음질의 등급에서 NHK 22.2 채널 시스템과 차이를 인지하기 어렵다는 결과를 도출하였다.
PDF

Digital Watermarking for Multi-view Image using View-point Recovering (시점복원을 이용한 다시점 영상의 디지털 워터마킹)

Kim, Bo-Ra;Seo, Young-Ho;Kim, Dong-Wook
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2013.11a
- /
- pp.138-140
- /
- 2013
본 논문에서는 단일시점의 텍스처 영상과 깊이영상을 수신 측에 전송하여 수신 측에서 원하는 시점을 생성하여 시청하는 2D 또는 3D 시스템을 가정하고, 이에 대한 영상 콘텐츠의 소유권을 주장할 수 있는 디지털 워터마킹 방법을 제안한다. 따라서 이 방법에서는 기존의 영상에 대한 공격 뿐 아니라 시점이동도 공격으로 간주한다. 시점이동 공격에 대해 본 논문에서는 송신된 시점으로 시점을 재변환하여 워터마크 데이터를 추출하는 방법을 사용하며, 여기에는 미리 학습된 자료(NCC(normalized cross-correlation) 값)를 사용한다. 워터마크 데이터를 삽입하는 방법은 기존에 가장 흔히 사용되는 방법, 즉 원 영상의 특정영역을 DCT하여 특정 부대역에 데이터를 삽입하는 방법을 사용한다. 실험을 통하여 시점이동된 영상에서의 워터마크 데이터 추출의 어려움을 보이며, 원시점으로 이동한 경우와 그렇지 않은 경우 추출한 워커마크 데이터의 차이도 보인다.
PDF

RECONSTRUCTING A SUPER-RESOLUTION IMAGE FOR DEPTH-VARYING SCENES

Yokoyamay, Ami;Kubotaz, Akira;Hatoriz, Yoshinori
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2009.01a
- /
- pp.446-449
- /
- 2009
In this paper, we present a novel method for reconstructing a super-resolution image using multi-view low-resolution images captured for depth varying scene without requiring complex analysis such as depth estimation and feature matching. The proposed method is based on the iterative back projection technique that is extended to the 3D volume domain (i.e., space + depth), unlike the conventional superresolution methods that handle only 2D translation among captured images.
PDF

Global lifelog media cloud development and deployment (글로벌 라이프로그 미디어 클라우드 개발 및 구축)

Song, Hyeok;Choe, In-Gyu;Lee, Yeong-Han;Go, Min-Su;O, Jin-Taek;Yu, Ji-Sang
- Broadcasting and Media Magazine
- /
- v.22 no.1
- /
- pp.35-46
- /
- 2017
글로벌 라이프로그 미디어 클라우드 서비스를 위하여 네트워크 기술, 클라우드 기술 멀티미디어 App 기술 및 하이라이팅 엔진 기술이 요구된다. 본 논문에서는 미디어 클라우드 서비스를 위한 개발 기술 및 서비스 기술 개발 결과를 보였다. 하이라이팅 엔진은 표정인식기술, 이미지 분류기술, 주목도 지도 생성기술, 모션 분석기술, 동영상 분석 기술, 얼굴 인식 기술 및 오디오 분석기술 등을 포함하고 있다. 표정인식 기술로는 Alexnet을 최적화하여 Alexnet 대비 1.82% 우수한 인식 성능을 보였으며 처리속도면에서 28배 빠른 결과를 보였다. 행동 인식 기술에 있어서는 기존 2D CNN 및 LSTM에 기반한 인식 방법에 비하여 제안하는 3D CNN 기법이 0.8% 향상된 결과를 보였다. (주)판도라티비는 클라우드 기반 라이프로그 동영상 생성 서비스를 개발하여 현재 테스트 서비스를 진행하고 있다.
PDF KSCI

Deep Neural Network Architecture for Video - based Facial Expression Recognition (동영상 기반 감정인식을 위한 DNN 구조)

Lee, Min Kyu;Choi, Jun Ho;Song, Byung Cheol
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2019.06a
- /
- pp.35-37
- /
- 2019
최근 딥 러닝의 급격한 발전과 함께 얼굴표정인식 기술이 상당한 진보를 이루었다. 그러나 기존 얼굴표정인식 기법들은 제한된 환경에서 취득한 인위적인 동영상에 대해 주로 개발되었기 때문에 실제 wild 한 환경에서 취득한 동영상에 대해 강인하게 동작하지 않을 수 있다. 이런 문제를 해결하기 위해 3D CNN, 2D CNN 그리고 RNN 의 새로운 결합으로 이루어진 Deep neural network 구조를 제안한다. 제안 네트워크는 주어진 동영상으로부터 두 가지 서로 다른 CNN 을 통해서 영상 내 공간적 정보뿐만 아니라 시간적 정보를 담고 있는 특징 벡터를 추출할 수 있다. 그 다음, RNN 이 시간 도메인 학습을 수행할 뿐만 아니라 상기 네트워크들에서 추출된 특징 벡터들을 융합한다. 상기 기술들이 유기적으로 연동하는 제안된 네트워크는 대표적인 wild 한 공인 데이터세트인 AFEW 로 실험한 결과 49.6%의 정확도로 종래 기법 대비 향상된 성능을 보인다.
PDF

Fast Grid-Based Refine Segmentation on V-PCC encoder (V-PCC 부호화기의 그리드 기반 세그먼트 정제 고속화)

Kim, Yura;Kim, Yong-Hwan
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2022.06a
- /
- pp.265-268
- /
- 2022
Video-based Point Cloud Compression(V-PCC) 부호화기의 세그먼트 정제(Refining segmentation) 과정은 3D 세그먼트를 2D 패치 데이터로 효율적으로 변환하기 위한 V-PCC 부호화기의 핵심 파트이지만, 많은 연산량을 필요로 하는 모듈이다. 때문에 이미 TMC2 에 Fast Grid-based refine segmentation 과정이 구현되어 있으나, 아직도 세그먼트 정제 기술의 연산량은 매우 높은 편이다. 본 논문에서는 현재 TMC2 에 구현되어 있는 Fast Gridbased Refine Segmentation 을 살펴보고, 복셀(Voxel) 타입에 따른 특성에 맞춰 두 가지 조건을 추가하는 고속화 알고리즘을 제안한다. 실험 결과 압축성능(BD-BR)은 TMC2 와 거의 차이를 보이지 않았지만, 모듈 단위 평균 10% 연산량이 절감되는 것을 확인하였다.
PDF

3-D Model-Based Tracking for Mobile Augmented Reality (모바일 증강현실을 위한 3차원 모델기반 카메라 추적)

Park, Jungsik;Seo, Byung-Kuk;Park, Jong-Il
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2011.07a
- /
- pp.65-68
- /
- 2011
본 논문에서는 모바일 증강현실을 실현하기 위한 3차원 모델기반 카메라 추적 기술을 제안한다. 3차원 모델기반 추적 기술은 평면적이지 않은 객체에 적용 가능하며, 특히 텍스처가 없는 환경에서 유용하다. 제안하는 방식은 대상 객체의 3차원 모델정보로부터 영상에서 추출한 에지와의 대응점을 찾고, 대응점의 거리를 최소화하는 카메라 움직임을 추정함으로써 이전 카메라 포즈(위치 및 방향)로부터 현재 포즈가 추적되는 방식이다. 안드로이드 플랫폼의 스마트폰 상에서 제안된 방식으로 카메라 포즈를 추적하고 3차원 가상 콘텐츠를 증강시켜 봄으로써 그 유용성을 확인한다.
PDF

3D Human Body Modeling on Smartphone (스마트폰에서의 3 차원 인체 모델링)

Han, Ji Soo;Park, In Kyu
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2019.06a
- /
- pp.135-136
- /
- 2019
본 논문에서는 스마트폰을 이용한 3 차원 인체 복원 시스템을 제안한다. 모바일에서의 인체 복원은 디바이스상의 한계로 인해 기기와 서버 간에 인체 모델링 과정을 분할하여 처리한다. 분할된 인체모델링 과정은 복원 과정과 출력 과정으로 나뉘게 되며 안드로이드 기반의 스마트폰을 사용하여 취득한 영상을 서버로 전송하고 3 차원 인체 복원을 수행하게 된다. 3 차원 복원 알고리즘은 인체 변형 모델을 기반으로 3 차원 모델로부터 2 차원 영상으로의 투영을 통해 최적의 자세 및 체형 매개변수를 추정하고 복원된 결과는 모바일로 전송되어 복원된 모델링 결과를 출력한다.
PDF

3D stereoscopic representation of title in broadcasting, the distance standardize for the study of parallax (입체영상 방송텍스트에서 입체감을 위한 패럴렉스 데이터 표준화에 관한 연구)

Oh, Moon Seok;Lee, Yun Sang
- Journal of Korea Society of Digital Industry and Information Management
- /
- v.7 no.4
- /
- pp.111-118
- /
- 2011
Recent advances in the media have no special change is the development of the 3D stereoscopic image, which started in the movie is coming over now to the broadcast. Confusing variety having, in the production of 3D images that are waiting for the standardized production. 3D images of them being used in broadcast subtitles, first because there is no standardized production systems, making it look is dedicated to the time and effort. This research necessary to create 3D images of these subtitles, titles, text-based objects, such as Rig imaging using a standardized way to synthesize the most stable is proposed. First, with captions or titles, and the readability and understanding of the uniqueness to the human eye to create an environment that is kind of crowd. Because of this, excessive camera Ferrell Rex (gap) created a branch bunch of snow, work should not hurt readability. 100 adult men and women throughout the experiment.
https://doi.org/10.17662/ksdim.2011.7.4.111 인용 PDF KSCI

The Personalized(targing) Service of HD Broadcasting and 3D Mesh Contents using RMPI (Personalized(targeting) 맞춤형 방송 및 3차원 Mesh Data 컨텐츠 서비스)

Jung, Joing-Jin;Lim, Tae-Bum;Lee, Suk-Pil
- Proceedings of the KIEE Conference
- /
- 2004.11c
- /
- pp.304-306
- /
- 2004
With the developing of current multimedia broadcasting, user will be provided for lots of various content through the various channel and media. Content provider and consumer want the various service using content with the better quality which is fit to users' preference. For transmitting this content in the limited transmission channel capacity, it needs to transmit the highly compressed content. The content of 3D mesh model-based on MPEG-4 enables the various content service that provides the lower size and the resonable quality, and Personalize(Targeting) service just provide the contents that user more wants and likes. This paper presents the study on the targeting service using compression of 3D mesh model-based on MPEG-4 and the adaptation of Embedded Graphic application program using it.
PDF

Search Result 1,332, Processing Time 0.028 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)