Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)
The Korean Institute of Broadcast and Media Engineers
- Semi Annual
Domain
- Media/Communication/Library&Information > Media/Consumers
2015.11a
-
In this paper, we propose a sparse signal reconstruction method referred to as the matching pursuit with a pruning-based tree search (PTS-MP). Two key ingredients of PTS-MP are the pre-selection to put a restriction on columns of the sensing matrix to be investigated and the tree pruning to eliminate unpromising paths from the search tree. In our simulations, we confirm that PTS-MP is effective in recovering sparse signals and outperforms conventional sparse recovery algorithms.
-
In this paper, we propose a matrix completion algorithm for Internet of Things (IoT) localization. The proposed algorithm recovers the Gram matrix of sensors by performing optimization over the Riemannian manifold of fixed-rank positive semidefinite matrices. We compute and show the closed forms of all the differentially geometric components required for applying nonlinear conjugate gradients combined with Armijo line search method. The numerical experiments show that the performance of the proposed algorithm in solving IoT localization is outstanding compared with the state-of-the-art matrix completion algorithms both in noise and noiseless scenarios.
-
최근 2D 와 3D 콘텐츠의 급격한 수요 증가로 인하여 2D 와 3D 공간에서 사람이 인지하는 물체의 시각적 정보량을 정량화할 필요성이 대두되었다. 본 논문에서는 정보이론에 기초하여 엔트로피 관점에서 2D 와 3D 영상의 시각적 정보량을 측정하는 방법을 제시한다. 시각적 정보량을 측정할 때, 기존의 연구에서는 고려되지 않았던 집중영역(saliency), 시각세포의 불균형으로 인한 주변영역 흐림현상인 포비에이션(foveation), 양안합성(binocular fusion)등 인간의 시각적 특성을 반영하였다는 점에서 기존의 연구들과 차이를 둔다. 2D 콘텐츠의 시각적 엔트로피는 단안시에 근거한 질감(texture) 엔트로피와 깊이 엔트로피로 구성되어 있다. 그리고 3D 콘텐츠의 시각적 엔트로피는 2D 에서의 시각적 엔트로피와 양안시에 의한 깊이 엔트로피를 포함한다. 본 논문의 시각적 엔트로피는 2D 와 3D 영상의 시각적 피로도를 측정할 때 사용될 수 있다.
-
본 논문에서는 다중 입출력 안테나 OFDM 통신시스템에서 신뢰할 만한 데이터 신호 사용하는 한 연판정 지향 채널 추정 기법을 제안한다. 기존 방식에서는 주어진 기준 신호만을 이용하여 채널을 추정하는 반면에 제안하는 기법은 기준 신호를 포함하여 신뢰할 만한 데이터 신호를 동시에 사용하여 채널을 추정한다. 모의실험을 통해 제안하는 기법이 기존 채널 추정에 비해 성능이 우수함을 확인할 수 있다.
-
본 논문에서는 하나의 중계기가 하나의 송신기로부터 신호를 받아 증폭한 후에 수신기로 재전송하는 방식으로 송신기와 수신기 사이의 통신을 돕는 네트워크를 고려하였다. 중계기가 독자적인 에너지원이 없는 경우 일정한 양을 에너지를 확보하여 중계에 사용하기 위해서 송신기로부터의 신호를 에너지로 하베스팅하는 모델을 생각하였다. 또한, 나아가 현재의 다양한 무선통신 네트워크에서 사용중인 적응변조를 적용하여 항상 일정이상의 비트오율을 만족할 수 있는 더욱 현실적인 모델이 되도록 하였다. 이러한 모델에서 정해진 만큼의 시간을 하베스팅에 사용했을 경우 처리율을 구하였으며, 나아가 그 시간을 최적화하여 유도한 처리율을 최대화하는 문제를 만들었다.
-
본 논문에서는 실내 환경 중 TV 시청환경에서 마이크로폰 어레이를 이용하여 다양한 다중 음원 방향을 추정하는 기법을 제안한다. 제안된 기법은 기존의 하나의 음원에 특화되어 있는 GCC-PHAT 기반의 방법을 GCC-PHAT 버퍼와 NMF를 도입하여 다중음원의 방향 추정을 가능하게 만들었다. 제안된 기법의 성능을 평가하기 위해서 실 거주 환경에서 발생하는 소음원과 TV 소리 방향 추정 결과에 대한 실측치와 추정치 간의 오차인 절대 평균오차를 측정하였으며, 실험 결과 제안한 기법이 기존의 방법인 GCC-PHAT보다 우수한 추정 성능을 보임을 확인하였다.
-
본 논문은 마그네틱 센서 기반의 오브젝트 추적 기술을 이용한 혼합현실 선거 방송 시스템을 제안한다. 마커 기반의 증강현실 기술은 방송환경에서는 강한 조명으로 인하여 마커의 특징점 추출의 간섭 및 소실로 추적이 끊기는 문제가 있다. 특히, 선거방송와 같은 생방송 중에 그래픽이 튀거나 사라지는 것은 방송 사고와 다름없다. 따라서, 우리는 조명이나 가림의 영향 없이 추적 성능을 강인하게 하기 위해서, 무선의 마그네틱 센서를 내장한 별도로 제작한 투표함 모형을 추적하도록 하였다. 본 논문에서는 마그네틱 센서를 내장한 실물 투표함을 실시간으로 추적하게 하고, 그 정보를 증강현실 방송 시스템과 통합한 시스템 구성 및 그것을 이용한 증강현실 선거 방송 어플리케이션을 보여준다. 그 결과, 연기자가 선거정보그래픽과 연동하는 투표함을 자유롭고 직관적으로 움직일 수 있었으며, 자연스러운 증강현실 합성 결과를 얻을 수 있었다.
-
현재 UHDTV (Ultra-High-Definition TV) 시대에 사용될 멀티미디어 부호화로 MPEG-H를 표준화로 진행하고 있다. 향후 방송용 오디오 콘텐츠는 채널 오디오 콘텐츠에서 진화하여 객체 오디오 콘텐츠까지도 필요하게 된다. 이에 따라, 본 논문에서는 고품질의 방송용 오디오 콘텐츠를 제작하기 위한 비균등 선형 마이크로폰 어레이 기반의 음원분리 방법을 제안한다. 제안된 방법은 주어진 어레이 배치에 따라 채널간의 시간차를 분석하고, 이에 따른 객체 오디오 생성을 위한 음원분리 기술을 적용한다. 제안된 기법의 성능을 검증하기 위하여 음원분리도를 측정하였고, MVDR (Minimum Variance Distortionless Response) 빔형성기와 성능을 비교하였다. 비교 결과, 제안된 기법이 MVDR 빔형성기에 비하여 12.8% 높은 음원분리도 수치를 나타낸 것을 확인하였다.
-
최근 디지털 방송의 새로운 서비스에 대한 소비자의 기대와 무선 통신 및 영상 압축 기술의 발전으로 인해 차세대 방송 기술에 대한 관심이 고조되고 있다. 미국 방송 표준화 기구인 ATSC에서는 차세대 국제 방송 표준을 위해 ATSC 3.0을 시작하였고, 고정 방송 및 이동 방송의 동시 서비스 제공을 목표로 하고 있다. TDM을 사용하여 두 방송 서비스를 제공하는 경우 ATSC 3.0 융합형 3DTV 서비스를 제공할 수 있으며, 모바일 방송의 파일럿 심볼을 이용한 채널 추정이 가능하므로 고정 방송만을 제공하는 경우보다 채널 등화 성능 측면에서 더 유리하다. 이에 본 논문에서는 ATSC 3.0 융합형 3DTV를 위한 채널 등화 시뮬레이터를 설계 및 구현하여 고정 방송 환경과 성능을 비교한다.
-
본 논문은 ATSC2.0 기반 8-VSB/MH 융합형 3DTV (A/104 Part 5 Service Compatible 3DTV using Main and Mobile Hybrid Delivery) 방식 수신모듈개발에 대한 내용을 기술한다. ATSC A/104 Part 5 SC-MMH 3DTV 방식은 2014. 8 월 미국의 지상파 DTV 표준화 논의단체인 ATSC 에서는 고정 HD 서비스를 위한 8-VSB 채널과, In-band 모바일 TV 서비스를 위한 ATSC M/H 채널을 이용하여, 주파수 효율을 극대화한 새로운 방식의 고정/이동 TV 융합형 3DTV 방식을 ATSC 3DTV Standard 로 채택되었으며, 2015 년말까지 좌/우영상의 화질차이 극복을 위한 화질개선안(Video Enhancement Information) 역시 ATSC 국제표준채택이 유력하다. 본 논문에서는 이와 같은 8-VSB/MH 융합형 수신기 개발에 필수적으로 필요한 8-VSB/MH 융합형 수신모듈 구현에 대한 내용을 기술한다.
-
기상이변으로 인하여 많은 재난이 발생하고 있지만 신속하게 재난발생 전후 상황을 전달받지 못하는 재난방송 음영지역이 많이 존재하고 있다. 본 연구는 대다수의 국민이 휴대하고 있는 DMB 수신기를 통해 재난정보를 수신할 수 있는 효율적인 전달매체로 소출력 국지적DMB재난방송을 활용하는 것에 대하여 연구하였다. 기존에 국민안전처 재난상황실에서 운영하고 있는 DMB재난방송시스템은 KBS 방송국등 지상파 DMB를 통하여 EWS 재난메시지를 송출하는 방식으로 운영하고 있지만 EWS 재난메시지를 수신할 수 있는 수신기는 극소수에 불과하여 실효성이 없는 상태로 일반 국민들을 대상으로 재난정보를 신속하게 전달할 수 있는 매체가 필요한 상태이며 재난상황과 재난 대피 방법등을 지역맞춤형 재난정보를 전달함으로 재난에 대한 국민의 신뢰도를 높이고 저비용으로 구축할 수 있는 소출력 국지적DMB재난방송의 활용방안을 연구하였다.
-
The U.S. music market is a lucrative market for many foreign musicians due to its sheer size and it continues to play a leading role in the world music industry. However, it is a challenge to gain entry into that market and an even greater challenge to achieve success and fame within it. In fact, changes in the media paradigm have allowed for musicians to be able to independently produce their own songs and promote them globally. Some scholars address that the media paradigm shifting from traditional outlets to new outlets gives a chance to bypass traditional gatekeepers when entering the U.S. music market. Based on this scenario, this article examined two songs from Korean singer, Psy: Gangnam Style and Gentleman as a single case study. Utilizing Google Trends as a source of information, this study examined how each song's recognition among American music fans was different based on radio spins on Top 40 commercial radio stations. This article sheds new light on radio, which has been neglected due to the media paradigm shift, and presents how radio programmers are part of a complicated gatekeeping process which ultimately decides which songs are to gain popularity.
-
OFDM 변조방식의 특징 중 하나가 SFN(Single Frequency Network) 기능이다. 최근 지상파 UHDTV방송을 기대하면서 OFDM 변조방식의 SFN기능을 이용한 가정 내 무선수신 환경에 대한 관심이 높아지고 있다. 그러나 SFN기능이 가능할지라도 송 중계기와 갭 필러 측면에서 보면 프로그램을 전달하는 별도의 백본망 없이 수신과 송신이 동일한 주파수로 이루어지려면 송신된 전파가 다시 자기 안테나로 수신되는 Feedback현상에 대해 좀 더 많은 연구가 요구되고 있다. 본 연구에서는 현재 가정과 사무실 등에서 사용하고 있는 저가의 가정용 T-DMB 갭 필러를 이용한 수신실태와 Feedback 현상에 대해 몇 가지 실험을 실행해 보았다. 가정용 갭 필러의 Feedback현상과 사용 형태를 분석함으로써 향후 UHDTV방송의 원활한 SFN망 구축과 가정 내 무선 수신환경 구축을 위한 방안을 제시하고자 한다.
-
방송망의 효율적인 관리 및 운영을 위해 다양한 측정 및 모니터링 방법이 제안되고 있다. 특히 디지털 방송신호의 특징상 송신 장비의 열화가 진행되더라도 수신 장비의 채널 복호 및 오류정정, 다양한 형태의 페이딩(fading) 간섭으로 인해 이를 정확히 파악하기 어렵다. 또한 운영 인력의 축소, 관리 대상 매체의 증가 등 방송사의 인력관리의 문제등도 감안할 때, 다양한 매체의 종합적인 품질 관리를 위해서는 집약적이고 시간 지속적인 측정방법의 도입이 필요하다. 본 논문은 이러한 다매체 다채널 방송 환경에서 효율적인 측정 및 모니터링을 위해 집적화된 형태의 방송 모니터링 시스템의 구현 방법을 제안한다. 제안하는 시스템은 다양한 매체의 튜너를 하나의 제어기에 연결하고 이를 스케줄링 기법에 의해 순차적으로 측정한 후 방송 품질의 핵심 파라미터 측정결과를 네트워크를 통해 원격 서버로 전송한다. 이를 통해 단기 및 장기모니터링을 실시할 수 있으며, 일간, 월간, 연간 신호의 변화를 종합적으로 측정 및 모니터링 할 수 있어 시간 및 계절에 따른 신호 품질의 변화 및 순간적인 방송 신호의 변화 등을 감지할 수 있는 새로운 형태의 방송 품질 모니터링 시스템이다.
-
본 논문에서는 다수 1 차 사용자가 다수 존재하고 2 차 사용자들이 다중 홉 통신을 하는 스펙트럼 공유 방식 무선 인지 네트워크를 분석한다. 다수의 1 차 사용자로부터의 간섭신호를 고려하여 각 2 차 사용자에서의 수신 신호대간섭잡음비를 분석하고 이를 바탕으로 2 차 사용자 네트워크의 불능확률을 구한다. 모의실험을 통해 1 차 사용자의 수가 감소함에 따라 불능확률이 감소한다는 것을 확인하였다.
-
LTE-Advanced system has been deployed with 2 and 4 transmission antennas (Tx) while the specification supports up to 8Tx. Due to deployment space, antenna dimension and complexity, the needs of deploying 8Tx system has not been motivated by operators. Recently, three dimensional (3D) beamforming with active antenna has attracted significant attention in the wireless industry. By incorporating 2D active array into LTE-A systems, the system offers freedom in controlling radiation on elevation and horizontal dimension. When the number of antennas increases in the form of 2D arrangement, spatial separation can be realized simultaneously in horizontal and elevation domain and vertical beam-steering can increase SINR of UEs in high floors. In this paper, we study the system operations and implementations for supporting 3D beamforming with 8Tx antennas. In our schemes, by reusing the conventional CSI feedback framework, the system can operate 2D active array without harming the backward compatibility. Evaluation results show that 3D beamforming provides capacity boosting over the conventional 2D beamforming systems while keeping same antenna structure.
-
사람 검출 시스템은 카메라의 위치 및 각도 등에 큰 영향을 받는다. 이로 인해 획득한 2D 영상에서 사람은 위치에 따라 각기 다른 크기를 갖는 형태로 나타난다. 이러한 요인들은 사람 검출 시스템의 실시간 구현을 어렵게 만드는 요인이 된다. 본 논문에서는 실내 공간의 구조를 깊이맵으로 구성하여, 이로부터 3D 공간을 구성한다. 3D 공간에서는 어느 위치에서든지 사람의 크기가 일관되므로 이를 2D 영상으로 투영하게 되면 2D 영상의 좌표에 따른 정확한 사람의 크기를 추정할 수 있다. 실험 결과로부터 제안 방법의 타당성을 입증하였다.
-
PDF는 미국 어도비 시스템즈(Adobe Systems) 사에서 만든 전자 문서 파일 포맷이다. PDF에는 일반 문서 및 문자, 도형 그림, 글꼴 등을 포함할 수 있으며, 동일한 문서를 컴퓨터 운영체제와 관계없이 모니터, 프린터 등의 출력 장치로 같은 모습으로 출력하기 위한 목적으로 개발되었다. 현재 거의 모든 운영체제에서 PDF 문서를 읽거나 인쇄할 수 있으며, 온라인 및 오프라인 환경에서도 쉽게 PDF 문서를 공유할 수 있으며, 보안성이 높아 공공기관, 연구소 등에서 자료를 배포할 때 많이 사용되고 있다. XML은 사람이 쉽게 읽을 수 있고 컴퓨터와 같은 기계가 쉽게 판독할 수 있는 형식으로 부호화된 문서를 작성하기 위한 일련의 규칙을 정의하는 데 사용하는 마크업 언어로서 W3C에서 정의하였다. 현재 XML은 인터넷 상에서 데이터를 표현 하거나 교환, 저장, 검색할 때 가장 널리 쓰이고 있다. 본 논문에서는 PDF 문서를 인터넷 상에서 쉽게 활용하도록 도와주며, XML 데이터 처리가 가능한 응용 프로그램에서 PDF 문서를 활용할 때 쉽게 사용할 수 있도록 도와주는 PDF-to-XML 변환 소프트웨어를 구현하였다.
-
In this paper, we propose an efficient sparse signal recovery algorithm referred to as the matching pursuit with a tree pruning (TMP). Two key ingredients of TMP are the pre-selection to put a restriction on columns of the sensing matrix to be investigated and the tree pruning to eliminate unpromising paths from the search tree. In our analysis, we show that the sparse signal is accurately reconstructed when the sensing matrix satisfies the restricted isometry property. In our simulations, we confirm that TMP is effective in recovering sparse signals and outperforms conventional sparse recovery algorithms.
-
In this paper, we propose a method pursuing robustness in ad hoc network system when the CSI of interferers is unavailable. The non-parametric linear minimum mean square error filter is exploited to achieve large fraction of the MMSE filter transmission capacity employing the perfect covariance matrix information. From the numerical results, we show that the proposed scheme brings substantial transmission capacity gain over conventional MMSE filter using sample covariance matrix.
-
본 논문에서는 스테레오 오디오 신호를 이용하여 음원을 분리하는 ADRess 알고리즘을 기반으로, 추정된 음원 방위각에 대한 신호 강도비를 이용하여 분리음원을 생성하는 새로운 분리음원 합성 기법을 제안한다. 입력된 스테레오 채널 신호 간 강도 차(IID) 특성을 이용하여 신호 분석 프레임별로 개선된 신호 강도비 함수에 따른 frequency-azimuth 평면을 구성하고, 이를 통해 추정된 방위각에 상응하는 신호 강도비로 표현되는 확률밀도함수를 좌/우 신호 중 하나의 주 입력 신호에 취함으로써 분리음원을 합성한다. 제안된 기법의 성능을 검증하기 위하여 SASSEC 에서 제공하는 테스트 음원 및 객관적 평가 지표를 이용하여 측정한 결과, 기존 ADRess 알고리즘에서 제시된 방법에 비해 개선된 품질의 분리음원을 합성하는 것으로 평가되었다.
-
아날로그방송이 디지털방송으로 전환되면서 방송 프로그램 음량의 다이나믹 영역이 더욱 증대되었고, 이로 인해 시청 중 한 채널 내에서 프로그램 전환 시 혹은 시청 채널을 다 채널로 전환 할 경우, 프로그램 간 혹은 채널 간의 오디오 레벨의 불균형으로 인해 편안한 시청이 방해 받을 여지가 커지게 되었다. 이런 문제를 해결하기 위해 ITU 에서는 디지털방송 음량 기준을 제정하였으며, 미국, 유럽, 일본 등 외국을 비롯하여 한국도 디지털방송음량 기술기준 및 표준을 제정하였으며, 본격적인 적용을 앞두고 있다. 본 연구에서는 지상파 및 유료방송의 채널들을 대상으로 현재 서비스되고 있는 방송음량을 측정하고 국제, 국내 기준과의 차이 등을 비교분석하여 기술기준 적용 필요성 등을 제시하고자 한다.
-
3차원 영상을 생성하기 위해 스테레오 매칭을 통해 깊이 정보를 획득한다. 이때 발생하는 경계영역과 텍스처가 부족한 부분의 깊이정보 부정확성 문제를 해결하기 위해 영상 분할 기반 스테레오 매칭 방법을 제안한다. 일반적으로 사용하는 윈도우 기반 스테레오 매칭 결과를 기반으로 분할된 영상 내에서 최적의 변위 값을 재 할당함으로서 깊이정보의 정확성을 향상시킬 수 있다. Mean-shift는 참조 영상에서 화소 간 평균값 차이가 최대가 되는 영역들을 반복적으로 찾는다. 유사한 평균값을 갖는 영역들을 기반으로 영상을 분할하는 것을 Mean-shift를 이용한 영상분할 이라고 한다. 분할된 영상은 각 영역을 대표하는 패치 구조를 가지고 있어 참조 영상에 포함되어있는 잡음에 강인한 특성을 지닌다. 스테레오 매칭을 통해 화소별로 변위 값을 할당해주는 대신, 분할된 영상을 이용하여 각 분할 영역에 동일한 변위 값을 할당한다. 분할된 영상에 동일한 변위 정보를 할당할 경우 객체와 배경의 경계영역에서 잘못된 변위 값이 할당되는 경우가 발생한다. 이러한 경계 영역의 변위정보 부정확성을 보완하기 위해 화소의 기울기 항을 비용 값 계산 과정에 추가하여 단점을 보완한다. 최종 비용 값 계산을 통해 획득한 초기 변위 지도에 중간 값 필터를 적용하여 분류된 영역에 동일한 변위 값을 할당한다. 제안한 방법을 적용하여 경계영역의 정확도가 향상된 최종 변위 지도를 획득한다.
-
최근 깊이 영상 기반 렌더링 방법을 이용하여 제작된 3차원 컨텐츠가 우리의 눈을 즐겁게 해주고 있다. 이러한 깊이 영상 기반 렌더링에서는 필연적으로 색상 카메라와 깊이 카메라 간의 시점 차이가 발생한다. 따라서 두 시점을 일치시키는 전처리 과정으로서 카메라 파라미터가 중요한 역할을 수행한다. 카메라 파라미터를 획득하는 과정으로 카메라 캘리브레이션이 수행된다. 널리 사용되는 기존의 카메라 캘리브레이션 방법은 평면의 체스보드 패턴을 여러 자세로 촬영한 다음 패턴 특징점을 손으로 직접 선택해야하는 불편함이 따른다. 따라서 본 논문에서는 이 문제를 해결하기 위해 원형 샘플 화소 검사와 호모그래피 예측을 이용한 반자동 카메라 캘리브레이션을 제안한다. 제안하는 방법은 먼저 FAST 코너 검출 알고리즘을 이용하여 패턴 특징점의 후보를 영상으로부터 추출한다. 다음으로 원형 샘플 화소를 검사하여 후보군의 크기를 줄인다. 그리고 호모그래피 예측을 통해 손실된 패턴 특징점을 보완하는 완전한 패턴 특징점군을 획득한다. 마지막으로 화소 정확성 향상을 통해 실수 단위의 정확성을 가지는 패턴 특징점의 위치를 획득한다. 실험을 통해 제안하는 방법이 기존의 방법과 비교하여 카메라 파라미터의 정확성은 유지하고 수작업의 불편함을 해소할 수 있음을 확인했다.
-
본 논문에서는 여러 대의 Microsoft Kinect 와 NVidia 사의 GPGPU 라이브러리 CUDA 를 사용하여 실시간 Free Viewpoint TV System 을 제안한다. Kinect 로부터 얻어진 컬러 및 깊이 영상을 통하여 두 카메라 사이의 가상시점에서 영상을 실시간으로 출력하는 시스템을 설계한다. 이 과정에서 많은 연산량을 요구하는 좌표계 변환 과정과 IR 패턴의 간섭문제를 해결하기 위해 사용되는 Nearest Neighbor 홀 채움 방식을 CUDA 를 이용해 병렬화시켰다. 실험 결과 CUDA 를 이용해 구성한 시스템이 기존의 CPU 만을 이용해 구성한 시스템보다 같은 시간 동안 더 많은 합성영상을 만들 수 있었다.
-
본 논문에서는 효율적인 자세인식을 위해 인체 골격 정보를 활용한 멀티클래스 SVM(Multiclass Support Vector Machine)학습 기반의 자세 인식 분류 기법을 제안한다. RGB 카메라로 취득한 영상을 활용하거나 깊이 카메라로부터 취득한 골격 정보를 그대로 사용하는 기존 연구와 달리 제안 기법에서는 깊이 정보로부터 추출한 인체의 3 차원 골격 정보를 이용하여 고차원의 특징을 추출하고 그로부터 자세 인식 분류를 수행한다. 제안 기법의 특징 벡터는 깊이 정보에서 취득한 골격 정보의 관절간 각도의 조합으로 구성하여 인체의 골격 편차에 강인할 뿐 아니라 특징의 차원을 효과적으로 감소시킬 수 있다. 또한 분류기로는 멀티클래스 SVM 방식 중 one-vs-one 분류 방식을 이용하여 학습 및 판별을 수행함으로써 제안 기술의 성능을 평가한다. 실험을 통해 제안 기법은 다수의 자세에서 비교하는 다른 학습 기법보다 비교적 높은 자세인식률을 보인다.
-
본 논문에서는 디지털 홀로그램(digital hologram)을 2 차원 비디오 압축기를 사용하여 압축하는 방법을 다룬다. 그 방법은 디지털 홀로그램을 다수 개의 부홀로그램(sub-hologram)으로 나누고, 각 부홀로그램을 2 차원영상화한 후 그 결과를 배열하여 동영상 시퀀스로 만들어 2 차원 동영상 압축기로 압축하는 방법이다. 각 부홀로그램을 2 차원 영상으로 만드는 방법으로 DCT(Discrete Cosine Transform)와 Fresnel 변환 변환(Fresnel Transform)을 사용하며, 다양한 크기의 부홀로그램을 고려한다. 2 차원 비디오 압축 방법으로는 H.264/AVC 와 HEVC 를 사용한다. 본 논문에서는 2 차원 영상 변환 방법, 부홀로그램의 크기, 그리고 2 차원 영상압축 방법에 따른 성능을 비교하고 분석한다.
-
객관적 영상 화질 측정(Image Quality Assessment: IQA)방법은 영상 화질 최적화 문제해결을 목적으로 하는 영상 처리 및 컴퓨터 비전 분야에 매우 중요하게 사용된다. 이를 위해, 저복잡도, 고성능 및 좋은 수학적 특성(예를 들어, 척도성(metricability), 미분가능성(differentiability) 및 볼록 성질(convexity))을 모두 만족시키는 객관적 IQA 방법이 활발히 연구되어 왔다. 그러나, 위해 위에서 언급한 좋은 수학적 특성을 가지는 대부분의 객관적 IQA 방법들은 좋은 수학적 특성을 만족시키기 위해 상당한 예측성능의 감소를 초래했다. 본 논문은 위에서 언급한 좋은 수학적 특성을 모두 만족시키면서, 예측 성능이 향상된 새로운 IQA 방법을 제안한다. 인간 시각 체계의 감수영역은 광도 입력에 대해 공간 도메인에서 미분 형태의 응답을 가지므로, 제안 방법은 이러한 시각 체계 응답을 모방하여 기울기 연산자를 도입한다. 제안한 방법에서 도입한 기울기 연산자는 매우 단순하게 설계되어, 계산 복잡도가 매우 낮다. 광범위한 실험 결과, 제안하는 IQA 방법은 기존 수학적 특성이 좋은 IQA 방법들 대비 더 좋은 성능을 보이면서 계산 복잡도 또한 낮았다. 따라서 제안 IQA 방법은 다양한 영상 화질 최적화 문제에 매우 효과적으로 적용될 수 있다.
-
본 논문에서는 2차원으로 배열된 4개의 스피커를 이용한 음향 재생환경에서 청취자의 위치에 따라 최적의 sweet spot을 제공하도록 스피커를 구동하는 방법을 제안한다. 먼저 청취자의 위치를 추적하여 청취자의 귀와 스피커 쌍 후보 사이의 경로의 비율을 구한다. 다음, 청취자의 위치를 고려하여 스피커 쌍 후보들의 스피커 간 거리 비율을 구한다. 마지막으로, 앞서 구한 두 개 거리 비율의 비율이 1에 가까운 스피커 쌍을 구동 스피커로 결정하고 cross-talk cancellation을 음원에 적용하여 청취자에게 제공한다. 모의실험을 통해, 청취자의 위치가 변할 때 제안하는 스피커 구동 방법을 사용하여 기존의 방법보다 청취자에게 넓은 sweet spot을 제공할 수 있음을 확인하였다.
-
MPEG-2 TS(Transport Stream)는 DTV(Digital Television), IPTV(Internet Protocol Television), DMB(Digital Multimedia Broadcasting) 등 디지털 방송 분야에서 압축된 오디오 및 비디오 데이터를 다중화하는 데에 전 세계적으로 널리 사용되고 있다. MPEG-2 TS 표준이 제정된 것은 1990년대 초반으로서 20여 년이 지난 오늘날의 방송과 통신 환경에 적합하지 않은 부분이 많이 포함되어 있다. 이러한 상황을 고려하여, MPEG(Moving Picture Experts Group)에서는 2014년에 MPEG-2 TS를 대체하고자 차세대 멀티미디어 전송 표준으로서 MMT(MPEG Media Transport)를 표준화하였다. 특히 네트워크 환경의 발전에 따라, MMT 표준은 IP 친화적이고 여러 가지 다른 종류의 네트워크를 병용한 멀티미디어 전달이 쉽도록 설계되었다. 본 논문에서는 실시간 방송에 의해 수신되는 MPEG-2 TS로부터 실시간으로 MMTP(MMT Protocol) 스트림을 생성하여 UDP/IP로 유무선 인터넷을 통해 멀티미디어 스트리밍 서비스를 제공하는 시스템을 구현하였다. 이를 위해 MPEG-2 TS 실시간 변환 기능을 갖춘 MMT 스트리밍 서버와 이로부터 서비스를 받을 수 있는 MMT 클라이언트를 구현하고 그 동작을 실험을 통해 검증하였다.
-
본 논문에서는 4K UHD(Ultra High Definition) 방송 수신기의 비디오 표준적합 및 에러 처리 평가를 위한 비디오 시험 스트림을 제안한다. 표준적합 시험 스트림은 4K UHD 방송 수신기의 비디오 압축 표준인 HEVC/H.265 의 표준 적합 여부를 판단하기 위해 사용이 가능하며, 에러 처리 평가 스트림은 비디오 스트림 내에 에러가 발생하였을 때 수신기가 에러를 처리하는 방식을 검증하기 위하여 사용 가능하다.
-
이동 방송 매체인 라디오에서는 주로 청취자가 차량 운전자이다 보니 서비스 권역을 이동할 경우나 음영지역에 위치할 경우 동일한 방송을 제공하는 다른 채널로 연계하는 서비스인 service following 기능에 대한 기술적인 지원이 요구되고 있다. 본 논문은 디지털라디오 방송에서 청취중인 프로그램의 상태가 양호하지 않을 경우 인접 또는 유사 채널로 자동으로 이동하여 서비스 수신을 지속할 수 있는 service following 에 대해서 기술적인 특징을 살펴보고 앙상블 다중화기에서 이를 지원하기 위한 FIG 시그널링 방법에 대해 소개하고자 한다.
-
사람 검출은 다양한 분야에서 활용이 많은 기술이다. 검출은 노이즈, 그림자, 조명 변화, 사람형태 등을 고려해야 우수한 성능을 얻을 수 있다. 본 논문에서는 블록기반으로 복잡한 실내환경에서 상기 문제를 극복할 수 있는 사람 검출 방법을 제안한다. 제안방법은 모션 추출, 배경차분화, 전경객체 추출, 사람의 고유색 검출로 구성된다. 다양한 실내환경에서 제안방법을 적용하여 우수성을 증명하였다.
-
본 논문에서는 실내에서 RGBD 영상을 이용하여 물체를 검출하는 방법을 제안한다. 특정 물체가 아닌 일반적인 여러 가지 물체에 대한 특징을 규정하기 어려우므로 본 논문에서는 영상 정보에 의존하기 보다 물체와 픽셀의 기하학적 구조에 기반하여 물체를 검출한다. 우선 컬러 정보를 이용하여 대략적인 영상 영역분할을 하고 이를 같은 레이블로 분류하여 물체와 배경의 후보를 얻는다. 대체로 실내 환경에서 바닥은 평면이라 가정할 수 있으므로 바닥의 평면 모델을 만들어서 물체 후보에서 이를 제외시킨다. 또한, 물체에 대한 간단한 가정을 통해 바닥 이외의 배경 역시 물체와 구분하여서 물체 후보들을 가려낸다. 최종적으로 3 차원 공간에서 가까이 위치하는 레이블을 하나로 통합하는 과정을 통해 최종적인 물체 영역을 검출하고 이를 bounding box 로 표시한다. 직접 촬영한 몇몇 실내 RGBD 영상에서 실험한 결과, 제안하는 방법이 기존 방법들에 비해 물체 검출 성능이 좋은 것을 확인하였다.
-
본 논문에서는 다수 객체 모델을 통해 잘못된 객체 모델 갱신의 영향을 줄이고 객체 추적의 정확도를 향상시키기 위한 방법을 제안한다. 객체 모델 집합은 다수의 객체 모델과 대응하는 가중치들로 정의된다. 각 델과의 유사도 가중 합을 고려 하여 객체 위치를 추정하고, 각 모델의 추정 신뢰도를 계산하여 가중치를 갱신한다. 실험 결과를 통해 제안하는 기법이 오클루젼, 밝기 변화로 인하여 객체 외형이 왜곡되었을 때 추적 성능을 크게 개선함을 보이고 기존 기법들보다 더 정확한 추적 결과를 제공함을 확인한다.
-
본 논문에서는 색상 및 깊이 기반 영상 분할 기법을 제안한다. 계층화된 영상 분할을 수행하기 위해서 색상을 기준으로 영상을 과분할 한 후, 과분할 영역의 깊이를 기준으로 영역 병합을 수행한다. 적은 개수의 화소로 이루어진 병합 영역을 제거하기 위해서 인접한 분할 영역 중 화소 수가 많은 영역에 병합시키는 이상영역 처리 기법을 수행한다. 제안하는 영상 분할 기법을 기존의 데이터셋 및 키넥트 취득 영상에 적용하여 신뢰도 높은 객체 단위 영상 분할이 이루어짐을 확인한다.
-
본 논문은 low-rank 행렬의 truncated nuclear norm 최소화를 이용한 HDR (high dynamic range) 영상 합성 기법을 제안한다. 제안하는 기법에서는 기존의 LDR (low dynamic range) 영상에서 얻은 밝기의 선형 관계에 기반하여 HDR 합성을 low-rank 행렬 완성 문제로 변환한 후, ALM (augmented Lagrange multiplier) 기법을 이용하여 효율적으로 최적의 해를 구한다. 컴퓨터 모의실험을 통해 제안하는 기법이 기존 기법에 비해서 낮은 계산 복잡도를 보이면서도 더 높은 품질의 HDR 영상을 합성하는 것을 확인한다.
-
SHVC(Scalable High efficiency Video Coding)는 다양한 멀티미디어 서비스 환경에서 높은 코딩 효율을 위해 공간적, 시간적, 화질적 스케일러빌리티를 이용한 표준 기술이다. SHVC는 멀티-계층 부/복호화를 수행하기 때문에 싱글-계층인 HEVC(High Efficiency Video Coding) 보다 추가적인 복잡도를 요구한다. 본 논문에서는 SHVC 복호화기의 복잡도를 분석하고 SHVC 복호화기에서 높은 복잡도를 차지하는 프레임 기반 업샘플링을 PU 기반 On-the-fly 업샘플링(On-the-fly Up-sampling) 방법과 SIMD 연산을 통해 고속화 한다. 제안하는 알고리즘이 적용된 SHVC 복호화기는 기존 SHVC 복호화기의 복호화 시간보다 평균 1.23배 고속화 성능을 보이며 업샘플링의 복잡도가 24.7%에서 1.9%로 감소하였다. On-the-fly 업샘플링 과정은 기존 프레임 레벨 업샘플링 과정 대비 평균 90.3% 수행시간 감소율을 보인다.
-
본 논문에서는 Non-blind 디컨벌루션 알고리듬 중 하나인 Richardson-Lucy(RL) 디컨벌루션을 영상 분할을 통해 성능을 향상시킨 알고리듬을 제안한다. RL 디컨벌루션은 영상의 크기가 커질수록 연산 양이 크게 증가한다. 따라서 크기가 큰 영상의 RL 디컨벌루션은 계산에 많은 시간을 필요로 한다. 이를 개선하기 위하여 영상을 적절한 크기로 분할하여 각각 RL 디컨벌루션을 계산한다. 또한 분할 시 생기는 왜곡을 줄이기 위해 리플 제거를 위한 알고리듬을 추가한다. 이를 통해 기존의 알고리듬보다 연산 양을 줄여 빠른 RL 디컨벌루션이 가능하도록 개선한다.
-
본 논문에서는 IP 망을 통한 다윈 스트리밍 미디어 전송 서비스에서 압축된 미디어를 RTP 패킷화하여 전송할 때 RTP 패킷의 헤더에 기록될 타임스탬프 (timestamp) 정보로부터 유도해 낼 수 있는 Normal Play Time 정보를 활용하여 비디오와 오디오 간에 미디어 동기화 지원 방법을 제안한다. 모의실험을 통해 제안된 미디어 동기화 알고리듬을 적용함으로써 서로 다른 미디어 간에 정확한 동기화가 제공됨을 확인할 수 있었다.
-
본 논문은 Multiscale Gradients (MSG)를 기반으로 한 Color Filter Array Interpolation을 배경으로 Kodak Dataset보다 실제 디지털 카메라로 촬영한 이미지에 가까운 McMaster Dataset에서 개선된 성능을 내는 알고리듬을 제안한다. MSG는 녹색 채널 보간, 녹색 채널 갱신, 빨간색, 파란색 채널 보간의 과정을 거친다. 이때 높은 스펙트럼 상관관계, 낮은 색채도, 낮은 색 경사도를 가진 Kodak Dataset과 달리 자연 이미지에서는 녹색 채널 갱신 과정의 추정방법을 사용하면 화질 및 Color Peak Signal to Noise Ratio (CPSNR)이 저하되는 것을 확인하였다. 이러한 실험결과를 바탕으로 개선된 필터와 색상 보간 과정을 통해 기존의 알고리듬에 비해 향상된 성능을 보여주는 알고리듬을 제안한다.
-
본 논문에서는 지역 최빈값과 가중치를 이용하여 새로운 히스토그램 평활화 방법을 제안한다. 여러 개의 평균명도값을 사용하여 히스토그램을 분할하는 기존 방식과는 달리 지역 최빈값과 전체 평균명도값을 사용하여 히스토그램을 분할한다. 지역 최빈값 산출 과정에서 지역의 범위를 조정할 수 있어 융통성 있는 히스토그램 분할 처리가 가능하다. 또한 히스토그램 분할 영역을 가중치에 기반해 새로운 영역의 히스토그램으로 분할한다. 해당 방법을 통해 발생빈도가 높은 명도의 과도한 변화 없이 화질개선 면에서 기존 히스토그램 평활화보다 좋은 효과를 얻을 수 있다. 다양한 크기와 히스토그램 분포를 가지는 영상을 대상으로 실험한 결과, 기존 히스토그램 평활화보다 광범위하게 사용될 수 있음을 확인하였고 특히 한쪽으로 치우쳐진 영상에 있어 더욱 효과적임을 알 수 있었다.
-
본 논문은 통합경보게이트웨이를 통하여 이기종 예 경보시스템들 간 상호 연계 및 재난 경보를 발령할 수 있는 통합경보시스템(Integrated Emergency Alert System)을 제안한다. 제안한 시스템은 재난 발령 인지를 담당하는 유관기관으로부터 재난 정보를 수집하고 이를 기존의 이기종 경보방송단말간의 연동을 위한 프로토콜로 변환하여 재난 상황 모델에 맞춰 경보 단말로 전달하는 기능을 가진다.
-
본 논문에서는 블랙박스 카메라에 적합한 기하왜곡 보정 기법을 제안한다. 제안하는 기법은 정교한 카메라 보정 기법 없이 카메라 중심점을 지나는 직선주행 평균 영상에 나타나는 소실점과 카메라 중심점의 기하학적 관계와 기하왜곡에 의해 왜곡된 소실선을 특징으로 한 향상된 Hough 기법을 이용하여 기하왜곡된 블랙박스 카메라 영상에 대한 단일 기하왜곡 매개변수 모델을 추정한다. 제안하는 기법은 각각의 기하왜곡 매개변수 후보들에 의해 보정된 영상의 소실선들에 대한 에지픽셀들의 향상된 Hough 기법의 투표과정을 통한 최적의 후보선출 과정, 선출된 기하왜곡 매개변수를 초기변수로 최다 투표된 소실선들에 대한 에너지함수 최적화 과정, 최적의 기하왜곡 매개변수를 추정하여 왜곡된 블랙박스 카메라 영상보정 과정으로 이뤄진다.
-
영상 역 하프토닝은 입력된 하프톤 영상으로부터 그레이 영상을 복원시키는 것으로, 하프톤 영상으로 처리하지 못하는 다양한 영상처리를 가능하게 해주는 방법이다. 기존의 참조표를 이용한 역 하프토닝 방법은 다양한 하프톤 영상과 원본 그레이 영상으로부터 추출한 정보를 이용해 입력 영상을 복원시키는데, 본 논문에서는 이를 바탕으로 하여 영상의 질을 전반적으로 향상시킬 수 있는 국부적인 이진 패턴 기반 참조표를 이용한 영상 역 하프토닝 방법을 제안한다. 먼저 참조표를 이용한 역하프토닝 방법을 이용해 영상을 복원한 후 각 픽셀에서의 국부 이진패턴을 계산하여 각 픽셀 값을 패턴에 따라 분류한다. 분류된 패턴 정보에 따라 국부 이진 패턴 기반 참조표를 생성하고 이를 통해 입력 하프톤 영상에 대한 역 하프토닝을 수행한다. 실험 결과는 제안하는 알고리즘이 오류 확산법에 의해 변환된 하프톤 이미지를 역 하프토닝 했을 때, 기존의 역 하프토닝 방법에 비해 더 나은 PSNR을 달성하는 것을 보인다.
-
본 논문에서는 시각장애인이 외국어로 된 미디어 콘텐츠를 이해하는데 필수적인 음성자막 서비스용 콘텐츠 저작방법을 제안하고 그 구현 예를 제시한다. 제안하는 방법은 저작 단계별로 편의 기술을 제공하여 저작자로 하여금 편리하고 경제적으로 음성자막 콘텐츠를 제작할 수 있도록 한다.
-
본 논문에서는 교통 감시 시스템에서 차량추적방법을 제안한다. 교통 감시 카메라를 이용한 차량추적시스템은 차량 감시, 사고감지 및 교통정보를 확인할 수 있게 하는 시스템이다. 차량추적을 위하여 먼저 가우스 혼합 모델(Gaussian Mixture Model)을 이용하여 배경과 전경을 분리하고 형태학적 필터링을 이용하여 차량을 검출한다. 검출된 차량으로부터 SURF(Speed Up Robust Features) 매칭을 통하여 차량추적방법을 제안한다.
-
본 논문에서는 HEVC(High Efficiency Video Coding)을 위한 고속 부호화 알고리즘을 제안한다. 제안 방법은 HEVC 의 화면내 부호화 과정에서 주변 부호화 모드 정보인 MPM(Most Probable Mode)과 RMD(Rough Mode Decision) 과정의 결과로 얻어지는 후보 모드들의 상관관계를 이용하여 높은 계산 복잡도를 가지는 RDO(Rate-Distortion Optimization) 과정이 고려하는 후보의 개수를 줄여 전체 부호화기의 부호화 복잡도를 낮춘다. 실험 결과에서는 제안 방법이 약 0.29% BD-rate 의 부호화 손실만으로 20.43%의 부호화 복잡도를 감소시켰음을 보인다.
-
최신 동영상 표준 코덱인 High Efficiency Video Coding (HEVC)는 기존의 H.264/AVC 보다 동일 화질 대비 최대 약 2배의 압축 성능을 보여준다. 이러한 성능을 얻기 위해 HEVC에는 다양한 압축 기술이 적용되었다. 그 예로, H.264/AVC에서는 인트라 예측 모드에서 9가지 예측 모드만을 사용한 반면 HEVC에서는 35가지의 모드를 이용해 화면 내 예측을 시행한다. HEVC에 적용된 다양한 기술들에 의해 부호화 복잡도가 증가하였고 복잡도를 줄이기 위해 다양한 고속 알고리즘이 연구되고 있다. 본 논문에서는 스크린 콘텐츠 영상 부호화에 적합한 고속 인트라 예측 알고리즘을 제안한다. 스크린 콘텐츠 영상이란 카메라를 이용해 촬영된 자연계 영상이 아닌 mobile phone, 방송 장비, 기타 전자 기기 등 컴퓨터 기술에 의해 생성되는 영상을 의미한다. 스크린 컨텐츠 영상은 자연계 영상과 달리 색의 변화가 전혀 없는 단순한 영역을 갖는 특성이 있다. 이러한 스크린 콘텐츠 영상의 특성을 반영하는 고속 알고리즘을 HEVC Test Model (HM) 16.6에 적용하였고, 스크린 컨텐츠 영상에서 25%의 속도 향상 결과를 얻을 수 있었다.
-
HEVC(High Efficient Video Coding)는 H.264/AVC 대비 하여 50% 정도의 높은 압축률을 보이지만 인코더의 복잡도가 크게 증가하였다. 이러한 높은 복잡도로 인한 실사용에 있어서의 문제를 줄이기 위하여 본 논문에서는 변환계수의 분포와 cbf(coded block flag)를 이용하여 예측블록의 크기를 빠르게 결정짓는 방법을 제안한다. 제안된 방법은 HM16.0 대비 42%의 부호화 속도를 향상시켰으며 1.9%의 성능 감소를 갖는다.
-
This paper proposes a tile level rate control for High Efficiency Video Coding (HEVC). The proposed tile level rate control is designed by considering the multi-core platform of tile in HEVC. The proposed tile level rate control allocates the number of bits for each tile based on the predetermined weight generated from the current picture level rate control. According to the experimental results, the proposed tile level rate control for HEVC on multi-core platform loses negligibly the bitrate accuracy about 0.07% on average over the reference software HM-14.0.
-
본 논문에서는 4K UHD 입력 영상에 대해 각 프레임을 다중 슬라이스로 분할하고, 이를 병렬 처리를 통해 실시간으로 부호화를 수행하는 소프트웨어 기반 HEVC 인코더의 율 제어 방법에 관한 연구이다. 이를 위하여 HEVC 가 지원하는 슬라이스를 적용하여 프레임을 독립적인 다중 슬라이스로 분할하였고, 각각의 슬라이스에 대해서는 기존에 제안된 몇 가지의 율 제어 방법을 개선하여 적용하였다. 본 논문에서는 다중 슬라이스에 각각 독립적으로 적용한 율 제어 방법에 대한 실험 결과를 통해 제안된 율 제어 방법의 안정성을 확인하고, 향후 연구로서 각 슬라이스의 출력 비트율을 예측하고 다중 슬라이스에 효과적으로 할당하는 방법과 이를 통한 주관적 화질을 향상 하는 방법에 대해 논한다.
-
일반 영상의 영상확대를 위한 다양한 알고리즘이 존재한다. 하지만 IR 영상의 경우 일반영상과 다른 특성을 가지고 있기 때문에 IR 영상을 위한 영상 확대 알고리즘이 필요하다. 따라서 IR 영상이 일반영상에 비해 디테일이 없다는 특성을 고려하여 복잡한 알고리즘을 적용시키기 보다는 ADRC[1]와 같은 단순한 분류 기법을 활용하여 LR-HR 패치를 분류하고 학습된 데이터를 이용하여 영상확대 알고리즘에 적용하였다. 또한 알고리즘의 성능을 향상시키기 위해 학습과정에 전처리 과정을 추가하여 알고리즘 작동 시 연산량의 증가 없이 확대 영상의 선명도를 향상시키고자 하였다. 이와 같은 방법으로 영상 확대 알고리즘을 수행하였을 때 통상적인 영상확대 기법인 bi-cubic interpolation 기법보다 CPBD 수치가 평균 0.0527 만큼 높은 결과를 확인할 수 있었고 전처리 과정을 추가하였을 때 이전보다 평균 0.0119 만큼 더 선명해진 영상을 얻었다.
-
본 논문은 human visual system(HVS)에 따른 주파수 민감도와 공간에서 다양한 특성들을 구현하기 위한 신호처리 방법을 개발하였다. 인간의 눈은 주파수 성분에 따라 민감도가 다르며 초점에서 멀수록 인지 가능한 해상도가 떨어진다. 주파수 민감도를 구현하기 위해서 본 논문은 영상 신호의 에너지 스펙트럼 모양이 contrast sensitivity function(CSF)의 모양이 되도록하여 영상 신호의 에너지를 증가시켰으며 신호 방향에 적응적인 multiband energy scaling 방법을 개발하였다. 기존의 시스템에서 능률만을 향상시키는 기존의 분석 모델과 비교하면 개발한 방법은 HVS에 좀 더 적절하고 선호되게 영상 신호를 처리할 수 있다.
-
본 논문에서는 광원 노출도를 이용한 저조도 영상 시인성 개선 기법을 제안한다. 제안 기법은 저조도 영상의 저주파 성분과 고주파 성분을 각각 개선한 뒤 병합하여 시인성이 개선된 영상을 얻는다. 먼저, 영상에서 추출한 광원 노출도를 기반으로 저주파 성분을 저조도 영역과 고조도 영역으로 구분하고, 각 영역의 특징을 반영한 전달 함수의 독립적인 생성 및 적용을 통해 개선된 저주파 성분을 얻는다. 다음으로 저주파 성분의 개선 결과로부터 저주파 성분의 개선 정도와 텍스처 정도를 얻고, 이들 값을 이용하여 고주파 성분을 효과적으로 개선한다. 실험을 통하여 제안 기법이 기존 기법에 비하여 우수한 시인성 개선 결과를 보임을 확인한다.
-
본 논문에서는 잡음이 있는 저조도 동영상의 고속 시인성 개선 기법을 제안한다. 먼저, 영상에서 고속 추출한 광도를 기반으로 입력 영상을 저조도 영역과 고조도 영역으로 구분한 뒤, 각 영역의 특징을 반영한 전달 함수의 독립적인 생성 및 적용을 통해 영상의 밝기를 개선한다. 다음으로 동영상의 풍부한 시공간적 정보 활용 극대화를통해 효율적으로 영상의 잡음을 제거한다. 마지막으로 영상의 색상 분포 분석을 통해 매핑 함수를 생성하고, 이를 적용하여 색상 치우침 문제가 있는 저조도 영상의 색상을 효과적으로 복원한다. 실험을 통하여 제안 기법이 기존 기법 대비 우수한 시인성 개선 및 속도 개선 결과를 보임을 확인한다.
-
본 논문에서는 고정된 카메라에서 초기 프레임을 참조하여 현재 프레임에 새롭게 유입된 물체의 실시간 분류 방법을 제안한다. 제안한 알고리즘의 실시간 분류 처리를 위하여 복잡도를 최소화 하였다. 먼저 전경과 배경을 구분하는 이진 분류 영상을 추출하기 위하여 DCT(Discrete Cosine Transform) 기법을 사용한다. DCT는 기존 공간영역에서 Texture를 분석하는 방식보다 더욱 정확하게 Texture를 분석할 수 있다. 이는 주파수 영역에서 Texture 특징 분석이 더욱 용이하고 각 요소 안에 intensity와 texture 정보를 종합적으로 고려할 수 있기 때문이다. 또한 DCT 계산 복잡도를 최소화하기 위하여 DCT 수행 전에 색 정보를 이용하여 미리 분류 영역을 분석함으로써 처리 효율을 극대화 하였다. 마지막으로 생성된 이진 분류 영상을 자연스럽게 matting하기 위하여 Guided 필터 사용을 제안한다. Guided 필터는 guidance 정보를 통해 입력 영상을 전반적으로 개선할 수 있지만 intensity가 평탄한 영역 등에서 그 한계를 보여주므로 본 논문에서는 Guided 필터의 단점을 개선하는 방법을 추가적으로 제안한다.
-
최근 디지털 콘텐츠 및 멀티미디어는 거의 모든 IT 산업에서 중요한 역할을 하고 있으며, 이중에서도 비디오 콘텐츠는 그 동안의 검색, 유통, 관리 등의 수동적인 범위를 넘어 실세계와의 실시간 상호작용을 통한 능동적이며 혁신적인 역할을 수행하고 있다. 실시간 비디오 검색 기술은, 다양한 분야에서 활용이 가능한데, 대표적인 서비스 분야는 ALV(Autonomous Land Vehicle : 무인자동차), SNS 서비스, 오락/스포츠/광고 서비스, 모바일 쇼핑, AR, Surveillance 분야 등 매우 다양하다. 본 논문에서는, 실시간 비디오 검색 기술의 개요와 적용분야 및 사례를 설명하고 실시간 비디오 검색기술을 객관적으로 평가할 수 있는 방법, 절차에 대한 인증서에 대한 규격을 제정하여, 사용자가 표준화된 실시간 비디오 검색 기술의 인증서의 내용을 토대로 자신의 목적에 따라 기술을 선택하여 사용할 수 있도록 하였다.
-
영상회의 장치에서 눈맞춤 영상을 생성하기 위해 어파인 변환(affine transformation)을 이용하면 반올림 오차(round-off error) 때문에 홀이 발생한다. 이러한 홀을 채우려면 홀 영역을 가리키는 홀 채움 마스크가 필요하다. 홀 채움은 보통 홀 채움 마스크를 참조하여 홀이 아닌 이웃 화소값들을 기반으로 손상된 영상을 복원하는 작업이다. 따라서 홀 영역을 정확히 검출하고 적당한 개수의 이웃 화소값을 참조해야 자연스러운 홀 채움 영상을 생성할 수 있다. 한편, 눈맞춤 영상을 생성할 때 얼굴 특징점을 이용해 얼굴 변환 마스크를 만들고, 얼굴 변환 마스크에만 어파인 변환을 수행한다. 이 논문에서는 얼굴 특징점에도 어파인 변환을 수행하고 수정된 얼굴 변환 마스크를 획득하여 정확한 홀 채움 마스크를 구한다. 또한, 홀 채움 마스크에서 레이블링을 수행하여 큰 홀 영역을 제거한다. 마지막으로, 어파인 변환을 수행할 때 기존 영상의 좌표값을 이용하여 자연스러운 홀 채움 영상을 생성한다. 제안하는 방법으로 홀 채움을 수행한 결과, 연속적인 눈맞춤 동영상에서 이웃값들을 참조하여 홀 채움을 수행한 영상보다 자연스러움을 확인했다.
-
We proposed a blind watermarking scheme using singular vectors based on Discrete Wavelet Transform (DWT) and Redundant Discrete Wavelet Transform (RDWT) combined with Singular Value Decomposition (SVD) for copyright protection application. We replaced the 1st left and right singular vectors decomposed from cover image with the corresponding ones from watermark image to overcome the false-positive problem in current watermark systems using SVD. The proposed scheme realizes the watermarking system without a false positive problem, and shows high fidelity and robustness.
-
본 논문에서는 3D 디지털 영상 컨텐츠의 저작권 보호를 위해 DWT(Discrete Wavelet Transform)를 이용하여 강인성(robustness), 비가시성(invisibility), 보안성(security)을 만족하는 블라인드(Blind) 워터마킹 방법을 제안한다. 이 방법은 깊이 영상 기반 랜더링(DIBR, Depth Image Based Rendering)에 효과적으로 대처하기위해 고안된 알고리즘으로, 랜더링시 발생하는 왜곡에 영향이 적은 1-Level DWT LH 부대역에 워터마크를 삽입하는 방법이다. 이 방법에서 저작권에 대한 판단은 추출한 워터마크 정보를 통합 판단하는 방법을 사용한다. 이 방법은 저작권 보호를 위해 원본 영상을 보관할 필요가 없으며, 깊이 영상 기반 랜더링 baseline distance 5% 공격에 좌,우시점 영상 모두 효율적으로 적은 에러율을 보이며 워터마크로서 충분한 강인성을 보여준다.
-
In this paper, we present a consistent and efficient edit propagation method that is applied for light field data. Unlike conventional sparse edit propagation, the coherency between light field sub-aperture images is fully considered by utilizing light field consistency in the optimization framework. Instead of directly solving the optimization function on all light field sub-aperture images, the proposed optimization framework performs sparse edit propagation in the extended focus image domain. The extended focus image is the representative image that contains implicit depth information and the well-focused region of all sub-aperture images. The edit results in the extended focus image are then propagated back to each light field sub-aperture image. Experimental results on test images captured by a Lytro off-the-shelf light field camera confirm that the proposed method provides robust and consistent results of edited light field sub-aperture images.
-
We have developed a novel LED display architecture with RGGB 4sub-pixels rendering. LED light control filter algorithm is proposed in order to reduce color fringes by sub-pixel rendering which is a method of perceptual enhancement. The results show that it has 2 times higher perceptual resolution without artifacts.
-
미리 저장된 객체의 3차원 특징점(Feature point) 좌표와 카메라 영상의 2차원 특징점 좌표를 매칭(Matching)하여 객체를 추적하는 방식의 경우, 카메라의 시점이 변할 때 특징점에서 발생되는 원근 효과(Perspective effect)가 반영되지 못하여 특징점 매칭 오류가 발생한다. 따라서 특징점에서 발생하는 원근 효과를 반영하여 정확한 카메라 포즈를 추정하기 위해 이전 프레임(Frame)의 카메라 포즈(Camera Pose)에 맞추어 텍스쳐가 포함 된 3차원 객체의 모델을 렌더링 하여 원근 효과를 적용한 후, 현재 카메라 영상과 특징점 매칭하여 프레임 사이의 카메라 움직임을 구하여 객체를 추적한다. 더 나아가 본 논문에서는 특징점 매칭에서 발생하는 작은 오류들로 인한 미세한 카메라 움직임은 2단계의 임계치(Threshold)를 적용하여 떨림 현상으로 간주하여 떨림 현상이 제거된 객체 추적을 수행한다. 매 프레임마다 카메라 포즈에 맞춘 추적 객체를 렌더링 하기 때문에 떨림 현상으로 간주되어 제거된 카메라 움직임은 누적되지 않고, 추적 오류도 발생시키지 않는다.
-
본 논문에서는 HDR(high dynamic range)영상을 LDR(low dynamic range)영상장치에 표현하기 위해 히스토그램 변형기법과 구간별 히스토그램 평활화를 이용한 인지기반의 톤 맵핑(tone mapping)기법을 제안한다. 인간의 시각특성을 이용한 톤 맵핑 알고리듬은 상당히 효과적이지만 고정된 형태의 맵핑 함수를 사용하기 때문에 모든 영상에서 동일한 효과를 얻지 못한다. 그리고 히스토그램 변형 기법을 적용한 인지기반 톤 맵핑 알고리듬의 경우 인지기반 톤 맵핑 함수를 이용해서 원 영상의 히스토그램을 제한하고 보상과정을 통해서 적극적인 톤 맵핑 함수를 얻을 수 있다. 그렇기 때문에 contrast 의 향상과 원 영상의 디테일 보존을 함께 얻을 수 있다. 하지만 전역 히스토그램 평활화의 사용으로 영상이 지나치게 밝아지거나 지나치게 어두워지는 경우가 발생할 수 있다. 제안하는 방법은 구간별 히스토그램 평활화를 적용하여 톤 맵핑 함수를 얻는다. 이는 과도한 평활화를 방지하고 원 영상의 디테일 보존의 성능이 더 좋다. 시뮬레이션 및 실험을 통해 성능을 비교하고 기존 방법에 비해 제안한 방법이 우수함을 입증한다.
-
조건부대체 알고리즘(CRA: Conditional Replenishment Algorithm)은 좌우 영상의 해상도가 서로 다른 융합형 3DTV 서비스 환경에서 입체영상의 화질을 개선하기 위해 제안된 기법이다. 조건부대체 알고리즘에서는 비용함수를 도입하여 quad-tree 구조를 가지는 가변크기의 처리단위 (PU: Processing Unit)의 최적 모드를 결정하는데, 본 논문에서는 관심 PU 의 모드를 결정하는 단계에서 주변 PU 들의 모드를 함께 고려함으로써 모드가 고립되는 현상을 방지하는 방법을 제안한다. 제안 방법을 통해 기존의 CRA 의 결과로 발생 가능한 특정 PU의 두드러짐 현상을 제거할 수 있기 때문에 합성된 입체 영상의 주관적 화질이 향상된다.
-
세계적으로 이상기후나 지진 등의 자연재난이 증가하고 그 피해도 대형화되고 있으며, 선진 여러 나라는 국민의 생명과 재산 보호를 위해 다양한 매체를 활용한 신속한 재난 경보 전달을 위해 노력하고 있다. 본고에서는 재난이 발생한 경우 광고매체로 활용되고 있는 디지털 사이니지를 통해 사람들에게 재난정보를 효과적으로 전달하여 대피하는데 도움을 주기 위한 정보 제공을 위해 디지털 사이니지를 통한 재난경보 표시 방법을 제시하였다.
-
본 논문에서는 HEVC 타일 병렬 부호화시 타일간 로드 밸런싱을 통해 부호화 속도를 향상시키는 방법을 제안한다. HEVC 는 병렬 부호화를 통한 부호화기 속도 향상을 위해 타일 단위의 부호화 기법을 제공한다. 하지만, 타일로 나누어진 영역의 부호화 시간 차이는 병렬 부호화를 통한 속도 개선 효과를 감소시킨다. 제안된 방법은 타일간 부호화 시간차이를 고려하여 부호화 옵션을 다르게 적용함으로써 부호화 효율 감소대비 부호화 속도 성능을 개선하였다.
-
본 논문은 4K UHD 입력 영상에 대한 HEVC 고속 부호화를 위하여 대부분의 상용 CPU 및 AP 에서 사용되고 있는 SIMD (Single Instruction Mutiple Data) 명령어를 사용한 고속의 정수 화소 단위 움직임 추정 방법에 대한 연구이다. 특히, IT 기기에서의 고속 동영상 부호화를 위해 기존의 SIMD 명령어를 개량하여 동일한 CPU 실행시간에 다수의 움직임 추정을 수행할 수 있는 SIMD 명령어를 사용하여 보다 같은 실행시간에 보다 넓은 영역에 대한 움직임 벡터 탐색을 수행할 수 있도록 Search Box 기법을 새로이 개발하고 이를 토대로 기존 HEVC 에서 사용되고 있는 움직임 추정 방법에 대하여 연산시간을 줄이는 동시에 화질 열화를 최소화 시킬 수 있는 방법에 대하여 논한다.