Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)
The Korean Institute of Broadcast and Media Engineers
- Semi Annual
Domain
- Media/Communication/Library&Information > Media/Consumers
2013.06a
-
KLT-AECQ 는 지각적인 성능 향상을 위하여 formant weighting 필터를 사용한다.Code Excited Linear Prediction(CELP) 코더는 사람의 음성신호를 압축하는 대표적인 방식이다. CELP 의 Rate-Distortion 성능을 향상 시키기 위해서 Karhunen-Loeve-Transform (KLT) 기반의 Classified Vector Quantization (KLT-CVQ) 방식이 제안되었으며, 이는 KLT 기반의 Adaptive Entropy-Constrained Quantization (KLT-AECQ) 방식으로 확장되었다. 기존의 KLT-AECQ 에서는 지각적인 성능 향상을 위하여 formant weighting 필터를 사용한다. 본 논문에서는 이 필터 대신에 Spectral Amplitude Warping (SAW) 필터를 적용함으로써, KLT-AECQ 코더의 지각적인 성능을 향상하였다.
-
본 논문에서는 enhanced aacPlus 부호화기의 스펙트럼 계수 무손실 부호화에 arithmetic coding을 적용하여 비트율을 감소시키는 방법을 연구하였다. USAC의 arithmetic coding을 enhanced aacPlus 구조에 맞게 변경하여 적용하였다. 기존 방법과 arithmetic coding 방법에 의한 부호화 비트 수를 비교하여 성능을 평가하였고, 모노 신호에서 최대 9.3%, 스테레오 신호에서 최대 6.6%의 비트 감소율을 확인하였다.
-
저전송률 오디오 부호화기의 성능 향상을 위해 가변 LPC 기반으로 스펙트럼을 평탄화 하는 방법을 제안한다. 제안한 방법은 대역별 scale factor를 동일하게 하여 비트 효율을 증가시키고 spectral hole이 발생하는 문제점을 해결할 수 있다. 또한, 가변 LPC 필터를 사용하여 프레임 특성에 따라 스펙트럼 평탄화 강도를 가변적으로 조절하여 성능 향상을 제공한다. 제안한 방법이 일반 LPC 필터 방법보다 저대역의 부호화 성능을 향상시키고 스테레오 왜곡을 감소시키는 것을 확인하였다.
-
스테레오-멀티채널 업믹스(Stereo-to-Multichannel Upmix)기술은 시장의 대부분을 차지하는 스테레오 음원을 홈시어터와 같은 멀티채널 스피커 재생 환경에서 효과적으로 재생하기 위한 채널 포맷 변환 기술을 말한다. 수평적인 공간감뿐만 아니라 수직적인 공간감을 재현하기 위하여 10.2, 22.2채널 환경의 경우 고도 채널이 추가되었다. 본 논문에서는 이러한 채널 환경에서 수직, 수평적인 공간감을 재현하기 위하여 새로운 초기 반사음을 생성하는 알고리즘을 제안하였다. 제안된 알고리즘은 진폭 패닝방법을 이용하여 전방의 가상 음원들에 의하여 발생되는 리시버 위치에서의 음압을 일치시킴으로써 기존 알고리즘이 가지지 못했던 이론적인 배경을 갖는다. 청취 평가 실험을 통하여 제안된 알고리즘은 음장의 수직, 수평적인 폭을 증가시키며, 좀 더 안정적인 음상 정위 성능을 가지는 것을 확인하였다.
-
본 논문은 비가 오는 장면을 촬영한 동영상에서 빗줄기를 효과적으로 제거하는 기법을 제안한다. 제안하는 기법에서는 광흐름 검출 기법을 이용하여 인접한 프레임에서 현재 프레임의 픽셀에 대응하는 픽셀을 검출하고, 확률에 따라 해당 프레임의 픽셀 적용 유무를 결정한다. 빗줄기로 검출된 픽셀을 인접한 프레임의 픽셀 값으로 대체함으로써 영상 내 빗줄기를 제거한다. 컴퓨터 모의실험을 통해 제안하는 알고리즘이 동영상에서 효과적으로 빗줄기를 제거할 수 있음을 확인한다.
-
본 논문에서는 공간 계층 분해를 이용한 3 차원 메쉬 시퀀스 압축 기법을 제안한다. 제안하는 기법은 우선 각 점에 대한 시간적 궤적을 공분산 행렬로 표현하고, PCA(Principal component analysis)를 적용하여 시간 궤적에 대한 고유 벡터와 PCA 계수를 획득한다. 공간적인 예측을 통해 PCA 계수에 대한 벡터 차를 추출하고, 벡터 차와 그것에 대한 고유 벡터를 전송한다. 제안하는 방법은 PCA 계수 예측의 성능을 높이기 위해 점진적 압축에서 사용하는 공간 계층 분해 기법을 적용하여, 계수 예측에 효과적인 이웃 점을 지정하도록 한다. 또한, 이웃 점 개수를 사용자가 임의로 지정할 수 있도록 하여, 성능과 복잡도간의 트레이드 오프를 제어할 수 있도록 한다. 다양한 모델에 대한 실험 결과를 통해 제안하는 방법의 성능을 확인한다.
-
화이트 밸런스를 유지해야 하는 이유는 입력 이미지의 컬러 밸런스와 동질의 화질 유지를 위하거나, 혹은 이미지를 개선할 때 화질 균일 성을 유지하기 위함이다. 그러나 기존 컬러 개선 방식들은 화이트 밸런스 보존에 관계없이 컬러 개선이 이루어지기 때문에 컬러 개선 전과 후의 화이트 밸런스가 다르게 나타난다. 이 논문에서는 색 순응 변환을 이용하여 화이트 밸런스를 보존하면서 자연스러운 컬러 이미지 개선 및 컬러 측정 알고리즘을 제안한다. 그 결과는 제안된 알고리즘은 Color Naturalness Index 와 Color Colorful Index 라고 풀리는 객관적 방법뿐만 아니라 주관적인 방법 에서도 개선됨을 확인하였다. 알고리즘의 복잡도는 낮으므로 현실 어플리케이션에서도 유용하게 이용될 것이다.
-
This paper purpose to correct color with histogram equalization, and improve image quality. Fog image is not clear enough to color information. So We need to correct each channel of fog image with histogram equalization. The algorithm offered in this paper is extracting R, G, and B channel, making histogram equalization, and adding or subtraction to brightness of each channel.
-
In this paper, we propose a resource allocation algorithm for the downlink of a two-tier wireless network in which femto-base stations are used as relays to macro-users. Simulation results show that the proposed algorithm has higher fairness index than the greedy scheme.
-
본 논문에서는 간섭 제한 적인 상황에서 지정된 채널을 추정해야 하는 실제적인 무선 애드혹 네트워크에서 비모수 선형 MMSE 필터 기반의 간섭 제어 채널 추정 기법을 사용하여 네트워크 성능을 개선시키는 새로운 기법을 제안한다. 제안하는 채널 추정 기법은 간섭의 정도에 따라 노드를 활성화 시키고 지정된 채널 추정을 한다. 실제적인 무선 애드혹 네트워크 모의실험을 통해 제안된 기법이 기존의 채널 추정 기법에 비해 상당한 전송 캐패시티 이득을 얻을 수 있음을 확인할 수 있다.
-
본 논문에서는 기존라디오(primary) 네트워크와 스펙트럼을 공유하는(spectrum sharing) 인지라디오(cognitive radio) 네트워크에서 비재생적(non-regenerative) 다중안테나 중계 (relay) 시스템을 위한 소스(source) 및 중계기 프리코딩(precoding) 기법을 제안한다. 제안된 기법은 소스와 중계기 프리코딩 행렬의 최적해를 구하기 위해 QCQP(Quadratically Constrained Quadratic Programming) 문제를 통해 구한다. 제안된 기법은 기존라디오 수신기에서의 간섭세기 제한을 만족하면서 낮은 MSE(Mean squared error)와 높은 MI(Mutual Information)를 달성함을 모의실험결과를 통해 보인다. 또한 아주 빠른 속도로 최적해로 수렴함을 보이고 있다.
-
본 논문에서는 높은 전송량을 요구하는 차세대 UHDTV(ultra-high definition television) 방송시스템을 위하여 MIMO(multi-input multi-output) 전송 기법을 고려하였다. 이러한 MIMO 전송 기법 중에서 가장 좋은 수신 성능을 나타내며, 송신 안테나 개수에 비례하여 전송량이 증가하는 LDC 전송 기법과 수신 성능 향상을 위하여 회전성상 및 심벌의 지연을 이용하는 기법을 고려하였다. 연속적인 에러가 발생하는 채널환경에서 수신 성능을 향상시키기 위해서는 신호를 분산시켜 전송하거나 신호를 섞어서 보내는 방법이 필요하다. 그러므로 본 논문에서는 이러한 두 가지 기법을 동시에 고려하여 높은 전송량을 달성하면서 수신 성능을 향상시킬 수 있는 회전성상이 적용된 LDC MIMO 전송 기법을 제안하고 수신 성능을 컴퓨터 시뮬레이션을 통하여 분석하였다.
-
본 논문에서는 오디오 피크 검출을 적용한 TV 방송 프로그램내 배경음악 식별 알고리즘을 제안한다. 제안한 알고리즘은 음악 핑거프린트 추출 및 전송부, 음악구간 검출부, 음악 핑거프린트는 고속 매칭 및 정보전송부 세 부분으로 구성되어 있다. 음악 핑거프린트 추출 및 전송부에서는 음악 원음 오디오 데이터를 퓨리에 변환하여 스펙트럼 계수를 추출한다. 추출된 스펙트럼의 성분 중에서 일정한 문턱값 이상의 에너지를 가지는 값을 피크로 검출하고 검출된 피크를 이용하이 핑거프린트를 생성하고 데이터 베이스화한다. 음악구간 검출부에서는 입력된 방송 프로그램 오디오 데이터에 GMM(Gaussian Mixture Model)을 적용하여 음악과 음악 외 오디오 데이터를 분류한다. 음악 핑거프린트 고속 매칭 및 정보전송부에서는 음악구간이라고 인식된 쿼리 오디오 데이터를 음악 핑거프린트 추출 및 전송부와 동일한 과정을 통해 핑거프린트를 생성하고 데이터 베이스화된 음악 원음의 핑거프린트들과 비교하여 가장 유사한 음원의 정보를 TV의 화면에 자막으로 보여준다.
-
본 논문에서는 차세대 스마트 TV 환경에서의 적응형 멀티스크린 서비스 시스템 구조를 제안하고, 이를 실제 스마트 TV 에 적용 가능하도록 프로토타입 시스템으로 구현한 결과를 보여준다. 제안 시스템은 적응형 콘텐츠 부호화 기술과 하이브리드 네트워크 전송 기술, 멀티스크린 서비스 발견 및 제어 기술을 포함하고 있다. 스마트 TV 를 중심으로 다양한 종류의 멀티스크린 장치가 연결되는 서비스 소비환경에 적응적인 콘텐츠를 제공하기 위해서 H.264/SVC 기반의 다계층 비디오 부호화/복호화 기법을 적용하였다. 또한, 다계층 부호화된 콘텐츠를 방송망과 인터넷 등 이종 멀티네트워크를 이용해 동시에 전송함으로써, 전송 대역의 가용성을 확장하는 하이브리드 네트워크 기반의 미디어 전송 기술과 UPnP 기반의 사용자 중심 멀티스크린 서비스 발견 및 이동기술을 제안한다. 기존의 멀티스크린 서비스가 단말의 소비환경에 비 적응적이고, 홈 네트워크 환경 및 플랫폼 폐쇄적인 환경에서 제공되는 단방향 멀티스크린 서비스인 반면, 본 논문에서 제안하는 적응형 멀티스크린 서비스 시스템은 네트워크 및 단말의 소비환경에 적응적이고 효과적인 웹 기반의 양방향 멀티스크린 서비스를 제공할 수 있다.
-
본 논문에서는 사각 평면이 아닌 실린더나 구 형태의 비평면 스크린에 고품질 파노라마 영상을 렌더링 하기 위해 스틸 카메라를 이용한 자동 캘리브레이션과 멀티 프로젝터를 이용한 파노라마 렌더링 시스템을 제안한다. 스틸 카메라를 이용한 비평면 스크린 캘리브레이션은 특정 패턴을 스크린에 투사하고 이를 촬영하여 프로젝터의 투사 왜곡을 보정하고 멀티 프로젝터간의 중첩 영역에 대한 보정을 자동 수행한다. 캘리브레이션이 완료된 이후에 멀티 프로젝터를 이용하여 고품질의 파노라마 비디오를 렌더링 하기 위해서 본 논문에서는 복수의 멀티 시스템과 동기화 카드를 이용하여 렌더링 시스템간의 재생 동기화를 수행 하였다. 제안하는 렌더링 시스템을 적용하면 기존의 전문가의 수동작업에 의한 인력 및 보정 시간을 줄일 수 있으며, 시스템 환경이 변하더라도 쉽게 적응적으로 렌더링 환경을 구축하는 것이 가능하고 고품질의 파노라마 비디오를 렌더링 하는 것이 가능하다.
-
최근 멀티미디어 콘텐츠(영화, 음악 등)를 스마트폰이나 태블릿 PC, 랩탑 등의 기기에서 끊김 없이 연속적으로 받을 수 있는 N 스크린에 대한 관심이 커지고 있다. 기존에도 화질에 대한 향상을 위한 부선 자원 관리 문제를 푼 경우는 있었지만 다양한 기기의 해상도를 고려하는 N스크린 서비스의 화질 불균형 문제를 해결하고자 하는 노력은 부족했다. 본 논문은 N스크린 멀티캐스트 환경에서 기기의 해상도와 각 그룹마다 시용자의 만족도를 고려한 다중 레이어의 중요도를 새롭게 정의하고, 정의된 중요도에 따라 각 멀티캐스트 그룹의 통신 대역폭과 모듈레이션을 조정해 사용자의 만족도를 최대화하는 과정을 소개하고 있다. 또한 시뮬레이션 과정을 통해서 시각적 중요도를 가장 많이 증가시킬 수 있는 방법으로 자원을 할당하는 것이 실제로 멀티캐스트를 그룹 구성원들에게 화질의 이득을 가져오는 것을 확인하였다.
-
본 논문에서는 깊이 영상과 컬러 영상의 매칭을 통한 강인한 전경 객체 영역화 기법을 제안한다. 기존의 컬러 영상 기반 객체 영역화 알고리즘은 배경과 객체의 색상이 유사한 경우 정확한 객체 영역화가 어렵다. 깊이 영상을 이용하면 이러한 오 검출을 줄일 수 있지만, 깊이 영상 취득 장비의 오류로 인하여 검출되는 객체 외곽선이 컬러 영상에 비해 세밀하지 못한 단점이 있다. 따라서, 깊이 영상의 외곽선을 비교적 세밀한 컬러 영상의 외곽선에 매칭시킨다. 아울러, 서로 다른 센서에서 취득한 두 영상을 매칭하기 위하여, 정규화된 상호연관성(normalized cross correlation)을 유사도 척도로 사용한다. 실험을 통하여 제안하는 알고리즘이 전경 객체 영역화의 오 검출을 줄이며, 동시에 객체 외곽선을 충실히 복원함을 확인한다.
-
본 논문에서는 기존 중앙집중형 방식의 텔레프레즌스 시스템에서의 확장성 문제를 해결하기 위해서 미디어 트래픽을 분산해서 처리 할 수 있는 구조와 서비스를 확장하기 위해서 제어 플랜과 미디어 플랜을 분리하는 구조를 제안하고자 한다. 트래픽 분산 기술을 적용한 텔레프레즌스는 제어 플랜과 미디어 플랜이 분리되어 수행하기 때문에, 트래픽 분산 및 서비스 확장에 용이하며, 여러 개의 미디어 분산 처리기(DP)가 클라이언트의 트래픽을 나누어서 중계하고 전달하기 때문에, 중앙집중형 텔레프레즌스 구조에 비해서 어느 한 시스템에 많은 트래픽이 집중되지 않는다. 또한, 서버에서 클라이언트로 직접 트래픽이 전달되지 않고 미디어 분산 처리기와 미디어 분산 처리기 사이에 트래픽이 우선 전달되고, 로컬에서 트래픽이 복사되어 여러 개의 클라이언트로 전달되기 때문에 네트워크 코아망에서의 트래픽을 감소시키는 장점이 있다.
-
본 논문에서는 다양한 환경에서 사용자의 각기 다른 사용 상황을 인지하고 그에 맞는 콘텐츠 및 사용자 인터페이스를 실시간으로 구성하여 제공하는 방법에 대해 제안한다. 방송/통신 환경에서도 다양한 사용자가 다매체, 다채널 등 여러 방법으로 컨텐츠를 소비 하고 있기에 단말 환경 및 사용자 특성을 인지하여 그에 적응적인 콘텐츠와 사용자 인터페이스를 제공하는 사용자 반응형 서비스에 대한 논의가 계속 되고 있다. 또한 다양한 디바이스가 보편적으로 보급됨에 따라 사용자는 하나의 스크린에 모든 관심을 주는 것이 아니라 다양한 스크린으로 동시에 관심을 분산시킨다. 그 동안 사용자가 선호하는 콘텐츠가 제공될 경우 더욱 그 주목도를 높이기에 다양한 세컨 디바이스에 개인 적응적 사용자 인터페이스 및 컨텐츠를 제공하는 것이 서비스 차별화의 중요한 요소로 작용하고 있다. 제안하는 프레임워크는 다양한 세컨 디바이스 사용자가 IPTV 와 같은 VOD 서비스를 동시에 이용할 경우 개인화 디바이스를 통해 각자의 서로 다른 환경에 적응적인 부가 서비스를 제공 받는 서비스에 적용하여 테스트를 진행하였다.
-
본 논문은 Boosted Random Ferns 기반의 회전 불변 얼굴 검출 방법을 제안한다. 기존 Random Ferns 의 경우 특징값을 추출할 때 임의로 선택한 두 픽셀의 밝기값 비교를 통하여 이진 특징값을 추출한다. 이 경우 해당 픽셀의 밝기값에 잡음이 포함되면 특징값이 부정확하게 추출되는 문제가 있다. 본 논문에서는 이러한 문제를 해결하기 위하여 임의로 두 블록을 선택하고 해당 블록내 밝기값의 평균을 비교하여 이진 특징값을 추출하였다. 또한 픽셀 위치를 임의로 선택하여 ferns 를 구성하였던 기존의 방법 대신 최고의 분류 성능을 가지는 fern 들을 이용하여 분류기를 구성하기 위해, AdaBoost 의 방법을 Random Ferns 에 맞게 변경하였다. Boosted Random Ferns 를 트리 구조의 cascade 노드에 방향과 각도에 따라 배치하여 연산 속도를 향상시키고 false-positive를 줄이는 효과를 보았다. CMU Rotated Face Database 를 사용하여 평가하였을 때, 기존 Random Ferns 는 false-positive 의 수가 57 개 일 때 66%의 검출률을 보인 반면, Boosted Random Ferns 는 false-positive 의 수가 45 개 일 때 88%의 검출률을 보였다.
-
본 논문에서는 연극공연을 관람하는 관객의 반응정보를 수집하기 위하여, 청각센서를 통해 관객의 음성을 획득하고 획득된 음성에 대한 감정을 예측하여 관객 반응정보 관리시스템에 전송하는 음성신호 기반 감정인식 시스템을 구현한다. 이를 위해, 관객용 헤드셋 마이크와 다채널 녹음장치를 이용하여 관객음성을 획득하는 인터페이스와 음성신호의 특징벡터를 추출하여 SVM (support vector machine) 분류기에 의해 감정을 예측하는 시스템을 구현하고, 이를 관객 반응정보 수집 시스템에 적용한다. 실험결과, 구현된 시스템은 6가지 감정음성 데이터를 활용한 성능평가에서 62.5%의 인식률을 보였고, 실제 연극공연 환경에서 획득된 관객음성과 감정인식 결과를 관객 반응정보 수집 시스템에 전송함을 확인하였다.
-
임의의 위치에 음상을 정위하는 기초적인 방법으로, 각각의 고도각과 방위각에서 측정된 머리전달함수를(HRTF : Head Related transfer Function) 원음에 convolution하는 기법이 사용된다. 하지만 더미헤드를 통해 측정된 HRTF는 사용자에 따라 정위감을 저하시킬 수 있다. 또한 좌표로 표현되는 영상과는 달리, 소리는 들려오는 방향을 정확한 좌표로 표현하기가 힘들다. 이에 본 논문은 HRTF를 사용하여 음상을 정위하는 경우의 정위감 개선에 대한 방법을 제안한다. 정위감 개선을 위해 Neville 보간법을 통해 HRTF를 그룹화하는 방법에 대해 연구하였으며, 생성된 HRTF를 음상 정위에 사용하고 청감 평가를 통해 성능을 확인하였다.
-
In this research, a mono-to-stereo upmixing algorithm based on music source separation is proposed. For the upmixing, a harmonic and percussive separation for jazz music is implemented. Then, the sources are re-panned by equalizing the loudness of left and right sides of listeners in the one proposed approach. In the other approach, the harmonic sources are spread by a decorrelator while the percussive sources are panned to the center. In the experiments, the re-panning algorithm showed advanced performance in terms of localization and timbral quality.
-
본 논문에서는 슈퍼픽셀(superpixel) 단위의 그래프 컷 알고리즘을 적용하여 객체 추적의 정확도를 향상시키기 위한 방법을 제안한다. 먼저 영상 분할 기법을 사용하여 입력 영상을 슈퍼픽셀로 분할하고 각 슈퍼픽셀에서 색상 히스토그램을 이용한 특성 벡터를 생성한다. 그리고 특성 벡터에 지지벡터기계(support vector machines)를 사용하여 각 슈퍼픽셀의 객체 확률 값을 추정한다. 객체 확률 값을 데이터 항(data term)으로, 이웃한 슈퍼픽셀 간의 특성 벡터 차 값을 스무드 항(smooth term)으로 하여, 그래프 컷(graph cuts) 알고리즘으로 슈퍼픽셀들을 객체와 배경으로 분류하고 객체 슈퍼픽셀을 최대한으로 포함하는 객체 윈도우를 찾는다. 실험 결과는 제안하는 기법이 기존 기법들보다 객체 추적 성능이 우수함을 보여준다.
-
본 논문에서는 지역적인 그래프를 이용하여 면 외 회전에 강인한 특징 기술 및 정합 방법에 대하여 제안한다. 특징 기반의 지역적인 그래프의 경우 SURF 등을 이용하여 찾아진 특징 정보에 대하여 특징 사이의 상관관계를 이용하여 지역적인 그래프를 생성함으로써 특징 기술의 적용 범위를 확장할 수 있고 이러한 지역적인 그래프의 정합을 위하여 새로운 비용 함수와 정합 방법을 제안한다. 또한 특징 정합 시 이를 활용하여 정합 후보를 결정함으로써 면 외 회전이 존재하는 영상에 대해 좀 더 강인한 특징 정합 결과를 얻을 수 있고 실험 결과 기존의 특징 정합 방법에 비하여 찾아지는 후보의 개수가 증가하고 찾아진 정합 결과의 정확도가 증가하는 것을 확인할 수 있다.
-
본 논문에서는 스마트폰에서 한 장의 깊이 영상을 이용하여 내용기반 3 차원 모델 검색 기법을 범용적으로 수행하기 위한 깊이 영상 전처리 기법을 제안한다. 우선 모바일 증강현실 플랫폼 중 하나인 Vuforia 를 이용하여 다수의 영상 취득과 동시에 스마트폰 카메라의 외부 인자들을 추정한다. 그 후 취득된 영상과 외부 인자들을 이용하여 Multi-View Stereo 기법을 통해 깊이 영상을 추정한다. 이렇게 추정된 깊이 영상은 3 차원 모델 검색 기법의 질의 깊이 영상으로 활용되어 3 차원 모델 검색 기법의 입력으로 활용할 수 있다. 실험 결과 본 논문에서 제안하는 전처리 기법으로 추정된 깊이 영상을 이용하였을 경우 3 차원 모델 검색의 범용성이 확장되고 3 차원 모델 검색이 올바르게 수행된 것을 확인하였다.
-
시선추적 인터페이스는 다른 감각기관에 비해 빠른 반응속도를 보이므로 효과적인 인터랙션 수단으로 활용가능하며, 이를 통해 사용자 경험을 향상시킬 수 있다. 따라서 시선추적 기술은 장애인 안구마우스, 운전자 시선정보 분석, 광고 효과 모니터링, 차세대 게임 등 다양한 분야에 활용될 수 있다. 본 논문에서는 시선추적 인터페이스의 정확도를 향상시키기 위한 기술을 소개한다. 실제 사용자를 대상으로 시선추적을 수행할 때 눈꺼풀로 인한 동공 가림 현상이 자주 발생하며, 각막반사광으로 인한 동공 경계 왜곡 현상이 발생하기도 한다. 이로 인해 동공 중심이 왜곡되어 시선위치에 오류가 발생한다. 이와 같은 문제점을 개선하기 위해 눈꺼풀 및 각막반사광으로 인한 왜곡 현상을 보정하여 동공 중심을 검출하는 방법을 제안한다.
-
본 논문은 방송 콘텐츠에서 사용할 수 있는 터치리스 형태의 모션기반 인터랙티브 증강현실 어플리케이션을 제안한다. SD 급 해상도를 가진 범용 모션 카메라를 사용하여 HD 해상도의 방송에서 증강현실 어플리케이션을 구현하기 위해서 깊이 영상의 임의 범위를 지정하여, HD 해상도에 매칭시켜 2D 터치리스 영역에서 손의 멀티터치를 인식하게 하였다. 이렇게 인식된 모션을 자주 사용하는 '왼손 클릭', '오른손 클릭', '양손클릭', '스크러빙-상/하/좌/우' 제스쳐를 인식하게 하였으며, '카루젤 메뉴', '막대그래프 메뉴', '슬라이드 메뉴', '큐브 메뉴'를 구현하여 터치리스 형태의 모션기반 인터랙티브 증강현실 어플리케이션을 제안한다. 방송에서 자주 사용하는 그래픽 정보를 연기자나 사회자가 본 논문에서 제안하는 인터랙션 어플리케이션을 통하여 오퍼레이터 없이 스스로 더 능동적으로 정보를 표출할 수 있는 방법을 설명한다.
-
본 논문에서는 광원 정보를 사용하여 다양한 재생환경에서 효과적인 홀로그래픽 비디오 서비스를 제공하기 위한 방법을 제안한다. 제안하는 기법에서 부호화 과정에서는 가우시안 블러를 적용한 영상의 개수를 조절, 분리 하고 다운 샘플링 한 하나의 영상 압축을 한 뒤 전송한다. 이 영상을 다운 샘플링, 업 샘플링, 보간법, 양방향 필터 (Bi-lateral filter) 등의 기법을 이용하여 획득한 영상과 나머지 영상을 다운 샘플링과 업 샘플링 하여 더한 영상의 차를 압축하여 수신측으로 전송한다. 복호화 과정에서는 압축된 광원 정보를 복원한 후 기본계층 정보를 가진 영상을 업 샘플링과 보간법, 양방향 필터 (Bi-lateral filter) 등의 기법을 적용하고 수신자의 환경과 고려에 따라 차영상을 더 한 후 CGH를 통해 홀로그램을 획득하였다. 실험을 통해 제안하는 기법이 기존의 방법들 보다 우수한 홀로그램을 복원 할 수 있다는 것을 확인하였다.
-
최근 3D의 발전으로 다음 세대의 3D 기술로 디지털 홀로그램을 지목하고 있다. 본 논문에서는 CGH 영상에서 Fresnelet 변환을 통해 주파수 영역에서 각각의 부대역의 특성에 따라 양자화를 다르게 적용하였고, 무손실 부호화인 허프만 코딩을 이용하여 데이터를 압축하는 방법을 제안한다. 실험결과 영상 품질이 다소 열화 되었다는 것을 PSNR 감소를 통해 알 수 있었고, PSNR이 33.50dB인 영상과 원본 영상을 비교하였을 때, 아주 좋은 영상 품직을 갖는 것을 확인 할 수 있었다. 압축률은 PSNR 33.5dB에서 약 50:1의 결과를 보였다.
-
홀로그래픽 스테레오그램은, 양안 스테레오스코픽 영상들을 레이저 기준파와 간섭시켜 생성된 홀로그래픽 패턴을 감광매질인 홀로그래픽 필름에 기록한 후, 이를 다시 광학적 회절을 이용하여 3차원 영상으로 재현하는 3차원 디스플레이의 한 방법이다. 본 논문에서는 다시점의 full-color, full-parallax 영상을 디지털 방식의 스테레오그램으로 제작하여 3차원 입체 영상으로 재현하기 위한 기록 시스템에서, 기록 매질인 홀로그래픽 필름 면에서의 영상을 고해상도 영상 센서를 이용하여 직접 획득하고, 이 영상 정보를 분석하여 광축을 제어함으로써, 왜곡없는 최적의 호겔을 형성하여 높은 회절 효율을 갖는 스테레오그램을 제작하기 위한 방법 및 장치에 대한 연구개발 결과를 기술하였다.
-
AT-DMB의 향상계층은 DQPSK 신호에 BPSK 또는 QPSK 신호를 더하여 변조하는 계층변조 방식을 사용하였기 때문에 수신기에서 채널 왜곡을 보상해야 신호의 복조가 가능하다. 다중 경로가 많은 지역에서는 주파수 선택적 페이딩이 발생하기 때문에 페이딩을 정확하게 추정하지 못하면 AT-DMB 향상계층 수신 성능이 저하되게 된다. 채널왜곡 추정을 위하여 AT-DMB 수신기에서는 채널추정 값을 스무딩하는 대역제한 필터를 사용한다. AT-DMB의 향상 계층 성능은 이 스무딩 필터의 대역폭에 따라 결정이 되며 적절한 필터 대역을 채널의 지연에 따라 설정해야 한다. 특히 SFN 환경에서는 수신 전력이 큰 둘 이상의 서로 다른 지연시간을 가지면서 수신이 되기 때문에 고정 대역폭 스무딩 필터를 사용한 채널왜곡 추정은 성능의 저하를 가져올 수 있다. 본 논문에서는 채널 지연 값을 추정하고 필터의 대역폭을 가변적으로 결정하는 방법에 대하여 설명하고 실험 결과를 보여준다.
-
기존의 영상 라벨러는 이중 스캔 연결 성분 라벨링 방식이 주로 사용되어 왔다. 그러나, 이중 스캔 연결 성분 라벨링 방식은 별도의 라벨 병합 구간 때문에 실시간 처리와 다채널 처리가 어렵다. 최근 단일 스캔 연결 성분 라벨링 방법들이 제안되었지만, 이들 역시 스캔 횟수는 줄일 수 있으나 별도의 라벨 병합 구간을 제거하지는 못하였다. 본 논문에서는 별도의 라벨 병합 구간을 갖지 않는 단일 스캔 연결 성분 라벨러 구조를 제안한다. 제안하는 구조는 라인 스캔과 동시에 라벨 병합이 이루어지기 때문에 고속 동작하고, 예상 가능한 프레임 처리율을 가지며, 다채널 처리가 가능하다. 제안하는 라벨러 구조는 FPGA로 설계되었고 동작이 검증되었으며, 성능 실험을 통해 고속 동작과 다채널 영상 처리에 적합함을 확인하였다.
-
스마트 하이브리드 DMB 방송은 방송망과 통신망을 연계하여 다양한 형태의 방통융합 멀티미디어 서비스를 제공하기 위한 기술이다. 대표적으로 망 연동을 통한 끊김없는(Seamless) 비디오 서비스와 3D/고품질 비디오 서비스가 가능하며, 방송망으로 DMB 방송을 수신하고 통신망을 통해 DMB 방송과 연계된 데이터 서비스를 제공하는 스마트 DMB 방송도 제공할 수 있다. 본 논문에서는 방통융합형 하이브리드 DMB 방송 기술을 통해 제공할 수 있는 서비스에 대해 기술하고, 서비스 제공을 위한 시스템 구조에 대해 기술한다.
-
증강방송(Augmented Broadcasting)은 최근 스마트 기기의 보급으로 인해 대중적으로 알려진 증강현실(Augmented Reality) 서비스를 스마트 TV 와 같은 하이브리드 방송 환경에 접목하여, 시청자에게 기존에 느낄 수 없었던 TV 시청에 대한 몰입감과 콘텐츠 조작의 양방향성을 제공하고자 하는 새로운 방송통신 융합 서비스 개념이다. 증강방송에 대한 개념과 PC 기반의 테스트베드 시스템은 이미 다수 발표되었으며, 본 논문에서는 디지털 지상파 방송 환경에서의 증강방송 시스템 실현을 위해 DTV 기반의 증강방송 시그널링과 콘텐츠 동기화 방안을 적용한 재다중화기(Re-multiplexer)의 설계 및 구현에 관해 설명한다.
-
최근 4세대(4G) 통신망으로의 전환의 가속화와 스마트 모바일 기기의 확산으로 인하여 무선 통신망에서 데이터 트래픽이 급증하고 있다. 이러한 급증하는 데이터 트래픽을 분산시키기 위하여 2개의 주파수 밴드를 사용하는 멀티 캐리어 기술이 선보이고 있다. 방송 디스크는 서버가 데이터베이스에 저장된 모든 데이터를 연속적으로 다수의 모바일 클라이언트에게 방송하고, 클라이언트는 방송 채널을 감시하여 원하는 데이터가 방송될 경우 방송 채널로부터 데이터를 수신하는 통신 구조이다. 이런 관점에서 방송 채널은 클라이언트가 데이터를 액세스할 수 있는 디스크의 역할을 담당한다. 본 논문에서는 무선 통신망이 멀티 캐리어를 지원할 경우, 클라이언트에서 실행되는 읽기 전용 트랜잭션의 정확성을 보장하기 위한 동시성 제어 기법(Dual-Channel based Concurrency Control: DCC)을 제안한다. 기존에 동시성 제어 기법들은 단일 방송채널에서 트랜잭션의 철회률을 줄이기 위하여 추가적인 제어 정보들을 방송하거나 방송 데이터의 타임스탬프 필드를 이용하고 있다. 클라이언트에서 실행되는 트랜잭션은 단일 방송 사이클이 아니라 여러 방송 사이클에 걸쳐서 실행된다. 이러한 방송 디스크 환경의 특징은 클라이언트 트랜잭션이 디스크에서 방송 인덱스를 판독하여 방송 프로그램 상에서 트랜잭션에 필요한 데이터가 방송 될 때까지 기다리게 된다. 이와는 달리 DCC는 주력 망과 보조 망에서 방송되는 방송 프로그램의 순서를 서로 다르게 하여 데이터 판독에 필요한 대기 시간을 줄일 수 있다. 보조망의 방송 프로그램의 순서는 주력망의 방송 프로그램 순서의 역순서로 방송함으로써 보조 망 또는 주력 망에서 실행되고 있는 트랜잭션이 다른 방송 채널의 방송 인덱스를 판독하지 않아도 방송 프로그램 순서를 예측할 수가 있다. 그 결과, DCC는 방송 디스크의 데이터 판독에 요구되는 대기시간을 줄여 읽기 전용 트랜잭션의 철회률을 줄일 수 있다는 장점을 갖는다.
-
최근 HD (High Definition) 또는 3D (Three Dimension) 이상의 고품질 방송 콘텐츠 수요가 증가하면서 디지털 방송 시스템은 실시간으로 실감형 서비스를 제공하기 위하여 발전 하였다. 특히, 세계 방송 비영리 협회 FoBTV (Future of Broadcast Television) 는 더 나아가 초 고해상도 UHD (Ultra High Definition) 급 이상의 영상을 제공하기 위해 지상파 방송과 유선 케이블 방송 시스템을 이용하여 고품질, 다시점 방송 서비스 뿐 아니라 낮은 전계 강도 환경에서 수신율을 높일 수 있는 기술방안을 논의하고 있다. 본 논문은 이와 같은 세계 방송 발전 흐름에 따라 지상파 및 케이블 방송 송수신 시스템을 구현하고 수신되는 영상의 품질을 평가하였다. 또한, 구현된 통합 시스템은 지상파로 수신되는 파일럿 신호의 크기를 분석하여 케이블로 재전송 되며 이를 통해 수신 성능의 품질을 향상시킨다.
-
차등 시공간 블록 코드 시스템은 다이버시티 이득을 송신단에서 파일럿 삽입이 필요 없이 얻을 수 있는 기술로 주목되고 있다. 특히, 협력 네트워크 시스템에서 서비스 영역을 확장하기 위하여 중계기를 사용하게 되는데 자연스럽게 채널 추정 기법을 고려하지 않은 방법들이 연구 되었다. 본 논문은 차등 준 시공간 블록 코드를 이용한 협력 전송 네트워크에서 ML(Maximum Likelihood) 기반의 준 최적 신호 결합 기법을 제시한다. 모의실험 결과를 통해 제안된 수신 결합 기법은 높은 신호 대 잡음비 환경에서 기존에 널리 사용되는 MRC (Maximum Ratio Combining) 기법보다 5dB이상의 이득을 얻는 것을 보여준다.
-
최근 3D의 발전으로 다음 세대의 3D 기술로 디지털 홀로그램을 지목하고 있다. 질 좋은 홀로그램을 디스플레이 하려면 디스플레이 장치의 화소의 크기가 더 작아져야하고 고 해상도의 홀로그램 콘텐츠가 필요하다. 이처럼 고해상도의 홀로그램 콘텐츠를 상용화하기 위해서는 기존 2D영상에 사용되고 있는 압축 등의 영상처리 기법들이 필요하다. 하지만 홀로그램 특성상 기존 2D 영상에 이용되는 영상처리 기법을 적용하기 어렵다. 본 논문에서는 이 문제점을 해결하기 위해 홀로그램을 Fresnelet 변환을 이용하여 기존 2D영상 처리 기법을 사용할 수 있는 에너지 특성을 분석 하였다.
-
본 논문에서는 3차원 입체 비디오 기술의 최종목표인 디지털 홀로그램 영상의 소유권 보호를 위한 디지털 워터마킹 알고리즘을 제안한다. 제안한 워터마킹 알고리즘은 디지털 홀로그램의 Fresnelet 변환 영역에서 악의적인 공격들에 대해 강한 내성을 가지는 계수 정보들을 이용하여 워터마킹 정보를 추출하여 사용한다. 제안한 알고리즘으로 압축 등의 공격을 수행하여 본 워터마킹 알고리즘의 강인성을 검증하였다. 실험 결과 제안한 디지털 홀로그램 워터마킹 알고리즘은 대부분의 공격들에 대해 매우 강한 내성을 보였다.
-
기존의 T-DMB 표준 문서에서는 T-DMB 기반의 비디오 서비스를 무료 서비스로 규정하여 스크램블링을 수행할 수 없도록 제한 사항을 두고 있다. 그러나, 최근의 T-DMB 수익 구조 개선의 노력과 차세대 T-DMB(AT-DMB) 기술의 등장으로 T-DMB 기반의 유료 비디오 서비스에 대한 관심이 점차 증대되고 있다. 본 논문에서는 유료 서비스 관련 기존 T-DMB 표준 문서들을 분석하여, T-DMB 채널을 통한 유료 비디오 서비스를 제공하기 위한 효율적인 시그날링 및 스크램블 방법을 제안한다. 제안된 방법은 기존의 비디오 서비스와 역호환성을 유지하여 이미 보급된 T-DMB 수신 단말에 문제점을 야기하지 않는 것을 특징으로 한다.
-
최근 방송, 의료, 우주산업, 게임, UCC, 핸드폰 등 여러 사업 분야에 걸쳐 실제에 근접한 영상을 요구하고 있고 이것은 3D와 Ultra High Definition (UHD) 영상의 출현으로 현실화 되고 있다. UHD 급에 걸맞는 압축률을 위해 Joint Collaborative Team on Video Coding (JCT-VC) 에서는 MPEG-4 Part 10 AVC/H.264를 뒤이을 차세대 코덱으로 High Efficiency Video Coding (HEVC) 를 개발을 시작했다. HEVC는 기존 MPEG-4 Part 10 AVC/H.264코덱과 비교해 40%이상의 압축률을 나타내지만 복잡도 역시 상승했다. 특히 복호화기에서 복잡도는 중요한 요소이며, 역 코사인변환 (Inverse Discrete Cosine Transform, IDCT) 은 전체 복호화시간의 8% ~ 16%를 차지하는 알고리즘이다. 본 논문에서는 IDCT 의 수행시간을 줄이기 위해 병렬프로그래밍 중의 하나인 SIMD명령어를 사용하여 효율적으로 병렬화 프로그래밍을 하는 기법들을 제안한다. 본 제안 기법은 IDCT 수행시간을 평균 59% 단축하는 결과를 보였다.
-
본 논문에서는 HEVC (High Efficiency Video Coding) SAO (Sample Adaptive Offset)의 병렬화 성능을 비교한다. HEVC 의 참조 소프트웨어인 HM-10.0 에서는 SAO 수행 과정의 연산량 및 메모리 접근을 최소화하고 카테고리 계산 과정에서 SAO 수행 전의 픽셀값을 사용하기 위해서 라인 버퍼를 사용한다. 그러나 이러한 라인버퍼의 사용은 SAO 에 대해 데이터-레벨의 병렬화를 적용하기 어렵게 만드는 주요 요인이다. 본 논문에서는 HEVC 디블록킹 필터가 적용된 픽쳐를 추가 메모리에 복사하는 구현 방식과 HM-10.0 의 SAO 구현 방식 각각에 대해 데이터-레벨 병렬화를 적용하고 각각의 성능을 비교 분석하였다. 실험 결과, HEVC 디블록킹 필터가 적용된 픽쳐를 추가 메모리에 복사하는 구현 방식은 데이터-레벨 병렬화의 구현은 쉽지만, 디블록킹 필터링 된 픽쳐를 추가 메모리에 복사하는 부분 때문에 HM-10.0 기반의 병렬화보다 복호화 성능이 저하될 수 있음을 확인하였다. 이에 반해 CTU 의 행 단위로 병렬 수행될 영역을 분할하는 방식은 구현의 용이성과 병렬화 성능을 동시에 얻을 수 있음을 확인하였다.
-
ITU-T VCEG 과 ISO/IEC MPEG 이 공동으로 구성한 JCT-VC (Joint Collaborative Team on Video Coding)이 표준화를 진행 중인 HEVC (High Efficiency Video Coding)은 H.264/AVC 대비 약 2 배의 압축효율을 갖는다. 하지만, 계층적 구조를 갖는 가변크기 블록의 사용과 재귀적 부호화 구조에 따른 인코더의 복잡도 증가는 개선해야 할 문제점으로 지적되고 있다. 본 논문에서는 현재 표준화가 진행 중인 HEVC 인코더의 실시간 구현을 위한 SIMD 명령어를 이용한 data-level 병렬화 기법, CPU 및 GPU 를 이용한 multi-threading 기법과 같은 다양한 병렬화 기법을 소개한다. 또한, 이러한 병렬화 기법들을 HEVC 인코더에 적용하기 위해 적합한 연산 및 기능 모듈에 대하여 소개한다. 본 연구를 통하여 HM (HEVC reference model)에 적용한 결과
$832{\times}480$ 영상의 경우 20-30fps 의 부호화 속도를 나타냈으며,$1920{\times}1080$ 영상의 경우 5-10fps 의 부호화 속도를 나타내었다. -
High Efficiency Video Coding 비디오 표준은 다양한 분할방식 및 35가지 예측모드를 허용하기 때문에 최적의 분할 및 예측모드를 결정하기 위한 연산량이 많다. 이를 줄이기 위하여 본 논문에서는 CU분할의 결정에 있어 가설검정을 이용하여 early splitting 및 early pruning을 위한 임계값을 설정하고, early splitting의 경우 연산의 결과값이 임계값보다 클 경우, early pruning의 경우 연산의 결과값보다 임계값보다 작을 경우 CU의 분할을 조기에 결정하는 논문[1]의 방법을 차용하여 CU의 분할을 조기에 결정하며, 추가로 비트율 및 왜곡을 연산하는 예측모드의 개수를 줄임으로써 인코더의 성능을 향상시켰다. 또한 예측모드를 결정할 때 RDOQ를 수행하지 않음으로써 예측모드를 빠르게 결정하며, TU의 분할에 있어서도 CBF의 값 및 임계값을 이용한 early pruning 방법을 수행하여 인코더의 성능을 향상시켰다. 실험결과 5.9%의 luma BDRate의 증가가 있었으나, 63.7%의 인코딩 시간이 절감되었다.
-
스마트 폰, 탭 등의 스마트 모바일 디바이스의 등장으로 단말기 성능이 좋아지고 화면의 크기와 해상도가 높아짐에 따라, DMB의 화질 개선에 대한 요구가 증가하고 있다. 2005년 DMB 본방송 당시에 이동 중 TV를 시청하는 것으로 만족하던 시청자들은 현재 DMB 화질에 대한 불만을 제기하고 있으나, DMB는 9년 전 기술로 DMB 채널 자체만으로는 화질 개선에 한계가 있다. 이에 KBS 기술연구소에서는 DMB 온에어 채널과 인터넷을 함께 이용하여 DMB 화질을 개선하고자 고화질 하이브리드 DMB 개념을 도입하고 그 기술을 개발하였다. 본 논문에서는 이러한 고화질 하이브리드 DMB에 대하여 살펴보고 올해 3월에 제주도에서 실시한 실험 방송 시스템 및 결과를 살펴봄으로써 그 서비스 가능성을 논하고자 한다.
-
방송 수신기는 종래의 디지털 방송 프로그램의 시청을 넘어서 인터넷 연결을 제공하는 스마트 TV 로 발전하고 있다. 본 논문은 초기 스마트 TV 의 단순한 인터넷 접속 기능을 넘어서 스마트 TV 가 가진 하이브리드 망 접속 능력을 십분 활용할 수 있는 증강방송 서비스를 실현하기 위한 증강방송 서비스 플랫폼의 구현기술을 소개한다. 증강방송은 방송사에서 송출하는 방송 프로그램과 융화된 양방향 실감형, 몰입형 증강 콘텐츠를 시청자에게 제공한다. 증강 콘텐츠는 시청자의 방송 프로그램 시청을 도와줄 수 있는 2D, 3D 그래픽 콘텐츠뿐만 아니라 촉각 등의 다양한 형태의 미디어로 제공 가능하다.
-
방송통신위원회 "장애인방송 편성 및 제공 등 장애인 방송접근권 보장에 관한 고시"[1] 8조3항에서는 장애인방송물을 제작 송신 재송신할 경우에 대하여, 한국정보통신기술협회(이하 "TTA")에서 제정한 시청각장애보조방송서비스 기술표준의 준수를 의무화 하고 있다. 이에 TTA에서는 시청각 장애 보조 방송 서비스 관련 모든 방송매체 공통의 시청각 장애 보조 방송 서비스 표준의 기술을 검증하고 장애인방송 의무 적용에 대한 정부 정책 및 방송사업자 업체 대상 상용화 적용 시험을 지원하고자 장애인방송 수신기 시험환경과 장애인방송을 송신 및 재송신하는 방송매체의 송출스트림의 표준적합성을 검증할 수 있는 시험환경을 개발하였다. 본 논문에서는 "시청각 장애 보조 방송 서비스"[2]표준의 자막방송 및 화면해설방송을 시험하기 위한 시험환경 및 시험도구 개발 내용을 소개한다.
-
최근 SoC의 발전으로 하나의 칩내에 많은 IP를 구현함으로써 IP간 통신을 위한 버스 시스템이 칩에 성능에 큰 요소가 되고 있다. 버스 시스템의 기존의 중계 방식으로 Fixed Priority, Round Robin, TDMA 방식 등이 있다. 하지만 기존의 중계 방식은 여러 문제점을 가지고 있다. 그중 Burst 기반의 버스에서 발생하는 문제로 하나의 우선순위가 낮은 마스터에서 중요한 데이터를 전송하는데 대기시간이 길어지는 것이 있다. 본 논문에서는 위의 문제점을 해결하기 위해 대기시간을 줄일 수 있는 매 클록마다 중계되는 중계 방식을 제안하고 이를 AXI 프로토콜 기반의 버스에 적용하여 구현하였다.
-
최근 에너지 절감과 친환경 정책에 따라 LED조명에 대한 관심이 높아지면서 방송제작 현장에서도 LED조명의 활용이 많아지고 있다. 방송조명은 출연자의 인물을 사실적으로 재현하고, 영상의 전체적인 분위기와 느낌을 자연스럽고 감성적으로 표현하는 것이 중요하다. 특히 TV 스튜디오에서 요구되는 LED조명의 중요한 광원 특성은 연색성, 색온도, 조도의 평탄도, 색공간 균일성 등이다. 이에 본 논문은 방송현장에서 요구하는 광원특성을 기초로 제정된 TTA(한국정보통신기술협회)의 "방송용 LED조명 인증기준"에 따라서 기존의 할로겐 조명 및 국내 외 제조사별 LED조명 기구의 특성을 측정하여 비교분석 하였다.
-
본 논문에서는 국내에서 제작되는 SDI(Serial Digital Interface)를 가지는 방송용 비디오 모니터에 대해 TTA 에서 제정한 인증기준을 적용하여 시험한 결과를 분석하였다. TTA 인증기준은 EBU(European Broadcast Union)의 비디오 모니터 요구사항을 참고로 작성되었으며 본 논문에서의 시험된 결과를 통해 국산 모니터 제품의 수준을 국제수준과 간접적으로 비교할 수 있는 기회가 될 것으로 판단한다. 또한 LCD 패널의 특성에 따라 제품의 고품질화에 한계가 되는 부분을 검토하여 향후 새로운 제품기술을 적용할 때 개선할 수 있는 참고자료로 사용될 수 있다.
-
본 논문에서는 A/V라우터, SDI to HDMI 비압축신호변환기 등 방송장비에서 주로 사용되는 SDI(Serial Digital Interface) 신호의 입력감도 특성이 케이블 길이에 따라 특성이 어떻게 변화되는가를 분석하기 위해 케이블 길이에 따른 신호의 특성을 분석하였다. 특성의 확인을 위해 ITU 및 SMPTE 표준에서 규정하는 Rise/Fall Time, Timing/Alignment Jitter 값과 PSNR 값을 활용하였다. 본 논문은 전송률에 따른 케이블 길이 변화를 비교 시험하여 방송장비 제조사에서 권고하는 케이블 길이에 대한 신뢰도 확인 및 실 사용 환경에서의 케이블 길이 고려 등을 위해 필요한 데이터를 추출하였으며, 향후 시험규격개발에 중요한 자료로 활용될 것으로 기대된다.
-
본 논문에서는 전관방송 시스템에 사용되는 전관방송용 파워앰프에 대해 TTA에서 개발한 시험규격을 설명하고, 주요 시험항목에 대해 출력 레벨에 따라 어떠한 특성이 나타나는지 시험 결과를 분석하였다. 시험을 위해 현재 상용으로 판매되는 정격출력이 260 W, 360 W, 480 W, 600 W 인 앰프를 사용하였고, 각각의 앰프에 대해 정격출력, 1/2 정격, 1/4 정격, 1/8 정격, 10W, 1W 일 때 주파수 응답, 신호대잡음비, THD+N 비를 측정하여 비교하였다. 향후 본 논문의 시험 데이타가 전관방송용 앰프의 성능을 가늠할 때 중요 지표가 될 것으로 기대한다.
-
소셜 TV 사용 시, 사용자들은 TV를 시청하면서 타 사용자와의 소통을 위해 리모컨을 이용해서 텍스트를 작성해야하는 불편함을 가지고 있다. 본 논문에서는 소셜 TV의 이러한 불편함을 해결하기 위해 사용자 반응 사운드를 자동으로 인식하여 상대방에게 이모티콘을 전달하기 위한 시스템을 제안하며, 사용자 반응 사운드 인식에 사용되는 분류방식들을 비교한다. 사용자 반응 사운드 인식을 위해 사용되는 분류 방식들 중에서, Gaussian Mixture Model(GMM), Gaussian Mixture Model - Universal Background Model(GMM-UBM), Hidden Markov Model(HMM), Support Vector Machine(SVM)의 성능을 비교하였다. 각 분류기의 성능을 비교하기 위하여 MFCC 특징값을 각 분류기에 적용하여 사용자 반응 사운드 인식에 가장 최적화된 분류기를 선택하였다.
-
3D 산업은 그 실용적인 활용가치로 인해 주목받고 있다. 안정적인 3D 시청환경을 구축하기 위해서는 구현기술의 발전이 중요한 과제이지만, 현재의 기술 수준이 제한적이기 때문에 사용자가 시청환경에 대해 주관적으로 느끼는 부분을 다루는'휴먼팩터 (Human-factor)'를 연구하는 것 또한 중요하다. 그 중 시각피로는 안정적인 3D시청환경 구축과 직결되는 중요한 문제이며, 이러한 시각피로의 주요원인은 수렴-조절 불일치 현상이다. 본 연구는 수렴-조절 불일치에 직접적인 영향을 미치는 것이 화면시차 자체가 아니라 수렴각에 영향을 미치는 응시대상의 화면시차라고 가정하였다. 따라서 응시대상의 화면시차가 3D상황에서 수렴조절 불일치를 유발하는지를 규명하기 위하여 시청자들을 대상으로 응시대상의 화면시차를 조작하면서 그것이 시각피로에 영향을 주는지를 측정하였다. 결과는 예상대로 다른 대상들보다 응시대상의 시차가 시각피로에 주요한 영향력을 준다는 것을 함축하고 있으며, 그 외에 비-응시대상과 관련된 이슈들이 논의되었다. 결론적으로, 응시대상의 시차를 적절하게 통제함으로써 사용자의 시각피로를 최소화 할 수 있으며, 이는 시각 3D 환경을 구축하는 데에 도움이 될 것이다.
-
본 논문에서는 스테레오스코픽 디스플레이에 사용되는 스테레오 영상의 피로도를 분석하여 스테레오 영상의 시청 및 제작에 응용될 수 있는 시스템을 제안한다. 스테레오 영상의 피로도는 스테레오 영상의 시청 및 제작 시 영상의 품질을 향상시키기 위해 고려해야 할 가장 중요한 요소이나, 현재 이에 관한 국제 표준이 정해지지 않아 디스플레이 및 스테레오 영상 제작자마다 다른 기준으로 피로도를 분석하고 있다. 따라서, 본 논문에서는 시청자의 신체적 특성, 디스플레이 장치의 크기, 시청거리, 영상의 특성 등 시청자의 피로도에 영향을 미치는 모든 요소를 종합적으로 고려한 실용적인 피로도 분석 시스템을 제안한다. 제안하는 피로도 분석 시스템은 The zone of comfortness 와 peak signal to noise ratio (PSNR) estimation 기술을 응용하여 영상의 시차(disparity), PSNR, 디스플레이 크기, 시청거리, 시청자의 양안 거리로부터 수렴-조절 불일치 (vergenceaccommodation conflict)와 양안 입사 자극 불일치 정도를 추정해 스테레오 영상의 피로도를 계산한다. 제안하는 시스템을 통하여 스테레오스코픽 디스플레이 장치에서 영상과 시청자 특성을 고려한 최적의 시청환경을 시청자에게 제안할 수 있으며, 스테레오 영상 제작에 있어 목표 시청 환경에 대해 피로도를 최소화할 수 있는 영상의 제작 등의 응용이 가능하다.
-
최근 들어 감성공학에 관한 관심도가 증가하고 있다. 감성공학과 관련된 연구는 사람의 감정 상태를 표현하는 방법에 관한 연구가 활발히 진행되고 있다. 감정 상태를 표현하는 방법으론 1980년대 Russel이 제안한 Circumplex 모델[1]이 가장 대표적으로 사용되고 있으며, 최근에도 여러 논문[3-6]에서 이 모델을 이용하여 감정 상태를 나타낸다. 하지만 이 모델의 경우에는 사람의 감정상태를 감정차원 평면위에 하나의 점(평균, 분산)으로 표현하기 때문에, 실제 생체신호와의 연관성, 언어 및 문화 차이에 의한 다양성에 관한 연구를 진행하기에 어려움이 있다. 따라서 본 논문에서는 척도 대비 분산의 크기 값을 판단하여 하나의 점이 아닌 다수개의 점으로 나타내는 방법을 제시한다.
-
콘텐츠의 기하급수적인 증가와 다양한 서비스 확산에 따라 추천 서비스에 대한 연구는 날로 증가하고 있다. 특히, SNC 이용의 증가는 콘텐츠의 생산과 소비에 대한 주체를 새로운 관점에서 파악 할 수 있는 유용한 정보원이 되고 있다. 따라서 본 논문에서는 SNC에서의 사용자에 대한 속성 데이터와 활동 데이터를 바탕으로 정보 처리활동 기반의 속성 요소를 도출하고, 이를 바탕으로 개인화 서비스를 제공하기 위한 사용자 유형 모델링 방안을 제안하고자 한다. 사용자 유형 모델링은 사용자 속성 요소 정의와 이들 사이의 관계로 구성된다.
-
의료 영상의 3차원 가시화는 최근에 교육 진단 수술 리허설 등의 목적으로 많은 관심을 받고 있다. 하지만 관심영역을 3차원으로 가시화 하는 작업은 복잡하고 시간이 많이 소요되는 과정이기 때문에, 대부분 ITK, VTK 같이 가시화 알고리즘이 구현된 오픈소스 라이브러리들이 사용되고 있다. 또한 인터페이스의 구현을 위해 Win32 API, MFC, Java SWT와 같은 플랫폼 또는 라이브러리들이 사용되고 있는 상황인데, 이러한 경향으로 인해 실제로 일련의 알고리즘을 모두 이해하고 직접 구현하는 경우는 거의 찾아보기 힘들다. 이에 본 논문은 의료 영상의 3차원 가시화를 위해 필요한 여러 기술들에 대해 설명하고, 이를 사용자와 상호작용 하는 인터페이스를 구현한 대화형 3차원 의료 가시화 소프트웨어를 구현하였다.
-
기존의 종이책은 다양한 스마트 모바일기기의 활발한 보급으로 인해 전용 단말기와 뷰어 앱(Veiwer App)을 통해 전자책(e-book)으로 서비스되고 있다. 최근에는 텍스트(Text) 중심의 전자책과 달리, 텍스트와 함께 동영상, 다양한 상호작용 요소를 중심으로 하는 앱북(App book)의 형태로 진화되고 있다. 아이패드(iPad)용 앱스토어(App Store)에서는 도서 관련 앱이 28%를 차지할 정도로 앱북 시장이 빠르게 성장함에도 불구하고, 여러 가지 전자책 전용 단말기, 뷰어 앱 UI(User Interface) 관련 연구들에 비해 앱북의 콘텐츠 및 UI에 대한 연구가 상대적으로 부족한 상황이다. 이에, 본 논문에서는 앱북 콘텐츠의 표시 방법에 따라 3개의 유형으로 분류하고, 대표 앱북을 선정하여, 콘텐츠의 객체 표시방법에 대해 분석하고, 상호작용 요소들을 분석하였다. 이를 통해, 객체 별 상호작용 요소를 고려한 전자잡지형 앱북의 콘텐츠 표시 방법 프레임워크를 설계하였다.
-
In this paper, we propose a fast and low-complexity Motion Estimation (ME) algorithm for High Efficiency Video Coding (HEVC). Motion estimation occupies 77~81% of the amount of computation in HEVC. After all, the main key of codec implementation is to find a fast and low-complexity motion estimation algorithm and architecture. The proposed algorithm uses only 1% of the amount of operations compared to full search algorithm while maintaining compression performance with slight loss of 0.6% (BDBR).
-
본 논문에서는 JCT-VC 에서 2013 년 1 월에 표준화가 완료된 High Efficiency Video Coding (HEVC)과 구글에서 2013 년 6 월에 개발 완료 예정인 VP9 의 압축 효율 비교를 수행한다. HEVC 는 UHD 등 고화질 방송 등에 대응하도록 디자인 되었으며, VP9 은 유튜브 (YouTube) 등과 같은 인터넷 비디오 스트리밍에 적합하도록 디자인되었다. VP9 의 경우 HEVC 와는 달리 로열티 프리 (royalty-free)를 지향하며 오픈소스 (open source) 방식으로 개발이 진행되고 있다. 본 논문에서는 HEVC 와 VP9 의 디자인 차별점을 소개하고, 랜덤 액세스 환경(Random Access, RA)과 저지연 환경 (Low Delay, LD)에서 HEVC 와 VP9 의 압축 효율을 비교한다. 실험 결과에 따르면, 방송 및 패키지 미디어 등에서 많이 사용될 랜덤 액세스 환경에서는 VP9 이 HEVC 대비 32.7% 열세를 보인다. 비디오 컨퍼런스등과 같은 저지연 환경에서는 VP9 이 HEVC 대비 26.7% 열세를 보인다. VP9 의 경우 개발이 완료된 것이 아니므로, 향후 압축 효율의 향상이 있을 것으로 기대된다.
-
High efficiency video coding (HEVC) appears due to the demand on high compression video coding beyond H.264/AVC in ultra-high definition (UHD) videos. As for intra prediction, HEVC has 35 prediction modes while H.264/AVC has 9 intra modes. To exploit the spatial correlation, we adopt an edge detection method, establish the edge map, and adaptively select the candidate modes using the acquired edge information in a block. The number of the candidate modes is determined through trade-off between computational complexity and coding efficiency. Besides, the range of coding unit sizes is determined using the uniqueness of the edge directions for the given image block. As a result, we reduced the encoding time by 56.8% at the cost of 2.5% BD-BR increase on average compared to Full modes at the HEVC reference software (HM 6.0 [1]).
-
A HEVC-based scalable 3D video coding system is proposed. The proposed system supports scalable transmission of multiview video data with depth maps. Key technologies in this system are reference picture management, reference picture list construction, and cross-layer dependency signaling. All the proposed technologies are used for the development of video coding system for UHD stereo display and glassless 3D display.
-
본 논문은 스마트 TV 플랫폼에서 실행되는 앱이 TV 에 특화된 기능을 수행하기 위해서 필요한 스마트 TV확장 API 의 정의와 그 구현에 대한 내용을 소개한다. 2013 년 3 월 TTA 에서 제정된 "HTML5 기반 스마트 TV 플랫폼" 표준은 스마트 TV 용으로 제작된 하나의 앱이 다양한 TV 수신기에서 동일한 사용자 경험(UX)을 바탕으로 실행될 수 있는 TV 플랫폼 표준이며, 이는 HTML5 를 포함하는 최신 W3C 기술 규격을 기반으로 하고 있다. 본 논문에서는 표준에 기술된 사항 중 채널과 프로그램과 같이 TV 에 특화된 기능으로 W3C 에 규격범위에 포함되지 않아 새롭게 정의된 확장 API 의 구조 및 기능에 대해서 설명한다. 확장 API 는 앱, 방송, 수신기의 세가지 항목으로 분류되어 상세한 인터페이스 기능을 정의하고 있으며 스마트 TV 플랫폼의 window 객체 아래에 전역 속성으로 계층 구조를 이루도록 설계되었다. 스마트 TV 앱은 이러한 확장 API 를 호출하여 방송과 연계된 다양한 서비스를 실현할 수 있다. 또한 본 논문은 확장 API 의 유효성 검증을 위하여 표준을 준수하여 구현된 수신기 플랫폼과 앱의 구현과 동작 사례를 제시하고 있으며, 유럽의 스마트 TV 방송 규격인 HbbTV 와의 비교를 통해서 API 의 장단점과 지원 범위를 확인하고 개선 방향을 모색한다.
-
본 논문은 "HTML5 기반 스마트 TV 플랫폼" 표준에 따라서 개발될 수 있는 다양한 스마트 TV 애플리케이션의 형식과 관계를 규정하기 위한 애플리케이션 모델을 소개한다. 스마트 TV 용 애플리케이션은 브라우저 기반의 웹 실행 환경에서 동작하지만 일반 PC 나 스마트 폰과 다른 TV 환경의 특성을 고려해야 하며, 이에 따라 앱의 형식을 분류하고 실행 방법과 생명 주기를 정의하며 애플리케이션 사이에서 동작 관계를 규정하는 등의 모델 정립이 필요하다. 본 논문에서는 스마트 TV 용 애플리케이션을 패키징 여부, 실행 방식, 방송 수신 기능의 활성화 여부, 채널 종속 여부의 4 가지 요소로 분류하여 애플리케이션의 정의, 속성, 플랫폼 실행방식 등을 기술한 애플리케이션 모델을 정의한다. 또한 각 애플리케이션의 생성과 종료를 위한 생명주기와 각 애플리케이션 사이에서 우선 순위를 기반으로 한 상호 작용 정책을 규정한다. 이러한 모델 정의를 바탕으로 스마트 TV 서비스에서 고려할 수 있는 대표적인 애플리케이션 동작 시나리오를 제시하고 유효성 검증을 위해 이를 구현한 수신기와 애플리케이션이 동작하는 사례를 소개한다.
-
오디오 핑거프린트는 콘텐츠의 오디오 신호의 특색을 요약한 서명(signature)으로 2nd 스크린 서비스의 기반 기술로 주목 받고 있다. 이를 이용한 오디오 핑거프린트 시스템은 콘텐츠의 오디오를 인식하고 해당 콘텐츠와 연관된 메타 데이터를 2nd 디바이스와 웹을 통해 연결시키는 기능을 제공한다. 스마트링크 TV 는 이러한 오디오 핑거프린트를 이용한 KBS 의 콘텐츠 장면(scene) 기반 2nd 스크린 서비스 플랫폼이다. 본 논문에서는 한국의 방송환경에 적용된 스마트링크 TV 의 전반적인 플랫폼 구조와 활용방법에 대해 살펴본다.
-
본 논문에서는 웹에 공개된 웹서비스들을 매쉬업하여 스마트 TV 앱을 개발하는 과정에서의 문제점을 고찰하고, 문제 해결을 위한 접근방법을 설명한다. 웹서비스 매쉬업 개발 시, 분산된 웹서비스 들 중 개발자가 필요로 하는 적절한 웹서비스를 손쉽게 찾기 어렵고, 웹서비스마다 인증받고 호출하는 방법이 다르며, 또한 서비스의 가용성을 확인하고 이용해야 문제로 요약된다. 이와 같은 웹서비스 매쉬업 과정의 문제를 해결하기 위해 제시한 본 연구의 접근 방법은 검색, 검증, 인증이 손쉽게 지원되는 개발환경 시스템으로 제공될 필요가 있으며, 자동화된 개발환경 시스템은 개발자를 도와 웹서비스의 활용을 증대시킴으로써 다양한 앱 개발의 촉매제가 될 수 있을 것이다.
-
본 논문에서는 시장 점유율 상위를 차지하는 3 종의 해외 유명 제조사의 상용 HD 급 실시간 방송용 H.264 인코더의 화질 성능에 대해 전 기준 화질 평가를 통해 비교한다. 이를 위해 VQEG(Video Quality Experts Group)등에서 배포하는 9 종의 기준영상을 이용하여 PSNR(Peak Signal to Noise Ratio)을 측정하였으며 인코더 별 성능 비교를 위해 9 종의 기준영상에 대한 평균 PSNR 과 인코더/디코더의 전체 지연시간을 측정하였다. 그 결과 장비 별로 조금씩 다른 특성 결과와 현재 H.264 인코더 시험 시 성능 평가의 애매한 부분이었던 화질에 대한 벤치마크 결과를 얻을 수 있었다. 본 논문의 실험 결과는 국산 방송용 인코더의 객관적인 성능 평가를 위한 지표로 사용될 수 있을 것으로 예측된다.
-
최근 일본의 지진 쓰나미 등 전 세계적으로 많은 재난이 증가하고 있고, 국내에서는 신속한 재난 정보 전송을 위해서 CBS(Cell Broadcast Service) Alert Message를 국가 표준으로 제정하였다. CBS를 통한 전송은 지역단위 전송이 가능하므로 재난이 발생한 지역에 신속한 전송 서비스를 가능하게 해준다. 하지만 국내의 경우 CBS Alert Message가 LTE(Long Term Evolution) 단말에서만 수신이 가능하고 3G 단말에서는 수신이 불가능하다. 이에 본 논문은 실내 환경에서 gateway-AP(Access Point)를 이용하여 3G 단말이 CBS Alert Message를 수신 할 수 있는 방법을 제시하려고 한다.
-
최근 세계 곳곳에서는 재난 발생이 증가하고 있으며, 재난의 규모 또한 커지고 있다. 따라서 이러한 재난을 예방하고 대응하기 위한 중요한 것 중 하나는 재난이 발생하였을 때 그 재난과 관계된 사람들에게 신속하게 전달하는 것이다. 신속한 재난 정보 전달을 통하여 재난에 의한 피해를 방지할 수 있게 된다. 본 논문에서는 윈도우 애저 모바일 서비스를 기반으로 한 재난 알림 어플리케이션을 개발할 때의 장, 단점에 대해서 서술한다. 윈도우 애저 모바일 서비스를 사용한 개발에는 이미 정의되어있는 기능들이 있다는 장점이 있다. 하지만 기능이 이미 정의되어있기 때문에 생기는 문제점 또한 존재한다. 이러한 장, 단점들을 분석하여 앞으로의 재난 알림 어플리케이션의 발전방향을 제시한다.
-
오늘날 미디어 발전은 상업적 방향으로 치중하는 경향이 있다. 하지만 연구계에서 지난 10년간 재난 미디어로서 가치를 실현하기 위한 기술 연구들의 진척도 확대되고 있는 가운데 앞으로 재난 미디어의 발전 방향성을 통찰적으로 이해해 볼 필요가 있다. 본 연구에서는 국내 재난 미디어 기술 연구들을 분석해 신속한 정보 전달을 위한 경보 미디어 기술과 휴대기기를 대상으로 하는 매체 기술에 대한 연구가 활성화 되어 있음을 발견했다.
-
압축 센싱 기술은 성긴 (sparse)신호의 경우 Nyquist 표본화율보다 적은 수의 표본으로도 원신호를 완벽하게 복원할 수 있는 이론을 제시하고 있다. 전통적인 영상 처리분야에 압축 센싱 기술을 적용하는 연구를 시작함에 따라 계산 복잡도 및 메모리 문제로 블록 영상 기반 압축 센싱 방법을 많이 고려하고 있다. 또한, 이러한 압축 센싱 방법에서 복원 과정은 일정 허용 오차 범위 기준을 복원 신호가 만족시키는 경우에 종료되므로, 허용 오차 범위에 따른 복원 신호 품질과 계산 복잡도에 변화가 발생하게 된다. 본 논문에서는 블록 기반 압축 센싱 방법을 이용하여 영상을 복원함에 있어, 허용 오차 값에 따른 복원 영상의 화질 변화와 시간 절감 정도를 비교, 분석하였다.
-
최근, 협력통신은 MIMO시스템을 대신하여 신뢰성 있는 통신을 위하여 많은 연구가 진행되고 있다. 기존 통신에 비하여 신뢰성 있는 통신은 가능하지만 중계기에 의한 협력시간은 시간 슬롯(slot)을 낭비시킨다. 그 결과 전송률이 감소되어 최대 전송률을 이룰 수 없다. 또한 전송률이 감소되는 동시에 전송속도도 감소되는 단점을 가지고 있다. 이 논문에서는 협력통신에서 감소된 전송률의 단점을 보완하고자 전송률을 증가시키는 기법을 제안하여, 초고속 통신을 가능하게 하는 기법을 제안한다. 또한 제안된 전송기법에 따른 복조기법을 제안하여 효율적으로 신호를 복조하는 기법을 제안한다. 모의실험을 통하여 제안한 기술의 성능평가를 한다.
-
본 논문에서는 기존의 하이브리드 MIMO 기법들이 정수 배의 멀티플렉싱 이득만 달성할 수 있는 단점을 해결하기 위해서 임의의 멀티플렉싱 이득을 달성할 수 있는 하이브리드 MIMO 기법을 제안한다. 제안된 기법은 다양한 멀티플렉싱 이득을 달성하기 위해서 전송 matrix 의 구성을 기존의 MIMO 기법들과 다르게 구성함으로써 멀티플렉싱 이득의 조절이 가능하다.
-
무선통신에서 다중안테나를 사용하지 않고 다이버시티 이득을 얻기 위한 대안으로 협력 통신 기법이 개발되어 왔다. 하지만 대부분의 협력기법들은 릴레이에 신호를 전송하는 과정에서 delay 가 발생하게 되어 전송률이 감소하는 단점이 있다. 본 논문에서는 OFDMA 시스템에서 feedback 정보를 이용하는 기법을 사용하여 전송 손실이 발생하지 않으면서 기존의 MISO(multi input multi output)시스템과 비슷한 성능을 갖는 새로운 협력모델을 제안한다. 제안된 기법은 bit error rate(BER) 관점에서 평가되고 협력하는 사용자와의 채널이 보장되면 기존의 MISO 기법과 비슷한 성능을 보이는 것을 보여준다.
-
본 논문에서는 채널상태에 기반하여 QRD-M (QR-decomposition based M algorithm)및 QRPIC (parallel interference cancellation using QR-decomposition)을 이용한 검출 기법을 제안한다. 기존의 QRD-M 검출기법은 성능은 좋지만 복잡도가 높고, QRPIC 기법은 성능은 떨어지지만 복잡도가 낮다. 제안된 검출 기법은 채널상태에 따라 QRD-M 검출 기법을 사용할지 QRPIC 검출 기법을 사용할지 결정하게 되므로 기존의 QRD-M 검출 기법보다 성능은 조금 감소하지만 복잡도가 크게 낮아진다.
-
본 논문은 차등 위상 편이 변조(DPSK) 시스템에서 파일럿 없이 주파수 추정하는 기법을 제안한다. 제안하는 주파수 동기오차 추정 방식은 파일럿을 사용하지 않고 DPSK 변조 방식에서 연속되는 신호의 차등 위상신호를 전송하는 특성을 사용하는 블라인드 기법이다. DPSK 신호의 위상 차분은 주파수 오차 추정을 실행 할 때 페이즈를 증가시켜 왜곡으로 작용하게 되는데, 본 논문에서는 간단한 상관기와 제곱기로 이러한 특성을 제거하여 주파수 추정 성능을 증가 시킨다. 알고리즘의 검증은 수식과 컴퓨터 시뮬레이션으로 수행한다.
-
본 논문은 OFDM (Orthogonal Frequency Division Multiplexing)기반의 LTE (Long Term Evolution)하향링크 시스템에서 PS (Primary Synchronization)신호를 이용한 잔여 시간동기 오차를 검출 기법을 제안한다. 제안된 잔여 시간동기 오차 검출 기법은 기존의 잔여 시간동기 오차 검출 기법과 달리, 수신된 PS 신호간의 상호상관 값을 이용하여 잔여 시간동기오차를 검출한다. 제안된 기법은 기존의 기법보다 낮은 복잡도를 가지며, 비슷한 성능을 보여주며 이는 컴퓨터 모의실험을 비교하였다.
-
본 논문은 2012년도 12월 31일 새벽 4시를 기하여 아날로그 지상파텔레비전이 디지털 지상파텔레비전으로 완전 전환되어짐에 따라 초고속정보통신건물인증에서 "특등급"건물도 필수적으로 광장비(광수신기)가 댁내의 세대단자함에 들어가야 함으로서 현재의 산업적 보급 현황에 대하여 알아보고자 한다. 방송공동수신설비에서 가장 중요한 설비로서 세대단자함에 광수신기가 들어가야 하지만, 최근의 경기침체로 인하여 건설경기도 침체됨으로서 구내통신설비에도 영향이 있는 것으로 파악되고 있다. 2009년 11월에 개정된 "방송공동수신설비의 설치기준에 관한 고시"와 초고속정보통신건물인증업무 처리지침 개정에 따라 특등급의 공동주택은 광선로 및 광 장비가 도입되어야 하나 초기 품질의 안정화나 장비의 활성화가 안되는 상황에서 고가의 장비가 일반적이었으나, 현재는 일부 대단히 단지가 조성됨으로서 추가적인 인하요건이 발생하고, 향후 1~2년 안에 점진적으로 가격과 품질이 안정화가 이루질 것으로 예상된다.
-
영상실감증대를 위한 시각, 청각정보의 제시방식에 대해서는 많은 진보가 이루어 졌다. 반면 후각은 정의하기 어렵고 다루기 까다롭기 때문에 관련연구를 찾아보기 어렵다. 본 연구에서는 후각정보를 통한 영상실감증대 연구의 첫걸음으로 후각정보에 대한 사용자 수용도를 조사한 후 이에 근거하여 다양한 영상을 분류하였다. 이를 위해 먼저 영상에 냄새가 존재하는지 (냄새존재여부), 영상과 함께 해당 냄새를 경험하고 싶은지 (냄새제시선호), 영상에 어울리는 냄새가 내가 좋아하는 냄새인지 (냄새자체선호), 그리고 영상에 어울리는 냄새가 얼마나 구체적인지 (냄새의 구체성)라는 네 가지 질문을 선정하였다. 각 질문들에 높은 혹은 낮은 점수를 받을 만한 다양한 장르의 영상 (51)개를 수집한 후, 참가자들에게 하나씩 영상을 시청하게 한 후 위의 네 가지 질문에 대해 7점 척도로 평정하게 하였다. 영상분류를 위해 두 질문씩 쌍으로 묶어 각 질문의 척도를 2차원 평면의 X, Y축으로 설정한 후 평정값을 이용하여 영상분류를 위한 산포도를 구성하였다. 2차원 평면의 서로 다른 사분면에 위치한 영상군집들은 영상실감증대를 위한 후각정보 제시에 중요한 시사점을 줄 것으로 기대한다.
-
본 논문에서는 증강현실을 방송환경에 접목한 증강방송 개념에 대한 소개와 이를 실현하기 위한 증강방송 메타데이터 및 증강방송 메타데이터를 저작하기 위한 저작도구에 대하여 소개한다. 방송환경이 모바일 환경과 달라 완벽한 증강 서비스를 제공하는데 있어서 한계가 있으나, TV 의 대 화면과 양질의 TV 프로그램, 스마트 TV 로의 발전에 따른 웹 환경 지원과 모션/음성 인식 인터페이스, 그리고 스마트 TV 애플리케이션의 등장은 증강방송의 가능성을 한층 높이고 있다. 이를 가능하게 하기 위하여 증강방송 메타데이터를 설계하였으며, 이를 사용자들이 편리하게 저작하기 위한 저작도구를 구현하였다.
-
기존의 T-DMB 방송은 기본적인 오디오/비디오 서비스와 함께 BWS, Slideshow, TPEG 등과 같은 다양한 형태의 부가데이터 서비스를 제공할 수 있다. 그리고 최근 성공적인 AT-DMB 시험방송과 더불어서 DMB-ECG, DMB 파일캐스팅, 맞춤형 DMB 서비스 등과 같은 다양한 메타데이터 규격을 활용한 고품질의 부가데이터 서비스 표준화가 완료되었다. 본 논문에서는 고품질의 부가데이터 서비스의 일환인 후각기반 감성미디어 서비스 제안하고, DMB 데이터채널을 통한 시그널링 정보 송수신 방법과 기존의 DMB 소비단말과의 역호환성을 고려한 감성미디어 DMB 소비단말 구조를 제안한다.
-
고해상도 HD 방송 및 3D 방송 시대를 맞아 좀 더 현실감 있는 방송에 대한 관심이 높아지고 있다. 이에 시청자의 오감을 자극하여 현장감을 높이는 기존 오감방송의 개념을 넘어서 감성방송 및 감성콘텐츠에 대한 관심이 높아지고 있다. 감성방송이나 감성콘텐츠는 콘텐츠 내의 물리적인 효과와 더불어 시청자가 콘텐츠의 내용으로부터 느끼는 각종 감정들을 정의하여 이를 적절한 감각효과로 변환하는 것에 초점을 맞춘다. 본 논문에서는 감성방송의 정의와, 감성방송이 갖추어야 할 선결조건 중 감성정보의 효과적인 추출방법, 감성 UX 엔진에 대한 간략한 개요를 설명한다.
-
본 논문에서는 모바일 환경에서의 얼굴인증 성능 향상 방법을 제안한다. 제안했던 기존 방법에서는 다중 반경 LBP 히스토그램을 분석하고 임계값을 적용하여 개인별 주요 블록을 구성하였다. 이 때 임계값의 적용에 따라 인증 성능의 변화가 발생할 수 있고, 주요 블록에 동일한 가중치를 적용하기 때문에 블록의 분별력을 크게 고려하지 않았다. 제안하는 방법은 주요 블록에 가중치를 적용하는 방법으로 주요한 블록과 비교적 덜 중요한 블록의 분별력을 높여 개인인증의 성능을 향상시킨다. 실험 결과 제안하는 방법이 기존 방법들 과 비교하여 낮은 에러율을 보였다.
-
본 논문에서는 영상 통화나 웹캠 혹은 화상 회의 상황의 비디오 영상에서 안정적으로 사람 영역과 배경을 분리하는 방법을 제안한다. 이 방법은 카메라가 고정이라는 등의 제약을 두지 않고 자유롭게 움직이는 비디오 영상에서 사용자의 입력도 필요 없이 자동으로 사람 영역을 분리해 내게 된다. 첫 프레임에서 얼굴 검출을 통해 사람의 대략적인 위치를 추측하여 배경과 사람 영역을 Gaussian Mixture Model 로 모델링하고, 매 프레임 이 모델을 효율적으로 갱신한다. 그리고 비디오 영상의 연속성을 에너지 함수 설계에 적용하여 프레임간 사람 영역의 변화가 크지 않고 안정적으로 나오게 된다. 제안하는 방법은 기존 방법들에 비하여 제약이 적고, 사용자 입력이 필요 없으며 안정적으로 사람 영역을 분리함을 실험을 통하여 확인하였다.
-
컴퓨터 비전에서 BoW를 이용한 장면 분류 기법에 대한 연구가 활발히 진행되고 있다. BoW 기법의 장면 분류는 K-means 클러스터링을 통하여 코드북을 생성하는 과정에서 트레이닝 이미지의 클래스 정보를 활용하지 않기 때문에 성능이 제한적이라는 문제점을 가지고 있다. 본 논문에서는 BoW를 이용한 장면 분류 과정에서 코드북 생성을 위하여 각각 특징 기술자들의 유클리디안 거리뿐만이 아니라 클래스 확률 밀도 함수들의 히스토그램 교차값을 최소화 하는 최적화 K-means 클러스터링 기법을 제안한다. 장면의 SIFT 특징 기술자 정보뿐만 아니라 장면이 속해있는 클래스 정보를 결합하여 클러스터링을 수행함으로써 장면 분류의 정확도를 높일 수 있다. 장면 분류 정확도 실험에서 제안하는 클러스터링을 사용한 BoW 장면 분류 기법은 기존의 K-means을 사용한 BoW 장면 분류 기법보다 높은 정확도를 보여준다.
-
재난이 발생할 가능성이 있을 경우 또는 재난 상황 발생 경우, 정보의 전달이 소외되는 곳이 없도록 하는 것이 중요하다. 이에 따라 국내에서는 재난 경보를 위한 여러 시스템들을 개발하였고 운영하고 있다. 그리고 이러한 시스템들을 통합하기 위해서 통합경보공유프로토콜을 표준으로 제정하였다. 그런데 이 표준은 XML을 사용하나 그 스키마를 함께 제공하지 않아 여러 기능을 사용하는데 있어서 어려움이 생긴다. 이와 같은 문제점을 해결하기 위해서 본 논문은 표준을 바탕으로 XML 스키마를 도출한다.
-
최근 다양한 종류의 재난 발생이 증가와 그 피해로 인해 재난에 대한 관심이 높아지고 있다. 특히 재난이 발생 징후가 포착되었을 때나 재난이 발생하였을 때 그 정보를 신속하고 정확하게 전달하고자 국내에서는 각 재난의 특성에 맞는 다양한 종류의 경보시스템을 개발하여 운영하고 있다. 하지만 다양한 경보시스템들은 그 관리책임기관이 다르기 때문에 개별적으로 등장하였다. 그래서 하나의 경보를 전달하기 위해 여러 시스템을 각각 동작시켜야 하는 등의 비효율성의 문제가 발생하였다. 이와 같은 문제를 해결하기 위해 미국, 유럽등지에서는 재난관리 시스템을 통합하려는 연구를 진행하고 있으며, 국내에서도 통합경보시스템을 위한 연구가 진행되어 이 연구 결과로 "이기종 경보 시스템 서버와 통합 재난 경보 게이트웨이 연계 프로토콜" 표준이 제정되었다. 이에 본 논문은 통합재난경보네트워크(IDAN: Integrated Disater Alert Network)를 계층적으로 분석하고, 경보전달을 위한 국제 표준인 CAP(Common Alerting Protocol)과 비교 연구하여 IDAN의 문제점을 제시하고 이를 해결하기 위한 방법을 제안한다.
-
최근 동일본 대지진 또는 중국 쓰촨성 대지진 등 국가적인 재해 재난이 한반도 주변에서 자주 일어나고 있다. 대한민국도 마찬가지로 집중호우로 인한 인명피해가 발생되기도 했다. 이러한 경우 해당 재난지역 내의 주민들이 지역상황을 인지하고 대피하게 할 수 있다면, 인명피해를 크게 줄일 수 있을 것이다. 이러한 문제의 해결책으로 보급률이 뛰어나고 개인 휴대형 기기인 휴대전화기를 통한 재난방송 기능이 제안되었다. 여기에는 재난 방송의 특성상 지연시간과 수신율에 문제점이 있을 수 있다. 그러므로 방송 (broadcasting)개념이 도입되어 다수의 사용자가 한 번에 수신할 수 있도록 CBS (Cell Broadcasting Service) 서비스를 제공하고 있다. 하지만 이 또한 현실적으로 LTE (Long Term Evolution) 망에서만 가능하며 3세대 통신, WCDMA (Wideband Code Division Multiple Access) 에서는 대기전력 소모에 의한 배터리 소요로 제외되었다. 본 지에서는 CBS를 이용하여 WCDMA 단말을 소지한 사용자에게도 DMB를 통해 재난상황을 인지 할 수 있는 새로운 게이트웨이를 제안한다.
-
광원 및 조명이 미약한 환경에서 획득된 저조도 영상은 인지적 및 색 왜곡적 측면에서 취약점을 가진다. 영상의 색 복원을 위한 연구인 색 항등성 기법은 저조도 환경에 적합하지 않기 때문에 저조도 영상을 대상으로 적용할 경우에는 좋은 성능을 내지 못한다. 이러한 문제를 해결하기 위하여 본 논문에서는 저조도 영상의 색 복원을 위한 톤 매핑 및 색 항등성 기법에 대해 분석한다. 톤 매핑 기법은 저조도 영상의 밝기를 개선해 색 항등성 기법의 적용을 가능하도록 하기 위해 사용되며, 이후 다양한 색 항등성 기법을 밝기 조절된 저조도 영상에 적용해 색 복원에 적합 여부를 판단한다.
-
본 논문에서는 gradient inverse weighted filtering(GIWF) 보간법 기반의 화면 내 디인터레이싱 알고리듬을 제안한다. 소실된 화소 줄을 보간하기 위해서 먼저 선 처리 과정을 통해 정해진 마스크의 중간 지점의 예측 값을 생성한다. 이 때는 4-tap 필터를 이용을 한다. 다음으로 이웃 픽셀들 사이에서 마스크 내의 기울기 정보를 이용하여 gradient-weighted 필터의 가중치 계수를 계산한다. 그리고 마지막으로 새롭게 제시된 GIWF 보간법을 이용하여 소실된 화소 줄을 보간하게 된다. GIWF를 이용하여 영상의 디테일을 보존하고 잡음을 제거하는 효과를 얻게 되었다. 제안된 방법의 영상 시퀀스에 대한 실험 결과는 기존의 방법들에 비하여 성능의 우수함을 보여준다.
-
표는 중요한 정보를 함축적으로 담고 있는 문서 요소로서 문서 영상에서 표의 내용과 구조를 분석하고 이해하려는 연구가 많이 진행되어 왔다. 이러한 표의 검출과 인식에 관한 기존의 연구들은 평판 스캐너로 취득한 문서 영상을 대상으로 이루어졌는데 최근에는 디지털 카메라와 스마트폰이 보급됨에 따라 평판 스캐너 대신 카메라를 이용한 표 인식의 필요성이 대두되고 있다. 따라서 본 논문에서는 카메라로 획득한 문서 영상에서 표 인식에 대한 알고리듬을 제안한다. 먼저 표가 선들의 집합으로 이루어져 있다는 가정 아래 문서 이미지에 존재하는 선을 이진화와 강인한 곡선 맞춤 알고리듬을 사용하여 검출한다. 검출된 선들의 교차점은 표의 요소일 수도 있으며 오검출의 결과일 수도 있는데 교차점 주변의 관찰 결과와 교차점 사이의 연관 관계를 에너지 식으로 표현하고 이 식을 최소화함으로써 각각의 교차점에 최적의 레이블을 할당한다. 얻어진 레이블은 표로 유일하게 변환되며 표의 구조를 셀 단위까지 추정할 수 있다. 다양한 표 영상에 대한 실험 결과를 통하여 제안한 방법이 문서영상의 기하학적인 왜곡에도 불구하고 영상에 존재하는 표를 성공적으로 인식함을 보여준다.
-
본 논문은 제한된 1비트 변환 (Constrained One-Bit Transform : C1BT) 알고리즘의 정합 오차 기준의 동적 범위를 확장하는 알고리즘을 제안하였다. C1BT는 정합 오차 기준으로 SAD (Sum of Absolute Differences)를 사용하지 않고 CNNMP (Constrained Number of Non-Matching Points)를 사용하여 하드웨어 구현을 용이하게 하고 속도를 대폭 향상시켰다. 이는 기존의 움직임 예측 방법인 전역 탐색 알고리즘 (Full Search Algorithm: FSA)과 비교하여 연산량을 크게 줄였으나 움직임 예측의 정확도를 현저히 감소시켰다. 이 점을 개선하기 위해 이 논문에서는 C1BT의 정합 오차 기준을 확장하여 움직임 예측의 정확도를 높이는 알고리즘을 제안하였다. 기존의 C1BT와 제안하는 알고리즘을 비교한 결과에서 제안하는 알고리즘이 기존의 C1BT에 비해 움직임 예측의 정확도의 기준인 PSNR 측면에서 더 우수한 성능을 보였다.
-
잡음이 존재하는 환경에서 이미지의 경계와 디테일을 살리는 것은 잡음을 제거하는 것에 있어서 가장 중요한 요소중의 하나이다. 이를 위한 방법 중 한가지는 Bilateral 필터를 이용하여 영상 잡음 제거를 하면서 영상의 경계와 디테일을 보존하는 방법이다. Bilateral 필터의 이러한 특성 때문에 최근 Bilateral 필터를 통한 영상 잡음 제거에 대한 연구가 한창 진행되고 있다. 이에 본 논문은 Bilateral 필터의 장점인 경계와 디테일을 부각시키는 능력을 개선하기 위해 가장 간단하다고 많이 알려진 영상의 경계 검출 알고리듬을 이용하여 더욱 효과적인 Bilateral 필터를 통한 영상 잡음 제거를 연구 개발하였다.
-
CT(Computed Tomography)영상에서 선량과 화질은 중요한 요소이다. 선량은 환자에게 직접적으로 악영향을 끼치는 요소이며, 화질은 환자의 병변을 판단하는데 매우 중요하게 작용한다. 반복적 재구성 알고리즘을 이용하면 저선량 영상에서도 고화질의 영상을 얻을 수 있는지 FBP와 정량적, 정성적으로 비교하였다. 촬영 프로토콜은 관전압 80, 100, 120kVp에서 관전류를 동일하게 200mA로 촬영하여 획득하였으며, 정량적 평가를 위해 SD(Standard Deviation), SNR(Signal to Noise Ratio), MTF(Modulation Transfer Function)를 측정하여 분석하였다. 선량은 80kVp일 때 가장 낮았으며, 120kVp일 때 가장 높았다. 80kVp의 영상을 Toshiba 사(社)의 AIDR 3D(Adaptive Iterative Reduction integrated into
$^{SURE}Exposure$ )로 재구성하고, 120kVp의 영상에 FBP로 재구성한 다음 정량적 비교를 한 결과 AIDR 3D를 적용한 영상의 SD가 낮게 나왔으며, SNR이 높게 나타났고, MTF 곡선은 유사하게 나타났다. 그리고 FWHM(Full Width at Half Maximum) 값의 오차가 거의 없었다. 결론적으로 AIDR 3D는 저선량에서도 높은 화질을 나타냄을 확인하였다. -
최근에 완료된 HEVC(High Efficiency Video Coding) 비디오 압축 표준은 H.264/AVC에 비해 2배 이상 향상된 압축 효율을 제공한다. 현재 진행 중인 HEVC 확장 (extension) 작업에서는 손실 및 무손실 부호화에서 4:2:2 및 4:4:4 색차 포맷과 최대 12비트 깊이를 지원하는 고급 프로파일을 개발하고 있다. 현재까지 개발된 HEVC의 CABAC(Context-based Adaptive Binary Arithmetic Coding)은 손실 부호화 환경에 적합하게 설계되었기 때문에 무손실 부호화 환경에서 최적의 부호화 성능을 제공하지 못한다. 본 논문에서는 4:4:4 색차 포맷 영상의 무손실 화면내 부호화 환경에서 잔여 신호의 통계적 특성을 고려한 향상된 CABAC 잔여 데이터 부호화 방법을 제안한다. 실험 결과를 통해, 본 논문에서 제안하는 향상된 CABAC 방법이 무손실 화면내 부호화에서 기존의 CABAC 방법에 비해 평균 약 2.41% 의 비트 수를 감소시키는 것을 확인했다.
-
본 논문에서는 메타데이터를 이용하여 사용자 시청경험을 향상시키기 위한 감성효과 메타데이터 저작도구의 설계 및 구현에 관한 것이다. 이를 위해 가상세계와 현실세계의 소통을 위한 규격인 ISO/IEC 23005 의 메타데이터를 이용한다. 다양한 목적을 가진 메타데이터의 유용성에도 불구하고, 실제 메타데이터를 저작하는 단계는 지루하고 단조로운 작업이다. 본 논문에서는 직관적이고 사용자 친화적인 메타데이터 저작도구를 소개한다. 제안된 저작도구는 사용자에게 방송콘텐트의 감성효과 저작을 위한 특징 정보를 제시함으로써 저작의 효율을 높일 수 있다.
-
본 논문에서는 기존의 화면해설 방송 제작 방법을 보완하기 위한 TTS 를 이용한 화면해설 방송 제작 방법을 제안한다. 우선 화면해설 방송이 삽입 될 수 있는 구간을 검출하기 위해 에너지 값과 스펙트럼 도심 값을 이용하여 묵음구간을 검출하고 검출된 구간에 TTS 를 이용하여 화면 해설을 삽입하였다. 제안한 방법을 이용하면 기존의 화면해설 방송 제작에 소요되는 인적, 시간적 노력을 줄일 수 있을 뿐만 아니라 화면해설 방송 콘텐츠의 양적 증가를 통해 시각 장애인들의 방송 접근성을 향상시키는 효과를 가져올 수 있다.
-
Kinect를 통해 Color영상과 Depth영상을 받아온 후, 사람과 사람의 스켈레톤이 검출되도록 했다. 스켈레톤이 검출되면 머리 위치를 중심으로 얼굴 유효영역을 만들고, 효율적인 얼굴 검출로 사용자 인식이 가능하도록 했다. 스켈레톤 검출 및 추적을 통해, 4가지 감정에 대해 제스쳐를 정의했으며, 각 감정에 따른 제스쳐를 취했을 때 정의한 감정이 인식되는지 실험했다. 실험 결과, 제스쳐를 통한 감정 인식 성공률이 86~88% 나왔으며, 이 제스쳐 인식이 다른 감정인식 방법과 융합될 필요가 있다.
-
Woo, Seung-Won;Sohn, Jong-In;Kim, Seung-Ryong;Kim, Jun-Hyung;Kim, Young-Jung;Sohn, Kwang-Hoon 286
감시 카메라에서 야간 시간대의 영상 품질은 매우 중요한 요소 중 하나이다. 본 논문에서는 IR LED Camera 에서 적외선 LED 를 사용한 회로적 제어를 통한 노출 제어에 문제점을 분석하고, 이를 해결하기 위한 적응적 배경 모델링과 IR 카메라의 특화된 객체 검출 방법을 제안한다. 노출 제어 방식의 배경을 제외한 적응적 배경과 객체의 합성으로 향상된 야간 영상획득 방식을 제안한다. 영상 개선 실험 결과는 기존의 회로적 노출 제어 방식의 영상보다 제안하는 방식이 프로세스의 단순화를 통한 비용 절감 효과와 야간 영상 품질 향상의 우수성을 보여준다. -
최근 많은 영상처리 연구자들 사이에서 마이크로소프트사의 실시간 깊이센서 '키넥트'가 상당한 관심을 받고 있다. '키넥트'는 실시간으로 깊이정보를 제공함과 동시에 별도의 센서를 부착하지 않고도 컴퓨터와의 인터렉션할 수 있는 가능성을 제공한다. 하지만 '키넥트'의 깊이영상은 홀 영역, 부정확한 경계, 낮은 해상도등의 많은 문제점을 지니고 있다. 이러한 부정확한 깊이 정보는 3차원 렌더링, 가상시점 영상 합성, 모션 인식 등에서 성능 저하를 야기한다. 따라서 본 논문에서는 깊이 정보 품질 향상기법에 관하여 깊이영상 신뢰도를 이용한 도메인 변환기반 해상도 상향 알고리듬을 제안한다. 정확하고 빠르게 홀 영역정보를 추정하기 위해 도메인 변환 기반의 경계 보존 필터링이 사용된다. 또한 다양한 깊이 영상의 노이즈를 효율적으로 제거하기 깊이 영상의 신뢰도를 이용한다. 실험결과를 통하여 제안하는 방법이 효율적으로 홀 영역을 채우고, 부정확한 경계를 제거하여 깊이 영상의 품질을 향상시키는 것을 확인할 수 있다.
-
최근 3D 비디오의 흥행과 더불어 사람들이 스테레오스코픽 비디오를 쉽게 접할 수 있게 되었다. 하지만 부적절한 스테레오 스코픽 비디오는 시청자로 하여금 어지럼증, 눈의 피로 등을 느끼게 할 수 있다. 따라서 비디오 컨텐츠를 분석하여 피로도를 예츨할 수 있는 지표의 개발이 필요하다. 스테레오스코픽 비디오에서 피로도를 유발시키는 원인은 여러 가지가 있으며, 본 논문에서는 비디오의 카메라 움직임 정보에 집중한다. 카메라의 흔들림은 심각한 멀미를 유발할 수 있다. 이는 스테레오스코픽 비디오에서 더욱 강렬하게 나타나게 된다. 우리는 스테레오스코픽 비디오의 흔들림을 측정하기 위해 3D 복원 기술을 사용한다. 특히, 좌안 비디오와 우안 비디오의 정보를 모두 활용하는 최적화된 알고리즘을 제안한다. 이를 통해 우리는 각 프레임의 카메라 위치와 방향 정보를 획득할 수 있다. 마지막으로 획득한 3차원 카메라 움직임 정보로부터 카메라의 흔들림을 잘 표현할 수 있는 점수를 계산한다.
-
디스플레이 기술이 발전함에 따라 다양한 크기의 디스플레이를 탑재한 장치들이 등장하게 되었고, 다양한 디스플레이 크기만큼 다양한 해상도를 사용하고 있다. 때문에 비디오 코덱과 scaler는 보편적으로 함께 사용된다. 그러나 기존의 scaler는 비디오 코덱의 복호화기와 화면 해상도 변환 모듈이 독립적으로 구성되고, 서로 간에 정보를 이용하지 않으므로 시스템의 성능 개선에 한계가 존재하였다. 즉, 비디오 코덱의 복호화기는 비트스트림으로부터 복호한 정보를 바탕으로 영상을 복원하고, 복원영상은 up/down scaler에서 확대/축소를 수행한다. 하지만 비디오 코덱의 비트스트림에 존재하는 정보는 영상의 특성을 반영하기 때문에 up/down scaler에서 비디오 코덱의 복호화기에서 복호된 정보를 이용하면 복잡도의 증가 없이 효율적인 확대/축소를 수행할 수 있다. 이에 본 논문에서는 비디오 코덱 중 차세대 비디오 코덱인 H.264/AVC 복호화기에서 생성된 복원 영상에 대해서 별도로 영상의 특성을 계산하는 모듈 없이 H.264/AVC 복호화기에서 복원된 정보 중 인트라 모드 정보를 바탕으로 영상의 특성에 맞는 up/down scaler를 구현하는 방법을 제안한다. 이 방법은 기존의 scaler들보다 물체의 경계영역을 더 선명하게 확대하는 효과를 보인다.
-
An Intelligent Landslide Detection Algorithm Based on Computer Vision for Disaster Prevention System자연재해의 예방에 대한 인식이 화두가 되면서 최근 재해 경보 시스템을 다루는 새로운 연구들이 활발히 진행되고 있다. 제안하는 알고리듬은 영상을 통해 얻은 정보를 이용하여 산사태를 초기에 검출하는 방법이다. 기존의 검출 방법은 사람이 직접 모니터링을 해야 하기 때문에 많은 인력과 시간을 필요로 하고 접근성이나 비용문제 등의 각종 제약이 따른다. 따라서 효율적인 산사태 감지를 위해 산사태 발생 가능 지역에 비디오 기반의 감지 시스템을 통해서 자동으로 검출하는 시스템이 필요하다. 감지 시스템에서는 신뢰성 있는 재난영역의 검출이 매우 중요하다고 볼 수 있다. 본 연구는 산사태를 검출하기 위하여 먼저 블록단위의 영역 움직임 검출을 하여, 움직임 맵을 만들고 일정한 시간 간격으로 반복적으로 변하는 영역의 움직임 맵을 기록한다. 또한 움직임 방향뿐만 아니라 발생 순서를 기록하여 더욱더 정확한 움직임을 판단할 수 있다. 제안된 알고리듬은 비디오영상 실험을 통해 탐지영역의 산사태 검출이 잘 이루어짐을 확인하였다.
-
최근 후쿠시마 원전, 쓰나미, 홍수와 눈사태와 같은 자연 재난들의 발생으로 인해 엄청난 수의 사상자와 막대한 재산피해가 초래되었다. 이런 재난을 미연에 방지하고자 하는 자동화된 조기 경보 시스템의 연구, 지능형 영상감지 기술 연구가 활발히 진행되고 있다. 이러한 지능형 영상감시기술을 적용하여 재난유형별 위험상황을 감지, 판독, 분석, 표출할 수 있는 기능을 구현하고자 통합된 카메라 영상정보를 활용하여 영상변화를 감지하여 자동식별과 판독을 통해 기준 값 이상의 변화감지 시 경보알림 및 해당 영상 표출을 제공하였다. 본 논문은 기존의 수위상승 감지는 수위계나 교량에 표시된 수위표의 숫자를 읽어 자동적으로 위험을 알려주거나 사람이 수위감지를 위해 설치된 카메라를 모니터링 하여 위험을 감지하도록 되어있던 점을 개선하여 기존 수위감지 목적으로 설치된 카메라의 영상을 분석하여 수위상승 위험을 알려주는 알고리듬을 제안하였다.
-
Lee, Yong-Tae;Paek, Myung-Sun;Lee, Yong-Hoon;Kim, Kwang Yong;Lee, Seoung Hyung;Kim, Tae Shin;Kwan, Dae Bok;Choi, Seoung Jong 307
국내에서는 1975년부터 민방위 기본법을 재정하여 민방위 경보 서비스를 실시하고 있으며 인구 5천이상의 도심지역의 민방위 경보를 위해 중앙과 시도를 중심으로 구축된 민방위 경보시스템이 운영되고 있다. 그러나 기존 재난경보시설과의 연동이 부족함으로써 특히 도심지역에서는 건물로 인한 민방위 경보 사각지대가 발생하면서 민방위경보 수신의 한계를 갖게 되었다. 이에 본 본 논문에서는 도시 소음차단 방음시설이 잘된 도심지역의 대형빌딩이나 아파트 내부 등 옥내에서의 민방위경보 사각지대를 해소하는 방안을 중심으로 도심지역의 민방위경보 수신 커버리지를 확대하는 방안에 대해 고찰한다. -
국가 긴급사태 발생시에는 긴급재난정보를 신속하게 전달하기 위하여 임시재해방송국을 개설할 수 있다. 그러나 국가긴급사태발생 시에는, 시정촌의 기초단체장들에게는 전기나 전화, 휴대폰 등의 연락회선이 두절되어 정보전달 수단이 한정되게 된다. 특히 라디오나 텔레비전 시청도 곤란한 상황에서 재난정보전달체계는 어려운 환경에 처하게 된다. 따라서 재난발생 초기에 임시재난방송국의 역할은 매우 중요하고, 피재지나 피난소에서 얻은 피난정보나 라이프라인정보, 지원물자 배포정보 등의 정보를 제공하고 있다. 본고에서는 동일본 대진재 시의 임시재난방송의 개설 및 운영 등에 관한 임시재난방송국의 운영사례 등을 소개하고자 한다.
-
최근 TV 와 같은 디스플레이들은 비접촉식 인터랙션에 의해 제어되는 방법을 많이 사용하고 있다. 이를 위한 다양한 방법들 중에서 풀 비전 기반 인터랙션 방법이 사용자에게 가장 자연스러운 접근을 유도한다. 본 논문에서는 이러한 풀 비전 기반 방법으로 같은 시점의 컬러 영상과 적외선 영상을 이용하여 사용자를 인식하고 손 동작을 이용하여 TV 를 제어하는 어플리케이션을 보인다. 이를 위해 적외선 영상과 거리의 관계를 도출하여 어플리케이션에 적용하고 제스쳐 기반으로 TV 를 제어하였다.
-
A novel foveation filter method is proposed in DCT domain. For countering the blocking and ringing artifacts, we devise the tools measuring the signal gradient, the block signal variations in the DCT domain. Each measurement is properly applied to each enhancement region and smoothing region. The proposed method optimally adapts the enhancement factors to the characteristics of the underlying signals and so maximizes the enhancement performances with significantly suppressing the artifacts. The subjective and objective evaluations verify that the proposed method sustains producing the improved video qualities for various sequences without tuning any parameters to individual sequences.
-
야간 영상에서 쉽게 발생하는 빛 번짐은 영상 내에 존재하는 색상 정보나 경계선과 같은 컴퓨터 비전에서 중요한 정보들에 대해 영향을 끼친다. 때문에 이를 효과적으로 이용하기 위해서는 빛 번짐 영역을 없애주는 보정단계가 필요하다. 보정하기 위해서는 먼저 그 빛 번짐 영역을 정확하게 찾아내는 것이 중요하다. 본 논문에서는 다층구조를 이용하여 얻어진 빛 번짐 영역을 더욱 정확하게 모델링 할 수 있는 방법을 제안한다. 제안하는 방법은 슈퍼픽셀을 이용하여 빛 번짐 영역 모델링의 정확도를 향상시킨다. 제안한 방법에 의하면 층 구조를 이용하면서 발생되는 문제점인 영상 밝기 정보에만 의존하여 잘못된 영역을 포함시키거나 누락시켰던 문제점을 해결하였다.
-
Haze is an extreme reason of the reduction of contrast when capturing image in the outdoor. Recently, there are several single image dehazing techniques, but they are not robust in dynamic variations of natural environment caused by the thickness, coverage of haze and appearance of sunlight. In this paper, we propose an effective and robust method to enhance luminance for image dehazing depending on histogram analysis. Compare with conventional methods, our proposal have better performance in term of contrast, and computation time.
-
본 논문에서는 ToF(Time-of-Flight) 카메라의 거리 잡음을 제거하는 방법으로 거리와 진폭에 따른 거리 잡음 모델링을 이용한 적응적인 SUSAN(Smallest Univalue Segment Assimilating Nucleus) 필터를 제안한다. ToF 카메라의 거리 잡음 제거를 위해서 기존에 제안된 여러 가지 방법들은 거리 잡음의 특성을 고려하지 않거나 진폭에 따른 거리 잡음의 특성만을 고려하였다. 하지만 실제 ToF 카메라의 거리 영상에 포함되는 거리 잡음은 진폭과 거리에 따라서 변화하기 때문에 거리와 진폭을 모두 고려한 거리 잡음 모델링이 필요하다. 따라서 제안하는 방법은 우선 거리와 진폭의 변화에 따른 ToF 카메라의 거리 잡음 특성을 모델링 한다. 이후 제안하는 방법은 생성된 거리 잡음 모델에 의해 인자가 결정되는 적응적 SUSAN 필터를 이용하여 ToF 카메라의 거리 영상의 잡음을 제거한다. 실험 결과 제안하는 방법은 기존의 ToF 거리 영상의 거리 잡음제거 방법에 비해 보다 효과적으로 거리 영상의 잡음을 제거하면서 디테일을 잘 보존하였다.
-
본 논문에서는 ATSC 지상파 DTV 방송시스템의 효율적인 관리를 위해 부가데이터 송수신 기술을 이용한 방송망 관리시스템을 제안한다. 제안된 방송망 관리시스템은 기존 송/중계기의 교체 없이 방송망을 원격으로 모니터링하고 제어할 수 있을 뿐만 아니라, 추가적인 주파수 할 당 없이 수 Mbps의 데이터를 추가로 전송할 수 있다.
-
본 논문에서는 차량에 부착된 4대의 어안렌즈 카메라 영상을 이용하여 차량 주위 전방향의 주변 정보를 포함하는 정합 영상을 생성하고, 생성된 정합 영상에서 차선을 검출하는 알고리즘을 제안한다. 기존의 전방 카메라만을 이용하여 차선을 검출하는 방법들은 안개와 같이 기상 환경이 안 좋은 경우 가시거리가 짧아져 정상적인 차선 검출이 어려운 문제가 있다. 이에 반해 4대의 어안렌즈 카메라로 차량의 주변을 촬영한 영상은 기상 환경에 영향을 적게 받아 안정적인 차선 검출에 용이하다. 어안렌즈 카메라로 촬영한 영상은 왜곡이 심하기 때문에 왜곡 보정을 수행한 후 차량 위에서 아래로 내려다본 시점으로 투영 변환하여 하나의 영상으로 정합한다. 정합영상에서 관심영역을 설정한 후 차선 후보 영역을 검출하고, 검출된 후보 영역들로 차선을 직선으로 모델링한다. 점선 차선 구간이나 차량 흔들림에 대응하기 위해 직선으로 모델링된 차선 정보의 차선 각도와 차량으로부터 거리 정보를 칼만 필터 기반 추적 및 보정하여 안정적으로 차선 검출을 수행한다. 실험 결과 제안하는 방법은 실선구간에서 99.57%, 점선구간에서는 90.48%의 검출 정확도를 가진다.
-
본 논문은 HEVC(high efficiency video coding)의 다양한 화면내 부호화 모드에 대한 성능을 분석하고, 그 분석에 바탕하여 RMD(rough mode decision)가 고려하는 화면내 예측 모드의 개수를 PU 의 크기별로 감소시키는 것과 함께, MPM(most probable mode)의 추가를 최소화해 RDO 가 고려하는 후보의 개수를 줄이고, 상위 CU 와의 Cost 차이값을 이용하여 CU 의 분할을 줄이는 것으로 부호화 복잡도를 감소시키기 위한 방법을 제안한다. 실험 결과에서는 2.02% BD-rate 증가만으로 부호화 시간을 10.87% 감소시킬 수 있음을 보인다.
-
본 논문에서는 동일 주파수 대역 내 DRM(Digital Radio Mondiale) Plus 신호와 FM(Frequeny Modulation) 신호가 모두 서비스 되는 Hybrid 방송 모드에 적합한 DRM Plus 신호 검출 기법을 제안한다. OFDM(Orthogonal Frequency Division Multiplexing) 신호의 Guard-Interval 상관 기법을 그대로 적용할 경우 DRM Plus 신호 검출 성능은 우수하나, FM 신호 수신 시 False Alarm 발생 확률이 증가하는 문제점이 발생한다. 제안한 방법은 Guard-Interval 상관 방법에 Reference 블록을 포함하고 있어, 약한 DRM Plus 신호에서도 판별 확률이 높고, 아날로그 FM 신호 수신 시 False Alarm이 발생할 확률이 낮은 특징이 있다. 모의 실험을 통하여 제안한 기법의 성능을 확인한다.
-
본 논문에서는 유럽의 디지털 라디오 방송 규격인 DAB+(Digital Audio Broadcasting Plus)와 DRM+(Digital Radio Mondiale Plus) 시스템을 수신하기 위한 소프트웨어 기반의 수신 시스템의 설계 및 구현에 대한 연구를 수행하였다. 기존의 아날로그 FM 수신기를 대체할 수 있도록 소프트웨어 기반의 디지털 라디오 수신 시스템을 구현하였으며, 각 시스템의 USB 수신기로부터 방송을 입력받아 메모리 공유기법을 통해 일괄 수신 처리함으로써 시스템의 부하를 감소시킨다.
-
본 고에서는 AM과 FM라디오의 디지털방송 전환을 위하여 현재 사용 중인 방송대역에서의 IN-BAND 방식 외에도 VHF 하위대역 혹은 VHF상위대역을 사용하는 OUT-Of-BAND 방식에 대해 각 전송방식의 장단점을 분석하였다. 그러나 현재 디지털라디오뿐만 아니라 TV도 UHDTV 도입을 위해 VHF상위대역 주파수 사용을 원하고 있어 DMB와 라디오와 TV의 차세대방송 주파수 요구가 상호 충돌이 예상된다. 그러므로 본 고에서는 FM의 디지털라디오 전환방법으로 VHF하위대역(TV채널 5번과 6번)에서의 OUT-Of-BAND 방법에 의한 DRM+ 전송방식 적용을 제안하고 있다, 중파라디오의 디지털방송도 동일 계열 DRM 기술 적용으로 수신기를 값싸게 제조하고 빠르게 보급함으로써 디지털라디오의 활성화 방안을 제시하고 있다.
-
본 논문에서는 깊이영상의 특징을 이용하여 깊이영상에 보다 적합한 움직임 예측방법에 대한 방식을 제안한다. 기존 컬러영상 기반으로 제안되었던 대부분의 움직임 예측 방법들이 깊이영상에 적용할 경우 local minimum 에 빠지게 되어 이에 따른 압축 성능 저하가 있음을 확인하였다. 본 논문에서는 이러한 문제점들이 깊이영상의 오브젝트 경계 영역에서 나타나게 됨을 분석하며, 이러한 문제점을 해결하기 위해 깊이영상의 경계 영역에 대해 feature matching 방식을 이용한 full search 방식을 제안한다. 실험적인 결과는 제안방식이 기존 full search 방식과 비교하여 성능은 비슷하게 유지한 채 복잡도를 크게 개선할 수 있음을 보여준다.
-
본 논문에서는 현재 활발하게 표준화가 진행중인 3D-HEVC 의 기술들 중 Backward View Synthesis Prediction(BVSP)에서 움직임 보상을 수행하는 서브 블록 경계에 가우시안 필터를 적용하는 방법을 제안한다. BVSP 에서는 4x4 서브 블록 단위로 대표 깊이 정보를 구하여 움직임 보상을 수행하기 때문에 서브 블록 경계에 블록킹 왜곡이 발생할 수 있으므로 가우시안 필터를 통해 이러한 왜곡을 줄일 수 있다. 하지만 모든 경계 픽셀에 대해 가우시안 필터를 적용하지 않고 경계 픽셀의 주변 정보에 따라 적응적으로 가우시안 필터를 적용하고, 필터의 컨트롤 파라미터 또한 적응적으로 변경하는 방법을 제시한다. 제안하는 방법을 기존의 HTM 6.2 와 비교했을 때, 평균 0.1%의 부호화 효율 개선을 보이고 복잡도는 1.2% 증가 하였다.
-
ITU와 ISO/IEC가 공동으로 UHD급 영상 부호화를 위해 표준화를 진행하고 있는 HEVC 코덱은 H.264/AVC 대비 2배 이상의 압축 효율을 갖는 것을 목표로 정하고 있다. HEVC(High Efficiency Video Coding)는 In-Loop Filter 기술로 H.264/AVC에서 사용하고 있는 Deblocking Filter와 새롭게 추가 된 SAO(Sample Adaptive Offset)를 사용하고 있다. 본 논문에서는 HEVC의 In-Loop Filter 기술 중 하나인 SAO의 기술의 EO에서 Category를 조금 더 정확하게 판단하여 분류하는 방법을 제안을 한다.
-
H.264 등 동영상 압축 표준에서는 비디오 신호의 시간적 중복 데이터를 제거하기 위해 움직임 추정/보상을 수행한다. 또한 움직임 추정/보상의 정확성을 향상하기 위해 다중 참조프레임을 지원한다. 여러 장의 참조 프레임 중 현재 블록과 가장 유사한 참조 프레임 영역으로부터 움직임 추정/보상을 수행하여 보다 정확한 예측에 의해 잔차신호의 크기가 감소하게 되고, 그 결과 부호화 효율이 더욱 개선되었다. 본 논문에서는 다중 참조 프레임을 사용한 움직임 추정/보상의 효율을 유지하면서도 참조프레임을 나타내는 참조프레임 인덱스 비트를 줄여주어 부호화 효율을 더욱 개선하는 방법을 제안한다. 본 논문에서 제안하는 방법은 움직임 추정/보상 시, 각각의 참조 프레임에서 움직임 추정/보상에 사용되는 예측화소들을 비교하여 다중 참조 프레임이 효과가 있다고 판단 되는 경우에만 다중 참조 프레임 움직임 추정/보상을 수행하고, 다중 참조 프레임이 효과가 없다고 판단 되는 경우에는 단일 참조 프레임 움직임 추정/보상을 적응적으로 수행하였다. 실험결과 제안하는 방법은 다중 참조 프레임 인덱스 부호화에 소요되는 비트를 절감하면서도 부호화 효율을 유지함을 확인 할 수 있었다. 제안하는 방법은 동영상 압축 코덱에 적용되어 압축 성능을 더욱 향상 할 수 있다.
-
방송유통이 중요하고 방송시장의 과제이다. 드라마외에도 다큐멘터리가 꾸준히 수출이 증가되는 추세이다. 콘텐츠 부가가치 창출과 고용확산을 위해 방송사와 제작사는 국내외 유통에 눈을 돌려야 하는 게 맞다. 여기서 흔한 질문 하나. "독립제작사가 어렵다고 하는 데, 수출 유통을 하면 쉽게 부가수익을 창출하지 않을까? 왜 안하지?" 그건 배고픈데 빵이 없으면 쿠키를 대신 먹으면 되지 않을 까하는 질문과 같다. 저작권을 방송사와 소유하는 것도 중요하고, 그 보다 사전기획과 제작을 해서, 수입이 생길때까지 회사가 '버텨내야 한다'. 유통한다고 수익이 바로 입금되는 것은 아니다. 한국의 방송콘텐츠 기획은 훌륭하다. 인구 5천만명의 나라에서, 한국어를 쓰는 나라가 많지 않음에도 우리 모국어로 많은 나라에서 보고있다는 것은 대단한 것이다. 또한 세계 거리에 싸이와 소녀시대가 울려퍼지는 것은 대단하다. 그것은 미디어를 염두 해둔 한글창제자부터, 대중산업을 이끄는 모든 한국 제작자들은 훌륭하다. 지금은 방송사와 제작사가 해외진출에 눈을 돌리고 있으며, 많은 성과를 내고 있다. 향 후 방송콘텐츠산업의 부가가치 향상과 발전을 위해서 좀더 많은 작품이 해외에 나가야 한다. 그렇게 하기위해서 해외에 더욱 적극적으로 진출을 모색하기 앞서, 글로벌 기획을 할 때 염두하여야 할 점을 정리해보겠다.
-
최근 3D산업의 급성장으로 인해 3D콘텐츠 제작에 대한 관심이 확산되고 있다. 지금까지는 3D콘텐츠 제작을 영화나 애니메이션 같은 자연영상을 3D변환하는 것에 초점이 맞추어져 있었다. 자동 3D변환에서는 window 영상처럼 텍스트, 이미지, 로고 등의 혼합되어 있는 영상을 처리하는데 어려움이 있다. 특히 텍스트는 동일한 깊이맵을 얻지 못하면, 깨짐, 흔들림 등의 문제점이 발생한다. 해결방법으로 혼합 영상을 구분하고 영상 영역만을 탐색해서, 3D변환을 하고, 다른 영역은 2D로 처리함으로써 상기 문제점을 극복할 수 있다.
-
3D Conversion은 3DTV 및 3D Display에 장착되어 제공되고 있다. 이외에도 다양한 변환 방법이 제안되어 왔다 기존 방법들은 영화나 애니메이션 같은 자연영상을 3D로 변환하는 것에 초점이 맞추어져 있었다. 따라서 자동 3D변환에서는 webpage영상처럼 텍스트, 이미지, 로고 등의 혼재되어 있는 영상을 처리하는데 어려움이 있다. 특히 텍스트는 동일한 깊이맵을 얻지 못하면, 깨짐, 흔들림 등의 문제점이 발생한다. 해결방법으로 webpage에서 image region만을 탐색해서, 3D변환을 하고, 다른 영역은 2D로 처리함으로써 상기 문제점을 극복할 수 있다. 이를 위해 본 논문에서는 변환하려는 영상 영역을 탐색하고 이 탐색된 영상들을 단순하게 픽셀의 수평이동이 아닌, 양선형 보간으로 변환하여 홀채움 문제를 극복할 수 있는 변환방법을 제안한다.
-
스마트 미디어 환경으로 변화하면서 전에는 볼 수 없었던 다양한 방송 서비스들이 소개되고 있다. 증강현실은 그중 하나로, 스마트 미디어를 위한 주요 서비스로 자리를 잡았으며, 디지털 방송 서비스로도 그 응용 기술이 확산되어 증강방송기술의 연구가 수행되고 있다. 증강방송은 TV 화면에 증강 콘텐츠를 방송 콘텐츠와 겹쳐 보여주는 서비스로, 스마트 기기로 제어하고 연동할 수 있다는 특징을 가지고 있다. 본 논문은 대표적인 유아 프로그램인 '방귀대장 뿡뿡이'로 증강방송 콘텐츠를 제작하여 시연함으로써 다양한 증강방송 활용 모델을 제시했다.
-
스마트 단말에 장착된 센서들로부터 단말의 상황 정보를 수집하고 분석하여, 상황에 적절한 동영상을 단말에게 스트리밍해 주는 서비스 구조를 제안한다. 스마트 단말은 NFC 또는 QR 코드 기반으로 전시물이나 특정 사물에 기등록된 동영상 정보를 획득하고, 저밀도 기반 WiFi 무선 실내 측위 기술을 사용하여 단말이 위치한 실내 공간 정보를 서버에 제공한다. 상황인지형 스트리밍 서버는 단말이 요청한 정보를 토대로 단말의 해상도에 적절한 동영상을 스트리밍 한다. 설계된 상황인지형 비디오 스트리밍 서비스 구조는 전시와 컨벤션, 대형 기관 및 테마파크의 안내 및 홍보 등의 용도로 활용될 수 있다.
-
텔레프레즌스 시스템은 기존의 영상회의 시스템과 비교하여, 라이프 사이즈의 출력, 고품질의 영상 및 음성 출력을 가능하게 함으로써 참석자로 하여금 실제 회의에 참석하고 있는 듯한 몰입도를 제공하여 원거리의 출장을 대체할 수 있는 시스템이다. 기존의 텔레프레즌스 시스템은 각 클라이언트의 미디어 정보를 중앙 서버에서 취합, 재구성하여 각각의 클라이언트로 전달하는 구조를 갖는다. 이러한 구조는 기능의 구현은 용이하나 모든 트래픽이 서버로 집중되어 서버가 설치되어 있는 통신 노드에 부하가 집중되는 단점을 갖는다. 이러한 문제점을 해결하기 위해 중앙 서버의 호처리 기능과 미디어 처리 기능을 통신망에 분산시키는 구조가 분산형 텔레프레즌스 구조이며, 분산 구조 하에서 각각의 클라이언트는 기존의 중앙 서버에서 처리되었던 미디어의 재구성 기능, 텔레프레즌스 서비스를 위한 고품질의 비디오 및 오디오 처리 기능, 협업을 위한 문서 공유 기능 등이 요구된다. 본 논문에서는 분산형 구조에서 요구사항을 만족하는 텔레프레즌스 클라이언트 시스템의 구현 방법에 대하여 기술한다.
-
본 논문에서 구현한 경량단말을 활용한 이종 박물관 관람 환경별 최적의 적응적 관광 서비스 제공 모듈은 서로 다른 박물관을 관람하는 상황에 맞춰 그 관람객에게 가장 적합한 서비스를 제공을 해주는 모듈이다. 종래의 박물관 관람 형태는 사용자가 박물관에서 나누어준 하드카피 형태의 팜플렛 또는 가이드 안내에만 의존한 관람 형태이고, 주제별 아이템에 관한 상세 정보도 현장에 배치된 안내물을 보던가, 박물관에서 대여형태로 제공하는 오디오 장비만을 활용 하는 수준이며, 특히나 제한된 시간내에 대형 박물관을 관람해야 하는 경우 자신이 관심있는 것만 볼 수 없는 환경이다. 본 논문에서 소개될 이 모듈은 가상화 기술과 경량 단말을 활용하여 대형 박물관 또는 미술관등을 방문한 관람객에게 본인에게 맞는 최적의 관람 서비스를 제공한다. 좀더 자세하게는 대형 박물관에서 이 모듈이 사용되는 경우 넓은 공간에 무수히 많은 작품들이 전시되어 있는 상황에서 가용한 관광시간에 본인이 보고자 하는 것들만 추천받아볼 수 있도록 도와줄 수 있고, 최소한의 원가를 들여서 제작된 경량 스마트 단말을 통하여 해당 작품에 대해 상세한 부가 정보를 제공받아 박물관의 관람효과를 극대화 할 수 있도록 도와준다.
-
본 논문에서는 허밍기반 음원 검색 시스템을 위한 오디오 특징 시퀀스 데이터 색인 기법을 제안한다. 우선 Query-by-Singing/Humming (QbSH) 시스템의 특징 데이터베이스를 생성하기 위하여 MP3 와 같은 다성음원에서 주요 멜로디를 추출하여 시퀀스데이터를 생성하고, 고속 검색을 지원하기 위한 시퀀스데이터를 색인화한다. 본 논문에서는 최소 Dynamic Time Warping (DTW) 거리 기법, 시퀀스 추상화 기법, 상한 값 기반 DTW 기법과 같이 세 가지의 시퀀스 데이터의 색인화 기술을 제시하고 각각에 대한 문제점을 파악하고, 성능을 평가한다. 이를 통하여 향상된 검색 시간과 검색 정확도를 얻을 수 있다.
-
최근 인터넷이나 스마트 홈 기기의 발달로 웹의 크기가 폭발적으로 증가함에 따라 인터넷상에 존재하는 웹 문서들을 추적하여 필요한 정보를 수집하는 기술이 중요성을 더해 가고 있다. 스마트 홈 클라우드 서비스는 스마트 홈과 클라우드가 융합된 기술로 개인과 가정에서 생성되고 소비되는 컴퓨팅 자원과 콘텐츠들을 외부 서버 또는 다른 가정과 필요할 때 결합하고 공유하는 서비스로, 더욱 만족스러운 서비스를 위해서는 사용자의 컨텍스트를 자동으로 수집, 처리, 가공해 주는 기능이 필요하다. 이에 본 논문에서는 사용자가 좀 더 편리하고 만족스럽게 가정내의 스마트 홈 기기를 사용할 수 있도록 사용자나 스마트 기기의 콘텍스트에 맞는 정보를 제공할 수 있는 클라우드 기반의 콘텍스트 크롤러를 연구 및 설계하였다
-
최근 상황인지 기반을 통해 사용자에 대한 모든 정보를 정확하게 파악하여, 현재 가장 필요한 데이터들만 추출하여 실시간으로 빠르게 지능적으로 제공하는 새로운 스마트 클라우드 컴퓨팅 모델의 연구가 필수적으로 요구되고 있다. 이에 본 논문은 관광객이 전시관이나 관광지에서 공연, 예술, 문화재 등을 감상할 때 클라우드 서버에 실시간으로 접속하여 개인 정보와 환경, TPO에 맞게 전시물의 설명이나 체험 서비스를 받을 수 있는 관광객 맞춤형 문화서비스 플랫폼을 연구 및 설계하였다.
-
모바일에서의 증강현실(Augmented Reality :AR) 어플리케이션은 디바이스의 구조상 많은 제약사항이 있기 때문에 데스크탑 환경에 비교하여 접근성이 낮다. 이러한 문제점을 해결하기 위해 다양한 방법의 연구가 진행되고 있다. 본 논문에서는 모바일 기기의 처리량을 줄이기 위해 프로그래밍 가능한 GPU(Graphic Processing Unit)를 이용, 영상처리 알고리즘을 병렬로 처리하고 고속화하여 모바일 AR 어플리케이션의 접근성을 높이는 비마커(Markerless)기반 객체 인식 시스템을 구현한다.
-
실내 측위 시스템은 실내 환경에서 위치 기반 서비스를 하는데 매우 유용하다. 그러나, Wi-fi 신호 등을 사용하는 일반적인 실내 측위 시스템들은 대부분 시스템의 설치와 유지 보수에 많은 비용이 소요된다. 마커를 기준으로 측위를 하는 영상 기반의 시스템도 있지만, 일반 사용자들에게 미적인 문제를 야기 시킬 수도 있다. 이 논문에서, 우리는 대부분의 공공장소에 이미 설치되어 있는 간판 등을 이용하는 새로운 영상 기반의 실내 측위 시스템을 소개한다. 간판의 위치와 방향은 그것들이 설치 될 때 해당 건물의 기준 좌표계에서 위치와 방향이 결정되기 때문에, 간판에 대한 사용자의 상대적인 위치와 방향을 얻어내면 건물의 기준 좌표계에서 사용자의 위치와 방향을 구할 수 있다. 실제 공공장소에서 수행 된 실험은 우리의 시스템이 실내 측위의 실용적인 방법이 될 수 있음을 보여준다.
-
본 연구는 N스크린 서비스의 이용행태(교차이용, 개인별 단말기 보유량, N스크린 이용을 위한 지불금액, N스크린 이용시간), 콘텐츠 특성(채널의 다양성, VOD의 다양성), 기능적 요인(시스템품질, 인터페이스, 결제시스템), 비용에 대한 이용자의 인식이 이용만족도와 지속이용의사에 미치는 영향을 살펴보았다. N스크린 유료 경험이 있는 이용자를 대상으로 (N=498), 웹을 통한 설문조사를 한 결과, 이용만족도에 가장 큰 영향을 미치는 요인은 기능적 요인 중 인터페이스로 나타났으며, 결제시스템, VOD의 다양성, 채널의 다양성, 비용 순으로 유의하게 나타났다. 본 연구는 이용자 차원에서 서비스 만족에 영향을 주는 요인들을 밝혀냄으로써, N스크린과 스마트TV의 활성화를 위한 기초 자료를 제공하는 데 의의가 있다.
-
2012년 말 아날로그 TV의 종료와 함께 기존의 아날로그 TV에서 사용하고 있는 채널들이 유휴 대역으로 존재한다. 현재 비교적 많은 유휴 상태로 있는 대역을 효율적으로 사용하기 위한 논의가 지속적으로 진행 중이다. 본 논문에서는 차세대 방송서비스를 위한 주파수 재분배 방법에 대해서 분석하였다. 차세대 방송 서비스는 역호환성(Backward Compatibility)이 보장되어야 한다고 가정하고, 현재 구성 되어있는 다중 주파수 망(MFN : Multi Frequency Network)의 한계와 이를 극복할 수 있는 방법에 대해서 기술하였다. 단일 주파수 망(SFN : Single Frequency Network)의 구성이 가능 한 경우, 현재 서비스 중인 HDTV 방송 서비스와 차후 제공할 수 있는 차세대 방송 서비스를 동시에 제공할 수 있도록 주파수 분배 안을 제시하였다.
-
청각장애인을 위한 지상파방송 서비스 중 자막방송은 100%에 가까운 편성 비율을 달성하고 있지만, 화면을 가리는 수화방송은 5% 수준의 편성에 그치고 있다. 본 연구에서는 자막방송을 수화로 번역하여 그래픽 수화방송을 생성함으로써 수화방송의 비율을 높이고자 한다. 수화 단어들의 빈도를 파악하고 중요 단어부터 모션 캡처하기 위해 과거 3년간 일기예보 스크립트를 분석하였다. 자막방송 문장을 형태소별로 분석한 다음 중요 품사 위주로 단어 단위로 번역하고, 기 구축된 한국어 어휘의미망을 이용하여 수화사전에 없는 유의어와 하위어를 대표어로 대체하였다. 기계번역 기술이 수화통역사의 수준을 따라잡을 수는 없지만 향후 수화방송도 선택적 서비스가 가능해지고 수화통역사의 수화방송이 모든 프로그램에 편성될 때까지 본 시스템이 보조적 시청 수단으로 사용 가능할 것이다.
-
현재 MPEG 에서 표준화 중인 IVC(Internet Video Coding)에서는 저지연 모드 부호화 구조에서 비참조 P 프레임 부호화 기법을 선택적으로 사용하여 2% 비트율 이득을 얻고 있다. 기존의 비참조 P 프레임 기법은 움직임 벡터(MV)의 크기를 이용하여 적응적으로 고정된 부호화 구조의 비참조 P 프레임을 적용하고 있으나 시퀀스에 따라서 오히려 부호화 성능이 크게 떨어지는 단점이 있다. 본 논문에서는 IVC 시험모델(ITM4.0)에 채택되어 있는 적응적 비참조 P 프레임 부호화 성능을 개선하기 위하여 기존의 고정된 비참조 P 프레임의 구조를 변경하는 기법과 MV 와 함께 프레임별 발생 비트량을 함께 사용하는 기법을 제시한다. 실험결과 제안된 기법은 시퀀스에 따른 큰 성능 저하 없이 ITM4.0 대비 3.0% 정도의 비트율 감소를 얻음을 확인하였다.
-
동영상 압축 표준인 HEVC(High Efficiency Video Coding)는 ITU-T(VCEG)와 ISO-IEC(MPEG)에서 JCT-VC라는 팀을 이루어 공동으로 표준화를 완성단계에 이르고 있다. 이 표준에서는 동영상 압축의 대표적 기술인 인트라 예측 방법을 사용하며, 기존 H.264/AVC 보다 더욱 다양한 방향의 예측을 통한 부호화 및 복호화의 효율을 가져온다. 제안하는 방법은 다양한 방향의 화소 예측에 사용되는 필터링 방법을 개선하여, 영상에 특성에 맞추어 DCT-IF 필터와 선형 필터를 적응적으로 영상의 특징에 맞추는 화소 예측 방법을 통해 기존 방법보다 약 2% 이상의 성능 향상을 가져오는 방법이다.
-
동영상 압축 기술 HEVC(High Efficiency Video Coding)는 ITU-T(VCEG)와 ISO-IEC(MPEG)에서 JCT-VC라는 팀을 이루어 공동으로 표준화를 완성 단계에 이르렀다. 기존 표준보다 약 50%의 성능 향상을 가져왔지만 다양한 최신 압축 기술을 사용함에 따라 부호화 및 보호화의 복잡도가 매우 복잡한 단점을 가진다. 제안하는 방법은 슬라이스 단위의 프로세싱을 OpenMP를 통한 병렬 구조를 적용하는 방법과 GPU 가속 모델을 적용한 방법을 통해 고화질 영상의 실시간 부호화 및 복호화에 대해 분석한다.