한국방송∙미디어공학회:학술대회논문집 (Proceedings of the Korean Society of Broadcast Engineers Conference) (Proceedings of the Korean Society of Broadcast Engineers Conference)
한국방송∙미디어공학회 (The Korean Institute of Broadcast and Media Engineers)
- 반년간
과학기술표준분류
- 미디어/커뮤니케이션/문헌정보 > 미디어/수용자
한국방송∙미디어공학회 2016년도 하계학술대회
-
효율적으로 깊이지도를 획득하기 위해 다양한 방법의 지역 기반스테레오 매칭 방법이 사용된다. 일반적인 지역기반 스테레오 매칭에 사용되는 비용값 계산 방법을 통해 깊이지도를 생성하게 되면 객체의 경계 영역이 무너지거나, 유사한 텍스쳐 정보가 연속적으로 나타나는 영역에서 부정확한 깊이값을 얻는 문제가 발생한다. 본 논문에서는 깊이지도의 정확성을 높이기 위해 2가지 단계를 거쳐 최종 깊이지도를 생성한다. 처음으로, 일반적으로 사용하는 지역기반 스테레오 매칭 비용 함수와 입력 영상의 기울기를 고려한 초기 비용값을 가이드 필터를 이용하여 최적의 비용값을 찾아 초기 변위지도를 생성한다. 스테레오매칭을 수행할 경우, 시점의 차이로 인해 보이지 않는 영역에서 정확한 변위값을 찾지 못하는 문제가 발생한다. 이러한 문제를 해결하기 위해 좌영상과 우영상을 기반으로 획득한 변위지도를 사용하여 교차검사를 함으로써 폐색영역을 찾아낸다. 폐색 영역을 이웃한 화소의 값을 사용하여 채울 경우 실선과 같은 오류가 결과 영상에 나타나게 된다. 이러한 오류 영역을 제거하기 위해 마지막으로 가중치를 적용한 중간값 필터를 적용한다. 실험 결과 제안한 방법을 사용하여 획득한 깊이지도가 기존의 방법보다 정확한 깊이값을 얻는 것을 확인할 수 있었다.
-
키 프레임 추출 기법은 2차원 비오 영상을 3차원으로 재구성하기 위해 꼭 필요한 프레임을 선택하는 방법이다. 본 논문에서는 비디오에서 빠르게 프레임을 검사하며 최적의 키 프레임을 선택하는 기법을 제안한다. 제안하는 기법은 3차원 재구성을 위한 전처리 과정에 초점을 둔 것으로 프레임 간 대응점 비율 검사를 통해 프레임의 도약 강도를 결정하고 기하 모델 추정이 원활한 프레임을 선택한다. 이로부터 3차원 복원 후처리 과정을 통해 최종적인 3차원 점군(point cloud) 데이터를 획득한다. 실험을 통해 다른 기법과 성능을 비교했을 때, 제안하는 기법이 복원 소요 시간도 적게 들고 보다 밀집된 3차원 데이터를 얻을 수 있었다.
-
최근 UHDTV(ultra high definition television) 등의 고해상도 디스플레이가 시장에 등장하면서, 기존의 저해상도 FHD(full high definition) 영상을 고해상도 영상으로 변환할 수 있는 초해상화(super-resolution, SR) 기법들이 각광을 받고 있다. 그 중, 선형 매핑(linear mapping)을 사용하여 저해상도 패치(patch)로부터 고해상도 패치를 복원하는 초해상화 기법은 상대적으로 낮은 복잡도로 좋은 품질의 고해상도 영상을 생성한다. 그러나 이러한 기법은 단순한 선형 매핑을 기반으로 하기 때문에 복잡한 비선형적(nonlinear) 저해상도-고해상도 관계를 예측하기 힘든 단점이 있다. 최근 각광받는 딥러닝(deep learning) 기술은 다층(multi-layer) 네트워크를 쌓아 입력과 출력 간의 복잡한 비선형 관계를 훈련시켜 좋은 성능을 보이는데, 이를 바탕으로 본 논문에서는 다중의 레이어로 구성된 다층 선형 매핑(multi-layer linear mappings, MLLM)을 기반으로 하는 초해상화 기법을 새롭게 제안한다. 제안하는 다층 선형 매핑은 기존 선형 매핑보다 비선형적 관계를 더 잘 예측하여 높은 품질의 고해상도 영상을 생성할 수 있게 한다. 제안된 초해상화 기법은 딥러닝 기반 초해상화 기법과 필적하는 품질의 고해상도 영상을 생성하면서도 더 낮은 복잡도를 지니는 것을 확인하였다.
-
요즘 들어, 3차원 콘텐츠의 수요는 지속적으로 증가하고 있다. 3차원 콘텐츠의 품질은 해당 장면의 깊이 정보에 큰 영향을 받기 때문에 정확한 깊이 정보를 얻는 방법이 매우 중요하다. 깊이 정보를 얻는 방법은 크게 수동형 방식과 능동형 방식으로 나뉘는데, 수동형 방식은 계산 과정이 복잡하고 깊이맵의 품질이 보장되지 않는 단점을 갖기 때문에 능동형 방식이 많이 사용되고 있다. 능동형 방식은 깊이 카메라를 이용하여 직접적인 깊이 정보를 얻는 방식으로, 대게 ToF(Time-of-flight) 기술이 사용된다. 이 논문에서는 ToF 깊이 카메라로 촬영된 실제 깊이맵의 특성을 분석하기 위해 여러 가지 촬영 환경과 객체에 대해서 SR4000 깊이 카메라와 키넥트 v2 센서를 이용하여 깊이맵 품질을 비교했다. 실험 결과, 적외선이 제대로 반사되기 어려운 방사성 물질이나 표면, 경계 영역, 어두운 영역, 머리 영역 등에서 정확한 깊이 정보를 얻기 어려웠으며, 실외 환경에서 정확한 깊이 정보가 획득되지 않는 것을 확인할 수 있었다.
-
본 논문에서는 몽골 지역에 발생하는 지진이 대규모 집단 거주지 및 상업 지역인 울란바타르(Ulaanbaatar) 도심지역에 큰 피해를 주고 있는바, 지진재난경보시스템 개발하여 현장에 구축함으로써 신속히 지진발생 상황을 전파하여 몽골 국민의 생명을 보호하고 재산피해를 줄이는데 역할을 수행할 수 있다. 울란바타르 외곽에 지진파를 감지할 수 있는 지진센서를 설치하고, 지진파를 수집하여 분석하고 진도의 단계에 따라 이벤트를 발생한다. 지진의 세기에 따라 단계별 상황을 판단하고 시민들이 빠른 대피를 할 수 있도록 울란바타르 도심지역에 경보방송을 전달함으로써 지진 피해를 최소화 시킬 수 있다.
-
최근 다양한 실감 미디어 기술과 표출 방법이 제시되고 있다. 특히 개인 방송에서 제작자 및 사용자에게 편리성을 제공하고 시청자의 실감성 체험을 극대화할 필요가 있다. 이에 따라 본 논문에서는 멀티 제스처가 필요한 실감 미디어를 멀티 디스플레이, 시점 선택, 3차원 객체 복원으로 정의하였다. 또한 사용자 및 제작자의 편리성을 위해 필요한 제스처에 대한 종류를 분석하였으며, 사용자의 다양한 제스처를 인식하고 실감 콘텐츠를 표출하도록 시스템을 구성하였다.
-
본 논문은 가상스튜디오(TV)에서 인터랙티브 가상 바닥을 위한 시스템 및 그 어플리케이션을 제안한다. 우리는 가상스튜디오에서 연기자와 바닥 그래픽간의 단순한 키(Keying) 합성 이질감을 줄이고자, 연기자를 추적하여 발 위치에 다이나믹한 발자취 표현이 가능한'인터랙티브 가상바닥' 어플리케이션을 구현하였다. 이것을 위해 마커 없이 연기자의 위치를 추적하도록 키넥트와 같은 모션인식 카메라를 사용하여 간편한 연기자 발 추적 시스템을 개발하였으며, 이것을 이용하여 연기자와 바닥간의 ' 가상 발 터치(Virtual Foot Touch)' 방법 및 일기예보용 인터랙티브 가상바닥(Interactive Virtual Floor) 어플리케이션을 개발하여, 연기자의 발이 바닥을 터치하는 위치마다 계절별 다이나믹한 발자취를 구현하였다. 그 결과 인터랙티브 가상 바닥의 합성결과가 기존의 가상스튜디오에서의 단순 합성보다 더 사실감 있고 자연스러운 합성결과를 보여준다. 우리는 본 시스템과 어플리케이션을 정규 뉴스 프로그램의 일기예보 방송에 적용하였다.
-
본 논문에서는 실시간 얼굴 추적을 위하여 기존의 CamShift 알고리즘의 단점을 보완한 새로운 CamShift 알고리즘을 제안한다. 배경 내 추적 객체와 색상이 유사한 객체가 존재할 경우 기존 CamShift 알고리즘은 불안정한 추적을 보여준다. 이러한 문제점을 화소 단위로 거리정보를 획득할 수 있는 Kinect 의 깊이 정보와 HSV 색공간 기반의 피부색 후보영역을 추출하는 Skin Detection 알고리즘을 이용하여 색상분포만 이용하는 기존의 CamShift 의 단점을 보완한다. 또한 추적하던 객체가 사라지거나 가려짐이 발생할 경우에도 다시 추적할 수 있는 특징점 기반의 매칭 알고리즘을 통하여 차폐영역에 강인한 특성을 가지게 한다. 이러한 향상된 CamShift 알고리즘을 사람의 얼굴 추적에 적용함으로써 다양한 분야에 활용 가능한 강인한 얼굴추적 알고리즘을 제안하고자 한다. 실험결과 제안하는 알고리즘은 기존의 추적 알고리즘인 TLD 보다 월등히 빠른 처리속도와 더 우수한 추적성능을 보여주었고, CamShift 보다 조금 느리지만 기존의 CamShift 가 가지고 있는 문제점들을 해결하였다.
-
특징점 기반 건물인식 시스템에서는 강건한 특징점을 추출하는 것이 인식률 향상에 바로 직결되는 중요한 요소이다. 영상에서 특징점들이 너무 많이 추출되는 경우 인식이나 학습단계에서의 알고리즘 수행 시간을 증가시키는 원인이 된다. 또환 중요하지 않은 특징점(배경이나 가려짐 영역, 기타 객체에서 추출된 특징점)이나 조명 변화에 민감한 영역에서 임의로(arbitrarily) 추출된 특징점은 인식률을 저하시키는 문제를 발생시킨다. 특히 도시환경에서 촬영된 영상의 특징점을 추출할 때 이러한 문제 현상들이 빈번하게 발생한다. 본 논문에서는 이러한 문제를 해결하고자 multi-view 영상에서 건물의 homography를 기반으로 정확히 정합된 특징점인 inlier만을 선택하는 알고리즘을 제안한다. Inlier로 분류된 특징점들은 건물 인식 시스템을 구성하기 위해 사용되고 조명 변화에 민감한 영역에서 임의로 추출된 특징점들은 영역 기반 특징을 추출하여 건물 인식 시스템의 인식률을 높인다. 또한 이를 이용하여 인식하고자 하는 건물과의 상관관계가 적은 잉여 영상들을 DB에서 제거하는 방법도 제안한다. 실험을 통하여 제안하는 기법의 우수성을 보였다.
-
본 논문에서는 HVS(human visual system)의 특성을 고려한 새로운 스케일러블 코딩방법을 제안한다. 제안된 방법은 먼저 영상 내에서 관심영역(saliency map)을 찾고 관심영역을 제외한 부분에 에지 보존 필터를 적용한다. 그 영상은 정해진 양자 파라미터 값으로 인코딩 되어 제안된 코딩 시스템의 베이스 층(base layer)이 된다. 기존 스케일러블 코딩 표준에서의 베이스 층과 다르게 본 논문의 베이스 층은 관심 있는 중요영역(foreground)을 보존하고 또한 배경(background)의 에지 성분도 보존한다. 기본 층이 전송되면 개선층(enhancement layer)은 원 영상과 복원된 베이스 층 영상간의 차분 영상에서 관심영역 순으로 보내진다. 실험은 HEVC 를 바탕으로 수행되었고 스케일러블 코딩 표준인 SHVC 와 관심영역에서 비교를 했을 때 제안된 알고리즘이 더 높은 PSNR 을 가지는 것을 확인하였다. 또한 전체적으로 지각적인 품질(perceptual quality) 또한 향상되었음을 확인하였다.
-
본 논문에서는 기존 Bag-of-Visual words (BoW) 접근법에서 반영하지 못한 이미지의 공간 정보를 활용하기 위해서 Spatial Pyramid Matching (SPM) 기법을 Latent Dirichlet Allocation (LDA) 모델에 결합하여 이미지를 분류하는 모델을 제안한다. BoW 접근법은 이미지 패치를 시각적 단어로 변환하여 시각적 단어의 분포로 이미지를 표현하는 기법이며, 기존의 방식이 이미지 패치의 위치정보를 활용하지 못하는 점을 극복하기 위하여 SPM 기법을 도입하는 연구가 진행되어 왔다. 또한 이미지 패치를 정확하게 표현하기 위해서 벡터 양자화 대신 희소 부호화 기법을 이용하여 이미지 패치를 시각적 단어로 변환하였다. 제안하는 모델은 BoW 접근법을 기반으로 위치정보를 활용하는 SPM 을 LDA 모델에 적용하여 시각적 단어의 토픽을 추론함과 동시에 multi-class SVM 분류기를 이용하여 이미지를 분류한다. UIUC 스포츠 데이터를 이용하여 제안하는 모델의 분류 성능을 검증하였다.
-
최근 Convolutional neural networks(CNN) 기반의 초해상화 기법인 Super-Resolution Convolutional Neural Networks (SRCNN) 이 좋은 PSNR 성능을 발휘하는 것으로 보고되었다 [1]. 하지만 많은 제안 방법들이 고주파 성분을 복원하는데 한계를 드러내는 것처럼, SRCNN 도 고주파 성분 복원에 한계점을 지니고 있다. 또한 SRCNN 의 네트워크 층을 깊게 만들면 좋은 PSNR 성능을 발휘하는 것으로 널리 알려져 있지만, 네트워크의 층을 깊게 하는 것은 네트워크 파라미터 학습을 어렵게 하는 경향이 있다. 네트워크의 층을 깊게 할 경우, gradient 값이 아래(역방향) 층으로 갈수록 발산하거나 0 으로 수렴하여, 네트워크 파라미터 학습이 제대로 되지 않는 현상이 발생하기 때문이다. 따라서 본 논문에서는 네트워크 층을 깊게 하는 대신에, 입력을 다중 채널로 구성하여, 네트워크에 고주파 성분에 관한 추가적인 정보를 주는 방법을 제안하였다. 많은 초해상화 기법들이 고주파 성분의 복원 능력이 부족하다는 점에 착안하여, 우리는 네트워크가 고주파 성분에 관한 많은 정보를 필요로 한다는 것을 가정하였다. 따라서 우리는 네트워크의 입력을 고주파 성분이 여러 가지 강도로 입력되도록 저해상도 입력 영상들을 구성하였다. 또한 잔차신호 네트워크(residual networks)를 도입하여, 네트워크 파라미터를 학습할 때 고주파 성분의 복원에 집중할 수 있도록 하였다. 본 논문의 효율성을 검증하기 위하여 set5 데이터와 set14 데이터에 관하여 실험을 진행하였고, SRCNN 과 비교하여 set5 데이터에서는 2, 3, 4 배에 관하여 각각 평균 0.29, 0.35, 0.17dB 의 PSNR 성능 향상이 있었으며, set14 데이터에서는 3 배의 관하여 평균 0.20dB 의 PSNR 성능 향상이 있었다.
-
본 논문에서는 다수의 영상을 빠르고 오류 없이 정합하기 위하여 정합과정의 전 처리로써 유사도 맵 생성 알고리즘을 제안한다. 본 논문에서는 블록화한 히스토그램을 통하여 영상간의 관계를 판별하게 된다. 두 영상의 블록 히스토그램을 비교하여 영상 간의 유사성과 위치관계를 8 방향으로 판별하고 이를 이용하여 유사도 맵에 영상들을 정렬하게 된다. 유사도 맵의 생성으로 정합 알고리즘을 적용해야 하는 경우의 수가 줄어들어 복잡도는 낮아지게 되어 이후 정합과정에서 속도의 이득을 얻을 수 있다. 또한 정합 방법으로 변형이 적은 영상을 정합하는데 탁월한 성능과 속도를 보이는 히스토그램을 이용한 방법을 제안한다. 제안 알고리즘을 이용하여 실험한 결과 기존의 다중 영상 스티칭 알고리즘에 비하여 매우 빠른 속도를 확인 할 수 있고 결과 영상 또한 오류가 적은 것을 확인 할 수 있다.
-
자막은 청각장애인들의 의사 소통, 정보 전달 및 정보 획득에 중요한 부분을 차지하는 서비스이다. 특히, 지상파 DTV 에서 청각장애인의 방송시청권보장을 위한 일환으로 제공되고 있는 폐쇄자막은 지상파 DTV 뿐만 아니라, 케이블, 위성방송, IPTV 및 VOD 서비스에서도 활용이 가능한 재활용성이 높은 콘텐츠이다. 그러나, 속기사에 의한 실시간 폐쇄자막 서비스가 제공되는 방송환경에서 많은 방송 프로그램의 폐쇄자막들이 일회성으로 사용되고 사라지는 경우가 많다. 본 논문에서는 이러한 폐쇄자막 콘텐츠의 미디어 매체별 재활용성을 높이기 위한 한 방법으로 CEA-708 표준을 지원하는 폐쇄자막의 사전 제작 및 기저작된 자막의 편집을 위한 저작도구를 소개한다.
-
본 논문은 북미의 차세대 지상파 방송 표준인 ATSC 3.0에서 고려하고 있는 ROUTE(Real-time Object Delivery over Unidirectional Transport) 및 MPEG-DASH(Dynamic Adaptive Streaming over HTTP)를 기반으로 자유시점 방송 서비스를 송 수신하기 위한 SLS(Service Layer Signaling)을 제안한다. 특별히 ATSC 3.0과의 역호완성을 위하여 기존의 ROUTE/DASH의 SLS는 그대로 유지한 채 자유시점 방송을 위한 정보만 추가하여 기존의 SLS와 상호동작이 되도록 설계하였다. 따라서 본 논문에서 제안하는 내용은 향후 ATSC 3.0와 같이 IP(Internet Protocol)을 기반으로 SLS을 수행하는 표준규격과 역호환성을 유지한 채 자유시점 방송서비스를 할 수 있을 것으로 기대된다.
-
본 논문에서는 동영상, 팟캐스트 오로부터 자막을 생성하여 청각장애인의 미디어 접근권을 향상시키는 음성인식기술을 적용한 자막생성에 대하여 제안한다. 또한 레퍼런스 음성 DB 와 드라마, 팟캐스트 오디오로부터 생성된 자막의 정확도에 대해 평가하였다. 오디오를 이용하여 생성된 자막은 사극의 경우에는 다소 정확도가 낮게 평가되었으나, 전체적으로는 약 80%이상의 정확도를 갖는 것으로 파악되었다.
-
조건부 대체 알고리즘 (CRA: Conditional Replenishment Algorithm)은 융합형 3DTV 서비스에서 부가정보를 전송함으로써 수신기에서의 화질을 개선하는 방법이다. 이 알고리즘은 비용함수를 도입함으로써 가변크기의 처리단위 (PU: Processing Unit) 마다 최적의 모드를 결정하는데, 이 과정에서 시공간적 인접 PU 사이에 모드의 불연속이 발생하는 경우에 블록화 또는 플리커링 현상 등 주관적 화질을 저하시키는 문제가 생길 수 있다. 본 논문에서는 모드를 결정하는 과정에서 시간적으로 연속적인 PU 사이의 상관성을 고려함으로써 플리커링 현상을 방지하는 기법을 제안하고 모의실험을 통해 주관적 화질이 향상됨을 보였다.
-
개인이 실시간 방송을 할 수 있는 개인방송은 게임, 스포츠, 교육을 비롯하여 시대의 흐름을 고려한 요리, 다이어트 등과 같은 광범위한 미디어 콘텐츠를 생산하고 있다. 최근에는 실감형 콘텐츠를 위해 360도 카메라와 이를 마우스, 터치스크린, 자이로센서를 이용하여 제어하는 방식들이 소개되고 있다. 하지만 이러한 기술들을 활용해 더 많은 콘텐츠를 생산하기 위해서는 기술을 쉽게 사용할 수 있도록 제작자의 편리성을 고려한 기술 서비스의 제공이 필요하다. 본 논문에서는 실감 콘텐츠 제작 편리성을 위한 개인방송용 NUI 기술 서비스에 대해 논하고자 한다. 콘텐츠의 다양성과 빠르게 변화하는 IoT 기기 확장성을 고려하여 이와 연동 가능한 제스처 인식, 음성 인식 등과 같은 비 접촉식 NUI 서비스 기술과 이를 활용해 방송 제공자가 편리하게 다양한 콘텐츠를 제공할 수 있는 서비스 개념도를 제안하고, 관련 API 설계에 대해 보인다. 본 연구를 통해 개인방송을 접하는 사람들의 편의성, 흥미를 만족시켜 다채로운 서비스를 제공할 수 있고 나아가 편리성을 고려한 NUI 서비스 가이드라인을 마련할 수 있을 것으로 기대된다.
-
본 논문에서는 지속적인 화면해설방송 모니터링을 통해서 방송사들의 장애인방송 편성의무 준수 여부를 확인하고, 화면해설방송 콘텐츠의 양적/질적 향상을 위해서 화면해설오디오의 정량적 분석과 시각장애인들의 수용도 조사를 통한 저작가이드라인 마련의 필요성을 설명한다. 또한 화면해설방송의 서비스 제공 유무 검증과 화면해설오디오 비중을 분석하기 위한 모니터링 시스템을 설계하고 화면해설오디오 비중 분석 및 징르별 비교를 통해서 화면해설방송의 문제점을 파악하고자 한다.
-
최근에 재난현장에는 사물인터넷기반의 다양한 장비나 장치들이 많이 활용되고 있으며, 이중에서도 드론이 심심찮게 활용이 되고 있다. 우리나라의 경우도 산림보호활동이나 화재가 발생하는 지역에 드론을 활용하여 재난대응을 하고 있다. 특히나 작년 네팔에서 지진으로 많은 인명과 재산 손실을 보았는데 이때 지난지역을 수색하는 등, 드론의 역할이 상당히 컸던 것으로 회자되고 있다. 본 논문은 최근에 산악구조 활동으로 생존자의 탐색을 위한 드론의 도입을 준비하며 모니터링 하였던 내용을 정리하고자 한다. 드론에 대한 국내의 현황을 먼저 알아보고, 실제적으로 몇 가지 필요한 요소를 나열한다. 산악구조활동에서 드론에 대한 제약인 최소 3km 이상의 원거리 탐색과 최소 30분 이상의 비행, 영상의 선명도, 열화상 등 재난구조에 필수적인 요소이다. 결과적으로 현재의 재난구조용 드론은 국내의 기술 기반이 취약하여 비행위주이고, 응용분야에 대한 깊이 있는 기술이전이 함께 이루어져야 만 드론에 대한 재난구조의 역할이 아닌가 판단한다.
-
디지털 방송이 대중화면서 방송 프로그램의 음량은 프로그램의 효과, 방송사간의 경쟁 등으로 인해 점점 더 커지고, 채널 간 및 프로그램 간의 음량 불균형이 심해지고 있다. 이를 해결하기 위해 ITU-R 에서는 음량 측정 방법 및 기준 음량에 대한 연구하여, 그 결과로 BS.1770 표준을 권고하였다. 이 국제 기준을 바탕으로 미국, EU, 일본 등 주요 선진국 뿐만 아니라 우리나라에서는 자국 내 기준을 제정하고, 디지털 방송 프로그램의 음량에 대한 규제를 시행하고 있다. 본 논문에서는 우리나라에서 음량 측정 방법으로 적용한 ITU-R BS.1770-3 방송 프로그램의 음량 측정 기법에 대해서 기술하고, 음량 측정 기법의 고속화 구현을 위한 방법을 제안한다. 제안된 방법은 BS.1770-3 의 음량 측정 기법에 적용된 필터와 True Peak 측정을 위한 필터의 병렬 고속화 방법으로 일반적인 필터 구현에 비해 4 배의 고속화를 달성하였으며, 제안된 방법을 EBU R128 및 Tech 3341 의 컨퍼먼스 스트림으로 실험하여 표준 규격을 만족하였다.
-
최근 기술의 발전으로 자연스로운 미디어와 실재감을 제공하는 차세대 3D 기술이 많은 관심을 받고 있다. 그 중 (초)다시점 미디어 기술은 기존의 안경식 3D 미디어 기술을 대체할 수 있는 기술로써 각광받고 있다. (초) 다시점 미디어는 기존의 미디어와 비교하여 많게는 10배가 넘는 시점 정보를 포함하고 있다. 그러므로, 대용량의 (초) 다시점 미디어를 전송하기 위해서는 IP 망에서 실시간성을 고려한 프로토콜 사용이 필요하다. 이를 위하여 본 논문에서는 차세대 미디어 전송 규격인 MPEG MMT를 이용하여 DirectShow를 기반으로 (초) 다시점 미디어를 전송, 재현할 수 있는 스트리밍 시스템을 구현 하였다.
-
본 논문에서는 정지영상에 주로 적용되어 왔던 히스토그램 등화 (histogram equalization) 기법을 실시간 동영상 화질향상에 이용할 수 있도록 확장한다. 우선, 동영상의 히스토그램 등화를 실시간으로 동작하기 위한 방안으로, 이전 프레임들의 히스토그램을 이용하여 현재 프레임의 변환 함수를 구성하는 방법을 제안한다. 또한 페이드-인 (fade-in) 등과 같이 장면 전환을 위한 특수 효과를 적용한 동영상이나 장면의 특성상 낮은 화소값이나 높은 화소값들만으로 구성된 동영상에 대해 히스토그램 등화를 적용할 경우 발생하는 문제점을 극복하기 위한 방법을 제시한다. 따라서 제안하는 알고리듬을 적용하여 동영상의 히스토그램 등화를 수행하면 실시간 동영상 처리가 가능할 뿐만 아니라, 다양한 특수 기법들을 사용한 동영상을 효과적으로 개선하여 향상된 화질의 동영상을 얻을 수 있다.
-
ISO/IEC 13818-1 MPEG2 시스템의 타이밍 모델은 인코더에 들어간 비디오와 오디오 샘플들이 일정한 딜레이가 지난 후 디코더에서 정확히 한 번씩 나타나는 식으로 구현된다. 해당되는 디코더는 타이밍 모델에 부합하여 대응되는 비트스트림을 전달받는다. 이를 통해서 적절하게 동기화가 이루어진 고품질 오디오와 비디오를 위한 디코더 구현을 쉽게 할 수 있다. 반면에, RTP 타이밍 모델은 실제 프리젠테이션 시간에 관한 타이밍 정보를 가지고 있지 않다. 데이터 패킷의 타임스탬프는 상대적 타이밍을 제공하고, RTCP 송신자는 스트림 간 동기화에 대한 정보를 제공하지만 RTP 수신기에서는 버퍼링의 량이나 패킷의 디코딩 시간에 대한 정보를 주지 않는다. 따라서 RTP는 유동적인 전송 지향적인 타이밍 모델을 가지고 있다. 반면에 MPEG-2 시스템은 정확한 타이밍 모델을 수신측을 위해 제공하고 있다. 본 논문에서는 MPEG-2 시스템과 RTP의 타이밍 모델의 이점을 가져와 MMT 시스템을 위한 타이밍 모델을 제안한다.
-
본 논문에서는 기존의 인지적 영상 압축 기법에 사용되었던 Just Noticeable Distortion(JND) 모델이 압축과정에서 생기는 왜곡인 양자화 왜곡에 적합하지 않는 다는 것을 보이고, 그 한계점을 해결하기 위하여 Just Noticeable Blur(JNB)의 개념을 적용하여 영상 압축에 적합한 모델을 제시하였다. 주파수 공간에서 영상의 복잡도 특징을 나타내는 Spectral Contras Index(SCI) 값을 사용해서 영상의 DCT 블록별 JNB 를 추정하고 이를 기반으로 영상의 DCT 계수 값을 감소시켜 최신의 DCT 기반 JND 를 적용한 인지적 압축 영상에 비해 더 낮은 PSNR 을 가지면서 왜곡도 인지되지 않는 영상을 얻을 수 있었다. 새롭게 제시한 모델을 적용하면 인지적 영상압축에서 기존의 방법보다 더 낮은 비트율로 유사한 인지적 화질 성능을 발휘할 것으로 예상된다.
-
본 논문에서는 ITU-R M.1798-1 에 기반한 해상 HF 데이터 통신을 위한 세 가지 종류의 디지털 통신 방식을 소개하고 비교한다. 처음 두 개의 시스템은 3 kHz 대역폭을 사용하는 디지털 통신 방식으로서 OFDM 방식과 멀티 톤 방식의 디지털 모뎀이며, 마지막 세 번째 방식은 10-20 kHz 의 대역폭을 사용하는 OFDM 방식의 디지털 통신 모뎀이다. 본 연구를 통하여 각각의 통신 방식에 대한 물리계층 규격을 비교 분석한다.
-
본 논문에서는 ATSC 3.0 규격에서 정의되는 부트스트랩 신호의 검출 방식에 대해서 소개한다. 부트스트랩 신호는 ATSC 3.0 방송 신호의 프레임에 앞서서 전송되는 신호로서 해당 방송 신호의 존재 및 이후 프리앰블에 대한 정보를 시그널링하는 역할을 하므로 ATSC 3.0 방송 신호의 복조 이전에 부트스트랩을 먼저 검출해야 한다. 본 논문에서는 부트스트랩 신호의 구조를 이용하여 수신기에서 부트스트랩 신호를 검출하는 방법을 제시한다.
-
본 논문에서는 스마트하게 UHD 미디어 전송을 가능하도록 하기 위해서 MPEG의 Systems 그룹에서 표준 기술로써 개발한 MMT (MPEG Media Transport) 기술의 표준화 현황과 향후 전망에 대해 살펴본다.
-
본 논문에서는 딥 러닝을 이용한 오디오 장르 분류 기술을 제안한다. 장르는 music, speech, effect 3가지로 정의하여 분류한다. 기존의 GMM을 이용한 장르 분류 기술은 speech의 인식률에 비해 music과 effect에 대한 인식률이 낮아 각 장르에 대한 인식률의 차이를 보인다. 이러한 문제를 해결하기 위해 본 논문에서는 딥 러닝을 이용해 높은 수준의 추상화 과정을 거쳐 더 세분된 학습을 진행한다. 제안한 방법을 사용하면 미세한 차이의 특성까지 학습해 장르에 대한 인식률의 차이를 줄일 수 있으며, 각 장르에 대해 GMM을 이용한 오디오 장르 분류보다 높은 인식률을 얻을 수 있다.
-
본 논문은 스피커의 저역 재생 대역을 확장하기 위한 가상 저음 시스템의 성능을 향상시키기 위한 방법을 제안하였다. 제안 방법은 생성하는 신호의 위상을 기존 신호의 위상과 맞추어 강화 과정에서 발생하는 상쇄 간섭의 가능성을 제거한다. 또한 생성한 배음의 상대적 크기를 기본 주파수에 맞추어 가변적으로 적용하여 저역감을 효과적으로 강화하면서 음색의 열화를 줄이는 방법을 제시한다. 제안한 알고리즘은 기존 가상 저음 시스템보다 더 높은 성능을 가지는 것을 확인하였으며, 스피커 환경에서 저역 재생 성능의 향상을 확인하였다.
-
본 논문에서는 멀티미디어 콘텐츠의 명료도를 향상시켜 사용자가 주변 환경과 관계없이 안정적인 볼륨에서 오디오 청취를 할 수 있는 다이얼로그 명료도 향상 알고리즘을 제안한다. 최근 모바일 기기들의 발달로 다양한 환경에서 영화, TV 또는 동영상 등의 멀티미디어 콘텐츠를 즐기는 일이 늘어나고 있다. 이러한 경우 시청자는 주변 환경에 따라 영상의 오디오 볼륨을 조절하게 되는데 주변 소음에 비하여 과하게 증폭된 볼륨은 주변에 피해를 끼치거나 고막에 손상을 일으킬 수 있으며 반대로 주변에 비해 너무 작은 오디오 볼륨은 시청을 어렵게 한다는 단점이 있다. 본 논문에서는 수신단에서 멀티미디어 콘텐츠의 오디오 신호로부터 다이얼로그 성분을 검출하여 음성 명료도 향상 알고리즘을 적용시켜 동일한 볼륨에서도 음성의 명료도를 높이는 알고리즘을 제안한다. 본 알고리즘은 다이얼로그를 검출하여 단순히 증폭 시키는 기존 기술들과 달리 전체 에너지는 유지하면서 명료도에 중요한 영향을 미치는 주파수 대역에 에너지를 집중시키는 에너지 재분배 방식을 이용해 동일한 볼륨에서도 더 높은 음성 명료도를 기대할 수 있다. 컴퓨터 시뮬레이션을 통해 본 논문에서 제안한 알고리즘이 명료도에 중요한 영향을 미치는 주파수대역을 적절히 증폭시킴을 확인할 수 있었다.
-
본 논문에서는 스펙트로그램을 이용한 딥 러닝 기반의 오디오 장르 분류 기술을 제안한다. 기존의 오디오 장르 분류는 대부분 GMM 알고리즘을 이용하고, GMM의 특성에 따라 입력 성분들이 서로 직교한 성질을 갖는 MFCC를 오디오의 특성으로 사용한다. 그러나 딥 러닝을 입력의 성질에 제한이 없으므로 MFCC보다 가공되지 않은 특성을 사용할 수 있고, 이는 오디오의 특성을 더 명확히 표현하기 때문에 효과적인 학습을 할 수 있다. 본 논문에서는 딥 러닝에 효과적인 특성을 구하기 위하여 스펙트로그램(spectrogram)을 사용하여 오디오 특성을 추출하는 방법을 제안한다. 제안한 방법을 사용한면 MFCC를 특성으로 하는 딥 러닝보다 더 높은 인식률을 얻을 수 있다.
-
저해상도 영상을 고해상도 영상으로 복원하기 위한 다양한 방법의 초해상도 기법이 존재한다. 다양한 기법들 중에서도 ELBP 분류기를 이용한 초해상도 기법[1]은 단일 영상 기반의 초해상도 기법으로 사전에 학습된 필터를 이용하여 고해상도 영상을 획득하는 기법이다. 그러나 해당 알고리즘을 일반적인 CPU 환경에서 수행할 경우 실시간으로 영상을 획득하는데 어려움이 존재한다. 본 논문에서는 지역메모리를 이용한 GPU 환경에서의 최적화를 수행하여 ELBP 분류기를 이용한 초해상도 기법의 가속성을 보인다. 먼저, 알고리즘에 대하여 간단히 설명하고 CUDA 가속화 기법[2]을 차례로 적용했을 때 얻을 수 있는 가속 성능을 확인한다. 최종적으로 본 논문은 CPU 환경과 비교했을 때 5 배의 가속 효과를 얻을 수 있다.
-
민주주의의 꽃, 제 20 대 국회의원 선거가 막을 내렸다. 지난 선거에서는 방송사뿐만 아니라 정당들도 엄청난 비용 지출과 노력이 소요되었다. 한 예로, 지난 4. 13 총선거 (제 20 대 국회의원)에서 방송 3 사 출구조사 비용으로 약 66 억원 이상이 지출됐다. 그리고 정당에서는 여론조사 비용으로 약 70 억원 이상을 지출했다. 이러한 큰 비용 지출과, 담당자들의 노력을 줄이기 위해 본 논문에서는 텍스트 마이닝과 감정분석을 적용한 후보 당선자 예측 어플리케이션을 제안한다. 첫째, 소셜 그래프 모델을 소개하여 지역 구조를 발견한다. 둘째, 텍스트 마이닝 기법을 이용하여, 후보자 관련 데이터를 가공한다. 셋째, 텍스트 감정 분석을 통해 후보자의 정보를 수치화 한다. 본 논문의 성능과 효율성을 평가하기 위해, 제 20 대 국회의원 선거에 사례연구를 진행하였다. 제안한 방법이 정확도와 수학적 통계 검증을 통해 가치 있는 효율성을 보였다. 선거방송을 위한 후보자 예측 도구의 도입으로 향후 선거(방송)에서의 큰 비용과 노력을 줄이는데 도움을 줄 것이라 기대한다.
-
교통표지판 검출 및 인식은 차량의 자율주행 및 ADAS (Advanced Driver Assistance System)의 필수적인 요소이다. 교통표지판의 각종 표식을 인식하기 위해서는 먼저 교통표지판 영역을 검출해야 하며, 이 작업은 통상적으로 교통표지판에 포함된 빨간색을 추출하는 컬러 필터링을 통해 이루어진다. 하지만 차량 영상에 나타나는 색상 성분은 태양광의 방향이나 날씨 등에 상당한 영향을 받으며 이러한 조도 환경은 차량이 주행하게 되면 시간적으로도 수시로 변화한다. 더군다나 사용하는 카메라의 내부적인 특성에 따라서도 색상 성분의 분포가 달라지기 때문에 컬러 필터링을 위한 임계값은 고정값을 사용하기 보다는 적응적으로 변화시킬 필요가 있다. 본 논문에서는 다양한 조도 환경과 다양한 카메라 종류에 따라서 영상 내 교통표지판의 빨간색 성분의 분포를 분석하고 이를 바탕으로 임계값을 가변적으로 설정하는 방법을 제안한다. 그리고 모의실험을 통해 제안 방법을 적용하면 고정된 임계값을 사용한 방법보다 조도변화에 강인하게 교통표지판 영역을 검출할 수 있음을 확인하였다.
-
본 논문에서는 손의 움직임 패턴으로 암호를 구성하고, 이를 인식하는 보안 시스템에서 기존의 고정된 공간에서 방향 데이터 범위를 생성하여 입력되는 패턴마다 적응적으로 방향 데이터를 뽑아낼 수 없었던 단점을 극복하고자 입력되는 움직임 패턴의 방향 데이터를 입력 패턴마다 적응적으로 생성하는 방법을 제안한다. 기존의 고정된 공간에서의 방향 데이터 생성 방식 기법과 비교 실험한 결과 정인식률 94.2%로 기존방식의 91.4%보다 높은 인식률로 만족할 만한 성능을 보여줌을 확인할 수 있었다.
-
일반 영상의 영상확대를 위한 다양한 알고리즘이 존재한다. 하지만 적외선 열화상 영상의 경우 일반영상과 다른 특성을 가지고 있기 때문에 적외선 영상을 위한 영상 확대 알고리즘이 필요하다. 따라서 적외선 영상이 일반영상에 비해 디테일이 없다는 특성을 고려하여 복잡한 알고리즘을 적용시키기 보다는 ADRC 와 같은 단순한 분류 기법을 활용하여 LR-HR 패치를 분류하고 학습된 데이터를 이용하여 영상확대 알고리즘에 적용하였다. 알고리즘의 성능 향상을 위해 학습과정에 전처리 과정을 추가하여 합성과정에서 추가적인 연산량의 증가 없이 확대 영상의 선명도를 향상시키고자 하였다. 또한 확대된 적외선 영상이 동일 해상도의 가시광영상에 비해 선명도가 떨어진다는 점을 고려하여 확대된 적외선 영상에 가시광영상의 고주파 정보를 합성시켜 이전보다 영상의 선명도를 더 향상시키고자 하였다. 이와 같은 방법으로 영상 확대 알고리즘만 수행하였을 때 통상적인 영상확대 기법인 bi-cubic interpolation 기법보다 JNB 수치가 평균 0.0727 만큼 높은 결과를 확인할 수 있었고 가시광영상과 융합하였을 때 이전보다 평균 0.0742 만큼 더 선명해진 영상을 얻었다.
-
후방 램프를 이용하는 기존의 차량 검출 기법들은 주로 색상 정보를 활용한다. 그러나 조도가 낮은 야간 환경의 특성상 색상 정보를 온전히 활용할 수 없는 경우가 빈번하게 발생한다. 이를 해결하기 위해 본 논문에서는 야간 환경에서 후방 램프의 밝기 값만을 이용해 차량을 검출한다. 일반적으로 후방 램프를 검출하기 위해 색상 정보와 밝기 값을 이용해 이진화를 하게 되는데, 본 논문에서는 밝기 값을 이용해 톤 매핑 과정을 수행하여 후방 램프의 모양을 보존한다. 밝기 값 만을 이용하기 때문에 오검출이 증가하게 되는데 이는 후방 램프에 대한 조건을 알고리즘에 적용함으로써 해결한다. 이에 더해 추적 알고리즘을 적용하여 남아있는 오검출을 제거한다. 이러한 과정은 모두 실시간으로 이루어지기 때문에 최근 활발히 연구되고 있는 자동 주행 시스템이나 주행 보조 시스템 등에 활용 될 수 있다.
-
자동차 산업이 발전하면서 안정적인 주행과 운전자의 편의성을 위한 지능형운전자보조시스템인 ADAS (Advanced Driver Assistance System)가 이슈가 되고 있다. 차선인식의 결과에 따라 차선이탈 경고시스템의 성능이 달라지기 때문에 차선인식은 ADAS에서 매우 중요한 핵심적인 기술이라 할 수 있다. 이에 본 논문에서는 그림자 영역과 같이 밝기의 분포가 균일하지 않는 환경에서 강인하게 동작하는 차선인식 알고리즘을 제안하였다, 지역적인 밝기 특징을 고려하여 차선에 해당하는 특징점을 추출하며, 추출된 특징점 가운데 이상치(outlier)를 제거하기 위해 RANSAC (RANdom SAmple Consensus) 알고리즘을 이용하여 차선을 검출한다. 또한 RANSAC 알고리즘에서 신뢰도가 높은 차선이 검출되면 그 주위에 특징점을 추출하기 위한 관심영역을 설정함으로써 안정적인 차선 검출이 가능하도록 하였다.
-
컴퓨터 비젼 분야에서 이미지 세그멘테이션은 객체 분리, 객체 추적, 의학 영상처리 등 다양한 분야에서 사용된다. 이전의 이미지 세그멘테이션은 사람의 개입이 없이 정확한 객체를 분리하지 못한다는 단점이 있다. 본 논문은 인접한 슈퍼픽셀을 트리를 활용하여 개층적으로 슈퍼픽셀을 통합하는 새로운 세그멘테이션 방법을 소개한다. 제안한 알고리즘을 수행하기 위해 기존의 슈퍼 픽셀 알고리즘을 사용하여, 각 슈퍼픽셀의 센터를 노드로 설정하고 들로네 삼각화를 수행한다. 각각의 인접한 노드는 순차적으로 유사도 측정하여 슈퍼픽셀을 통합한다. 실험 결과를 통해 제안한 방법이 과분할 세그멘테이션을 제거하였으며 영상의 중요한 정보를 잘 보존하는 것을 확인하였다.
-
최근 자율주행자동차에 대한 관심이 증가함에 따라 교통 상황을 인식하는 방법에 대한 연구도 활발하게 진행되고 있다. 특히 교통신호등의 인식은 치명적인 결과를 야기하는 교통사고와 밀접하게 연관된다는 점에서 중요성이 더욱 부각되고 있다. 본 논문에서는 컴퓨터 비전 시스템을 기반으로 한 교통신호등 인식 방법을 제안한다. 차선, 표지판 등과는 다르게 교통신호등은 빛을 발하는 특징이 있으며 그 모양과 형태 또한 규격화 되어 있다. 이러한 특징 중 색상과 형태 특징을 이용하여 두 단계의 추출과정을 거쳐 교통신호등을 인식한다. 먼저 HSV 색 공간에서 적색, 녹색, 주황색의 빛을 발하는 영역을 찾아낸 뒤, 신호의 원형 특징을 이용해 가로, 세로 사이즈와 크기로 신호의 후보를 추출한다. 다음, 신호등의 검은 박스 영역을 찾기 위해 추출한 신호 후보군의 주변부가 검정색인지를 확인한다. 최종적으로 신호등의 박스 부분을 검출하여 신호를 발하는 위치를 기반으로 신호를 인식한다. 실험결과 많은 계산량을 요구하는 기계학습을 사용하지 않고도 실시간 처리와 높은 인식률로 교통 신호를 인식할 수 있음을 확인하였다.
-
본 논문에서는 template matching을 이용한 PMMVD(Pattern Matched Motion Vector Derivation)기술에 대해 움직임 추정 방식에 따라 복잡도를 분석한다. PMMVD 기술은 HEVC의 화면 간 예측 기술과는 다르게 움직임과 관련된 정보를 부호화하지 않으며, 복호화기에서 움직임 벡터를 추정하는 방식이다. 따라서 종래의 기술 대비 높은 효율이 발생하지만 복호화기의 복잡도는 급격히 증가하게 된다. 이러한 이유로 다양한 움직임 추정 방식에 따라 성능을 분석하여 최적의 조합을 찾는 것은 매우 중요한 이슈임을 알 수 있다. 이를 위하여 현재 JVET(Joint Video Exploration Team)에서 FVC(Future Video Coding)를 위해 발표한 참조 소프트웨이인 JEM 2.0(Joint Exploration Test Model 2)을 이용하여 실험을 수행하고 향후 연구 방향을 논의한다.
-
최근 차세대 비디오 코덱 기술로써 다양하게 논의 되고 있는 영상 내 지역적 밝기 보상 기술은 다수의 광원이 존재하는 영상 내 다른 영역 마다, 다른 밝기 변화 정도를 보상해주기 위한 방법이다. 상세하게는, 현재 CU의 주변 화소와 예측 블록의 주변 화소를 이용한 보상 계수를 계산하여 현재 CU의 예측 화소에 보상을 해주는 것이다. 이 때, 보상 계수를 구하기 위한 현재 CU와 예측 블록의 주변 화소들을 서브 샘플링함에 있어서, 현재 CU의 크기에 따라서 서브 샘플링율을 차등 설정하고 이에 따른 성능 변화를 분석한다.
-
날이 갈수록 빨라지는 IT분야의 발달로 최근 정보 통신망, 핸드폰, 컴퓨터 등의 발달과 함께 시간과 장소에 상관없이 빠르게 동영상 수요가 급증 하고 있다. 급증하고 있는 동영상 수요에 맞춰 고품질의 서비스를 제공하기 위해서는 압축 부호화 기술이 필수적이다. 이와 같은 흐름에 따라 표준화 기관인 ITU-T, ISO/IEC는 2013년 초, 최신 압축 부호화 기술인 HEVC를 제정하였다. HEVC에서는 이전 표준과 비교하여 다양한 부호화 기술이 포함되었는데 그 중 화면 내 예측 기술에서는 35가지 모드 중에서 최적의 모드를 결정하여 예측 블록을 더욱 정밀하게 생성한다. 이때, 색차 성분의 화면 내 예측 모드는 휘도 성분의 예측 모드와는 달리, 고정된 5개의 모드만 가지고 있다. 본 논문에서는 5개 모드의 번호를 통계적 특성을 이용하여 새롭게 모드 번호를 할당하는 실험을 수행하고 결과를 분석한 후, 향후 연구 방향을 제시한다.
-
본 논문에서는 하나의 넓은 동적 영역(High Dynamic Range: HDR)을 갖는 이미지를 Earth Mover's Distance(EMD)값을 이용한 이미지 분할 기법을 적용한 유사 지역 그룹화를 통해, 각 그룹별로 톤 매핑을 수행하는 기법을 제안하고자 한다. 기존의 EMD 값을 통한 이미지 분할 알고리듬은 이미지 내의 같은 그룹으로 분류된 지역에서 휘도(luminance)의 변화가 클 때 후광 현상(halo artifact)이 발생하는 문제점을 보였다. 본 논문에서는 기존의 알고리듬으로 분할된 이미지를 처리할 때 휘도 변화량(gradient)의 정보를 활용하여 후광 현상 제거함으로써 주관적 화질을 향상시켰다.
-
본 논문에서는 인간의 시각적 특성을 반영한 Just Noticeable Difference (JND) 모델을 사용한 움직임 예측을 통한 프레임율 향상 기법을 제안한다. 기존의 다중 프레임 기반 움직임 예측을 통한 프레임율 향상 기법은 움직임 벡터의 정확성을 높이기 위해 다중 프레임을 사용하며, 전체 영역에 대해 같은 블록 크기와 탐색 영역으로 움직임 예측을 수행함으로써 불필요한 계산량이 많아지고 움직임 벡터의 부정확한 예측이 수행된다는 단점이 있다. 제안하는 알고리듬은 인간의 시각적 특성을 고려한 Free Energy-based Just Noticeable Difference (FEJND) 모델을 사용하여 이전 프레임과 현재 프레임만을 사용하여 영역 특성에 따른 적응적 움직임 예측을 수행하여 정확성을 높인다. 실험 결과에 따라 제안하는 알고리듬의 성능이 향상되었음을 알 수 있다.
-
최근 UHD 방송서비스에 대한 관심이 고조됨에 따라 고품질 방송 콘텐츠 보호에 대한 요구가 증가하고 있다. 이에 따라, DVB, MPEG, ATSC 등 국제 표준단체에서는 기존 방식보다 보안 성능이 우수한 디지털 방송 보호 규격을 논의하고 있으며, 디즈니, 파라마운트, 소니 픽처스 등 세계 주요 콘텐츠 제작사들이 설립한 비영리 기관인 MovieLabs 에서도 고품질 콘텐츠 보호를 목적으로 AES-128 또는 그 이상의 강도를 갖는 콘텐츠 암호화 알고리즘을 필수적으로 사용하도록 규정하였다. 본 논문에서는 디지털 방송 보안을 위해 널리 사용되고 있는 DVB-CSA 및 AES-128 보다 보안성능이 우수한 것으로 알려진 방송 콘텐츠 암호화 규격인 DVB-CSA ver3 표준 규격 기반으로 설계 및 구현된 스크램블 시스템에 대해 소개한다.
-
보행자 인식을 위한 컴퓨터 비전 알고리즘은 야간 상황과 같이 저조도 환경에서는 인식 성능이 떨어지고 있다. 이로 인하여 최근 저조도 환경에서 촬영된 영상으로 야간 상황에서 객체 인식 성능을 높이는 기법들이 연구되고 있다. 야간 환경은 주간 환경과는 다르게 광량이 적기 때문에 인간의 시각으로도 객체 인식에 어려움이 있고 일반적인 카메라로 촬영된 영상으로 객체 인식이 어렵다. 최근에는 NIR 카메라를 이용하여 촬영된 영상으로 야간 보행자 인식 알고리즘이 개발되고 있으나, 인식률과 객체 인식 가능 거리 및 범위가 한정적이다. 또한 기존의 야간 보행자 검출 기법들은 방대한 연산량이 필요하기 때문에 실시간 객체 인식이 불가능하다. 본 논문에서는 NIR 카메라로부터 촬영된 영상으로 preprocessing 후 ACF(Aggregated Channel Feature)를 이용하여 최근 연구되고 있는 카메라 움직임이 있는 야간 환경에서 보행자 인식 알고리즘을 PC 및 TK1 Board 환경에서 구현하고 객체 인식률을 높인다.
-
본 논문에서는 스테레오 채널 신호 간 강도비를 이용하여 음원을 분리하는 EADRess 알고리즘과 부분기반 표현을 특징으로 한 비음수 행렬 인수분해를 통해 음원을 분리하는 NMF 가 결합된 새로운 음원분리 알고리즘을 제안한다. 입력 오디오 신호로부터 frequency-azimuth 평면 구성을 통해 식별된 방위각에 상응하는 신호 강도비로 표현되는 확률밀도함수를 이용하여 1 단계 음원분리를 수행하고, 얻어진 개별 분리음원을 대상으로 supervised NMF 및 Wiener 필터 기반 마스킹 함수를 적용함으로써 잔류 혼합성분을 제거하는 2 단계 음원분리를 수행한다. 제안된 EADRess/NMF 결합 음원분리 알고리즘의 성능을 검증하기 위하여 SASSEC 에서 제공하는 테스트 음원을 이용하여 측정한 결과, 개별 음원분리 알고리즘에 비해 SIR 이 각각 1.41dB, 10.43dB 향상된 결과를 얻었다.
-
본 논문은 깊이 영상 기반의 렌더링 방식을 이용하는 다시점 영상 시스템에서 새로운 프레임율 변환(Frame Rate Up-Conversion, FRUC) 방식을 소개한다. 제안된 방식은 깊이 영상을 이용해 각각의 블록을 세부 영역으로 나누고, 주변 시점의 영상을 이용해 각각 세부 영역의 폐쇄 영역의 정보를 복원한다. 복원된 폐쇄 영역의 정보와 기존의 세부 영역의 정보를 이용해 움직임 예측 및 보상을 수행한다. 제안하는 방법은 폐쇄 영역이 발생하는 영역에서 기존의 방법보다 정확한 움직임 예측을 수행한다.
-
본 논문에서는 전송하고자 하는 원영상 대신에 전혀 다른 영상을 전송하여 원영상 정보를 보호하는 스테가노그래피(steganography) 기법을 제안한다. 전송할 영상의 자연스러움을 잃어버리지 않으면서 원영상을 복구할 수 있는 차영상 정보를 LSB(Least Significant Bit)에 담고, 픽셀간의 위치 관계를 무작위로 섞어 줌으로써, 원영상을 보호하는 기법을 제안한다. 본 논문에서는 우선 원영상과 전송할 영상 (cover image)의 차영상을 생성하고, 각 픽셀의 차이값을 큰 범위로 양자화하여 차영상의 데이터 크기를 줄인다. 그리고, 각 픽셀의 차이값을 전송할 영상의 4 픽셀에 걸쳐서 하위 2bit 에 나누어 담는다. 8bit 영상에서 하위 2 bit 를 다루기 때문에, 각 채널 밝기값의 최대 차이값은 3 으로 설정되어 자연스럽게 영상을 생성할 수 있다. 끝으로 신호의 보호를 위하여 차영상의 픽셀과 전송할 영상의 픽셀간의 대응위치를 무작위 순열로 변환하여 외부에서 쉽게 복원할 수 없도록 한다. 이러한 스테가노그래피 제안 기법을 통하여 원영상 대신에 커버 영상을 전송함으로써, 자연스러운 정보전송이 가능하며, 외부의 감시와 복원에 안전한 정보보호 기능이 강화될 수 있다. 여러 영상에 대한 실험을 통한 제안 기법에 의하면, 전송되는 커버 영상이 자연스럽기 때문에 외부에서 정보가 숨겨진 사실을 느끼지 못하며, 송수신 장치에 내장된 무작위 순열을 통하여 외부에서는 원영상 정보를 복구하는 것도 매우 어렵게 되어 있음을 확인하였다. 본 제안 기법은 군사통신이나 중요한 정보를 다루는 기관에서의 정보 전달 및 정보보호 시스템에서 사용될 수 있다.
-
본 논문에서는 로드밸런싱 (load balancing) 기반의 HEVC (High Efficiency Video Coding) 디블록킹 필터(deblocking filter) 병렬화 방법을 제안한다. 본 논문에서는 디블록킹 필터의 병렬화를 위해 TU (Transform Unit)의 경계 정보를 이용하여 픽쳐 단위로 디블록킹 필터의 작업량을 예측하고, 예측된 작업량을 기반으로 코어에 균등한 일을 할당함으로써 디블록킹 필터의 병렬화 효율을 향상 시켰다. 실험결과 제안하는 로드 밸런싱 기반 디블록킹 필터 병렬화 방법을 사용하여 균등 분할 디블록킹 필터 병렬화 방법에 비해 11%의 디블록킹 필터 속도를 향상시켰다.
-
본 논문에서는 HEVC (High Efficiency Video Coding) 복호화기의 SAO (Sample Adaptive Offset)를 효율적으로 병렬화하기 위한 방법을 제안한다. HEVC 는 주관적 화질 향상 및 압축 효율 향상을 위해 디블록킹 필터 (de-blocking filter)와 샘플 적응적 오프셋 (SAO)이라는 두 가지 인-루프 필터를 사용한다. 두 종류의 인-루프 필터의 사용은 HEVC 복호화기의 복잡도를 증가시키는 요인이며, 인-루프 필터에 데이터레벨 병렬화를 적용하여 고속으로 복호화를 수행할 수 있다. 본 논문에서는 SAO 의 병렬화를 위해 CTU (Coding Tree Unit)의 행 단위로 병렬화를 수행함으로써, 병렬화로 인한 추가적으로 발생하는 라인 버퍼 사용을 줄여 SAO 병렬화 효율을 향상시켰다. 실험결과 제안하는 SAO 병렬화 방법을 사용하여 균등분할 SAO 병렬화 방법에 비해 91%의 속도를 향상시켰다.
-
본 논문은 FTN(faster-than-Nyquist) 신호가 적용된 DVB-T2 시스템의 동기 알고리듬에 미치는 영향에 대하여 분석하였다. 파일럿 기반의 동기 알고리듬은 FTN 신호의 간섭 영향으로 인하여 동기 성능의 열화가 발생한다. 기존의 DVB-T2 시스템을 기반으로 하여 FTN 변수에 따른 성능의 변화를 실험으로 분석하고 SUI 채널 환경에서의 성능을 분석하였다.
-
본 논문에서는 단일 노출 영상으로부터 다수의 가상 노출 영상을 생성하고, 그 영상을 한 장의 HDR 영상으로 합성하여 SDR 디스플레이 시스템에 개선된 화질의 영상을 보여주도록 하는 방법을 제안한다. 이 방법에서는 주어진 단일 노출 영상을 Retinex 이론을 적용하여 조명 성분과 반사 성분으로 분리하고, 새로운 노출 조절 알고리즘을 제안하여 다수의 가상 조명 성분과 원본 이미지의 반사 성분을 생성하며 이들을 이용하여 다수의 가상 노출 영상을 생성한다. 생성된 다수의 가상 노출 영상은 가중치 합성 함수에 의해서 암부의 세부 표현력이 개선되고 명암비가 높아져 SDR display 에서도 우수한 화질의 HDR 영상으로 변환된다. 기존에 제안된 알고리즘과 비교 실험을 통해, 본 논문에서 제안된 HDR 영상 합성 기법의 성능을 증명한다.
-
본 논문에서는 화면 내 블록 카피 (IntraBC: Intra Block Copy) 예측 기술의 압축 성능 분석과 향상된 해쉬 기법을 통한 HEVC (High Efficiency Video Coding) 스크린 콘텐츠 코딩 성능 기법을 제안한다. 현재 SCM (Screen Content Coding Test Model) 에 채택 된 화면 내 블록 카피 기술에서는
$16{\times}16$ 블록에는 1차원 탐색을 수행하고$8{\times}8$ 블록에서는 해쉬기반 전역 탐색을 수행하여 해쉬가 일치하는 블록들과 RD-Cost를 수행한다. 현재의 해쉬기반 전역탐색에는 기울기 (Gradient) 위주의 해쉬 구성으로 인해 해쉬가 고르게 분포하지 않아, RD-Cost 수행횟수가 과도하게 많아지는 문제가 있다. 제안하는 방법은 전역적 화면 내 블록 카피의 해쉬 구성 방법을 개선함으로써, 기존 SCM-6.1 대비 0.46%의 BDBR 향상을 확인하였다. -
본 논문에서는 과거와 현재지도를 자연스럽게 융합하여 살펴볼 수 있는 열 적외선 영상 기반 지도 조작 인터페이스 시스템을 제안한다. 이 시스템은 두 지도의 융합과 손가락 터치 검출로 구성되어 있다. 두 지도의 융합은 호모그래피 방법을 사용하여 과거지도를 워핑하고 이를 현재지도 위에 중첩하였다. 손가락 터치 검출은 열 적외선 카메라를 사용하여 손가락 접촉 후 생기는 잔류 열을 검출하였다. 손가락 접촉 위치는 검출된 잔류열을 이용하여 계산하였다. 현재 위성지도에서 특정 위치에 손가락을 터치하면 접촉한 위치를 계산하고 과거지도를 프로젝터로 투사하여 지도 조작이 가능하게 하였다. 제안하는 방법을 통해 구현된 인터페이스 시스템은 손가락 터치로 과거지도와 현재지도를 이해하는데 효과적으로 활용 될 수 있을 것으로 예상된다.
-
본 논문에서는 다중 지역 이진 패턴(Multi-scale Bock LBP, MB-LBP) 특징과 랜덤 포레스트에 기반한 새로운 기법의 머리 방향 분류 기법을 제안한다. 제안 기법에서는 occlusion 과 조명의 변화에 강인한 분류 정확도를 얻기 위해서 랜덤화된 트리를 학습하는 것을 목표로 한다. 우선, 얼굴 이미지로부터 많은 MB-LBP 특징을 추출하고, 얼굴 영상들을 랜덤하게 입력하고 MB-LBP 크기 파라미터와 같은 랜덤 특징과 블록 좌표들을 사용하여 트리를 생성한다. 게다가 각 노드에서 정보 이득을 최대화 하는 트리의 내부 노드를 생성하기 위해서 uniform LBP 의 특성을 고려한 분할 함수를 개발한다. 랜덤화된 트리는 랜덤 포레스트에 포함되어 있으며 마지막 결정단계에서 Maximum-A-Posteriori criterion 으로 최종 결정을 한다. 실험 결과는 제안 기법이 다양한 조명, 자세, 표현, occlusion 상황에서 기존의 방법보다 개선된 성능으로 머리 방향을 분류 할 수 있음을 보여준다.
-
지상파 UHD 방송의 시행 및 확대를 목표로 세계 각 국에서 정부 민간 차원의 대규모 투자 및 개발이 활발히 진행되고 있다. 기존 HD 방송 대비 데이터양이 막대하게 증가되기 때문에 실시간 고효율 처리를 위한 기술 개발 및 연구가 진행되고 있다. 특히 UHD 방송 제작 관련하여 UHD 카메라로부터 영상 및 음향을 실시간으로 획득하고 편집된 영상을 재생하기 위한 시스템 개발이 최근 주요 방송장비 업체 주도로 진행되고 있다. 이에 본 논문은 최대 2 채널의 4K UHD 영상 데이터를 동시에 실시간으로 획득 및 재생하기 위한 FPGA (Field Programmable Gate Array) 및 고속 입출력 인터페이스 기반의 하드웨어 플랫폼을 제안하였다. 또한 카메라/디스플레이와 편집 서버 간의 데이터의 고속 고효율 전송을 위한 로직을 HDL(Hardware Design Language) 설계하여 FPGA 내에 탑재하고 카메라/디스플레이/편집 서버와 통합하였다. 시험 결과 2 채널 4K 60fps 영상 데이터를 정상적으로 획득 및 재생하였다.
-
일반적으로 UHD 방송 편집 시스템에서 UHD 영상의 데이터양이 막대하기 때문에 실시간 전송을 위해 코덱과 함께 압축하여 편집 서버로 혹은 편집 서버로부터 스트림 형태로 전송한다. BT.1120 형태로 전송 송출된 SDI (Serial Digital Interface) 내장 음향 데이터는 영상과 달리 보조 데이터 영역에 다른 메타 데이터들과 함께 합성되어 전송 송출되기 때문에 추출 및 합성이 상대적으로 어렵다. 특히 재생을 위해서는 영상 코덱으로부터의 출력 영상과의 동기를 고려해야 하고 음향 데이터를 BT.1120 표준에 맞춰 보조 데이터 영역에 합성해야하기 때문에 개발에 어려움이 있다. 이에 본 논문은 UHD 영상/음향 데이터의 실시간 획득/재생 시스템에서의 SDI 내장 음향 데이터의 추출 및 합성을 위한 FPGA (Field Programmable Gate Array) 기반 하드웨어 플랫폼을 제안하였다. 또한, 이를 위한 음향 데이터 추출 로직과 합성 로직을 HDL(Hardware Design Language) 설계하여 FPGA 내에 탑재하고 카메라/디스플레이/편집 서버와 통합하였다. 시험 결과 4K 60fps 데이터에서 정상적으로 영상과 음향을 분리/획득 및 합성/재생하였다.
-
Recently high dynamic range imaging technique is hot issue in computer graphic area. We present a progressive tone mapping algorithm, which is based on weighted least squares optimization framework. Our approach combines weighted leastsquaresfiltering with iCAM06, for showing more perceptual high dynamic range images in conventional display, while avoiding visual halo artifacts. We decompose high dynamic range image into base layer and detail layer. The base layer has large scale variation, it is obtained by using weighted least squares filtering, and then the base layer incorporates iCAM06 model. Then, adaptive compression on the base layer according to human visual system. Only the base layer reduces contrast, and preserving detail. The resultshows more perceptual color appearance and preserve fine detail, while avoiding common artifacts.
-
During the
$2^{nd}$ JVET (Joint Group on Future Video Coding Technology Exploration) meeting, up to 22 coding tools focusing on Future Video Coding (FVC) were proposed. Despite that the application of proposed coding tools has a considerable performance enhancement, however, the encoding time of Joint Exploration Model (JEM) software is over 20 times for All Intra coding mode, 6 times for Random Access coding mode, of HEVC reference model (HM), and decoding time is 1.6 times for All Intra coding mode, 7.9 times for Random Access coding mode, of HM. This paper focuses on analyzing the complexity of the JEM software compared with HM. -
차량 인식 기술은 지능형 자율주행 차량 및 첨단 운전자 보조 시스템 (ADAS: Advanced Driver Assistance System)의 개발에 있어서 핵심 요소 기술이다. 영상 기반의 차량 검출 알고리즘은 일반적으로 가설 생성 (HG: Hypothesis Generation) 단계와 가설 검증 (HV: Hypothesis Verification) 단계로 구성된다. 가설 검증 단계는 관심 영역 (ROI: Region of Interest) 내에 차량이 존재할 가능성이 있는 후보 영역을 만드는 단계로서 전체 알고리즘의 복잡도와 성능에 영향을 미친다. 본 논문에서는 관심 영역 내에 존재하는 그림자와 차량으로 인한 에지를 검출하고 두 특징 정보를 결합한 가설 생성 방법을 제안하고 차량 후방 영상을 이용하여 사각지대를 감시하는 시스템에 제안 방법을 적용하는 실험을 수행하였다. 실험 결과로 제안 방법이 차량 후보 영역의 존재 여부와 위치 정보를 판단하기에 적합하며 이를 통해 차량 검출 알고리즘의 계산 복잡도를 개선하면서도 다음 단계인 가설 검증 시 검출 성능을 향상시킬 수 있음을 확인하였다.
-
본 논문에서는 딥러닝 기술 중의 하나인 CNN(Convolutional Neural Network) 기반의 얼굴 표정 인식 기법을 제안한다. 다섯 가지 주요 표정의 얼굴 영상을 CNN 구조에 스스로 학습시켜 각각의 표정 패턴에 적합한 특징 지도(feature map)를 형성하고 이 특징 지도를 통해 들어오는 입력 영상을 적합한 표정으로 분류한다. 기존의 CNN 구조를 본 논문에서 이용한 데이터 셋에 알맞게 convolutional layer 및 node의 수를 변경하여 특징 지도를 형성하고 학습 및 인식에 필요한 파라미터수를 대폭 감소시켰다. 실험 결과 제안하는 기법이 높은 얼굴 표정 분류 성능을 보여준다는 것을 보였다.
-
본 논문에서는 다중 랜덤 워커(multiple random walkers)에 기반한 객체 추적 기법을 제안한다. 우선 서포트 벡터 머신(support vector machine)을 이용한 분류기 기반 객체 추적 기법을 소개한다. 다음으로 영상의 영역에 대한 특징 벡터 중 배경으로부터 추출된 특징 벡터를 억제하는 기법을 제안한다. 영역에서 배경 요소를 찾기 위해 다중 랜덤 워커를 이용한 전경 및 배경 추출 방법을 제시한다. 배경 요소를 억제하여 학습된 서포트 벡터 머신은 객체와 배경이 유사한 영상, 객체가 다른 물체에 의해 가려지는 영상 등에서 객체와 배경을 확실하게 구분하여 객체를 잃지 않고 추적할 수 있다. 마지막으로 실험을 통해 제안하는 기법이 기존 기법에 비해 우수한 추적 성능을 보임을 확인한다.
-
본 논문은 human visual system(HVS)에 따른 주파수 민감도와 공간에서 다양한 특성들을 구현하기 위한 신호처리 방법을 개발하였다. 인간의 눈은 주파수 성분에 따라 민감도가 다르며 초점에서 멀수록 인지 가능한 해상도가 떨어진다. 주파수 민감도를 구현하기 위해서 본 논문은 영상 신호의 에너지 스펙트럼 모양이 contrast sensitivity function(CSF)의 모양이 되도록 하여 영상 신호의 에너지를 증가시켰으며 신호 방향에 적응적인 multiband energy scaling 방법을 개발하였다. 기존의 시스템에서 능률만을 향상시키는 기존의 분석 모델과 비교하면 개발한 방법은 HVS에 좀 더 적절하고 선호되게 영상 신호를 처리할 수 있다.
-
최근 웨어러블 장치의 개발로 인하여 다양하게 생체 신호를 측정하는 방법이 많아지고 있다. 이와 관련하여 대표적으로 측정하는 신호가 PPG(plethysmography) 신호이다. PPG 신호를 이용하여 맥박수, 혈박출량, SPo2 등의 값들을 추정할 수 있다. 그러나 웨어러블 장치의 특성상 동적잡음이 많이 발생하게 된다. 동적잡음을 제거하기 위한 방법들은 가속도 센서를 사용하는 방법, 칼만필터(Kalman filter)를 이용하는 방법 등 다양한 방법들이 존재한다. 그러나 여전히 범용으로 사용하기에는 한계가 있다. 본 논문은 Neural Network를 사용하여 개인별로 PPG 신호를 학습하여 PPG 신호의 이상 유무를 판단하고 이전 신호의 평균 맥박수를 사용하여 효과적으로 PPG 신호의 정확한 맥박수를 검출하는 알고리듬을 제안한다.
-
본 논문에서는 DIBR 3 차원 영상을 위한 블라인드 워터마크 방법을 제안한다. DIBR 을 이용한 3 차원 영상은 낮은 Bitrate 와 시점조정 가능성으로 인해 주목받고 있지만, DIBR 과정 중 워터마크 손상이 발생해 워터마크에 어려움이 있다. 이를 극복하기 위해 DIBR 의 특성을 이용한 깊이영상 기반으로 워터마크 삽입 영역을 탐색하는 방법을 사용하며, 이를 통해 시점이동에 민감하지 않은 영역에 워터마크를 삽입하는 것이 효과적임을 실험적으로 증명하였다. 또한 시점이동 후 사라질 가능성이 큰 불필요한 워터마크 삽입을 최소화하여 워터마크 삽입 후 영상의 화질저하를 줄였다. 이에 본 논문에서는 깊이영상을 이용해 변화가 적은 영역을 탐색하기 위한 연구를 진행하였다. 이는 후에 가상 시점 영상에 추가적인 공격이 가해지더라도 더 강인성을 가질 수 있는 기초가 되었다. 또한 블라인드 워터마크 방법을 적용하기 위해 기존 워터마크 데이터와 유사도를 측정하는 방식으로 워터마크 삽입 위치를 파악하였다.
-
영상에서 배경으로부터 객체를 분류하는 영상 분류 알고리즘은 물체 인식 및 추적 등 다양한 응용분야에서 중요하다. 본 논문에서는 고정된 카메라에서 다수의 초기 프레임을 참조하여 실시간 영상 분류 방법을 제안한다. 먼저 전경과 배경을 구분하는 확률모델을 제안하였으며 초기 프레임 동안에 카메라의 특성을 추출하여 카메라에 적응적으로 영상을 분류한다. 또한 분류된 영상에서 human의 특징을 이용하여 분류된 결과를 보정하는 방법을 제안한다. 마지막으로 제안한 알고리즘의 실시간 분류 처리를 위하여 복잡도를 최소화 하였다.
-
디지털 라디오 수신 환경에서 권역을 이동하거나 수신 신호가 미약한 구간 특히 실내로 이동을 하고자 할 경우 서비스를 자동으로 연계해 줄 수 있는 서비스 연계(service following) 기술이 필요하다. 본 논문에서는 하이브리드 라디오 환경에서 자동으로 서비스 연계가 가능한 방법을 제안하고자 한다. 구체적으로는 서비스 연계 이벤트가 발생할 경우 연계 대상을 단말에서 결정하는 것이 아니라 인터넷 상에 이를 처리할 수 있는 서버를 두어 청취자로부터 전달되는 위치 좌표를 포함한 관련 방송 파라미터를 제공받아 가장 적합한 연계 대상을 식별한 후 이를 다시 단말에 제공하는 방식이다.
-
본 논문은 에너지 하베스팅을 하는 다수의 중계기를 사용하여 다중 홉 통신을 하는 시스템을 다룬다. 중계기는 파워 비콘에서 보내는 무선 에너지 신호를 이용하여 신호 전송에 필요한 에너지를 얻는다. 신호 전송은 여러 프레임을 통해 이루어 지는데, K 개의 프레임 동안 에너지를 하베스팅하고, 다음 프레임에 다중 홉으로 정보 신호 전송을 한다. 이 때 수신기에서의 불능 확률을 1) K 가 변화할 때, 2) 다중 홉 수 가 변화할 때로 나누어 시뮬레이션 한다.
-
본 논문은 ATSC2.0 기반 8-VSB/MH 융합형 3DTV (A/104 Part 5 Service Compatible 3DTV using Main and Mobile Hybrid Delivery) 방식 다중화기 개발에 대한 내용을 기술한다. ATSC A/104 Part 5 SC-MMH 3DTV 방식은 미국의 지상파 DTV 표준화 논의단체인 ATSC 에서 고정 HD 서비스를 위한 8-VSB 채널과, In-band 모바일 TV 서비스를 위한 ATSC M/H 채널을 이용하여, 주파수 효율을 극대화한 새로운 개념의 3D 콘텐츠 전송기술을 도입한 HD 급 지상파 3DTV 방식으로 2014 년 8 월 융합형 3DTV 서비스 시그널링 방안 및 2015 년 10 월 부가정보(VEI: Video Enhancement Information)를 이용한 화질개선 기술을 ATSC 3DTV Standard 로 채택하였다. 본 논문에서는 이와같은 8-VSB/MH 융합형 3DTV Head-End 핵심장비인 8-VSB/MH 융합형 3DTV 다중화기 구현에 대한 내용을 기술한다.
-
본 논문에서는 ATSC 3.0 규격에서 정의되는 부트스트랩 신호를 이용한 수신기 동기 방식에 대해서 소개한다. ATSC 3.0 방송 신호의 프레임에 앞서서 전송되는 부트스트랩 신호는 시간영역에서 반복되는 구조를 가지므로 이를 이용하여 수신기에서 타이밍 및 주파수 동기를 획득할 수 있다. 본 논문에서는 부트스트랩 신호의 시간영역의 반복구조를 이용하여 수신기에서 타이밍 및 주파수 동기 획득 방법을 제시한다.
-
본 논문에서는 동영상에서 제한된 종류의 동적 객체를 자동적으로 검출하여 추적하는 기법을 제안한다. 제안하는 기법은 객체 검출 기법[1]과 객체 추적 기법[2]의 협업을 통해 이를 수행한다. 검출기는 매 장면마다 객체들을 검출하고 이 중 높은 신뢰도의 객체에 대해 추적을 시작한다. 추적기는 이전 장면에서 학습된 분류기에 기반하여 객체를 추적한다. 추적 결과와 겹치는 검출 결과를 분석하여 현재 장면에서 객체의 정확한 위치와 모양을 추정한다. 겹치는 검출 결과가 없을 때는 검출기로 부터 추적 결과의 신뢰도를 측정하고 문턱값에 따라 추적을 계속 진행하거나 종료한다. 실험 결과를 통해 제안하는 기법이 기존 검출 기법에 비해 우수한 검출 성능을 보임을 확인한다.
-
본 논문에서는 3 차원 영상시스템에서 발생하는 경계 잡음을 Projection onto Convex Sets(POCS) 방법을 활용하여 제거하는 기법에 대해서 소개한다. 3 차원 영상시스템에서의 경계 잡음은 일반적으로 손상된 깊이영상 의하여 가상 시점의 합성 과정에서 발생하는 잡음을 뜻한다. 본 논문에서는 이러한 경계 잡음을 분석하고, 제안 방식을 이용하여 효과적으로 제거할 수 있음을 여러 실험을 통하여 확인하였다.
-
신호등 검출은 지능형 교통 시스템에서 매우 중요하며 최근 신호등 검출 관련한 연구가 활발히 진행 중이다. 하지만 기존의 신호등검출 알고리듬의 문제점은 조명의 변화에 민감하다는 문제점이 있다. 이러한 문제점을 해결하기 위하여 본 논문에서는 다음과 같은 신호등 검출 알고리듬을 제안한다. 먼저 제안하는 색상지도와 HSV(Hue-Saturation-Value)를 이용하여 신호등의 후보를 검출한다. 검출한 신호등의 후보로부터 HOG(Histogram of Oriented Gradient) 서술자를 이용하여 특징을 추출한 다음 최종적으로 선형 SVM(Support Vector Machine)을 이용하여 신호등을 검출하는 알고리듬을 제안한다.
-
최근 실세계에 존재하는 물체의 3차원 형상과 색상을 디지털화하는 3차원 객체 복원에 대한 관심이 날로 증가하고 있다. 3차원 객체 복원은 영상 획득, 영상 보정, 점군 획득, 반복적 점군 정합, 무리 조정, 3차원 모델 표현과 같은 단계를 거처 통합된 3차원 모델을 생성한다. 그 중 반복적 점군 정합 방법은 카메라 궤적의 초기 값을 획득하는 방법으로서 무리 조정 단계에서 전역 최적 값으로의 수렴을 보장하기 위해 중요한 단계이다. 기존의 반복적 점군 정합 (iterative closest points) 방법에서는 시간이 지남에 따라 누적된 궤적 오차 때문에 발생하는 객체 표류 문제가 발생한다. 본 논문에서는 이 문제를 해결하기 위해 색상 영상에서 SIFT 특징점을 획득하고 3차원 점군을 얻은 뒤 가중치를 부여함으로써 점 군 간의 더 정확한 정합을 수행한다. 실험결과에서 기존의 방법과 비교하여 제안하는 방법이 절대 궤적 오차 (absolute trajectory error)가 감소하는 것을 확인 했고 복원된 3차원 모델에서 객체 표류 현상이 줄어드는 것을 확인했다.
-
현행 수화방송서비스는 방송영상 화면위에 수화영상을 덧씌우는 방식으로 송출하기 때문에 수화영상의 크기가 작고 수화 영상을 제거하거나 크기 위치 조정이 불가능하여 청각장애인의 TV 시청에 불편함을 초래하고 있다. 청각장애인의 방송접근권 확대와 일반시청자의 TV 시청환경 제고를 위해 스마트 수화방송서비스는 방송 인터넷 융합 하이브리드 방식으로 방송영상과 수화영상을 방송망과 인터넷망으로 각각 송출하고 TV수신기가 두 영상의 동기화를 처리하고 앱을 통해 수화영상의 크기, 위치 조정 및 제거 서비스를 제공한다. 본 논문에서는 방송 인터넷 융합 하이브리드 방식인 스마트 수화방송서비스의 표준 기술 및 동기화 방식을 소개하고 스마트 수화방송 시험환경 및 동기화 지연시간 측정 결과를 소개한다.
-
한국정보통신기술협회(이하, TTA)에서 제정된 " HTML5 기반 스마트 TV 플랫폼(TTAK.KO-07.0111/R1)" 은 개방형 국제 기술표준인 W3C/HTML5 을 기반으로 스마트 TV 에서 방송환경과 운영체제에 종속되지 않고 애플리케이션이 실행될 수 있도록 스마트 TV 플랫폼의 기술 요구 사항을 정의한 표준이다. TTA 에서는 이러한 표준 기반의 TV 앱 생태계를 활성화하기 위해 앱 개발도구(SDK)를 개발하여 배포하였고, 이어서 TV 장치 없이 PC 환경에서 표준 기반으로 개발된 앱을 실행할 수 있는 있는 에뮬레이터 개발을 추진하였다. 개발된 에뮬레이터는 사용자의 방송 정보 설정을 바탕으로 방송 재생 및 제어 기능을 제공하고 표준 기술로 작성된 앱을 방송 연동형 혹은 패키지 형태로 실행할 수 있는 기능을 제공한다. 본 논문에서는 TTA 에서 개발한 표준 기반 TV 에뮬레이터의 설계 및 구현에 대해 소개한다.
-
한국정보통신기술협회(이하,TTA)에서는 "HTML5 기반 스마트 TV 플랫폼(TTAK.KO-07.0111/R2)"표준(이하, 스마트 TV 2.0 표준)을 2016 년 6 월에 개정하였으며, 본 논문에서는 스마트 TV 2.0 표준을 준수하여 개발되는 스마트 TV 용 앱 개발도구(SDK, Software Development Kit)의 두 가지 확장 내용을 다룬다. 첫 번째 확장 내용은 스마트 TV 2.0 표준이 개정됨에 따라 추가되는 기능인 고급입력 API, 녹화 및 다운로드 API 인터페이스를 확인하고 검증할 수 있는 검증기능 구현에 대한 내용이며, 두 번째 확장 내용은 표준기반 TV 애뮬레이터를 스마트 TV 앱 개발도구에서 사용 가능하게 하는 인터페이스 구현에 대한 내용이다. 본 논문에서는 표준기반 서비스를 만드는 개발자에 대한 지원과 표준기반 TV 앱 생태계의 활성화를 위한, 스마트 TV 플랫폼 표준 앱 개발도구 확장기능의 설계 및 구현에 대하여 소개한다.
-
본 논문은 2016 년 6 월 TTA 개정 표준 "HTML5 기반 스마트 TV 플랫폼(TTAK.KO-07.0111/R2)"에서 스마트폰, 태블릿 등 컴패니언 디바이스를 통해 스마트 TV 에 설치된 서비스 애플리케이션(이하, 앱)을 원격으로 조회, 실행, 종료 등의 제어를 지원하는 표준 기술을 소개한다. 이 기술은 표준에서 이미 정의된 멀티스크린 기술을 바탕으로 컴패니언 디바이스(모바일, 테블릿 등)를 통해 스마트 TV 를 인지하고 해당 TV 의 IP 주소 정보를 인식하여 JSON-RPC 프로토콜을 이용한 함수 형식 제어 요청을 통해 정보를 전달하는 방식으로 스마트 TV 수신기는 앱 정보 제공, 특정 앱 실행, 앱 종료 등 다양한 원격 앱 제어 기능을 서비스한다. 또한, 해당 원격 앱 제어 기술을 PC 기반의 가상환경인 스마트 TV 2.0 에뮬레이터 구현으로 표준기술에 유효성 검증과 서비스 응용 사례를 설명한다.
-
일반적으로, 비행 표적의 궤적을 예측하기 위해 회귀분석이 사용되어왔다. 그러나 이 방법은 표적이 매우 다이내믹한 움직임을 보일 경우에는 오차가 크다는 한계가 있다. 이러한 문제를 해결하기 위해 본 논문에서는 다양한 수식을 생산해 내는 유전자 알고리즘을 이용하여 비행 표적의 다음 궤적을 예측해 내는 방법을 제안한다. 유전자 알고리즘을 통해 생산된 예측식을 토대로 비행 표적의 궤적을 3D 형태로 시각화 하였으며, 실제 관측 데이터와 예측된 데이터의 오차를 통해 정확도를 검증하였다.
-
본 논문에서는 중계 차량 내 콘트롤러 사용빈도 분석을 위한 방법에 대해 논한다. 중계 차량 내 장비는 대부분 외산에 의존하고 고가의 장비를 사용하고 있다. 따라서 투자비용이 높고 국산화 기술에 대한 연구가 미미하다. 또한 사용하는 장비의 기능은 한정적인 것에 반해 불필요한 확장 기능이 너무 많이 탑재되어 있어 사용자의 활용 빈도가 낮고, 사용하기가 어렵다. 이에 본 논문에서는 인간공학적 콘트롤러 개발을 위해 이동식 중계 차량 내 콘트롤러 사용빈도를 영상 기반으로 자동 분석하기 위한 방법에 대해 제안한다. 사용빈도 분석을 위해 사용자의 손을 추적하고, 손으로 추정되는 좌표 값을 파악하여 계속 누적한다. 일정시간 동안 누적한 좌표값을 분석하여 콘트롤러 사용 빈도에 대해 파악하고자 한다. 이는 국내 중계방송 환경에 적합한 콘트롤러 장비를 개발하는 데 도움을 줄 수 있으며 국산 기술을 확보할 수 있는데 의의를 가진다.
-
리얼리티 예능 TV 프로그램이나 다큐멘터리, 스포츠 중계, 인터넷 개인 방송 등 다양한 방송 프로그램에서 기존의 촬영시스템과 다른 새로운 기기와 방법을 도입하고 있다. 특히 드론을 활용한 항공 촬영시스템으로 사람이나 지미짚 카메라로 촬영이 불가능했던 높은 구도에서 촬영하고, 액션 캠을 활용한 촬영시스템으로 사용자가 직접 휴대하거나 신체에 부착하여 역동적인 영상을 촬영하고 있다. 하지만 현재까지 개발 및 도입되고 있는 시스템들은 실내 촬영에 어려움과 영상 가장자리 왜곡 발생, 배터리 수명 문제로 장시간 촬영에 한계점이 있다. 이에 본 논문에서는 실시간으로 사용자를 검출하고 추적하면서 주변 환경과 사용자의 모습을 촬영하는 이동형 촬영 로봇 시스템을 제안하였다. 사용자의 제어 없이 실시간 촬영 및 저장 서비스를 제공하기 위해 로봇 스스로 카메라 영상을 통해 사용자를 검출, 위치 정보를 획득하고 이동하여 추적함으로써 근거리 영역을 유지한 상태로 새로운 기법과 구도에서 촬영하는 시스템을 구성하였다.
-
손 제스처는 스마트 글래스 등 웨어러블 기기의 NUI(Natural User Interface)로 부각되고 있으며 이를 위해서는 손 제스처 검출 및 인식 기능이 요구된다. 또한, 최근 MPEG 에서는 IoT(Internet of Thing) 환경에서의 미디어 소비를 위한 표준으로 IoMTW(Media-centric IoT and Wearable) 사전 탐색이 진행되고 있으며, 손 제스처를 표현하기 위한 메타데이터도 하나의 표준 기술요소로 논의되고 있다. 본 논문에서는 스마트 글래스 환경에서의 손 제스처 인식을 위한 과정으로 스테레오 영상을 통한 손 윤곽선 검출과 이를 메타데이터로 서술하기 위하여 베지에(Bezier) 곡선으로 표현하는 기법을 제시한다.
-
현재 사용 되어지고 있는 대부분의 영상 합성 알고리즘들은 영상의 크기가 클수록 계산량이 많아지는 특징이 있다. 따라서 UHD 영상을 대상으로 영상 합성을 할 때 속도가 기존의 HD 영상에 비해 크게 느리다는 점과 특수 카메라 사용 혹은 카메라 위치 고정 등의 제한이 필요하다는 점의 단점들이 있다. 이에 본 논문에서는 스마트폰에서 콘텐츠를 촬영한 영상들을 이용하여 영상 분류, Map 생성, Rendering 의 과정을 통해 현재 사용 되어지고 있는 영상 합성 알고리즘과 비교하여 보다 빠르게 영상 합성을 할 수 있는 알고리즘을 제안한다. 촬영 시 EXIF 에 저장되는 GPS 정보를 이용하여 그룹화를 진행한 후 영상의 특징점 매칭을 통해 Map 을 생성하는 것이 본 논문에서 제안하는 알고리즘이다. 이를 위해 본 논문에서는 FAST 특징점 알고리즘과 FREAK 기술자 알고리즘을 사용하였으며 Rendering 을 통하여 해당 알고리즘을 검증 하였다.
-
본 논문에서는 양방향 필터와 (bilateral filter) 선형 사상 함수를 (linear mapping function) 이용한 역 톤매핑 (inverse tone mapping, iTMO) 알고리즘을 제안한다. 상용 HDR (high dynamic range) 디스플레이가 (display device) 보급됨에 따라 이미 존재하는 수 많은 LDR (low dynamic range) 영상을 활용하여 HDR 디스플레이에서 시청할 수 있도록 동적 범위를 (dynamic range) 확장하는 (expand) 역 톤 매핑 방법이 개발 되어야 한다. 여러 논문을 통해 다양한 역 톤 매핑 방법이 제안되어 왔는데, 대부분의 방법이 HDR 디스플레이의 동적 범위에 맞춰 LDR 영상의 동적 범위를 확장하는 것에 그쳤다. 확장하는 방법은 다양하지만, 동적 범위의 한계로 인해 LDR 영상에서 사라진 세부 사항을 (detail) 복원하는 것에는 전혀 효과적이지 않았다. 이에 본 논문에서는 LDR 영상의 동적 범위를 확장하는 것뿐만 아니라 LDR 영상에서 표현되지 못한 디테일을 복원하는 방법을 제안한다. 이를 위해 입력 영상에 양방향 필터를 적용하여 영상을 기본 계층과 (base layer) 세부 계층으로 (detail layer) 분해한 후 기본 계층에 대해서는 동적 범위에 맞게 확장하고, 세부 계층에 대해서는 디테일을 복원하기 위해 선형 사상 함수를 적용하였다. 실험을 통해서 다른 iTMO 방법에 비해 세부 사항을 효과적으로 복원할 수 있음을 확인할 수 있었다.
-
프로젝터와 레이저 포인터를 이용한 상호작용은 널리 알려져 있다. 상호작용을 통해 레이저가 쓰기 동작을 하는 것처럼 보이게 함으로써 프레젠테이션에 활용하거나 마우스 기능을 대신하여 사용자와 영상간의 상호작용을 수행하였다. 본 논문은 위의 연구를 확장하여 스크린 영상에서 레이저를 실시간 검출하여 떨림 정도를 측정하는 방안을 제안한다. 제안된 방법은 레이저 광점이 찍힌 스크린 영상을 카메라로 다시 입력 받는 과정에서 레이저를 정확하게 검출하고 이를 통해 기준점 대비 실험자의 손 떨림의 정도를 수치화 하여, 손 떨림을 검출하고자 할 때 사용되었던 기존 방법인 자세 떨림(postural tremor)이나 운동 떨림(kinetic tremor)과 같은 직관적 관찰에 비해 떨림의 정도를 효과적으로 나타낼 수 있다.
-
본 논문에서는 VR 영상의 스티칭을 위한 특징점 추출 방식의 하나인 SIFT 알고리즘의 고속화 방법을 제안한다. 이 방법은 SIFT 의 각 단계 모두에 최적화 방법을 적용하여 CPU 에 최적화된 알고리즘을 구축하였다. 그리고 비독립적인 과정들로 이루어진 SIFT 특징점 추출 연산을 병렬화하기 위한 방법으로, 영상 분할 방법을 제시하며 SIFT 의 새로운 병렬화 방법을 제안한다. 특히 최적화 과정을 통해 Scale-space Extrema Detection 과 Orientation Assignment 과정에서 큰 시간 단축 효과를 보여 총 75.5%의 시간을 단축하였다. 이를 OpenMP 와 영상 분할 방법을 활용한 CPU 병렬화로 FullHD(
$1920{\times}1080$ )해상도 영상에서 약 4000 개의 특징점을 추출하는 데 평균 91ms 의 성능을 보이며 기존 GPU 고속화 논문 대비 약 30%의 성능 개선 효과를 보였다. -
디지털 홀로그램 비디오 콘텐츠를 서비스하기 위해 압축 부호화 기술이 필요하다. 본 논문에서는 기존의 2차원 압축 기술을 이용하여 디지털 홀로그램 비디오를 압축하는 방법을 제안한다. 본 논문의 목적은 다양한 변환 및 압축 파라미터의 최적의 압축 효율을 가지는 값을 도출 하는 것이다. 디지털 홀로그램 데이터는 화소 간의 상관성이 거의 없기 때문에 2차원 압축 기술을 적용 시 압축 효율이 좋지 않다. 따라서 도메인 변환을 통해 화소 간의 상관성을 높인 후 압축을 한다. 도메인 변환 후 다양한 변환 레벨 별로 디지털 홀로그램 시퀀스를 생성하고 2차원 압축 기술의 다양한 파라미터를 변경해 가면서 최적의 효율을 가지는 파라미터 값을 도출한다.
-
본 논문에서는 동공 검출 기반 눈 검출 및 추적 시스템을 구현하기 위한 방법의 최적 조건을 제안한다. 이러한 시스템을 구현하려면, 구현하기 위해 사용하는 동공 명암 차 현상이 어떠한 환경과 시스템을 갖춰야 하는지에 대한 정보가 필요하다. 본 논문에서는 어떠한 조건에서 동공 명암 차 현상이 확실하게 검출이 되는지를 실험하였다. 실험결과 본 논문의 실험 환경내에서 카메라 렌즈와 눈 사이의 거리가 60cm에서 80cm사이일 때, 조명의 세기가 강할수록 동공 명암 차 현상이 강인하게 검출되는 것을 확인하였다.
-
본 논문에서는 초고화질의 비디오 실시간 복호화를 위해 HEVC(High Efficiency Video Coding)에서 지원하는 병렬화 기술인 Slice와 Tile 기술을 이용하여 초고해상도 영상에 대한 복호화기 병렬화 성능을 비교한다. Slice와 Tile은 분할 데이터간 의존성이 존재하지 않으므로 분할된 데이터를 다중 스레드에 할당하여 데이터-레벨 병렬화를 수행하였다. 실험 결과에서는 병렬화된 복호화기 성능이 기존 순차 복호화기에 비해 최대 2.08배 고속화 되었고, 분할 데이터 수가 증가하여도 화질 손실이 거의 없는 결과를 보인다.
-
현재 차량 내 운전자에게 편의성과 안전성을 제공하는 시스템이 활발히 개발 중이고 향후 ADAS(Advanced Driver Assistance System)와 스마트 자동차에서 영상 정보를 이용한 물체 추적과 분석은 매우 중요한 부분을 차지하고 있다. 영상에서 얻을 수 있는 정보 중 현재 도로의 이정표 정보는 중요한 분석 정보로 사용된다. 하지만 국내 도로표지판 검출 연구의 경우 유럽과 북미와 비교하여 연구 개발이 활발히 진행되고 있지 않다. 국내의 경우 도로 이정표에서 영문자뿐만 아니라 한글 문자 정보까지 포함하고 있어 검출이 쉽지 않다. 또한 비교적 밝고 잡음이 적은 검출하기 좋은 환경에서는 검출이 잘 되지만 명암이 뚜렷하지 않고 잡음이 많은 환경에서는 도로 이정표 문자 검출이 어렵다. 이에 본 논문에서는 CLAHE(Contrast-Limited Adaptive Histogram Equalization) 방법을 적용하여 영상이 어둡고 잡음이 많은 환경에서 국내 도로 이정표의 문자 정보를 얻는다. 실험 결과, 기존 방법에 비해 문자 영역 검출 성능이 향상되었다.
-
컴퓨터 생성 홀로그램(CGH)는 방대한 계산 량을 가지고 있어, 고해상도의 홀로그램을 생성하기 위하여 고속 홀로그램 생성 방법이 필요하다. 본 논문에서는 다중 GPGPU의 스케쥴링 기법을 이용하여 고속화 하는 방법을 제안한다. 첫 번째로는 커널 내에서 공유 메모리를 이용한 스케쥴링 기법을 통하여 고속화를 하고, 두 번째로는 GPGPU간의 P2P(peer-to-peer)데이터 전송을 이용한 스케쥴링을 했다. nVidia의 GTX680 2개 GPGPU를 이용하여 기존의 방법보다 약 50%의 속도 향상을 확인하였다.
-
본 논문에서는 지각적 동영상 부호화 기법으로서 부 대역 부호화 기반의 시각적 민감도가 낮은 고주파 영역을 억제하는 기법을 동영상 코덱 전처리로 사용하는 것을 제안한다. 먼저 억제하기 위한 고주파 대역 설정을 위해 입력 시퀀스의 프레임들을 특정 주파수 대역으로 나눈다. 나누어진 주파수 대역 중 고주파 대역에 한에 적절한 이득 값 조절을 통하여 고주파 영역을 억제한다. 이와 같은 전처리 이후 동영상 압축 표준에 적용하여 인간의 시각적 구조의 인지 특성을 고려한 동영상 압축 효율을 얻는다. 모의 실험을 통해 제안 기법을 H.264의 전처리로 적용한 결과와 전처리 없이 적용한 결과를 비교하여 시각적 차이 없이 평균 9.56%의 데이터 감소 효과를 얻었다.
-
본 논문에서는 고효율 비디오 부호화에서 채택하고 있는 인-루프 필터 중 SAO (sample adaptive offset)를 컨볼루션 신경망으로 대체하여 부호화 효율을 향상시키는 방법을 제안한다. SAO 는 양자화 에러를 줄이기 위해 인코더에서 디코더로 적절한 오프셋 값을 전송한다. 제안하는 컨볼루션 신경망을 사용한 인-루프 필터는 인코더와 디코더가 같은 컨볼루션 신경망을 사용하여, 추가적인 비트를 디코더로 전송할 필요 없이 양자화 에러를 줄일 수 있다. 컨볼루션 신경망의 구조는 두 가지를 각각 사용하였고, 각 컨볼루션 신경망의 구조에 대해서 입력 영상과 원래 영상의 평균제곱오차에 따라 다른 모델을 적용하였다. 따라서 제안하는 방법을 HEVC에 적용하여 기존의 방법보다 더 적은 bit 로 더 좋은 화질의 영상을 얻어서 BD-rate 의 gain 을 얻을 수 있을 뿐만 아니라, 주관적인 화질의 비교에서도 더 좋은 결과를 보인다.
-
Residual Differnetial pulse-code Modulation (RDPCM) 기법은 비디오의 압축을 위한 시간 및 공간 예측 후 남은 잔여신호를 인접 화소를 이용하여 추가적인 중복정보를 제거하는 기법을 의미한다. 본 논문에서는 우선 잔차 신호의 예측을 위하여 인접 화소 사이 선형 가중 합으로 예측 모델을 세우고, 각 가중치를
$L_1$ 정규화를 포함하는 비용함수를 통해 추정함으로써 보다 효율적인 부호화 성능을 제공하는 알고리즘을 제안한다. -
리포터의 짧은 현장 중계를 위해 중계차와 MNG 등 기존 중계시스템을 동원하는 것은 많은 시간과 비용을 요구한다. 최근 스마트폰의 연산 능력, 카메라의 화질, 모바일 데이터 네트워크의 속도, 그리고 스마트폰과 네트워크의 안정성이 비약적으로 발전함에 따라 스마트폰을 이용한 간단한 현장 중계 방송이 가능하게 되었다. 본 논문에서는 이를 위한 스마트폰 애플리케이션, 스튜디오에 위치한 관리서버와 송수신시스템, 스마트폰 영상과 스튜디오 영상의 실시간 부/복호화 모듈, RTP를 이용한 전송 모듈 등의 개발에 대해 기술하고, 개발 중인 시스템을 KBS의 '보이는 라디오' 실시간 중계방송에 활용한 사례에 대해 소개한다.
-
본 논문에서는 UHD (Ultra High Definition) 방송의 비디오 표준인 HEVC 에서 슬라이스 에러가 발생하는 시나리오에 대한 UHD 방송 시험 스트림을 제안한다. 제안 스트림은 개발한 여러 슬라이스 에러 스트림 항목 중 슬라이스 경계를 정의한 slice_segment_address, end_of_slice_segment_flag 신택스의 에러 시나리오에 따라 제작하였으며, 제작된 스트림을 현재 판매되고 있는 UHD 수신기에 재생하여 결과를 확인하였다.
-
본 논문에서는 영상보안시스템을 구성하는 장비 간의 상호연동 적합성을 평가하는 방법과 분석 결과를 제시한다. 꾸준한 성장세를 보이고 있는 영상보안시스템 분야는 기존의 아날로그 CCTV(Closed Circuit TeleVision) 체계 대신 네트워크 인터페이스 기반의 시스템으로 변화하고 있다. 이에 따라 IP(Internet Protocol) 기반의 네트워크 환경에서 장비 간 연동을 위해 국제적으로 ONVIF(Open Network Video Interface Forum), PSIA(Physical Security Interoperability Alliance)와 같이 여러 CCTV 제조사들이 모인 산업계 포럼에서 장비 간 상호호환성을 위해 인터페이스 프로토콜을 정의하고 자체 표준화를 주도하고 있다. 이에 본 논문은 TTA에서 국내 영상보안시스템의 상호운용성을 위해 개발한 ONVIF 기반의 상호연동 인증 기준을 기반으로 영상보안시스템 장비 중 하나인 IP 카메라와 NVR(Network Video Recorder)에 대해 상호연동 적합성을 평가하는 방법을 설명하고 분석 결과를 제시한다.
-
본 논문에서는 4K UHD 방송장비 중 디스플레이기기와 인코더의 성능 시험을 위해 개발된 패턴 발생장비를 소개하고 있다. 패턴의 제작 및 재생 방법에 따라 표출되는 패턴의 종류를 그래픽/실사, 정지/동영상으로 구분할 수 있는데 본 논문에서는 모션블러, 모션져더, AV lip sync, 텍스트 주변 인코딩 화질 열화 확인, 화이트 노이즈, 프레임 누락, HDR 확인, 지연시간 측정, 계단현상 확인, 이미지 스티킹 등 그래픽 동영상 패턴에 대해 각각의 제작 의도를 설명하고 이를 통해 디스플레이기기와 인코더의 성능을 평가하는 방법에 대한 간략한 소개와 개발된 패턴발생장비의 입출력 사양을 제시하고 있다.
-
TV 시청 도중 세컨드 디바이스로 멀티태스킹하는 시청패턴과 더불어 방송과 시청자가 상호작용하는 양방향 서비스 요구사항의 증대에 따라 KBS는 시청자 참여 서비스를 위한 티벗 서비스 플랫폼을 개발하였다. 티벗 서비스 플랫폼은 모바일에 특화된 시청자 방송 참여 서비스 플랫폼을 지향한다. 이러한 티벗 서비스 플랫폼 개발 결과의 핵심은 '손쉬운 시청자 참여 서비스 적용 프로그램 확대'가 가능하다는 점이다. 본 논문에서는 시청자 참여 서비스 플랫폼인 티벗이 더욱 강화된 참여 서비스를 위해 사용자와 제작자의 요구를 반영하여 개선한 기능을 제안한다. 제안한 기능은 시청자와 소통하는 최근 제작 트렌드에 맞추어 TV 프로그램 제작에의 활용성과 시청자의 편의성을 개선시켰다. 또한, 개선된 기능을 적용한 방송 프로그램 사례에 대해 살펴본다.