Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)
The Korean Institute of Broadcast and Media Engineers
- Semi Annual
Domain
- Media/Communication/Library&Information > Media/Consumers
2015.07a
-
본 논문에서는 ANC 시스템의 빠른 수렴을 위하여 2차 경로 필터를 초기화하는 방법을 제안한다. 대부분의 ANC 시스템에서는 2차 경로 필터를 설계하기 위하여 LMS 알고리즘을 사용한다. 그러나 기존의 방법들은 2차 경로 필터의 초기 계수 값을 0으로 설정하기 때문에 필터의 수렴 시간이 길어진다. 이를 해결하기 위하여 본 논문에서는 미리 구한 계수 값을 2차 경로 필터의 초기값으로 설정하여 필터의 수렴 시간을 줄이는 방법을 제안한다. 제안한 방법을 사용하면 2차 경로 필터의 초기 단계부터 에러가 작게 나타내며, 이에 따라 ANC 시스템의 수렴이 빨라진다. 상용 헤드셋을 이용하여 제안하는 방법을 실험하였으며, 기존 방법보다 빠르게 ANC 시스템이 수렴하는 것을 확인하였다.
-
본 논문에서는 공간 오디오 부호화 기법인 MPEG 서라운드에서 공간 파라미터 전송 시 위상 파라미터를 생략하는 기법에 대해 다룬다. 기존 방법에서는 한 프레임이 모두 적은 위상차를 가지는 경우에도 정상적으로 처리하여 전송한다. 이러한 경우 위상차 파라미터를 생략하여 비트 효율을 향상시킬 수 있다. 스테레오 복원 과정에서 발생하는 채널 간 시간차에 기반해 설계된 양자화기를 생략 기법에 적용하면 기존에 비해 평균적으로 40 ~ 50% 정도의 위상 파라미터 절감 효과를 얻을 수 있다.
-
본 논문에서는 Matlab 공개 toolbox 인 k-wave 를 사용하여 실내 음향 파라미터를 측정하는 방법을 제시한다. 첫째, 본 논문에서 제시한 k-wave 를 이용한 방법의 유효성을 검증하기 위해, k-wave 로 얻은 실험값과 [1]에서 제시한 실제 실내에서 마이크를 통하여 측정된 값을 비교하였다. 그 결과 k-wave 를 사용하였을 때 잔향 시간은 [1]과 매우 유사하게 측정이 되었고
$D_{50}$ 값의 오차는 평균 5.2%로 측정되었다. 따라서 k-wave 를 이용하면 실제 측정값을 대체할 수 있는 양호한 결과를 얻을 수 있었다. -
본 논문에서는 선박의 기적소리 방향 검출을 위한 시스템을 개발한다. 제안하는 시스템은 4개의 마이크로폰으로부터 기적 소리를 입력받아 원하는 주파수 대역의 신호만 통과하도록 디지털 필터링된다. 필터링된 신호로부터 8 방향의 기적소리 방향 탐지가 가능한 알고리즘을 제안한다. 또한, DSP를 이용하여 제안된 시스템의 프로토타입을 구현하였다.
-
본 논문에서는 FAST(Features from Accelerated Segment Test) 특징점 검출기와 SURF 특징점 표현자(descriptor)를 수정하고 조합하여 영상의 왜곡에 강인하면서 정합을 수행할 수 있는 새로운 특징점 정합 기법을 제안한다. 스케일 공간을 생성하여 스케일 변화를 고려하고 잡음에 강인하기 위해 영상에서 특징점 후보군을 결정한다. 기존의 FAST는 에지 부분에서 특징점을 많이 검출하게 되는데 이러한 단점을 주곡률(principal curvatures)을 적용하여 개선하고자 한다. 또한 영상의 회전 변화에 강인하기 위해 SURF 특징점 표현자를 사용한다. 제안하는 정합 기법은 적은 계산량으로 기존의 특징점 정합 기법보다 우수한 성능을 나타낸다. 특별히 잡음이 존재하는 영상에서의 정합에 강인함을 보여준다.
-
In any mobile ad hoc environment, collision amongst mobile objects is always likely to occur unless there is a certain level of intelligence to detect and avoid the collision. This phenomenon of detection and avoidance is the key attribute for safety applications in vehicle to pedestrian (V2P) communications systems. In this paper, we propose a V2P communications concept for collision detection and avoidance.
-
다중 안테나(MIMO, multi-input multi-output) 기법은 채널 용량을 증가시키기 위한 기술로써 최근 많이 연구되어 지고 있으며, DVB-T2, LTE 기술 및 802.11ac 등 방송, 이동통신 및 Wi-Fi 등 여러 분야에서 다양하게 쓰이고 있다. 그러나 다중 안테나 전송 기법은 송 수신 안테나 개수에 비례하여 채널 용량이 증가되므로, 채널 용량을 중가시키기 위해서는 많은 송 수신 안테나가 필요하다는 단점을 가지고 있다. 최근 다중 안테나 전송 기술과는 다른 방법으로 전송량을 증가시키는 기술인 FTN(faster than Nyquist) 전송 기법이 연구되고 있다. FTN 전송 기법은 동일한 대역폭에서 비트 오류 없이 정보를 전송할 수 있는 나이퀴스트(Nyquist) 심벌율보다 빠르게 심벌을 전송하는 기법으로 이론적으로 최대 20%까지 채널 용량을 증가시킬 수 있다. 그러므로 본 논문에서는 채널 용량을 증가시키기 위하여 다중 안테나 기법과 FTN 송신 기법을 연동하여 기존 다중 안테나 전송 기법의 단점을 보완하는 MIMO-FTN 전송 기법의 성능을 분석한다.
-
현 3D 실험 방송은 좌영상과 우영상의 듀얼스트림을 전송하는 서비스 호환 방식으로 제공되고 있다. 본 논문에서는 3D 실험방송에서 발생하는 제한된 대역폭에 따른 화질의 저하를 해결하는 방법을 제안하였다. MPEG-2 TS 와 MMT 의 GFD Mode 를 사용하여 상기 두 영상을 지상파와 IP 망으로 전송 받아 화질의 열화없이 안정적으로 제공할 수 있는 Hybrid Contents Player 를 개발 하였다. 제안된 시스템은 MMTP Packets 을 우 영상, TS file 을 좌 영상으로 하여 두 영상의 동기화를 통해 고화질의 스테레오스코픽 영상을 구성한다. 이를 위해 본문에서는 MPEG-2 TS 와 MMT 의 GFD mode 의 파일에 대해 분석하고, 동기화 방법에 대해 설명하였으며 실험을 통해 사용자가 3D 시청을 원할 때 스테레오스코픽 영상이 재생되는 Hybrid Contents Player 를 검증하였다.
-
디지털라디오에서의 데이터 서비스는 라디오가 가지는 미디어의 특성으로 인해 주로 텍스트나 간단한 이미지 위주의 데이터 서비스가 제공되고 있다. 본 논문에서는 DAB 에서 표준으로 제정된 동적 레이블 플러스 서비스를 이동 환경의 청취자에게 유익한 소리로 제공하기 위해 필요한 제어 메시지 구조를 정의하였다. 또한 정의된 제어 메시지를 PAD 채널을 통해 기존 동적 레이블 플러스 데이터와 동시에 전송하는 방법을 제안하였다.
-
본 논문에서는 대역폭 효율을 향상시키는 공간 변조(spatial modulation) 다중 안테나 시스템을 제안한다. 기존의 공간 변조 다중 안테나 시스템은 다중 송신 안테나 중 하나의 안테나를 사용하여 채널 간에 간섭을 피할 수 있어서 다중 경로가 많은 실내 환경에서 적합하다. 그러나 심벌 전송 구간마다 한 개의 안테나만을 선택하여 전송하므로 다중 안테나의 최대 부호 이득을 얻을 수 없다. 이를 극복하기 위하여 시공간블록부호화 방식을 적용한 공간 변조 다중 안테나 시스템은 두 개의 안테나를 사용하여 수신 성능을 향상시키지만 대역폭 효율이 향상되지 않는 단점이 있다. 본 논문에서는 Hybrid STBC 시스템을 적용한 공간 변조를 제안하여 공간 변조 다중 안테나 시스템의 대역폭 효율을 개선한다.
-
본 논문에서는 음성 및 음악 모두에 대해 최고의 품질을 제공하는 최신 오디오 코덱인 USAC 을 DAB+에 적용하기 위한 전송 방안을 제안한다. 기존 DAB+는 AAC+ v2 로 불리는 HE-AAC v2 (High Efficiency Advanced Audio Coding version 2) 오디오 코덱을 사용하였다. 하지만 AAC+ v2 는 낮은 데이터 전송률에서 음악에서는 좋은 품질을 제공하나 음성에서는 상대적으로 품질이 떨어지는 단점이 있다. 반면 USAC 은 낮은 데이터 전송률에서 음악 및 음성에 모두 좋은 품질과 높은 압축 성능을 제공할 수 있는 최신 오디오 코덱 기술이다. USAC 의 성능을 최대한 보장하기 위해서는 DAB+와 달리 VBR 을 적용하는 효과적이다. 따라서 본 논문에서는 USAC VBR 스트림을 DAB+에 전송하는 방안을 제안한다. 제안된 전송 방안을 적용할 경우 최적의 음악 및 음성 품질을 효율적으로 제공할 수가 있다.
-
국내에서 디지털라디오를 위한 연구와 실험 및 전송방식 선정 시도가 1997년부터 본격적으로 시도되었다. 그동안 국내에서 검토된 디지털라디오 전송방식은 DAB, DAB+, HD-Radio, DRM, DRM+ 방식에 대한 연구가 이루어졌고, 비교실험도 실행되었다. 그러나 각각의 전송방식에 대한 방송사마다 선호도가 다르고, 주파수 할당 문제를 포함하여 정부와 방송사의 이해와 득실에 대한 해석 방향이 많이 다르기 때문에 아직도 국내 전송방식을 결정하기가 매우 어려운 실정이다. 이에 본 논문은 먼저 아날로그 라디오방송과 디지털 라디오방송이 공통적으로 가지고 있어야 하는 중요한 목표와 목적 몇 가지를 선정하여 연구문제로 설정하였다. 연구방법으로는 현재 아날로그 FM방송과 동일한 내용이 동시에 전송되고 있는 DMB의 라디오 채널을 대상으로 FM방송과 수신환경을 비교 조사를 해보고, 주어진 연구문제를 충족할 수 있는 요소를 얼마나 가지고 있는지 분석을 해보았다. 나머지 전송방식에 대해서는 DMB에 포함된 DAB방식의 디지털라디오 규격과 2011년 ETRI 비교실험 결과 자료를 기준으로 상대적 비교를 통하여 긍정적 요소와 부정적 요소를 분석 헤 봄으로써 향후 디지털라디오 수신환경 구축 목표와 전송방식 선정에 실질적인 도움이 될 수 있는 방안을 제시하고자 한다.
-
본 논문에서는 전시 공간에서 전시 콘텐츠를 그냥 지나치거나 적극적으로 상호작용하려 하지 않는 관람객의 관심과 흥미를 이끌어 내기 위하여 어포던스(affordance, 행위 유발성) 특성을 반영한 인터랙티브 아트 콘텐츠 설계에 관한 내용을 다룬다. 이를 위하여, 우선, HCI 나 인지심리 영역에서 다루고 있는 어포던스 이론을 고찰하고, 특히 전시 공간에 나타나는 어포던스의 요소를 연구한 기존 연구들 분석하였다. 이를 기반으로 사람들의 행동과 흥미를 유발 시킬 수 있는 전시공간에 적합한 어포던스 기반 멀티 모달 인터페이스 설계 방향을 제시하였다. 또한, 제시된 멀티 모달 인터페이스 설계 특성을 반영하여 터치 스크린을 이용한 멀티 모달 미디어 아트 콘텐츠를 설계 제작하였다.
-
최근 고 해상도의 콘텐츠의 보급이 늘어나는데 이에 따라 암호화를 위한 계산 량과 시간이 증가하였다. 본 논문은 고 해상도의 콘텐츠에서 많은 양의 암호화 계산과 시간을 줄이기 위해 프레넬 변환을 이용한 암호화 방법을 제안하였다. 프레넬 변환을 통하여 획득한 회절 영상은 거리에 따라 가운데로 집중되는 특성을 가지는데, 고 해상도의 영상을 먼 거리에서의 회절 영상을 획득하여 가운데의 집중된 영역에 암호화를 수행하여 암호화 영역을 줄여 계산 량을 줄일 수 있다. 본 논문에서 제안하는 암호화 알고리즘을 구현하여 10m의 거리일 때 0.004%의 데이터만 암호화 하여 모든 데이터를 숨길 수 있다.
-
최근 UHD TV 시장이 커지면서 이에 따라 4K 이상의 해상도에 대응하는 코덱의 필요성이 증가하였다. 2013년 1월 차세대 동영상 압축 기술인 HEVC (High Efficiency Video Coding)가 제정되면서 초고해상도 동영상에 대응이 가능해졌다. 새로운 동영상 압축 기술이 제정되면서 초고해상도 동영상에서도 워터마킹의 필요성이 증대되었다. 본 논문에서는 PU 크기와 모드의 상관관계를 이용하여 압축 시 인트라 프레임에서 워터마킹 삽입영역을 제시한다. 또한 이를 바탕으로 간단한 워터마킹 삽입 방법 알고리즘을 소개한다.
-
본 논문은 최근 관심이 높아지고 있는 UHD 콘텐츠 제작과 관련하여 8K UHD 비디오 렌더링 시스템을 제안한다. 현재 시장은 4K UHD 비디오를 중심으로 편집되고 있는 실정을 감안하여, 기존의 상용 UHD 편집 S/W 기반에서 4K UHD 단위의 편집은 유지한 상태로 8K UHD 를 편집하는 환경을 제안하고, 이를 비디오 렌더링 시스템으로 설계하고 구현하였다. 본 비디오 렌더링 시스템은 상용 편집 S/W 기반에서 동작 가능하고, 특히 압축된 비디오 스트림의 디코딩과 비디오 렌더링(합성)을 GPU 기반으로 구현하여 시스템 성능을 효율적으로 사용하였다. 향후 8K UHD 가 시장에 보급되고 시스템 자원이 함께 발전하기 전까지 4K UHD 와 8K UHD 를 잇는 중간 관점에서 활용될 수 있으며, 아울러 4 채널의 4K UHD 비디오를 동시에 편집/모니터링 하는 용도로도 활용이 가능하다.
-
본 논문은 외부 전원에 연결되었지만 본래의 용도(예: 셋톱박스인 경우 방송서비스 제공)로 사용되지 않는 대기상태에서도 기존 셋톱박스처럼 업데이트를 수행하면서도 기존의 셋톱박스에 비해 전력소모를 줄일 수 있는, 대기상태의 셋톱박스를 제어하는 방안을 제안한다. 본 논문의 제어방안은 셋톱박스로 전달되는 CPU 활성화 메시지를 이용하거나 메시지의 프로토콜의 일부만 분석하는 방법을 이용하여 셋톱박스 업데이트 필요 유무를 판별하는 방안으로 이는 낮은 CPU(Central Processing Unit) 연산 량만 필요로 하여 셋톱박스 전력소모 저감에 적합하다. 본 논문의 제어방안은 기존의 사업자 측면에서 대기상태 셋톱박스의 업데이트 편의성을 유지시키면서도 국가적 차원의 전력소모 저감에 기여를 할 것이다.
-
본 논문에서는 이미지를 시각적 단어로 표현하여 분석하는 기법인 bag-of-visual words (BoW) 모델을 기반으로 latent dirichlet allocation (LDA) 모델을 결합하여 시각적 단어의 구조를 파악하여 이미지를 분류할 수 있는 모델을 제안한다. 우선 이미지를 시각적 단어로 기존의 방법보다 정확하게 표현하기 위해서 희소 부호화(sparse coding) 기법을 적용한다. 기존의 BoW 모델은 하나의 이미지 패치를 하나의 단어로 표현하였지만, 희소 부호화 기법을 통해 하나의 이미지 패치를 여러 개의 단어로 표현할 수 있다. 제안하는 모델을 이용하여 이미지를 분류하기 위해서 분류 성능 측정에 많이 쓰이는 multi-class SVM 기법을 이용한다. UIUC 스포츠 데이터를 이용한 성능 측정을 통해 제안한 기법의 클래스 분류 성능을 검증하였다.
-
본 논문은 현재 서비스 시작 단계인 UHDTV 방송 서비스의 확산을 위해서 UHD 콘텐츠 제작 워크플로우에서 우선적으로 요구되는 UHD 콘텐츠의 실시간 획득, 저장을 하고 이를 편집할 수 있는 UHD 콘텐츠 인제스트 및 편집용 비디오 서버 시스템의 설계와 구현 방법에 대해 기술한다. 제안된 UHD 콘텐츠 비디오 서버 시스템은 최대 8K UHD 콘텐츠를 실시간으로 인제스트 및 재생하고, 또한 저장된 콘텐츠를 상용 편집툴과 연동하여 8K 콘텐츠를 편집할 수 있다.
-
본 논문에서는 4K 플랫폼 인제스트(Ingest) 서버 시스템에서 영상처리 하드웨어 장치와 서버간의 커널 인터페이스를 지원하기 위한 PCIe 디바이스 드라이버의 구조를 설계 및 구현하였다. 제안하는 디바이스 드라이버 아키텍처는 동작하는 프로세스의 특성에 따라 크게 3개의 계층으로 분리하여 독립적인 PCIe 인터페이스 제어와 영상처리 하드웨어의 실시간 데이터 연산처리가 가능하도록 설계하였고, 병렬처리 방식으로 PCIe 디바이스를 제어함으로써 복수의 영상처리 장치에 대한 지연 현상이 발생하지 않도록 설계하였다. 본 논문에서 제안한 디바이스 드라이버의 아키텍처를 구현한 결과 효율적인 영상처리 장치 제어를 통해 4K 플랫폼의 콘텐츠를 실시간으로 획득 및 저장, 전송하는 결과를 얻을 수 있었다.
-
근래 3D산업의 발전으로 디지털 홀로그램 기술이 부각되고 있다. 본 논문에서는 디지털 홀로그램 영상을 쿼드트리형식으로 Fresnelet 변환을 통한 양자화기를 구현하기위해 특징 및 중요도를 분석하는 방식에 대해 제안한다. 디지털 홀로그램 영상을 Fresnelet 변환을 수행한 뒤 부대역 별로 평균에너지에 따른 에너지 분포의 순위를 정하였고, 크기에 따른 히스토그램의 결과를 이용해 향후 디지털 홀로그램 압축 및 전송 기법에 적용할 수 있는 것을 확인 하였다.
-
본 논문에서는 디지털 홀로그램(digital hologram)을 2 차원 비디오 압축기를 사용하여 압축하는 방법을 다룬다. 그 방법은 디지털 홀로그램을 다수개의 부홀로그램(sub-hologram)으로 나누어 배열하고, 각 부홀로그램을 2 차원영상화하여 부홀로그램 배열을 동영상 시퀀스로 만들어 2 차원 동영상 압축기로 압축하는 방법이다. 본 논문에서는 각 부홀로그램을 2 차원 영상으로 만드는 방법으로 DCT(Discrete Cosine Transform)와 Fresnel 변환 변환(Fresnel Transform)을 사용한다. 2 차원 비디오 압축 방법으로는 H.264/AVC 와 HEVC 를 사용하여, 두 방법의 압축결과를 비교, 분석한다.
-
본 논문에서는 디지털 홀로그램 영상 데이터를 Fresnelet 변환을 이용하여 압축하는 기법을 다룬다. 이 방법은 quad-tree 기반 Fresnelet 변환을 통해 주파수 영역의 부대역으로 나누고, 각 부대역의 에너지에 따라 일정 순서의 부대역을 제거한 후, 나머지 부대역들을 2 차원 동영상 압축기로 압축하는 방식이다. 압축기는 H.264/AVC 와 HEVC 사용되며, 실험결과는 압축기를 거치지 않고 특정 부대역의 에너지를 제거한 영상과 원본과의 화질을 비교하고, 제거되는 않은 영역들을 압축한 결과 압축률에 따른 화질을 비교, 분석한다.
-
본 논문에서는 자연스러운 파노라마 영상 생성을 위해 FAST(features from accelerated segment test)를 이용한 특징점 기반의 파노라마 영상 생성 기법을 제안한다. 다수의 영상을 이용해 자연스러운 파노라마 영상을 만들기 위해 실린더 투영을 수행 한 후 추출된 특징점들을 RANSAC(random sample consensus)을 이용해 정합 시 오차율을 최소화한다. 서로 다른 방향에서 얻은 다수의 영상을 합성할 때 정합 경계 주변의 이질감을 보완하기 위해 블렌딩 기법을 사용함으로써 자연스러운 파노라마 영상을 생성한다. 다수의 영상으로 실험을 한 결과 왜곡이 보정되고 자연스러운 파노라마 영상을 생성할 수 있었다.
-
본 논문에서는 디지털 영상 컨텐츠의 저작권 보호를 위해 DWT 를 이용하여 강인성(robustness), 비가시성(invisibility), 보안성(security)을 만족하는 blind 워터마킹 방법을 제안한다. 이 방법은 영상정보에 대한 변화를 원본 영상의 특정 부분에 국한하지 않게 하기 위해서, 특정 주파수 성분에 워터마크를 삽입하는 것이 아닌 전체 영상에 워터마크를 삽입하는 방법이다. 이 방법에서 저작권에 대한 판단은 추출한 워터마크 정보를 통합 판단하는 방법을 사용한다. 이 방법은 저작권 보호를 위해 원본 영상을 보관할 필요가 없으며, Gaussian filtering, average filtering, sharpening 의 영상 필터링, JPEG 손실 영상 압축, resizing, 영상 품질 향상을 위한 Contrast 나 histogram equalization 등의 공격에 충분한 강인성을 보여준다.
-
3 차원 컨텐츠 제작은 많은 관심을 받고 있는 분야이다. 변위 지도로 표현 가능한 깊이 정보는 3 차원 컨텐츠를 생성하는데 필수적이다. 본 논문에서는 깊이 카메라 및 스테레오 카메라를 이용하여 정확한 변위 지도를 생성하는 방법을 제안한다. 제안하는 방법은 스테레오 영상 사이의 변위를 예측하기 위해서 깊이 카메라 정보를 3 차원 워핑 방식에 의해서 좌우 카메라 위치로 투영한다. 투영된 깊이 정보는 스테레오 영상의 크기에 맞춰서 업샘플링된다. 최종적으로 업샘플링된 깊이 카메라 정보와 스테레오 정보가 결합되어 정확한 변위 지도를 생성한다. 실험 결과는 제안하는 방법이 기존의 단일 센서를 이용한 방식에 비해서 좀더 정확한 결과를 생성함을 보여준다.
-
디스플레이 해상도가 지속적으로 고해상화가 되면서, 기존 저해상도 영상을 고해상도 디스플레이 크기에 맞춰 해상도를 키우는 기법인 초해상화(super-resolution, SR) 기법에 많은 관심이 쏟아지고 있으며 이에 대한 많은 초해상화 논문들이 게재되었다. 이 중 현재 최상 품질의 고해상도 영상을 복원하는 한 초해상화 기법은, 입력 받은 저해상도 영상을 자가 예제(self-examples)로 사용하여 선형 매핑(linear mapping)을 통해 점진적으로 여러 레벨(level)를 거쳐 조금씩 키우는 방법이다. 이때 각 레벨마다 기존 저해상도 영상 크기로 반복적으로 줄여 오차를 줄이는 역투영법(back-projection)을 사용하는데, 이 방법은 처리된 영상에 시각적 품질을 낮추는 링 아티팩트(ringing artifacts)를 생산하며, 이는 매 레벨마다 계속 누적이 되어 고해상도 결과 이미지 품질에 악영향을 미치는 단점이 있다. 이를 보완하기 위해, 본 논문에서는 저해상도 정지 영상을 고해상도 정지 영상으로 점진적으로 키울 때 일반적인 역투영법 대신 비국소적 평균법(non-local means, NLM) 기반 역투영법을 사용하는 초해상화 기법을 제안한다. 제안하는 기법은 매 레벨마다 생기는 링 아티팩트를 효과적으로 제거하여 높은 시각적 품질의 고해상도 영상을 복원할 수 있게 한다. 실험을 통해 제안된 초해상화 기법을 사용 시 기존 초해상화 기법보다 향상된 고품질 고해상도 영상 복원이 가능한 것을 확인하였다.
-
광적응(Luminance Adaptation; LA) 효과는 영상의 배경 밝기에 따른 왜곡에 대한 시각 인지 민감도가 달라지는 특성을 의미한다. 기존 영상 화질 측정(Image Quality Assessment; IQA) 방법들은 베버의 법칙(Weber' s law) 모델을 이용하여 LA 효과를 IQA 방법에 반영해왔다. 그러나, 이러한 IQA 방법들에 있어서 베버의 법칙 기반 LA 효과 모델은 다음 두 가지 이유로 부정확하게 동작한다: (i) 전통적인 베버의 법칙 모델은 실제 광도(luminance)에 대한 인지 민감도 응답값을 정확히 반영할 수 없다는 것이 밝혀졌다, (ii) 대부분 IQA 방법들은 픽셀 강도 영역에서 계산되지만, 베버의 법칙과 같은 LA 효과 모델들은 광도 영역에서 개발되었다. 따라서 광도와 픽셀 강도간 비선형 관계로 인해 IQA 방법에 반영된 베버의 법칙 기반 LA 효과 모델들은 부정확하게 동작한다. 이 문제를 해결하기 위해, 본 논문에서 처음으로 픽셀 강도 영역에서의 LA 모델을 이론적으로 유도한다. 본 논문에서 제안하는 픽셀 강도 영역에서의 LA 효과 모델은 감마 교정 함수(Gamma correction function)와 광도 영역에서의 LA 효과 모델인 제곱-법칙(power-law) 모델을 기반으로 하는 테일러 급수 확장 근사화를 통해 유도된다. 제안하는 픽셀 강도 영역 LA 효과 모델의 효과를 검증하기 위해, 제안하는 LA 효과 모델을 PSNR 에 도입하여 광범위한 실험을 수행한다. 실험 결과, 제안하는 LA 효과 모델 기반 PSNR 은 PSNR 및 베버의 법칙 기반 PSNR 대비 괄목할 만한 주관적 화질 예측 성능 향상을 보였다.
-
본 논문은 방송의 가상스튜디오 제작 환경에서 많이 사용되는 회전 또는 스크롤 메뉴를 진행자가 직접 휠(회전보드)을 움직여, 진행자와 그래픽과의 자연스러운 상호작용이 가능한 인터랙티브 가상현실 방송 제작 어플리케이션을 제안한다. 이를 위해, 우리는 물리적인 휠의 움직임을 인지할 수 있도록 관성측정장치(IMU: Inertial Measurement Unit)를 사용하였으며, IMU 센서가 부착된 휠을 크로마키로 처리하기 위해 푸른색의 페인팅된 물리적인 휠을 사용하였다. 본 어플리케이션을 통해서 가상스튜디오의 연기자는 물리적인 휠의 움직임을 느끼면서 휠을 회전시킴으로써 별도의 연습이나 훈련 없이도 직관적으로 회전하는 여러 타입의 가상 그래픽 메뉴를 제어할 수 있다. 우리는 상하 스크롤, 원형 회전, 스크롤 연동형 메뉴 어플리케이션들을 개발하였으며, 이것을 방송에 적용하여, 연기자와 휠에 연동한 그래픽과의 인터랙션이 자연스럽게 합성됨을 확인하였다.
-
자막방송은 지상파 방송 수신을 통해 시청 가능한 자막 서비스를 의미하며, 현재 모든 지상파 방송 프로그램에 대해 자막방송이 제공되고 있다. 자막방송을 위한 자막 데이터는 일반적으로 속기를 통해 입력되며, 방송에서 속기를 통해 작성된 자막 데이터는 파일로 저장되어 해당 방송 프로그램에 대한 메타데이터로 활용되거나, 동일한 프로그램이 재방송으로 편성될 경우의 자막방송에 활용될 수 있다. 하지만 재방송의 경우 편집으로 인해 본방송과 내용상의 차이가 발생할 수 있으므로 편집이 발생한 부분을 포착하여 자막 데이터에도 동일한 편집을 적용한 후에 자막방송으로 활용되어야 한다. 따라서 재방송 송출에 기존 자막파일이 활용될 경우 반드시 전처리를 통해 자막과 영상의 내용을 일치시키는 과정이 필요하다. 그러나 방송 현장의 재방송 편성/송출 워크플로우에서는 자막 전처리를 위해 필요한 정보들이 갖춰지지 않는 예외적인 경우가 종종 발생하기 때문에 이를 해결하기 위한 방법이 필요하다. 이에 본 논문에서는 방송 현업의 재방송 편성/송출 워크플로우에서 파일기반 자막송출 기능을 안정적으로 사용하기 위해 자막 전처리 과정에서 발생할 수 있는 오류들에 대한 대처방법을 설명하고, 그 방법을 구현한 시스템을 소개한다.
-
본 논문은 방송 프로그램과 증강 콘텐츠를 융합하여 시청자와의 상호작용 및 시청 몰입감을 향상시키고, 시청자의 증강 콘텐츠 선택권을 보장할 수 있도록 다중 CP 를 지원하는 양방향 증강방송 시스템에 대한 설계 및 구현에 관한 것이다. 구현된 증강방송 시스템은 증강 콘텐츠 제어정보 생성을 위한 증강방송 저작도구, 다중 CP 기반 증강 콘텐츠의 관리 및 다운로드 처리를 위한 증강방송 콘텐츠 서버, 방송 스트림과 증강방송 서비스 제어정보 등을 다중화기 위한 증강방송 재다중화기, 증강 콘텐츠의 다운로드 및 렌더링을 위한 증강방송 서비스 플랫폼, 이용자 상호작용 처리를 위한 증강 콘텐츠 UI 로 구성된다. 향후 구현 시스템을 활용한 실험방송 및 시범서비스 등을 통해 증강방송 서비스의 상용화 및
$3^{rd}$ party 증강 콘텐츠 사업자가 참여할 수 있는 새로운 미디어 생태계를 구축함으로써 방송 미디어 시장 활성화에 기여할 것으로 기대한다. -
매장의 매출 증가를 위해 고객의 의견을 반영하는 것은 일반적인 마케팅이다. 여러 기관 및 대형 매장에서 고객의 의견을 반영하기 위해 여러 가지 방법을 취하고 있다. 하지만 대형 매장이 아닌 소규모 소상공인의 매장에는 고객의 의견 수집을 위한 고객의 참여 유도가 쉽지 않아 데이터를 모으기가 힘들다. 이런 문제점을 해결하기 위해 본 논문에서는 친근한 디자인과 접근성 좋은 UX를 가진 '소상공인을 위한 고객 의견 수집' 서비스를 모바일 앱 형태로 설계하고 구현했다. 이는 가게에 대한 고객들의 생각을 소상공인들이 직접 예상하고 수렴하여 잠재적인 매출향상에 도움을 주는데 그 목적이 있다.
-
최근 이슈화되고 있는 국가직무능력표준(NCS)에서 "방송통신직종"의 직무분석과 "국가기술자격검정"의 자격시험제도에 관한 실행방안을 알아본다. 국가직무능력표준은 학벌 중심의 사회에서 능력 중심의 사회로 전환하기 위한 정부의 정책방향에 따라 표준을 구성하였고, 표준에 기반 하여 학교교육 직업훈련 및 자격제도 개편을 하고자 시행되고 있다. 방송통신직종은 대분류가 정보통신이고, 중분류가 방송기술, 소분류가 방송제작기술, 방송플랫폼기술, 방송서비스로 분류되고 있다. 방송통신 직종의 각 세 분류 내에 능력단위를 보고 "국가기술자격검정"의 연관성을 검토하였다. 결과적으로 국가직무능력표준의 직무 능력단위의 수준을 검토함으로서 국가기술자격검정의 자격등급별로 타당성을 비교하였으나 능력단위 수준 및 능력단위의 내용이 가지고 있는 다양한 직업군을 자격검정으로 맞추지 못 할 것으로 판단이 되고, 자격제도의 올바른 시행을 위해서는 세부 항목을 검토하여 세분화하거나 자격검정을 새롭게 분류하여 제도화를 하거나 정비가 필요할 것으로 판단이 된다.
-
본 논문에서는 시각장애인에 대한 미디어 접근성에 관한 설문 조사와 그 결과를 제시하고 시각장애인용 미디어 콘텐츠 제작과 관련하여 접근성을 향상시키기 위한 기술의 연구개발 동향 및 개발 방향을 제시한다.
-
본 논문에서는 MLT 멀티미디어 프레임워크를 이용하여 홍보동영상을 자동 합성하는 웹 기반 서비스 프레임워크 상에서의 연동 인터페이스를 개발한다. 소상공인 홍보영상 제작시스템은 일반 소상공인들의 업종 정보와 잠재고객 특성정보를 기반으로 사진이나 동영상을 입력하면 관련된 홍보동영상을 자동으로 출력하는 시스템이다. 인지도가 높고 기능이 다양한 상용 소프트웨어들이 다수 존재하지만 소상공인들이 쉽고 저렴하게 사용할 수 있는 시스템 구성을 위해 본 논문에서는 공개소스 프로젝트인 MLT 멀티미디어 프레임워크를 사용한다. LGPL에 따라 개발 중인 MLT는 멀티미디어 콘텐츠들을 쉽게 조합하고 표시하는 필수 기능들을 제공하며 플러그인 구조를 채용하여 신규기능 탑재 및 효과추가도 가능하다. 하지만 MLT는 영상생성에 필요한 저수준 기능들을 주로 제공하므로 상위 계층에서 입력된 정보를 반영하여 홍보영상을 만드는 시스템 구성을 위해서는 상위 모듈들과의 연동 인터페이스의 설계 및 구현이 필요하다. 따라서 본 논문에서는 홍보전략 및 홍보의도와 같은 상위수준의 정보를 고려하여 MLT로 동영상을 실제 합성할 수 있도록 하는 계층화된 연동 구조를 제안한다.
-
최근, 텔레비전을 시청하지 않는 대기 상태에서의 셋톱박스의 대기 전력이 여타 가전기기의 대기 전력보다 10 배 이상을 상회하고 있어, 셋톱박스의 대기전력 저감은 국가적으로도 관심을 받고 있다. 셋톱박스의 대기전력 저감을 위해 대기상태의 셋톱박스의 최소전력 동작 모드인 수동대기모드가 제안되었지만, 셋톱박스가 수동대기모드에서는 셋톱박스의 업데이트 및 제어가 어려우므로, 셋톱박스의 수동대기모드 활용은 어려울 것이다. 본 논문은 수동대기모드에 가까운 대기전력을 소모하면서도 대기상태에서도 셋톱박스의 업데이트를 제공할 수 있는 망연동수동대기 모드를 정의하고, 망연동수동대기모드를 이용한 셋톱박스의 업데이트를 위한 셋톱박스 제어기법을 제안하고, 이 제어 기법을 위한 셋톱박스와 네트워크의 구조, 기능, 시그널링에 대해 설명한다. 본 논문의 망연동수동대기모드와 제어 방안은 셋톱박스 사업자 측면에서 활용성이 높으므로, 낮은 대기전력을 소모하는 셋톱박스 시장을 활성화하여 국가 및 세계적인 전력 감소에 큰 기여를 할 것이다.
-
본 논문에서는 멀티미디어 및 수학 관련 알고리즘 분야에서 각광 받고 있는 CUDA(Compute Unified Device Architecture) 기법을 실시간 동영상 자막 처리에 이용 한다. 실시간 고화질 동영상 자막 처리의 낮은 속도를 개선하기 위한 방법 제안으로 써, 이의 함수 구성을 제안한다. 기존의 자막 처리 방식에서는 하나의 코어만을 이용하였다. 이 방법 대신에 CUDA 를 적용 함으로써, 더 많은 코어를 이용해 실시간 자막 처리의 지각적인 성능을 향상하였다. 삽입하고자 하는 자막에 대해 비트맵 이미지를 형성하고, 이의 정보를 처리한다. Intel
$Core^{TM}$ i7-4710 MQ, GTX870 환경에서 실험하였으며, 실험 결과 C code 만으로 연산을 한 것 보다 CUDA code 가 약 88% 정도의 속도 향상이 있음을 보였다. -
ICT 기술이 급속하게 발전함에 따라 수없이 많은 기술이 등장하고 정착되고 안정화되고 있는 상황에서 빅데이터 이슈는 매우 중요하다. 이러한 변화에 빠르게 대응하는 개인이나 기업에게 엄청난 새로운 기회와 부가가치 창출을 제공을 부여해 주고 있다. 현재 방송분야에서는 빅데이터 기술이 콘텐츠 서비스 분야에서 활발히 적용되고 있으며 그 영역이 점차 확대되고 있는 추세이다. 이에 본 논문은 디지털 방송 시스템을 구성하고 있는 다양한 기기에서 발생되는 장애나 이벤트를 빅데이터 분석을 통해 통합관제 모니터링, 통계 및 분석을 통하여 처리할 수 있는 시스템을 제안한다. 제안한 시스템은 방송 인프라 통합 관리, 실시간 이벤트 검색, 장애 분석 및 리포팅 기능을 제공함으로써 문제점을 신속히 파악하여 안정적인 방송 운영을 지원하도록 한다. 또한 각종 방송 장비들의 로그 정보를 수집하여 서비스 상태 및 작업 통계를 통한 시스템의 가용성을 평가할 수 있도록 한다.
-
지상파 디지털멀티미디어방송(T-DMB)을 이용하여 국지적인 재난경보 방송을 실시하고 있지만 산간오지 등과 같은 전파 음영 지역에는 시설 투자의 한계로 서비스가 제한되고 있는 실정이다. 무선 마을 방송 시스템은 ISM 밴드 주파수를 사용하고 있으며 마을 방송용으로 주파수를 제한하여 간섭영향이 상대적으로 적은 장점을 갖는다. 본 논문에서는 T-DMB 재난 방송을 기존 무선 마을 방송 시스템의 장점을 이용하여 산간오지의 댁내까지 방송 가능한 시스템을 제안하였다. 재난 발생시 T-DMB 특수 수신기의 재난 방송 출력 신호를 무선 마을 방송 송신기와 복수의 댁내 무선 수신기를 통하여 방송 가능한 구조이며 T-DMB 수신기와 무선 방송 송신기간에는 접점 인터페이스를 통하여 정확한 시퀀스 제어가 필요하다. 무선 마을 방송 시스템은 UHF 대역의 ISM 밴드 무선 주파수를 이용하여 오지산간 지역의 부락에 적합한 특성을 갖고 있다. 장애물로 인한 장거리 전송의 한계는 무선 중계기를 이용하여 커버리지를 확장 가능하다. 따라서, 본 논문에서는 T-DMB 재난 방송을 재송신하는 수단으로 ISM 밴드와 연동할 경우 방송 음영지역 해소 및 재난 방송 수신율이 개선되어 국지적 재난에 대한 대국민 인명과 재산보호에 기여할 것으로 판단된다.
-
각종 자연적 사회적 재난 위험의 증가와 함께 국내에서도 선진국과 같은 대국민 경보 전달체계의 정비가 진행중이다. 본 연구는 경보 전달 체계에 대한 시민들의 인식 실태를 조사 분석하고, 시민들의 인식을 바탕으로 한 시스템 개선 방향점을 찾아보고자 했다. 조사 결과에 의하면 현재 시민들의 경보 전달에 관한 인식은 매우 낮은 것으로 나타났다. 이런 경보 전달의 문제를 해결하는 시스템적 방법으로는 도심형의 야외 디지털 전달체계와 구내방송을 활용한 건물내 전달 체계 개선이 필요한 것으로 파악되었다. 또 한편으로는 경보 상황에서 사람들의 실질적 대응 행동 유발의 전략적 사회 맥락을 제공하는 연구가 필요하다는 것이 나타났다. 예를 들어 왜 사람들은 실제 경보 메시지를 받으면 방송에 주목하게 되는지, 또 그런 시민에게 어떤 식으로 대응 행동 가이드를 제공할지가 앞으로의 과제로 부각되었다.
-
최근 국내외에서 자연재난 뿐 아니라 사회재난으로 인한 피해가 크게 증가하고 있다. 이를 극복하기 위해서는 기존보다 더욱 진보된 재난방송 시스템이 필요하다. 하지만 현재 일본의 One-Seg 기반 재난방송 기술은 자동인지 기법이 포함되어 있지만 국내의 T-DMB(Terrestrial-Digital Broadcasting) 기반 재난방송 기술은 자동인지 기법이 포함되어 있지 않다. 이에 본 논문은 One-Seg 기반의 자동인지 기법뿐만 아니라 국내에서 연구되고 있는 T-DMB 기반의 자동인지 기법을 소개 하며 이에 대한 성과를 기술한다.
-
최근 세계적으로 이상기후나 지진 등의 자연재난이 증가하고 그 피해도 대형화되고 있는 추세로, 선진 여러 나라는 국민의 생명과 재산 보호를 위해 다양한 매체를 활용한 신속한 재난 예보와 지능적이고 맞춤식 경보 전달을 위해 노력하고 있다. 본고에서는 지능 맞춤형 경보발령 관련 해외 동향을 소개하고, 통합경보시스템의 구조와 통합경보시스템에서의 지능형 경보발령과 맞춤형 경보발령에 대한 정의, 통합경보시스템에서 지능 맞춤형 경보발령을 적용하는 방법에 대해 제시하였다.
-
본 논문에서는 Microsoft 에서 나온 여러 대의 Kinect 를 이용하여 Free Viewpoint TV System 을 구현해 보고자 한다. Kinect 로부터 얻어진 색상 영상과 깊이 영상을 통하여, 실시간으로 두 대의 카메라 사이에서의 가상시점에서 영상이 출력되는 시스템을 설계한다. 또한, 여러 대의 Kinect 를 이용할 때, 간섭현상으로 인해 IR 패턴을 제대로 인식하지 못하여 홀이 생성되는 문제점을 확인하고, Nearest Neighbor 방식과 Inpainting 기법을 사용하여 홀을 제거하는 방식을 소개한다. 실험 결과, 홀의 주변과 비슷한 값으로 홀을 채울 수 있었지만, 홀의 크기에 따라 Edge 경계가 부정확해 지는 현상을 확인할 수 있다.
-
본 연구는 실감미디어를 활용한 무대기술 적용을 위해 UWB 센서를 이용한 동적 피사체 추적 시스템을 제안하고자 한다. 최근 공연산업에서는 실감미디어를 활용하여 관객의 오감을 자극하여 극도의 몰입감을 제공하는 시도가 지속해서 증가하고 있다. 특히 배우와 무대장치의 움직임을 실시간으로 반영하여 디지털 미디어 연출 요소로 활용한다면 관객의 실재감과 몰입감을 효과적으로 증대시킬 수 있다. 하지만 대부분 위치추적 솔루션은 제조, 물류, 유비쿼터스 자동화 시스템으로 연구가 활발히 진행되고 있으며, 공연 무대기술과 관련하여 위치추적 솔루션 연구는 미진한 실정이다. 따라서 본 논문에서는 고속의 근거리 무선 통신망을 제공할 수 있는 해결책으로 최근 주목받고 있는 Ultra Wide Band 무선 센서를 사용하여 무대 공연기술 활용에 적합한 동적 피사체 위치추적 시스템을 개발하고, 그 성능을 실험하여 위치정보의 정확도를 분석하고자 한다.
-
본 논문에서는 기존의 배경 분리 알고리즘 결과에 GrabCut 알고리즘을 도입하여 보다 정확한 배경 분리를 수행하고자 한다. 기존의 알고리즘은 동영상의 프레임 간 정보만을 이용하여 배경 확률 모델을 만들고 배경과 전경을 분리한다. 제안하는 알고리즘에서는 먼저 프레임 간의 정보를 이용하여 간단하게 배경과 전경을 분리하는 기존의 배경 분리 알고리즘을 적용한다. 분리된 결과의 정확도를 향상시키기 위해 프레임 내의 정보를 이용하는 GrabCut 알고리즘을 적용한다. 즉, 본 연구에서는 동영상의 프레임 간 정보와 프레임 내 정보를 모두 이용하여 배경과 전경을 분리하고자 한다. 실험결과에서 Change Detection Workshop dataset 에 포함된 몇 가지 영상에 대해 실험 한 후 결과 영상 비교 및 F-measure 를 통해 개선된 결과를 확인할 수 있다.
-
흉부 X-ray 영상에서 몸체 및 관심영역 분할 기법은 의료 X-ray 영상의 화질 개선 알고리즘을 더 효과적으로 적용하기 위해 전처리 단계로 영상의 물체와 배경을 분할하거나 관심영역만을 분할하는 방법이다. 보통 화질 개선 알고리즘을 적용할 때 영상의 밝기 정보나 주파수 정보를 이용하여 영상 디테일과 대비를 개선하는 방법을 사용한다. 영상 전체에 이러한 알고리즘을 적용하는 경우 불필요한 배경 정보가 포함되기 때문에 디테일과 대비가 떨어질 수 있다. 본 논문은 사용자가 보고자 하는 부분의 정보만을 사용하도록 물체를 분할하는 알고리즘을 제안한다. 1 단계로 몸체 분할 알고리즘을 이용하여 배경 성분의 정보를 제외하고 2 단계에서는 몸체의 중심인 폐와 폐사이의 장기 정보만을 볼 때의 관심영역 분할 알고리즘으로 팔이나 목, 복부의 불필요한 정보를 제외하는 방법을 제안한다.
-
컴퓨터 생성 홀로그램(CGH: computer generated hologram) 기법은 기존의 광학계 장치와 변수들을 수학적으로 모델링하여 일반 범용 컴퓨터(PC: personal computer)로도 디지털 홀로그램을 생성할 수 있는 기술이다. 이 기술은 디지털 홀로그램의 해상도와 3D 물체의 광원 수에 따라 알고리즘의 연산량이 좌우되기 때문에, 실용적인 사용을 위해서 알고리즘의 연산량을 낮추거나 하드웨어의 연산 속도를 높이는 연구가 필수적이다. 본 논문에서는 초다광원 3D 물체의 디지털 홀로그램을 고속으로 생성할 수 있는 방법을 제안한다. 제안하는 방법은 한 개의 서버 PC와 다수의 클라이언트 PC들로 구성되어 있으며, 이들은 일반적으로 사용되는 범용 GPU (graphic processing unit)가 장착되어 있다. 서버에서 3D 물체의 광원을 스캔하여 데이터화 하고, 클라이언트 PC들의 연산 능력에 따라 광원 데이터를 분할하여 클라이언트들에게 각각 전송한다. 각각의 클라이언트들은 전송받은 데이터를 이용해 다중 GPU 기반의 CGH 연산을 수행하여 간섭 패턴들을 생성하고, 생성된 패턴들은 다시 서버 PC로 재전송된다. 서버 PC로 재전송 된 패턴들이 하나로 누적되면 디지털 홀로그램이 생성된다. 본 실험에서, 기존의 방법으로는 139,655개의 광원에 대해
$1,024{\times}1,024$ 해상도의 홀로그램을 생성하는데 약 2,250 ms가 걸린 반면, 제안하는 방법은 약 478 ms의 속도로 생성할 수 있음을 확인하였다. -
IT 기기와 서비스가 보편화되고 있는 시점에 사용자 인터페이스의 중요성은 날이 갈수록 중요해지고 있다. 사용자가 특정한 일을 하기 위해서는 반드시 인터페이스를 통해 시스템과 의사소통해야하며 인터페이스가 얼마나 편리하고 친근한가에 따라 작업의 효율성도 달라진다. 그러므로 인터페이스는 사용자와 시스템 간의 원활한 의사소통을 통해 정확한 업무 수행하기 위한 요소로 매우 중요하다. 이러한 분위기 속에서 다양한 IT 기기가 등장하면서 이에 따른 UI 트렌드도 변화하고 있다. 최근 UI 트렌드로는 대표적으로 Responsive UI(반응형 UI)를 비롯해 Metro UI, Tile Layout 등이 있다. 하지만 이러한 UI만으로는 소상공인들 위한 홍보 영상 제작 플랫폼(이하 Ad-it)에서 홍보 영상을 만들기 위한 미디어 리소스 수집하는 데에 어려움이 존재한다. 소상공인의 주요 연령대가 40~50대라는 점을 감안하여 사용자의 IT 기술 친숙도를 반영하지 않았기 때문이다. 이러한 문제점을 해결하고자 본 논문에서는 홍보 영상 리소스 수집을 위해 소상공인이 쉽게 따라올 수 있도록 단계별로 나누어진 Step UI 개념을 도입하여 홍보 영상 제작에 필요한 미디어 리소스를 수집을 위한 Step UI를 구현하였다.
-
소규모 매장을 운용하고 있는 대다수의 소상공인들은 매장 홍보를 위해 전통적으로 사용되고 있던 오프라인 인쇄를 통한 전단지를 이용하고 있다. 최근에는 네이버 배너 광고, 디지털 사이니지 등을 이용한 온라인 홍보도 일부 이용하고 있으나, 온라인 홍보의 경우, 홍보 채널에 맞는 홍보물을 제작하기 위해 별도의 추가 비용이 발생하고 있으며, 홍보물 제작을 위한 비용부담으로 인하여 변화하는 상황에 최적화된 홍보물을 이용한 매장 홍보에 한계를 가지고 있다. 이에 본 논문은 소상공인이 매장 홍보를 위해 타겟 사용자 그룹군의 특성을 분석/제공하는 홍보전략을 반영하여 최적의 디지털 홍보물을 자동으로 제작하고, 가용 채널을 통해 홍보물을 쉽게 배포할 수 디지털 홍보물 자동 제작 프레임워크를 제안한다. 본 논문에서 제시하는 프레임워크를 이용하여 소상공인의 매장 상황 변화 및 홍보의도에 최적화된 디지털 홍보물을 쉽게 제작할 수 있으며, 이를 통한 홍보 효과 증대 및 홍보 비용 절감에도 기여할 수 있을 것이다.
-
YUV 파일을 RGB 형태의 color space 로 변환하는 과정은 엄청난 연산으로 많은 시간이 소요된다. 이런 문제를 다양한 방법을 이용하여 속도 감소율을 확인할 것이다. 처음으로 기본 소스코드의 소요시간을 기준으로 삼기 위하여 최적화와 병렬프로그래밍을 사용하지 않고 프로그램을 설계하였다. 최적화와 병렬프로그래밍 단계를 진행하였을 때 C언어로 구현 된 최적화되기 전과 최종적으로 CUDA 기반의 병렬프로그래밍을 사용한 함수를 비교해보았을 때 속도의 증가율이 575%로 엄청난 속도의 차이를 확인할 수 있다. 이와 같은 기술을 영상을 다루는 모든 분야에서 처리속도가 증가함에 따라 효과적인 작업을 기대해 볼 수 있다.
-
한국정보통신기술협회(TTA)은 "HTML5 기반 스마트 TV 플랫폼(TTAK.KO-07.0111/R1)" 표준을 제정하였고, 스마트 TV 용 앱 생태계 활성화를 위해 표준기반 스마트 TV 앱 개발도구(SDK, Software Development Kit)를 개발하였다. 개발도구는 표준 기반 앱 개발의 전체 라이프사이클에 필요한 프로젝트 관리, 앱 오류검사, 애뮬레이션, 패키징 및 앱 서버 전송 기능을 자동화했다. 표준에 대한 이해도가 낮은 개발자들이 표준 기반 앱을 개발 할 수 있도록 코드 자동 완성 기능과 표준 적합성 검사 기능 및 샘플 앱 등을 제공함으로써, 개발자들이 앱 자체의 기능에 대한 설계와 분석에만 집중할 수 있도록 했다. 본 논문에서는 스마트 TV 앱 개발을 위한 개발도구의 소프트웨어 구조와 개발도구가 지원하는 각 기능에 대한 구현 내용에 대해 소개한다.
-
본 논문은 개발자에게 멀티플랫폼 지원을 위한 웹언어 기반의 하이브리앱 개발환경을 제안한다. 최근 웹 기술의 발달로 웹 언어 기반의 애플리케이션이 증가 하고 있다. 그러나 웹 언어로 구현된 모바일 애플리케이션의 경우 디바이스의 플랫폼에서 제공하는 고유의 자원들에 대한 사용이 어려우며, 애플리케이션 마켓에서 배포가 어려운 단점이 있다. 본 논문에서는 이러한 문제를 해결하기 위해 통합개발환경을 구현하여 개발자들이 웹언어로 다양한 플랫폼에서 애플리케이션을 개발할 수 있는 환경을 제공한다. 제안하는 통합개발환경은 안드로이드와 타이젠 운영체제를 지원하며, 브라우저 기반의 웹 에뮬레이터와 애플리케이션 패키징 인터페이스를 지원하여 개발되는 소스코드를 테스트할 수 있도록 한다. 또한, 웹 에뮬레이터에서 디바이스 고유의 리소스를 사용하기위한 API를 설계한다. 제안하는 방법의 검증을 위해 타이젠 기반의 IVI 디바이스와 안드로이드 스마트폰을 사용하여 웹 언어로 작성된 애플리케이션을 테스트 한다.
-
최근 영상 및 음향 기술이 발전함에 따라서 실감 오디오에 대한 기술이 촉구 되고 있으며 커넥티드 오디오에 대한 수요와 공급이 매년 증가하고 있다. 본 논문은 헤드폰을 이용해서 사용자에게 제공되는 일반적인 스테레오 신호 및 모노 신호를 음상 정위을 변화시키기 위해서 HRTF (Head response transfer function)을 적용하였으며 인공 잔향을 이용해서 공간감을 구현하였다. 실제 실험을 위해서 MATLAB을 이용하여 시물레이션을 구현하였으며 MATLAB의 GUI를 통해서 사용자에게 음상의 위치를 입력받게 된다. 이를 통해 음상이 사용자가 입력한 순서의 경로를 따라서 음상 정위가 변화에 대해서 입증하였다.
-
단어의 유사도 측정 알고리즘은 DB 인덱싱, 필터링, 소스코드 분석 소프트웨어, 음성 인식 등 다양한 분야에서 활용되고 있다. 하지만 기존의 단어의 유사도만 비교하는 시스템에는 발음이 비슷한 유사단어나 오타가 있는 유사단어들은 측정을 못하는 단점이 있다. 언어의 유사도 측정에서는 알파벳만으로 볼게 아니라 언어 발음의 발화적 특성 또한 고려되어야 한다. 본 논문에서는 글로벌 시장에서의 다국적 기업들의 제품이나 문화 수출 등의 도움이 되는 각 나라의 금기어와의 발화적 특성까지 고려한 단어 유사도를 측정 할 수 있는 시스템을 제안한다. 11개국의 4개 언어 총 21487개의 금기어 단어를 금기어 데이터로 사용하였다. 제안하는 방법의 성능을 평가하기 위하여 타 알고리즘과의 성능비교와 여러 나라의 다양한 언어의 사용자들로부터 사용자 평가를 수행하였고 제안하는 방법이 발음 유사도를 측정하지 않는 알고리즘보다 우수한 성능을 보임을 확인하였다.
-
재난 발생이 예상되거나 발행한 경우, 신속하게 정확한 정보를 전달할 수 있다면, 효과적으로 재난 피해를 줄일 수 있다. KBS는 재난 방송 및 재난 경보방송 주관방송사로서 방송을 이용하여 전국적 및 국지적으로 재난 정보를 신속히 전달하고 있다. 본 고에서는 KBS가 수행하고 있는 통합 디지털 재난 방송 시스템과 그 활용 현황을 중심으로 하여, 재난 방송과 재난 경보방송의 개념, KBS가 구축한 통합 디지털 재난 방송 시스템의 구성과 활용에 대하여 알아본다.
-
사회의 발전과 그에 따른 인구의 증가로, 다양한 사회적, 자연적 재난으로 인한 인명과 재산 피해가 증가하고 있다. 국내에서는 이러한 추세에 따라 신속하고 정확한 재난 대응을 통해 인명과 재산을 지키기 위한 표준화된 재난 관리 체계를 구축하기 위한 연구를 진행하고 있다. 본지는 이러한 연구 과정의 일환으로, 통합경보시스템의 경보 발령에 사용되는 통신 방식과 그 흐름에 대해 제시한다. 또한, 통합경보시스템을 구축하기 위해 통합경보시스템 참조모델의 구현과 경보발령에 대한 시나리오를 가정하여 검증하였다.
-
사회 규모와 인구의 급속한 증가에 따라, 다양한 재난으로 인한 인명과 재산의 피해가 증가하고 있는 추세이다. 이에 따라 재난으로 인한 인명과 재산의 피해를 최소화하기 위한 표준화되고 안정적인 재난 관리 체계의 중요성 또한 높아지고 있다. 본 논문에서는 이러한 통합 경보 시스템을 구축하는 데 기초가 되기 위한 통합 경보 시스템 참조 모델의 개괄적인 구조, 그리고 이들을 구성하는 각각의 컴포넌트 중, 다양한 이기종 경보 발령 시스템과 표준 경보 발령대 간의 통신을 담당하는 게이트웨이의 설계에 있어 필요한 시스템 요구사항과 설계안을 제시한다.
-
최근 IT융합 기술이 더욱 발전하고 있고 사물 인터넷의 활용으로 생활의 편리 및 안전과 관련된 다양한 응용 기술들이 개발되고 있다. 이에 본 논문에서는 IT융합 기술을 활용해 재난상황 발생 시 초기 대응이 가능한 시스템을 개발하였다. 개발된 시스템은 각종 센서를 이용하여 재난 상황을 감지하고 재난 발생 시 즉시 중앙 서버로 재난발생을 알린다. 중앙 서버에서는 건물내부에 있는 인원들에게 스마트폰을 통해 신속히 그 상황을 알리고 평소에 조명등으로 사용되는 LED를 능동적인 비상구유도등으로 활용함으로써 재난상황에 대해 신속히 대응하여 인명사고를 줄일 수 있을 것이다.
-
본 논문에서는 준 지도 학습에 기반한 중요 객체 검출 방법을 제안한다. 첫째, 색상과 공간 정보를 활용하여 이미지를 분할한 후, 분할된 영역을 색상의 유사도로 연결하여 그래프를 만든다. 둘째, 색 대비 및 가장자리 사전 지식을 활용하여 중요 객체에 해당하는 씨앗 노드와 배경에 해당하는 씨앗 노드를 추출한다. 끝으로, 중요 객체 및 배경 씨앗 노드를 이용하여 준 지도학습 기법에 적용함으로써 이미지 전체 노드의 중요도를 계산한다. 실험 결과, 제안한 알고리즘이 최신의 다른 알고리즘보다 높은 재현율 구간에서 높은 정밀도를 보임을 확인할 수 있고, 시각적으로도 좋은 성능을 보임을 확인할 수 있다.
-
최근 고화질 영상의 수요가 증가함에 따라, UHD급 디스플레이의 디지털 기기가 등장하기 시작했다. 하지만 기존의 스케일러 모듈에 사용된 보간법들로는 기존의 저해상도의 영상 콘텐츠로부터 고품질의 영상을 획득하기가 어렵다. 따라서 본 논문에서는 고품질의 영상을 획득 가능한 초고해상도 영상에 적합한 스케일러를 제안한다.
-
본 논문에서는 비디오 영상을 입력 했을 때 특징점 추적을 통한 다수 영상의 고속 스트칭 기법을 제안한다. 빠른 속도로 특징점 추출을 위해서 FAST(Features from Accelerated Segment Test) 기법을 사용한다. 특징점 정합과정은 기존의 방법과는 다른 새로운 방법을 제안한다. Mean shift 를 통해 특징점이 포함된 영역을 추적하여 벡터(vector)를 구한다. 이 벡터를 사용하여 추출한 특징점들을 정합하는데 사용한다. 마지막으로 이상점(outlier)을 제거하기 위해 RANSAC(RANdom Sample Consensus) 기법을 사용한다. 입력된 두 영상의 호모그래피(homography) 변환 행렬을 구하여 하나의 파노라마 영상을 생성한다. 실험을 통해 제안하는 기법이 기존의 기법보다 속도가 향상되는 것을 확인하였다.
-
모바일 기기의 보급률과 성능이 급속도로 성장하면서 모바일 기기에서의 비디오 소비 또한 크게 증가하였다. 하지만, 전력과 공간을 줄이기 위해 설계된 모바일 플랫폼은 데스크톱 플랫폼과 비교하여 성능의 한계가 존재한다. 따라서 대용량 비디오 처리를 위해 SIMD 아키텍쳐를 이용하는 임베디드 GPU를 활용하여 이와 같은 한계를 극복하기 위한 고속화 연구가 많이 진행되고 있다. 저장된 데이터를 활용하는 영상처리는 GPU 뿐만 아니라 CPU가 반드시 함께 이용되어야 하며, 모바일 환경에서의 이기종 컴퓨팅 시스템은 프로세서 사이의 낮은 전송속도와 이로 인한 대기시간, 모바일 운영체제가 지원하는 데이터 형태의 필수적인 사용 등의 구조적 단점이 존재한다. 본 논문에서는 임베디드 GPU를 활용한 영상처리 고속화를 위해 임베디드 CPU측에서 병렬처리를 이용하여 앞서 설명한 단점들을 극복하고 실험결과로 모바일 이기종 컴퓨팅 구조에서 임베디드 CPU 활용이 전체적인 연산 효율을 증가시키는 결과를 보였다.
-
TV 시청 도중 세컨드 디바이스로 멀티태스킹하는 시청패턴과 더불어 방송과 시청자가 상호작용하는 양방향 서비스 요구사항의 증대에 따라 KBS 는 시청자 참여 서비스를 위한 티벗 서비스 플랫폼을 개발하였다. 티벗 서비스 플랫폼은 시청자의 피드백을 실시간으로 반영하여 방송 제작자의 요구 사항을 만족시키는 동시에 방송을 통해 시청자 간 소통을 강화할 수 있는 KBS 의 세컨드 스크린 서비스 플랫폼이다. 본 논문에서는 시청자 참여 서비스를 위한 티벗 세컨스크린 서비스 플랫폼의 전반적인 구조와 특징, 서비스 운용 현황에 대해 살펴본다.
-
현재를 '빅데이터' 시대라 부른다. '빅데이터', 그 용어가 주는 의미대로 우리가 처리해야 할 데이터가 매우 많다는 것을 의미 하며, 과거의 데이터 정제 기술로 유의미한 정보로 가공하려면 상당한 자원이 필요하다. 현재, 장비의 고성능화 등으로 가능성이 검증되고 있고, 일부 비즈니스에 활용되는 단계이나 여전히 혼돈의 문제가 존재하며, 이러한 문제의 해결책으로 제시되는 것 중의 하나가 바로 '소셜 큐레이션'이라 할 수 있다. 본 개발 서비스1)는 시청자들이 방송 콘텐츠를 소유하고 공유하고자 하는 욕구를 반영하여, 실시간으로 TV를 보면서 방송 프로그램을 캡처하고 공유할 수 있게 한다. 방송콘텐츠에 관한 '소셜 큐레이션' 서비스이며, 이는 각 사용자들이 캡처하여 생성한 수많은 콘텐츠 중에서 사용자들이 원하는 콘텐츠를 사용자들의 사회적인 관계를 이용하여 선별적으로 제공할 수 있도록 구성한 것이다. 본 논문에서는 서비스의 개발 방향과 시스템 구성 등을 설명한다.
-
Oh, Juhyun;Jeon, Seonggyu;Kim, Byungsun;Kim, Minho;Kang, Sangwook;Kwon, Hyukchul;Kim, Iktae;Song, Youngho 191
청각장애인을 위한 지상파방송 서비스 중 자막방송은 100%에 가까운 편성 비율을 달성하고 있지만, 수화방송은 방송화면을 가리는 특성과 비용 등의 문제로 5% 수준의 편성에 그치고 있다. 본 연구에서는 자막방송을 수화로 번역하여 그래픽 수화 방송을 생성함으로써 수화방송의 비율을 높이고자 한다. 일기예보에 한정하여 수화방송을 생성한 기존 연구 결과를 바탕으로 모든 방송 프로그램에 적용 가능한 그래픽 수화방송 시스템을 제안한다. 자막방송 문장을 형태소별로 분석한 다음 중요 품사 위주로 단어 단위로 번역하고, 한국어 어휘의미망을 이용하여 수화사전에 없는 단어를 대표어로 대체하였다. 형제어와 문맥 정보를 이용하여 중의성 단어를 성공적으로 번역하였다. 기존 일기예보 수화방송 시스템의 수화 사전과 수화 모션 데이터베이스를 추가 구축하였다. 자동번역 기술이 전문 수화 통역사의 수준을 따라잡을 수는 없지만 향후 수화방송도 선택적 서비스가 가능해지고 수화통역사의 수화방송이 모든 프로그램에 편성될 때까지 본 시스템이 보조적 시청 수단으로 사용 가능할 것이다. -
최근 TV 서비스의 가입자 및 TV 프로그램 콘텐츠의 급격한 증가에 따라 빅데이터 처리에 적합한 추천 시스템의 필요성이 증가하고 있다. 본 논문은 사용자들의 간접 평가 데이터 기반의 추천 시스템 디자인 시, 누적된 사용자의 과거 이용내역 데이터를 저장하지 않고 새로 생성된 사용자 이용내역 데이터를 학습하는 효율적인 알고리즘이면서, 시간 흐름에 따라 사용자들의 선호도 변화 및 TV 프로그램 스케줄 변화의 추적이 가능한 토픽 모델링 기반의 알고리즘을 제안한다. 빅데이터 처리를 위해서는 분산처리 형태의 알고리즘을 피할 수 없는데, 기존의 연구들 중 토픽 모델링 기반의 추론 알고리즘의 병렬분산처리 과정 중에 핵심이 되는 부분은 많은 데이터를 여러 대의 기계에 나누어 병렬분산 학습하면서 전역변수 데이터를 동기화하는 부분이다. 그런데, 이러한 전역데이터 동기화 기술에 있어, 여러 대의 컴퓨터를 병렬분산처리하기위한 하둡 기반의 시스템 및 서버-클라이언트간의 중재, 고장 감내 시스템 등을 모두 고려한 알고리즘들이 제안되어 왔으나, 네트워크 대역폭 한계로 인해 데이터 증가에 따른 동기화 시간 지연은 피할 수 없는 부분이다. 이에, 본 논문에서는 빅데이터 처리를 위해 사용자들을 클러스터링하고, 클러스터별 제안 알고리즘으로 전역데이터 동기화를 수행한 것과 지역 데이터를 활용하여 추론 연산한 결과, 클러스터별 지역별 TV프로그램 시청 토큰 별 은닉토픽 할당 테이블을 유지할 때 추천 성능이 더욱 향상되어 나오는 결과를 확인하여, 제안된 구조의 추천 시스템 디자인의 효율성과 합리성을 확인할 수 있었다.
-
본 논문에서는 비문(鼻紋) 이미지를 이용한 개의 개체인식 시스템에서 정확도를 높이는 방법을 논하고자 한다. 비문 이미지에는 개 코의 특성상 반사로 인한 다수의 잡음이 생기게 되는데 이는 전체 시스템의 인식률을 낮추는 주요 원인이다. 본 알고리듬에서는 반사광으로 인해 비문 이미지에서 탐지된 잘못된 특징점을 제거하고 RANSAC 알고리듬을 적용하여 정확도를 높이는 방법을 제안한다. 실험 결과 본 알고리듬은 종이에 비문을 찍어내지 않고도 충분한 정확도를 가지는 시스템을 구축 할 수 있음을 보였다.
-
최근 실내에서 아동 및 치매노인의 실종사고가 빈번히 발생함에 따라 안전에 대한 관심이 높아지고 있다. 이에 아동 및 치매노인의 위치를 알 수 있도록 GPS를 활용한 제품들이 출시되고 있다. 하지만 GPS단말기는 실내에서 위치추적이 불가능하다는 단점이 있다. 따라서 본 논문에서는 실외뿐만 아니라 실내에서도 대상자의 위치를 실시간으로 파악할 수 있는 위치추적 시스템을 개발한다. 개발된 시스템을 이용하여 피보호자가 이동한 경로를 실시간으로 추적하는데 도움을 줄 수 있다.
-
본 논문에서는 먼저 주성분 분석 (Principal components analysis, PCA) 을 활용한 Non-local means (NLM) 을 소개하고, 주성분 분석을 하기 위해 필수적인 공분산 행렬 계산을 효율적으로 하는 방법을 제안한다. NLM 에서의 Neighborhood patch 의 크기를
$S{\times}S=S^2$ , 이미지 전체의 픽셀 수를${\mathcal{Q}}$ 일 때 공분한 행렬을 계산 하기 위해서는$S^2{\times}{\mathcal{Q}}$ 크기를 가지는 행렬간의 곱 연산이 필요하다. 결론적으로 본 논문에서는 이 행렬의 크기를 줄임으로써 PSNR (Peak signal-to-noise ratio) 의 손실 없이 NLM 의 복잡도를 줄일 수 있음을 보여준다. -
본 논문에서는 차세대방송시스템을 위한 저복잡도의 비균등성상 디매핑 기술을 제안한다. 비균등성상기술은 차세대 방송시스템에서 사용될 발전된 형태의 성상 기술로, 기존 균등성상 기술에 비해 개선된 성능을 제공한다. 그러나 비균등성상기술을 사용하는 경우 균등성상기술에 비해 수신기에서 성상신호를 디매핑시 더 높은 복잡도를 요구하게 된다. 본 논문에서 제안되는 저복잡도의 비균등성상신호 복호화 기술은 한 개의 성상심볼을 구성하는 여러 비트들 중에서 실제로 유효한 정보를 담고 있는 일부 비트들만을 성상신호 복호시에 고려함으로써 성능열화 없이 감소된 수신기 복잡도를 제공한다. 제안되는 기술은 높은 차수의 성상과 낮은 부호율이 사용될 때 유용하게 사용될 수 있다.
-
본 논문은 적응적 휘도 성분 부호화(Adaptive Luminance Coding)알고리듬을 이용한 블록의 움직임을 고려한 장면전환 감지 성능을 개선시키는 알고리듬을 제안하고자 한다. 기존의 장면전환 기법에서는 단순 물체의 움직임도 장면전환으로 인식하는 문제가 발생하는 점을 착안하여 본 논문에서는 적응적 휘도 성분 부호화와 블록 매칭 오류를 활용하여 보다 정확한 장면전환 기법을 제안하고자 한다. 실험결과를 통해 제안하는 방법이 기존 방법보다 높은 Precision과 Recall을 보이는 것을 확인할 수 있다.
-
차세대 지상파 방송 규격인 Advanced Television Systems Committee (ATSC) 3.0 에서는 OFDM 심볼내의 특정 부반송파 대역에서 발생하는 군집 오류(burst errors)로 인한 성능 열화를 극복하기 위하여 주파수 인터리버 (frequency interleaver) 기법을 채택하였다. 주파수 인터리버는 OFDM 심볼 내의 데이터의 위치를 랜덤하게 배열하여 채널에서 발생하는 군집 오류 (burst error)를 분산시켜 성능 열화를 극복한다. 본 논문에서는 다양한 채널 환경에서의 주파수 인터리버의 성능을 펑가하고 효과를 분석한다.
-
본 논문은 차세대 지상파 국제 방송 표준인 Advanced Television Systems Committee (ATSC) 3.0 의 주요 기술로 선정된 layered division multiplexing (LDM) 기술에서 효율적인 framing 및 multiple physical layer pipe (PLP) 구성 방법을 소개하고 성능을 평가하였다. Multiple PLP 를 전송하는 환경에서 본 구성 방법의 장점을 살펴보고, LDM 적용 시 기존 기술 대비 성능 이득을 분석해 보고자 한다.
-
본 논문에서는 ADT 전송기법에서 추가 데이터에 채널 부호화를 적용하여 전송률 손실 없이 성능을 향상시킬 수 있는 방법을 제안하였다. ADT 전송기법은 추가로 전송할 데이터에 따라 성상을 다르게 하여 보내는 전송기법이다. ADT 전송기법에서는 수신단에서 실제로 전송되지 않는 추가 데이터를 얼마나 잘 검파하는지에 따라 시스템 성능이 좌우된다. 이에 성능 향상을 위하여 추가 데이터에 채널 부호화를 적용하였다. 일반적인 통신 시스템에서는 채널 부호화를 적용할 경우 데이터 전송률의 감소가 필연적으로 발생하게 된다. 그러나 본 논문에서 제안하는 방법은 실제 전송되지 않는 추가 데이터에 채널 부호화를 적용함으로써 전송률 손실을 방지하였다. 또한 제안한 방법을 컴퓨터 모의실험을 통하여 분석하였다.
-
케이블 방송망에서 멀티-Gbps(Giga bit per second) 초고속 인터넷 서비스 제공을 위해 최근 북미에서 DOCSIS 3.1(Data over Cable Service Interface Specifications Version 3.1) 표준을 발표하였다. DOCSIS 3.1 은 최대 10Gbps 하향 데이터 전송과 최대 2Gbps 의 상향 데이터 전송을 목표로 한다. DOCSIS 3.1 이 이전 DOCSIS 표준들과 다른 점은 전송 효율을 높이기 위해 물리계층 전송 방식에 큰 변화를 주었다는 점이다. 기존 6MHz 대역폭의 단일 반송파 전송 방식에서 최대 192MHz 광역 채널의 다중 반송파 전송 방식으로 변경하였다. 또한 채널 오류정정 방식으로 BCH(Bose, Chaudhuri, and Hocquenghem)와 LDPC(Low Density Parity Check) 연접부호를 적용하여, 이로 인한 SNR 성능 이득 통해 4096-QAM 의 고차 변조를 지원한다. 본 논문에서는 최대 192MHz 의 광역 채널로 전송되는 약 2Gbps 의 전송 데이터에 대한 채널 오류 정정을 위해 고속의 LDPC 복호기 구현 방법을 제시한다.
-
본 논문에서는 나카가미-m 페이딩 채널 환경을 가진 무선 중계 네트워크에서 reactive 누적분포함수(cumulative distribution function) 기반 중계기 선택 기법을 제안한다. 제안된 기법은 수신 신호대잡음비(signal-to-noise ratio)의 누적분포함수 값에 따라 중계기를 선택한다. 본 논문에서는 제안한 기법의 불능 확률(outage probability)과 다이버시티 차수(diversity order)를 분석한다. 제안된 기법이 얻을 수 있는 다이버시티 차수는 중계기의 개수와 페이딩 파라미터에 의해 결정되며 최대 다이버시티(full diversity)를 얻음을 볼 수 있다. 그리고 모의 실험에서는 분석된 불능 확률 및 다이버시티 차수가 정확하게 일치하는 것을 확인한다.
-
본 논문에서는 ATSC (Advanced Television Systems Committee) 3.0 시스템을 위한 LDM (Layered Division Multiplexing) 기술을 제안하고, 그 성능을 전산실험을 통해 분석한다. 제안된 LDM 시스템은 기존의 TDM (Time Division Multiplexing) / FDM (Frequency Division Multiplexing) 기술에 비해 약 3 에서 9 dB 의 성능 이득을 나타낸다.
-
최근 들어 일반인들도 다중 콥터와 4k 고성능 카메라를 장착한 상용 드론을 구매하여 자신의 취미 활동용으로 사용하고 있다. 드론을 이용한 많은 동호회가 생겨나고 1인 1드론, 개인용 드론의 시대가 시작되고 있다. 또한 사물인터넷의 시대에 걸맞게 아두이노, 라즈베리파이와 같은 오픈하드웨어 플랫폼과 오픈 소스를 이용하고 저가형 3D printer 의 보급으로 자신만의 독특한 형태를 지니는 기체 제작을 시작하고 있다. 이에 본 논문에서는 3D 캐드를 이용한 위상최적화 기법을 적용하여 기존 상용 기체의 강성은 그대로 유지하되 기체 프레임 무게를 절반으로 줄인다. 또한, 풍동실험을 진행해서 기존 기체에서 발생하는 유체흐름을 분석하고 새로운 기체를 적용했을 경우에도 유사한 유체흐름이 나타나도록 설계하여 3D 프린터를 사용하여 제작하였다.
-
최근 스마트폰등 ICT기반의 전자제품들이 보편화 되면서 무인항공기에 적용 가능한 전자기술들이 급속히 개발되어, 항공 기술과 ICT 기반 전자 기술이 융복합되어 무인항공기는 군용위주의 활동 영역을 넘어 민간분야에서 까지 활발히 진출하고 있다. 현재까지는 전통적인 항공 선도 업체들이 군용무인기 중심의 고가의 무인기를 생산하여 시장을 장악하였으나, 이제는 공공 및 민간영역에서 무인기를 상업화하기 위한 기업들이 등장하고 있어 민수영역에서 무인기 시장은 급성장세에 있다. 국내의 무인기 기술은 기술혁신과 시장창출 주도가 가능한 선진권 수준이며, 무인기의 핵심인 ICT기반 전자부품 기술은 세계 최고의 수준으로 두 분야의 기술을 융복합화하여 경쟁력 있는 무인기 개발을 신속히 진행하면, 전 세계적으로 성장하는 무인기 개발 시장은 우리에게 새로운 성장 동력이 될 수 있다. 자율비행, 상황인식 및 회피 기능 등 미래 무인기 선도기술을 개발하고, 국산화지연 또는 외국의 수출제한 품목에 대한 국산화 개발 및 핵심 부품의 국산 경쟁력 강화를 통하여 무인기 산업의 고부가가치를 창출할 수 있다.
-
본 논문에서는 멀티콥터에서의 음향 취득에 필요한 프로펠러 소음 저감 방법을 제시한다. 멀티콥터의 사용성 증대에 따른 방송 및 다분야에서 응용이 늘어남에 비해 방송 분야에서 멀티콥터의 음향 취득 기술이 미비한 것이 사실이다. 높은 품질의 동영상 촬영 기술이 나날이 발전하고 있는데 비해 멀티콥터에서의 음향 취득에 대한 연구는 진행이 활발하지 않다. 이에 본 논문은 음성 신호 처리 분야에서 소음 저감 기술로 많이 쓰이는 적응 신호처리를 이용하여 프로펠러 소리를 저감하는 방법을 제시한다. 먼저, 적용한 적응 신호 처리 기술에 대한 설명을 통해 본 논문에 이용한 프로펠러 소리 저감 방법을 설명토록 하며, 프로펠러 소리에 대한 분석을 통해 발전 가능한 연구를 논의한다.
-
군사용으로 먼저 개발되어 시장을 형성했지만, 드론의 제작이 많아지면서 소비자 시장이 급속도로 확대되고 있다. 최근 중국의 DJI는 기업가치 100억 달러 이상을 넘볼 정도로 급성장 하였고, 드론용 소프트웨어나 플랫폼을 확보한 스타트업 기업들에 대한 투자도 활발하게 진행중이다. 구글이나 페이스북, 아마존 등 자사의 서비스 강화를 위한 목적으로 드론 기술을 적극적으로 활용하고 있으며, 드론의 시장 확대에 따른 드론 시장 생태계도 크게 확장하고 있다. 향후 민간용 드론 시대가 도래 할 것이라고 예상하고 있다. 이에 맞춰, 본 논문에서는 민간용 드론의 국내 외 활용사례 중심으로 살펴보고, 민간용 드론 시대를 대비하여 국내 대응 방안을 제시해보고자 한다.
-
실시간으로 초고속 이동통신 서비스를 제공하기 위해 5 세대 이동통신 시스템에서는 초광대역(ultra wideband) 시스템 구축에 용이한 3-300GHz 밀리미터파 대역의 도입을 고려하고 있다. 그러나 밀리미터파 대역 신호는 상용 이동통신에서 사용되는 3GHz 이하의 대역에 비하여 전파특성이 열악하다. 이러한 밀리미터파 대역의 효과적인 활용을 위해 5 세대 이동통신 시스템에는 아날로그/디지털 빔포밍 기술을 결합한 하이브리드 빔포밍 기술을 고려하고 있다. 본 논문에서는 하이브리드 빔포밍 기술을 적용한 다중 안테나 상향링크 시스템에서 제로-포싱 (zero-forcing) 구조의 송수신기 설계 기법을 소개한다.
-
본 논문에서는 개선된 자세 인식을 위한 학습을 통한 자세 인식 기법을 제안한다. 제안 자세 인식 기법은 영상의 모든 픽셀 값을 사용하지 않으며 인체의 골격의 위치 정보와 자세의 학습을 기반으로 한다. 최근 자세 인식기법에 다양한 기계 학습 기법을 적용하여 제스처 인식률을 높이는 연구가 진행되고 있지만 실시간 프레임에 적용하는데 한계가 있다. 반면 고차원의 특징점을 추출하여 신경망 학습방식을 이용하면 적은 계산량과 손쉬운 실행이 가능하다. 고차원의 특징점은 깊이 정보로부터 사람의 골격 정보를 이용해 추출하여 차원을 감소시키며 신경망 학습 방식에서는 각 자세에 대한 고차원의 특징점을 이용하여 자세의 학습을 진행한다. 신경망학습은 학습 단계에서는 미리 알려진 자세와 예측된 자세의 비교를 통해 오류를 최소화 하는 방향으로 학습을 진행하며, 판별 단계에서는 새로운 자세를 입력하여 고차원 특징점을 이용한 신경망 학습 기반의 제안 기술의 성능을 평가한다. 실험에 의하면 제안 기법은 약 96%의 자세 인식률을 보이고 자세 인식기법을 동작 인식으로 확장 가능성 또한 보인다.
-
본 논문에서는 화재의 움직임 정보에 기반하여 역동적인 화재를 감지하는 기법을 제안한다. 우선 감시 카메라와 같은 고정형 감시 장치로부터 얻어진 색 정보를 분리하기 쉬운 좌표계로 변환하고 이전에 수집된 데이터들로부터 얻어진 사전 정보로부터 화염 영역을 추출한다. 또한 화염 영역의 가장자리가 움직임이 매우 크다는 사실에 기반하여 광흐름 벡터로 얻어진 시간적 분산값을 이용한 움직임 모델을 생성한다. 화염 영역은 움직임 모델과 결합되며 오탐을 걸러내기 위해 충분한 양의 화재 영역이 중첩될 때 최종적으로 화재를 판별한다. 본 논문에서 제안한 방법은 실험 결과에서 우수한 탐지 능력을 보인다.
-
본 논문은 EBME(Extended Bilateral Motion Estimation) 알고리듬에서 움직임 벡터들의 방향과 크기를 고려한 알고리듬을 제안하였다. EBME는 높은 연산량을 요구하기 때문에 프레임 내의 x, y방향 각각의 평균 움직임 벡터크기를 이용하여 동적 프레임과 정적프레임을 판단하고, EBME 수행여부를 결정하여 연산량을 줄인다. 또한 동일한 움직임 벡터들의 방향과 크기를 비교하여 MVS(Motion Vector Smoothing)단계 수행여부를 판단함으로써 연산량을 줄인다. 제안하는 알고리듬을 적용한 실험 결과 기존의 EBME 알고리듬에 비해 수행시간은 단축되었으나 PSNR(Peak Signal to Noise Ratio)은 향상 되었다.
-
본 논문은 하이브리드 방송서비스의 여러 유형 중 ITU-T J.301 에서 정의한 AR-STV 환경에서 시청자가 선호하는 콘텐츠 사업자의 선택에 따라 동일한 방송프로그램에 대해서 서로 다른 하이브리드 방송서비스를 소비할 수 있는 시청자 경험과 시스템에 관해 설명한다. 하이브리드 방송서비스는 방송통신융합서비스의 한 형태로서 방송망과 인터넷을 결합하여 각각의 장점을 살려 기존에 방송망에서 제공하지 못했거나 구현하기 어려웠던 서비스를 시청자에게 효과적으로 제공하는 데 목적이 있다. 이러한 목적의 일환으로 시청자 선호 기반 하이브리드 방송서비스는 시청자에게 방송프로그램 시청 도중에도 선호하는 콘텐츠 사업자를 변경할 수 있는 선택권을 제공함으로써 방송 참여에 대한 관심을 유도하고, 콘텐츠 사업자들에게는 질 높은 콘텐츠 제공 경쟁을 유도함으로써 발전된 하이브리드 방송 환경 조성에 기여할 것으로 기대된다.
-
본 논문은 다시점 영상에서 프레임율 변환 (Frame Rate Up Conversion, FRUC) 기법을 적용하는 방식에 대하여 서술한다. 먼저, 임의의 시점의 영상을 생성하기 위해서 사용되는 중간시점 영상합성 (View Synthesis, VS)기법과 연속되는 영상 사이에 새로운 영상을 만들어내는 프레임율 변환기법에 대하여 간략히 소개한다. 그리고, 기존의 프레임율 변환 방식과 다시점 영상의 특징을 이용한 프레임율 변환 방식을 소개하고 각각의 방식으로 생성한 영상의 화질을 비교한다.
-
Bae, Byungjun;Oh, Sungheun;Yim, Hyunjeong;Oh, Hyeju;Kim, Soonchoul;Lim, Hyoungsoo;Hur, Namho 337
최근 들어 기존의 MPEG-2 시스템에서 벗어난 차세대 방송 서비스 및 시스템 기술에 대한 관심이 고조되고 있다. 즉, 부호화된 콘텐츠를 전송하기 위해서 현재 사용되고 있는 MPEG-2 스트림 대신, 세그먼트 기반의 IP를 활용하는 방향으로 변모하고 있다. 더욱이, 차세대 방송 표준화를 추진 중에 있는 ATSC 3.0 에서는 MPEG-2 스트림을 제외하고 세그먼트 기반의 IP 만 고려하고 있다. 본 논문에서는 이러한 기술 기반의 차세대 방송 서비스 및 시스템 개발을 위해서 필요한 콘텐츠 반복 재생 방법을 제안한다. 제안된 방법은 기존 디지털 방송에서 사용하고 있는 MPEG-2 스트림의 반복 재생과 동일하게, 제한된 용량의 콘텐츠를 반복 재생하여도 연속적으로 재생되는 것처럼 보이도록 하여 실제 방송 환경과 동일한 테스트 환경을 제공한다. 향후, 세그먼트 기반의 차세대 방송 서비스의 도입 단계에서 제안된 내용이 많이 활용될 것으로 기대한다. -
본 논문은 베이지안 비음수 행렬 인수분해 (Bayesian nonnegative matrix factorization, BNMF) 기반의 음성 강화 기법에서 음성과 잡음 성분의 latent source 수에 따른 강화성능에 대해 서술한다. BNMF 기반의 음성 강화 기법은 입력 신호를 서브 신호들의 합으로 분해한 후, 잡음 성분을 제거하는 방식으로 그 성능이 기존의 NMF 기반의 방법들보다 우수한 것으로 알려져 있다. 그러나 많은 계산량과 latent source 의 수에 따라 성능의 차이가 있다는 단점이 있다. 이러한 단점을 개선하기 위해 본 논문에서는 BNMF 기반의 음성 강화 기법에서 최적의 latent source 개수를 찾기 위한 실험을 진행하였다. 실험은 잡음의 종류, 음성의 종류, 음성과 잡음의 latent source 의 개수, 그리고 SNR 을 바꿔가며 진행하였고, 성능 평가 방법으로 PESQ (perceptual evaluation of speech quality) 를 이용하였다. 실험 결과, 음성의 latent source 개수는 성능에 영향을 주지 않지만, 잡음의 latent source 개수는 많을수록 성능이 좋은 것으로 확인되었다.
-
컴퓨터 기술이 발전하고 컴퓨터 사용이 일반화 되면서 휴먼 인터페이스에 대한 많은 연구들이 진행되어 왔다. 휴먼 인터페이스에서 감정을 인식하는 기술은 컴퓨터와 사람간의 상호작용을 위해 중요한 기술이다. 감정을 인식하는 기술에서 분류 정확도를 높이기 위해 특징벡터를 정확하게 추출하는 것이 중요하다. 본 논문에서는 정확한 피치검출을 위하여 음성신호에서 음성 구간과 비 음성구간을 추출하였으며, Speech Processing 분야에서 사용되는 전 처리 기법인 저역 필터와 유성음 추출 기법, 후처리 기법인 Smoothing 기법을 사용하여 피치 검출을 수행하고 비교하였다. 그 결과, 전 처리 기법인 유성음 추출 기법과 후처리 기법인 Smoothing 기법은 피치 검출의 정확도를 높였고, 저역 필터를 사용한 경우는 피치 검출의 정확도가 떨어트렸다.
-
본 논문에서는 다양한 멀티 채널 오디오 규격들을 설명하고, 스테레오와 5.1 채널과 같이 기존에 많이 사용되고 있는 오디오 시스템 구조와 UHD 오디오 채널 시스템이 호환되기 위한 구조를 제안한다. 제안된 구조는 두 채널을 공간 오디오 코딩 기법으로 한 채널 오디오 신호화 공간 파라미터를 출력하는 구조를 기반으로 셋 채널을 한 채널로 변환하는 모듈과, 넷 채널을 한 채널로 변환하는 시스템을 설계한다. 이렇게 설계된 변환 모듈을 이용하여, 22.2 채널을 10.2 채널로 변환하기 위한 구조와 10.2 채널을 5.1 채널로 변환하기 위한 다채널 오디오 변환 시스템을 설계한다. 설계된 다채널 오디오 변환 구조를 실험하기 위하여 22.2 채널 오디오를 스테레오와 공간 파라미터로 변환하고, 다시 스테레오와 공간 파라미터를 이용하여 22.2 채널로 복원한 후 해당 채널에 대한 비교를 수행한다. 실험에서 보이는 바와 같이 스테레오와 공간 파라미터로부터 본원 된 경우임에도 불구하고 원음에 매우 유사한 파형의 결과를 얻을 수 있다.
-
본 논문에서는 기존의 채널기반의 오디오 기술에 대해 다양한 서비스가 가능하고, 재생환경에 독립적인 객체기반 실감음향 기술에 대해 논하고자 한다. 현재, 극장 사운드를 중심으로 객체기반 오디오 기술이 적용된 사운드가 점차 확산되고 있으며, 미국, 유럽 등 차세대 방송용 오디오에 객체기반 오디오 기술의 도입을 적극적으로 고려하고 있다. 객체기반 오디오 기술은 콘텐츠의 제작단계에서 재생환경을 고려할 필요가 없고, 현장의 음향을 신호와 3 차원 공간 정보로 구분하여 음향 공간의 정보를 그대로 표현함으로써, 재생환경에서는 3 차원 공간 정보를 활용하여 다양한 3 차원 음향 재생 기술을 활용하여 재생할 수 있다. 이러한 객체기반 실감음향 기술 개발을 위해서는 편리한 제작 및 3 차원 공간 정보 표현 기술이 필요하며, 청취환경에서는 객체기반 실감음향 콘텐츠를 제작자의 의도대로 렌더링할 수 있는 재생 및 제어 기술이 필요하다. 이에 객체기반 실감음향 기술의 기술동향과 객체기반 실감음향 서비스를 위한 콘텐츠 표현/제작 및 재생 기술에 대하여 고찰해 보고자 한다.
-
카메라 캘리브레이션은 다시점 카메라 시스템에서 내부와 외부 인자로 이루어진 카메라 파라미터를 획득하는 과정을 의미 한다. 이는 3차원으로 표현되는 장면과 카메라간의 구조를 다루기 위해 중요하다. 그러나 카메라 캘리브레이션은 사람이 직접 손으로 각 영상에서 사각형의 네 점을 정확히 찍어 주어야 하는 과정 때문에 카메라의 수와 패턴 영상의 수가 늘어남에 따라 상당히 번거로운 작업이 된다. 본 논문에서는 카메라 캘리브레이션 과정에서 손으로 수행하는 작업을 줄이기 위해 자동으로 패턴 특징점을 탐색하는 알고리즘을 제안한다. 제안하는 방법은 먼저 영상에서 패턴 특징점의 후보를 찾기 위해 해리스 코너 검출 방법을 사용한다. 그리고 후보 주변의 원형 샘플 화소를 이용하여 유효한 패턴 특징점을 추출한다. 실험 결과는 Matlab 캘리브레이션 툴박스를 이용하여 획득한 카메라 파라미터와 비교해 보았을 때 큰 차이가 없지만 수작업의 번거로움을 상당히 감소시켰음을 확인하였다.
-
A Comparison of guided image filtering algorithms based disparity enhancement for view interpolation본 논문에서는 영상 보간의 결과 측면에서 깊이를 보정하는 방법 중 하나인 유도 영상 필터링 기법을 비교한다. 실험을 위해 초기 깊이 영상을 두 종류의 유도 영상 필터링 기법으로 개선을 하였다. 초기 깊이 영상과, 각각의 필터링 기법에 의해 개선된 변이 영상을 이용하여 영상 보간을 하였고, 그 결과를 비교하였다. 결과로서 한 시점 영상의 텍스처 정보만을 이용하여 변이를 개선하는 유도 영상 필터링 기법으로 변이 영상을 개선하게 되는 경우에 육안으로는 구분이 갈 정도로 변이가 개선이 되지만, 영상 보간의 측면에서 보았을 때는 크게 차이가 없거나 오히려 품질이 저하되는 경우를 확인할 수 있었다.
-
기존에 H.264를 기본 계층으로 SVC와 MVC를 결합한 스케일러블 다시점 비디오 부호화기를 SVC와 MVC의 DPB를 통합한 통합형 DPB(Decoded Picture Buffer) 설계를 바탕으로 구현하였다. 그러나 구현된 비디오 부호화기로 HD급 이상의 해상도를 갖는 영상을 압축하는데 있어서 효과적인 성능이 나오지 않았다. 이러한 이유로 SHVC와 MV-HEVC의 부호화 구조를 결합하여 고해상도 처리를 위한 스케일러블 다시점 부호화기 설계를 제안한다. 제안된 방법을 통해서 SHVC와 MV-HEVC가 통합된 스케일러블 다시점 비디오 부호화를 효율적으로 구현할 수 있을 것으로 예상한다.
-
디지털 홀로그래픽 TV 시스템을 구현하려면 홀로그래픽 정보 획득 장치가 필요한데, 해상도 한계 때문에 홀로그램의 프린지 패턴을 상용 촬상 소자로는 직접 기록할 수 없다. 이를 극복하는 방법으로는 컬러 영상과 거리영상 정보를 얻은 후에 압축을 거쳐 수신 디스플레이단에 전송하고 이 정보로부터 3차원 모델을 형성한 후에 컴퓨터 생성 홀로그램을 생성하고 이를 회절소자를 이용하여 디스플레이하는 방법이 현재로서는 현실적인 방법이 될 것이다. 홀로그래픽 디스플레이에서는 회절소자인 공간광변조기 성능의 한계 때문에 기존 2DTV와 같은 수준의 디스플레이 구현은 매우 어렵다. 기존 공간광변조기는 픽셀피치가 커서 시야각이 매우 좁으나, 픽셀 크기를 작게 하는 동시에 공간광변조기 면적을 크게 하기에는 기술적인 어려움이 많다. 본 논문에서는 홀로그래픽 TV를 구현하는데 있어서 기술적으로 극복하고 고려해야 할 주요 요소에 대하여 분석한다.
-
컴퓨터 생성 홀로그램(CGH: computer generated hologram) 기법은 기존의 홀로그램의 광학적 장치의 단점을 보완하여 범용 컴퓨터에서 홀로그램을 생성할 수 있도록 하는 기술이다. CGH는 입력으로 주어지는 물체의 3차원 정보와 출력으로 나오는 디지털 홀로그램의 해상도에 따라 그 연산량이 결정 된다. CGH는 단순하고 반복적인 수학적 계산을 통하여 디지털 홀로그램을 생성하게 되는데, 기존의 연구들에서는 GPU(graphic processing unit)를 이용하여 알고리즘들을 병렬적으로 처리한다. 본 논문에서는 기존연구에서 쓰인 GPU를 이용한 CGH을 개선하여 GPU가 장착되지 않은 상용 컴퓨터에서 GPU가 장착된 다른 컴퓨터들의 연산 자원을 활용하여 CGH를 수행 할 수 있는 프로그램의 개발 방법을 제안 한다. 본 시스템은 GPU가 요구되지 않는 한 개의 서버 컴퓨터와 GPU가 장착된 다수의 클라이언트들로 구성되어 있다. 서버 측에서 물체의 3차원 정보를 입력 받아 각각의 클라이언트들에게 적절한 연산량을 분배하고, 각 클라이언트들은 이미 알려진 GPU 기반 CGH를 통하여 연산을 수행 한 뒤, 그 결과를 서버로 다시 전송하게 된다. 서버는 수신한 각 결과들을 누적하여 입력 받은 물체에 대한 하나의 온전한 홀로그램을 생성할 수 있게 된다.
-
Advanced television systems commitee (ATSC) 3.0 은 효율적 주파수 사용을 위하여 여러 개의 방송 스트림을 계층 분할하여 전송하는 layered division multiplexing (LDM) 기술과 연집오류에 의한 성능저하를 방지하기 위하여 시간 인터리버 (time interleaver) 기술을 채택하였다. 본 논문에서는 LDM 기반 시간 인터리버 기술의 각 계층별 성능을 모의실험을 통하여 다양한 채널 환경에서 평가하고 효과를 분석하였다.
-
본 논문에서는 렌티큘러 렌즈를 이용한 무안경 입체 디스플레이 환경에서 렌티큘러 렌즈의 속성과 디스플레이 장치의 속성의 변화에 따라 다중 시점에서 촬영한 영상으로부터 적응적으로 하나의 다시점 입체 합성 영상을 생성하는 방법을 제안한다. 제안 방법에서는 렌티큘러 렌즈의 기본 속성과 디스플레이 장치의 기본 속성값을 고려하여 다중 시점에서 획득된 영상의 서브픽셀들의 가중 평균을 구하고 이를 다시점 입체 합성 영상의 서브 픽셀의 값으로 사용하도록 하였다. 여러 다시점 영상을 이용한 실험을 통하여, 렌티큘러 렌즈의 속성과 디스플레이 장치의 속성이 정확히 하드웨어적으로 일치 하지 않은 상황에서도 본 논문에서 제안하는 적응적 다시점 서브 픽셀 재배치 기법을 통하여 3D 입체감이 안정적으로 제공됨을 확인하였다.
-
본 논문에서는 다시점 깊이영상 기반 3 차원 영상시스템에서 깊이영상의 해상도에 따른 압축성능을 비교 실험한다. 다시점 깊이영상 시스템에서 깊이영상은 중간시점 합성을 위해 사용되며, 깊이영상은 중간영상의 화질에 큰 영향을 미치게 된다. 본 논문에서는 3 차원 영상시스템에서 깊이영상 해상도에 따른 중간영상의 화질변화를 분석하고, dilation filter 로 인한 성능변화를 비교 분석한다.
-
본 논문은 HDR(high dynamic range) 동영상을 기존의 LDR(low dynamic range) 디스플레이 단말에 표현하기 위해 톤 매핑을 수행할 때 발생할 수 있는 프레임간 깜박임 현상(flickering artifact)을 줄이는 방법에 관한 연구이다. HDR 동영상의 톤 매핑 문제에 있어 HDR 정지영상을 대상으로 개발된 많은 톤 매핑 방법을 그대로 적용하는 경우 시간 축 정보가 고려되지 않아서 깜박임 현상이 발생하여, 주관적 화질을 떨어뜨리는 결과를 초래한다. 이러한 프레임간 깜박임 현상을 줄이기 위해, 본 논문에서는 프레임의 평균 밝기 정보를 이용하여 HDR 동영상 통 매핑 과정에서 프레임간의 밝기 일관성이 유지하도록 하는 방법을 제안한다.
-
본 논문에서는 원의 호 곡선에 따라 배치된 다중 RGB 카메라 영상으로 생성한 깊이 지도를 정렬하는 방법을 제안한다. 원의 호 곡선에 따라 배치된 카메라는 각 카메라의 광축이 한 점으로 만나서 수렴하는 형태가 이상적이다. 그러나 카메라 파라미터를 살펴보면 광축이 서로 수렴하지 않는다. 또한 카메라 파라미터는 오차가 존재하고 내부 파라미터도 서로 다르기 때문에 각 카메라 영상들은 수평과 수직 오차가 발생한다. 이와 같은 문제점을 해결하기 위해 첫 번째로 광축이 한 점으로 수렴하기 위해서 카메라 외부 파라미터를 보정하여 깊이 영상 정렬을 하였다. 두 번째로 내부 파라미터를 수정하여 각 깊이 영상들의 수평과 수직 오차를 감소시켰다. 일반적으로 정렬된 깊이 지도를 얻기 위해서는 초기 RGB 카메라 영상으로 정렬을 수행하고 그 결과 영상으로 깊이 영상을 생성한다. 하지만 RGB 영상으로 카메라의 회전과 위치를 보정하여 정렬하면 카메라 위치 변화에 따른 깊이 지도 변화값 적용이 복잡해 진다. 즉 정렬 계산 과정에서 소수점 단위 값이 사라지기에 최종 깊이 지도의 값에 영향을 미친다. 그래서 RGB 영상으로 깊이 지도를 생성하고 그것을 처음 RGB 카메라 파라미터로 워핑(warping)하였다. 그리고 워핑된 깊이 지도 값을 가지고 정렬을 수행하였다.
-
본 논문에서는 인간의 시각 인지 특성 중 하나인 돌출영역(saliency region) 응시 특성을 고려한 LCD 디스플레이의 백라이트 제어 방법을 제안한다. 제안된 방법은 입력 영상의 화소 분포를 분석하고 주된 응시 영역 검출 결과를 가중치 함수로 이용하여 영역별로 분할된 영상의 블록에 대응하는 백라이트를 증폭 혹은 감소시킨다. 소비전력의 증가 없는 백라이트 블록별 증폭 기법 구현을 위하여 백라이트 증폭 총량은 백라이트 감소 총량으로 제한하고 블록 별로 증폭 양 결정을 위하여 MPEG2 TM-5 Rate Control 모델을 도입하여 적응적 백라이트 레벨 결정 방식을 적용하였다. 백라이트 증폭 시뮬레이션 결과를 바탕으로 제안된 방법이 소비전력 증가 없이 인간 시각이 주로 응시하는 돌출 영역의 화질을 개선함을 보였다.
-
본 논문은 HEVC(High Efficiency Video Coding) 기반의 3차원 비디오 부호기에서 깊이 비디오 부호화의 효율 증대를 위한 디블록킹 필터(deblocking filter)를 제안한다. 디블록킹 필터는 블록 왜곡(blocking artifact)을 보정하기 위한 필터인데 원래 색상 영상의 특성에 맞게 설계되어서 비슷한 목적을 지닌 SAO(Sample Adaptive Offset)와 더불어 기존 방법의 깊이 비디오 부호화에서는 사용되지 않는다. 제안 방법은 디블록킹 필터의 사전 실험 통계에 기반하여 기여도가 낮은 normal 필터를 제외시킨다. 또한, 깊이 비디오의 특성을 고려하여 임펄스 응답(impulse response)를 변형하였다. 이 변형된 디블록킹 필터를 깊이 비디오 부호화에만 적용하고 색상 비디오 부호화에는 기존 디블록킹 필터를 사용하였다. 3D-HTM(HEVC Test Model) 13.0 참조 소프트웨어에 구현하여 실험한 결과, 기존 방법에 비해 깊이 비디오 부호화 성능이 5.2% 향상되었다. 색상-깊이 비디오 간 참조가 있기 때문에 변형된 깊이 비디오 부호화가 색상 비디오 부호화 효율에 영향을 끼칠 수도 있지만 실험 결과 색상 비디오 부호화 성능은 유지되었다. 따라서 제안 방법은 성공적으로 깊이 비디오 부호화의 효율을 증대시켰다.
-
대용량 컨텐츠 수요와 공급의 증가에 따라 UHD 비디오의 분석, 색인, 편집 등을 위한 장면전환을 검출하는 방법이 요구되고있다. 따라서, 이전까지 많은 연구자들이 다양한 장면전환 검출 방법을 연구해왔다. 그러나 카메라의 다양한 움직임과 장면의 변화를 정확하게 검출하기는 어렵다. 또한, 4K (
$3820{\times}2160$ ) 해상도 이상의 UHD 비디오들은 데이터 량을 더욱더 증가시키기 때문에 이전의 장면전환 검출 방법은 UHD 비디오 컨텐츠에 적용하기에는 너무 많은 시간이 걸리는 문제점이 발생한다. 본 논문에서는 차세대 고효율 코덱 HEVC의 부호화 부가정보를 이용한 4가지 장면전환 검출 방법을 제안한다. 연산량을 줄이기 위해 프레임 특징에 따른 방법을 각각 제시하며, 실험 결과를 통해 HEVC로 부호화 된 UHD 컨텐츠들의 장면전환 검출 가능성을 확인한다. -
본 논문에서는 MPEG 에서 현재 Type-1 동영상 표준을 위해 연구를 진행하고 있는 인터넷 비디오 코딩(Internet Video Coding, IVC)의 압축 성능에 대한 평가 방법 및 결과를 다룬다. 다년간의 연구로 IVC 의 성능은 매우 개선되어 왔으나, 산업이 원하는 수준에 도달했는지를 검증하기 위해서는 타 동영상 코덱과의 비교 평가 역시 필요하다. 이를 위하여, AVC/H.264 를 기반으로 Type-1 표준화를 진행해온 Web Video Coding(WebVC)의 인코더와 IVC Test Model 10.0 을 압축 성능 관점에서 객관적으로 비교 평가함으로써, IVC 의 부호화 성능의 뛰어남을 보이고자 한다. 또한, 상용화된 AVC/H.264 High Profile 과도 비교함으로써, IVC 의 객관적인 성능을 확인하고자 한다. 특별히, MPEG 내에서 결정한 시각적 비교 조건(Visual comparison condition)에 입각한 목표 비트율 및 양자화 변수 조건에 맞추어 평가한다.
-
본 논문에서는 ATSC3.0 기반 UHD 급 고정/이동방송 융합형 3DTV 서비스 시나리오에 대한 내용을 기술한다. ATSC3.0 은 북미지상파 표준화 방송방식의 차세대 지상파서비스 표준으로 2016 년 까지 기술표준 논의완료를 목표로 물리계층, 전송프로토콜계층 및 4K-UHD 서비스를 포함한 응용서비스계층으로 분류하여 표준화 논의 중에 있다. 본 논문에서는 스테레오 스코픽 콘텐츠의 좌/우영상을 각각 고정 TV 채널 및 모바일 TV 채널로 나누어 전송하고 이를 융합형 3DTV 방식을 지원하는 수신기에서 동시에 좌/우영상 신호를 수신하여 3D 영상을 합성하는 방법으로 지상파 DTV 한 채널(6MHz 대역)내에서의 4K-UHD 고정 TV 서비스, 모바일 HD 서비스 및 UHD 3D 서비스를 동시에 제공할 수 있는 고정/이동방송 융합형 3DTV 서비스 방법을 제시한다. 따라서 본 논문에서 제안하는 융합형 3DTV 서비스는 추가적인 3D 부가정보를 전송하지 않고 4K-UHD, 모바일 HD 및 UHD 3D 서비스를 시청자에게 제공 가능하다.
-
현 3D 실험방송은 좌 영상과 우 영상의 듀얼 스트림을 전송하는 서비스 호환 3D서비스를 제공하고 있다. 이와 같은 방식은 지상파를 이용해 전송되므로 제한된 대역폭에 따른 화질의 저하가 불가피한 것으로 여겨진다. 이에 본 논문에서는 상기 두 영상을 각각 기존의 지상파와 IP망으로 전송하여 화질의 열화 없이 안정적인 화질을 제공할 수 있는 MMT와 MPEG2-TS 융합형 Hybrid 3D 방송 시스템을 제안하였다. 제안한 시스템은 기존의 지상파를 통해 주영상을 MMT의 GFD mode를 이용하여 보조영상을 전송하여 두 영상의 동기화를 통해 고화질 스테레오스코픽 영상을 구성한다. 이를 위해 본 논문에서는 MPEG2-TS와 MMT의 GFD mode의 파일 구성을 각각 분석하고, 실험결과를 통해 제안한 MMT와 MPEG2-TS 융합형 Hybrid 3D 방송 시스템을 검증하였다.
-
2014 년 4 월 TTA 에서 개정된 " HTML5 기반 스마트 TV 플랫폼(TTAK.KO-07.0111/R1)" 은 적응형 스트리밍 서비스를 지원하기 위한 기술로 MPEG-DASH 표준을 준용하고 이를 기반으로 추가적인 기술 요구사항을 정의하고 있다. 또한, 이러한 기술 요구 사항에 대한 적합성 시험을 위하여 " HTML5 기반 스마트 TV 플랫폼 수신기 적합성 시험(TTAK.KO-07.0119/R1)" 표준에 적응형 스트리밍 기술 요구 사항 관련한 시험 기준, 수행 절차, 판정 기준 등이 추가되었다. 이에 TTA 에서는 " HTML5 기반 스마트 TV 플랫폼" 표준을 준수하여 개발된 스마트 TV 의 적응형 스트리밍 기술 요구 사항에 대한 표준적합성을 검증할 수 있는 시험환경을 구축하였다. 본 논문에서는 TTA 에서 구현한 적응형 스트리밍 적합성 시험환경에 대해 소개한다.
-
세계적인 디지털 방송 전환과 더불어 방송 기술의 비약적인 발전은 HD(High Definition) 방송 시대를 넘어 UHD(Ultra High Definition) 방송 시대를 개막하였으며, UHD를 비롯한 다양한 차세대 방송 기술들이 개발되고 있다. 이러한 변화에 따라 차세대 방송 기술의 선점을 위한 유럽의 DVB 2.0, 미국의 ATSC 3.0, 일본의 ISDB-Tmm과 같은 최신의 방송 표준이 제정되 거나 제정을 준비하고 있다. 국내의 차세대 방송 원천 기술에 대한 연구 개발이 어느 때보다도 시급한 상황이다. 본 논문은 방송 통신 융합환경 하에서 초고화질 콘텐츠를 전송할 수 있도록 하는 차세대 융합방송 프로젝트의 일환으로 유럽의 차세대 디지털 방송 시스템에 적용된 MPLP 기법을 분석하고, 해당 기법을 적용하여 지상파 방송망을 통해서 HD 및 4K UHD 서비스를 다중화하여 변조시스템에 전송하는 다중화 시스템의 구조를 제안한다.
-
FSC(Field Sequential Color) LCD has high efficiency, high brightness and color saturation due to 3 times aperture larger than conventional LCD. However it is well known that color break-up (CBU) and color interference are hot issue need to be solved. We propose a novel sequential driving method with edge-lit light guide composed of
$16{\times}15$ blocks to reduce CBU and color interference. The experimental results show not only suppression of CBU but also the side effects are minimized. -
객체의 인식을 위한 컴퓨터 비전 알고리즘은 안개와 비와 같은 기상이 좋지 않은 상황에서는 인식 성능이 떨어지고 있다. 이로 인하여 최근 악천후 환경에서 촬영된 영상으로부터 날씨 현상을 제거하는 기법들이 연구되고 있다. 빗줄기는 시공간적 무작위성으로 인하여 검출 및 제거가 어려운 현상이다. 또한 기존의 빗줄기 검출 및 제거 기법들은 대부분 고정된 카메라로부터 촬영된 영상을 대상으로 처리함으로써 자동차와 같은 움직임이 있는 촬영환경에서는 부적합하다. 최근에는 카메라나 객체의 움직임에 대응할 수 있는 빗줄기 검출 및 제거 알고리즘이 개발되고 있으나, 방대한 연산량이 필요하기 때문에 실시간이 불가능하다. 본 논문에서는 최근 연구되고 있는 카메라 움직임이 있는 환경에서 빗줄기 검출 및 제거 알고리즘을 DSP 환경에서 구현하고 내부 메모리 최적화와 EMDA 이용, 소프트웨어 파이프라인 등을 통해 최적화를 수행하여 실시간성을 보인다.
-
조건부 대체 알고리듬은 양안식 3DTV의 기준/부가 영상을 각각 고정/이동 수신기를 통해 전송하는 방식인 융합형 3DTV의 화질을 개선시키기 위한 방법이다. 기존 조건부 대체 알고리듬은 HD급 해상도를 갖는 융합형 3DTV의 화질개선에 대한 성능을 보여 왔으나, UHD급 서비스에 대한 관심이 높아짐에 따라 UHD급 융합형 3DTV에 대한 조건부 대체 알고리듬의 성능을 확인할 필요가 있다. 본 논문에서는 UHD급 해상도를 갖는 융합형 3DTV에 조건부 대체 알고리듬을 적용하여 적절한 화질 개선이 이루어지는 지에 대한 가능성을 확인하고자 한다.
-
본 논문은 human visual system(HVS)에 따른 주파수 민감도와 공간에서 다양한 특성들을 구현하기 위한 신호처리 방법을 개발하였다. 인간의 눈은 주파수 성분에 따라 민감도가 다르며 초점에서 멀수록 인지 가능한 해상도가 떨어진다. 주파수 민감도를 구현하기 위해서 본 논문은 영상 신호의 에너지 스펙트럼 모양이 contrast sensitivity function(CSF)의 모양이 되도록 하여 영상 신호의 에너지를 증가시켰으며 신호 방향에 적응적인 multiband energy scaling 방법을 개발하였다. 기존의 시스템에서 능률만을 향상시키는 기존의 분석 모델과 비교하면 개발한 방법은 HVS에 좀 더 적절하고 선호되게 영상 신호를 처리할 수 있다.
-
영상을 취득한 후 다양한 응용프로그램으로 확장이 가능한 4 차원 light field 영상은 일반적인 2 차원 공간 (spatial) 영역과 추가적인 2 차원 각 (angular) 영역으로 구성된다. 그러나 이러한 4 차원 light field 영상을 2 차원 CMOS 센서로 취득하므로 이에 따른 해상도 제약이 존재한다. 본 논문에서는 이러한 4 차원 light field 영상이 가지는 해상도 제약 조건을 해결하기 위하여, 4 차원 light field 영상에 적합한 학습 기반 (learning-based) 초해상도 (superresolution) 알고리즘을 제안한다. 제안하는 알고리즘은 공간영역 해상도 그리고 각영역의 해상도를 각각 2 배 향상시킨다. 실험에 사용되는 영상은 상용 light field 카메라인 Lytro 에서 취득하며, 기존의 선형 보간 기법인 bicubic 기법과의 비교를 통해 제안하는 기법의 우수성을 검증한다.
-
동영상 부호화에서 중요하고 매우 높은 비중을 차지하는 화면 간 예측에서는 휘도와 색차 성분에서 다양한 tap의 보간 필터를 사용한다. 본 논문에서는, 현재 표준인 HEVC(High Efficiency Video Coding)에서 쓰이는 보간 필터인 DCT-IF(Discrete Cosine Transform-based Interpolation FIlter)에 알아보고 tap 수에 따른 성능을 분석한다.
-
본 연구는 제한된 특정 환경 내에서 실시간으로 로봇이 장애물을 감지하고 충돌 없이 목적지에 도달 할 수 있도록 하는 것을 목표로 한다. CCTV를 이용하여, 로봇과 내비게이션 서버만으로는 해결 할 수 없는 장애물을 실시간으로 감지할 수 있도록, 내비게이션 서버와 로봇 간에 통신을 최적화하기 위한 알고리즘을 개발하였다. 또한 내비게이션 서버는 어떤 로봇이 불특정 그리드에 먼저 도착해야 하는 지에 대한 데이터와 로봇의 상태를 나타내는 데이터, CCTV와의 상호작용을 통한 장애물 정보를 나타내는 장애물 맵을 유지함으로써 알고리즘의 완성도를 높였다. 이 연구는 제한된 특정 영역과 로봇의 최적화 배치 개수를 구하여 실제, 다양한 영역에서 사용할 수 있도록 구현하는 것을 목표로 한다.
-
RFID란, 무선 주파수를 이용해 원거리에서 태그의 정보를 판독하거나 인식할 수 있는 객체 인식 기술 중 하나이다. 최근 바코드를 대체하여 RFID 기술을 이용하는 산업이 물류, 유통, 환경, 보안 등 다양한 분야에 걸쳐 전 세계적으로 성장세를 보이고 있는 추세이다. 특히 RFID 기술 중 위치 탐지 및 측정 기술을 이용한 사례가 많다. 본 연구에서도 이러한 기술을 이용하여 공항이나 쇼핑몰 등과 같은 넓고 개방된 공간에서 객체들을 추적하는 시스템을 구현하고자한다. 모든 객체들이 RFID를 가지고 있는 환경에서 Cluster와 센서 네트워크를 이용해 RFID를 감지하면 RFID의 데이터를 서버에 전송하고 서버는 이 데이터들을 분석하여 객체의 위치 및 동선을 추적한다. 객체 추적을 함으로써 정확하고 신뢰성이 있는 데이터를 얻는 것을 본 연구의 목적으로 한다.
-
본 논문에서는 알 수 없는 주파수의 정현파외란(sinusoidal disturbance)을 가지는 선형시불변(linear time-invariant) 시스템에 대해 그 외란의 주파수 추정과 억제를 목표로 하는 알고리즘을 설계한다. 제시된 알고리즘은 주파수 추정을 위한 적응관측기(adaptive observer)와 외란 제거를 위한 출력조정기(output regulator)로 구성된다. 기존에 연구에 비하여 모델불확실성에 대한 강인성은 유지하면서 제어기의 초기값(initial value) 설정에 의존하지 않는 안정도 및 성능을 가진다. 제안된 알고리즘은 외란의 주파수를 완벽하게 추정하며, 그 정보를 바탕으로 외란 제거 성능을 보장할 수 있다. 또한, 실제 광디스크 시스템(optical disc drive systems)에 대한 시뮬레이션을 통하여 그 효과를 보여준다.
-
국내 자영업자의 수는 매년 증가하고 있으나 판로나 홍보 부족으로 인해 폐업하는 자영업자의 수가 급격하게 증가하고 있다. 대형 FC는 별도의 마케팅을 지원하는 조직을 보유하고 있어 홍보나 판촉에 용이하지만 개인 소상공인들은 주로 전통적인 광고수단인 전단이나 판촉물을 통해 홍보함에 따라 수익 창출에 어려움이 있다. 최근 고속 네트워크 발전과 다양한 고성능 스마트 단말의 보급으로 홍보할 수 있는 매체와 채널이 다양화되고 있다. 그러나 소상공인들은 이러한 환경을 적극적으로 이용할 수 없는 상황이다. 따라서 IT 활용 능력을 통해 소상공인이 손쉽게 이용하기 위한 경쟁력 있는 다차원 홍보물을 활용한 소상공인 점포지원 서비스가 필요하다. 본 연구 과제에서는 다차원 홍보물을 활용한 소상공인 점포지원 서비스 시스템 및 UI 개발을 수행한다. 이를 통해 고객의 점포 재방문율을 향상시켜 소상공인들의 이익 창출을 증대할 수 있다. 본 연구에서는 다차원 홍보물을 활용한 소상공인 점포지원 서비스 시스템 및 UI 개발을 위해 소상공인 점포들이 이용 가능한 서비스 시나리오 개발, 고객 정보 관리 기능 개발, 다양한 형태의 메시지 전송 기술 개발과 시험 테스트를 수행한다. 본 용역 과제는 (1) 다차원 홍보물을 활용하여 고객 재방문율을 향상하는 서비스 시나리오 개발, (2) 고객 정보 관리 기능 개발, (3) SMS, MMS, 애플리케이션 등을 이용한 다양한 형태의 메시지 전송 기술 개발, (4) 고객 정보 관리와 다차원 홍보물 전송이 수행 가능한 형태의 UI 개발, (5) 소상공인 점포지원 서비스 시스템 프로토타입 개발 부분으로 구분하여 진행되었다.
-
최근 지능형 차량과 ADAS(Advanced Driver Assistance System) 개발에 있어 차량 영상을 이용한 도로 정보 분석이 중요한 화두로 떠오르고 있다. 다양한 도로 정보 중에서 도로표지판 검출 및 판단은 차량 운행 환경을 파악할 수 있는 중요한 과정이 될 수 있다. 이에 본 논문에서는 차량 영상에서의 색상 정보를 이용하여 표지판의 후보 영역을 추출(Candidate Generation)하고, 후보 영상에 대한 HOG(Histogram of Gradient) 특징 분석을 통해 도로표지판 여부와 그 종류를 판단(Object Classification)하는 알고리즘을 구현하였다. 또한 구현 알고리즘은 실시간 처리가 가능한 속도를 보여주어 지능형 차량 또는 ADAS에서의 실제 적용이 가능하도록 하였다.
-
The automatic traffic sign detection and recognition has been one of the highly researched and an important component of advanced driver assistance systems (ADAS). They are designed especially to warn the drivers of imminent dangers such as sharp curves, under construction zone, etc. This paper presents a traffic sign recognition (TSR) system using morphological operations and multiple descriptors. The TSR system is realized in three stages: segmentation, shape classification and recognition stage. The system is designed to attain maximum accuracy at the segmentation stage with the inclusion of morphological operations and boost the computation time at the shape classification stage using MB-LBP descriptor. The proposed system is tested on the German traffic sign recognition benchmark (GTSRB) and on Korean traffic sign dataset.
-
컴퓨터 비전이나 감시영상 시스템에서 유동인구 수 측정은 보안 및 경제적 측면에서 중요한 과제이다. 본 논문에서는 RGB센서와 Depth센서를 이용해서 유동 인체를 식별하고 추적하며, 유동인구 수를 측정하는 방법을 제안한다. 제안된 방법은 받아온 영상에서 유동인체를 검출하고, 검출된 인체를 추적한다. 추적된 정보는 이동방향 인식을 하기 위해 사용된다. 중첩에 대한 문제를 해결하기 위해 Merge&Separate 방법과 Kinect Merge&Separate방법을 제안한다. 검출된 유동인체에 대한 정보는 다양한 변수들로 저장된다. 또한 RGB센서와 Depth센서의 장단점을 상호 보완할 수 있는 인체 매칭 시스템을 제안한다. 본 논문의 실험은 자체적으로 제작한 영상을 사용하여 실험을 진행하였다. 실험을 통하여 제안된 유동인구 수 측정 시스템이 유동인구 검출률을 향상시킬 수 있음을 보여준다.
-
본 논문에서는 FRUC(Frame Rate Up-Conversion)을 위한 효과적인 관심영역 분리 방법을 제안한다. 기존의 알고리듬은 움직임 벡터를 이용하여 관심영역을 지정하고 이를 기반으로 추가적인 재탐색이 요구되며 경우에 따라 잘못 예측된 움직임 벡터가 사용됨으로 인해 관심영역에 대한 신뢰성이 낮다. 본 논문에서는 이전과 다음 영상과의 시간적 연관성을 이용하여 이 두 영상간의 상관관계에 따라 효과적으로 신뢰영역 및 관심영역을 분리한다. 본 논문에서는 기존에 제안되었던 알고리듬으로 생성된 보조 영상과 원본 영상과의 차이에 대해 제안한 관심영역 분리 방법을 적용하여 그 결과를 비교하고, 성능 척도로서 객관적 화질을 비교한다. 실험 결과를 통해 기존에 제시된 다수의 알고리듬 보다 비교적 간단한 방법을 통해 효과적으로 관심 영역을 분리하고 또한, 성능이 크게 향상될 수 있음을 보인다.
-
A Novel Single Lens 3D Endoscope and Endoscopic View Controller for Immersive Robotic Surgery System본 논문은 자유 시점조절과 깊이감 조절이 가능한 단일렌즈 양안시 3D 내시경과 Head-mounted display 를 사용한 새로운 로봇수술 시스템을 제안한다. 최근 들어서 여러 양안식 입체영상장치가 의료 영역에 적용되고 있다. 그러나 3D 의료 장비들은 zooming 과 자유로운 시점조절, 그리고 접사를 하는 데에 한계가 존재한다. 입체영상 장비에서 필연적으로 발생하는 이러한 문제점들은 3D 영화를 찍기 위해서 사용되는 것과 같은 2 대의 카메라와 2 개의 렌즈를 사용하는 데에서 원인을 찾을 수 있다. 이러한 문제점들은 Da Vinci 로봇 수술 시스템과 같은 가장 최신의 시스템에서도 해결되지 못하였다. 본 논문에서 제안하는 새로운 시스템은 지금까지 제시된 문제점들을 해결하고, 현재 존재하는 로봇 수술 시스템에 몰입 입체영상 수술이나 증강 현실 수술을 가능하게 하기 위한 목적으로 제안되었다.
-
2014 년 4 월 TTA 에서 개정된 "HTML5 기반 스마트 TV 플랫폼(TTAK.KO-07.0111/R1)" 표준의 멀티스크린 서비스는 UNnP, mDNS 등의 ZeroConf 네트워크 기술을 기반으로 스마트 TV 수신기가 스마트 폰이나 태블릿과 같은 다양한 컴패니언 디바이스를 발견하고 서로 연결하여 디바이스 간 연동 서비스를 구현할 수 있는 기술을 정의하고 있다. 또한, 이 멀티스크린 기술을 활용하여 개발된 서비스(앱)가 표준을 준수하는 다양한 수신기에서 동일한 사용자 경험(UX)으로 실행되기 위해서는 수신기가 멀티스크린 기술 요구 사항을 준수하여 구현되었는지를 검증하는 적합성 시험이 반드시 필요하다. 본 논문에서는 이러한 적합성 시험을 위한 시험 기준과 수행절차, 판정 기준 등을 정의하고 있는 " HTML5 기반 스마트 TV 플랫폼 수신기 적합성 시험(TTAK.KO-07.0119/R1)" 표준에 멀티스크린 시험을 위하여 추가된 시험 항목과 이를 실제로 실행하여 수신기를 검증하기 위하여 개발된 테스트케이스를 소개한다. 아울러, 컴패니언 디바이스에서 실행되면서 수신기의 테스트케이스와 연동하여 수신기 기능을 검증하는 데 활용하는 모바일 테스트 프레임워크와 이를 기반으로 하는 모바일 테스트케이스의 구현을 설명한다. 아울러, 본 논문에서는 TTA 에 구축된 멀티스크린 시험 환경에서 표준 기반 참조 수신기를 대상으로 멀티스크린 시험을 수행한 사례를 통해 시험환경의 유효성을 확인하고 향후 개선 방향을 제시한다.
-
웹 서비스에 주로 적용되어 왔던 OAuth 2.0 사용자 인증 기법을 이벤트 기반 IoT 디바이스 데이터 통신 처리에 이용할 수 있도록 확장한다. OAuth 2.0 사용자 인증 기법은 최소화된 인증 절차에 맞추어져 있지만, 이벤트 기반의 IoT 디바이스의 데이터를 응용하기에는 적합하지 않은 실정이다. OAuth 2.0 사용자 인증 기법을 이용하여 이벤트 기반의 IoT 디바이스 데이터 통신으로 동작하기 위한 구성방법, Data Format, 그리고 전송 구조를 제안한다.
-
안개 제거 알고리즘은 single image에서 대기값(Airlight)와 대기의 빛 전달량(Transmission)을 추정하여 안개로 인한 빛의 산란에 의해 생긴 Contrast 감소 및 채도의 왜곡과 같은 영상 왜곡을 보정해줌으로써 안개 영상에서 안개를 효과적으로 제거해준다. 하지만 기존의 안개 제거 알고리즘은 안개 영상에 특화되었기 때문에 안개가 없는 영상에 알고리즘을 시행 할 경우 색상과 명암에 왜곡을 불러 일으킬 수 있다. 이에 따라 알고리즘을 수행하기 앞서 안개 량을 측정하고 그 결과에 따라 안개 제거 알고리즘에 제거 정도 가중치나 알고리즘 수행 여부를 판단할 필요가 있다. 본 논문은 기존 안개 제거 알고리즘들이 영상의 patch를 사용하여 빛 전달량(Transmission)을 추정한다는 것을 이용하여 빛 전달량을 구함과 동시에 안개 량을 판단하는 알고리즘을 개발하였다. 안개량을 측정하기 위해 각 patch의 pixel 분포 특성과 patch의 빛 전달량(Transmission)을 구하기 위한 특정 값과 실제 pixel의 명암(Intensity)을 비교하여 안개 량을 측정한다.
-
지역적으로 영상의 대비를 개선하는 알고리즘은 X-ray 영상에서 효과적인 대비 개선의 결과를 얻을 수 있는 방법이다. 그러나 일반영상과는 다른 X-ray 영상의 특성으로 과도한 개선과 인접한 지역간의 특성이 비슷하지 않은 경우가 있기 때문에 부자연스러운 결과를 발생시킨다. 본 논문은 위와 같은 문제들을 해결하기 위해 비 중첩 서브블록 기반 영상 대비 개선 알고리즘으로 각 서브블록당 대비 개선 적용 방법과 블록화 현상 제거 방법을 제안한다. 제안 대비 개선 방법은 적절한 대비 개선과 빠른 연산 결과를 보이며, 블록화 제거 방법은 자연스러운 최종 결과를 얻는다.
-
일반 영상의 화질을 개선하기 위해 다양한 알고리즘이 존재한다. 하지만 X-ray 영상의 경우 일반 영상과 특성이 다르기 때문에 기존의 화질 개선 알고리즘으로는 진단에 적합한 화질을 얻을 수 없다. 디지털 X-ray 기기로부터 처음 획득된 X-ray 영상은 데이터 범위가 일반 영상에 비해 넓고 밝기 레벨이 고르지 못하다. 특히 Chest X-ray 영상의 경우 다양한 이유로 촬영하기 때문에 갈비뼈와 혈관, 척추 뼈 등 특성이 다른 모든 부위들을 자연스럽게 개선할 필요가 있다. 본 논문은 영상의 불필요한 배경 성분을 제거하여 특정 밝기에 밀집되어 있는 데이터들의 히스토그램 범위를 확장시키고 주파수 대역 별 가중치를 조절하여 대비 및 선명도를 향상시킨다. 마지막으로 전역적 대비 개선 기법과 지역적 대비 개선 기법의 장점을 취하여 진단에 적합하도록 개선된 Chest X-ray 영상을 얻는다.
-
본 논문은 카메라 촬영 시 손 떨림 등에 의해 생기는 불균일한 블러 현상에 대해 영상 IMU 센서와 노출시간이 긴 영상과 짧은 영상 쌍을 이용한 디블러 알고리즘을 제안한다. 먼저 IMU 센서로부터 얻어진 gyro 데이터로 초기 커널을 추정한다. 그런 다음 노출시간이 다른 영상 쌍에 Lucas-Kanade 기법을 적용하여 상기 추정된 초기 커널을 개선한다. 이렇게 구해진 커널에 기반하여 residual deconvolution 을 수행 디블러 영상을 생성한다. 실험 결과로부터 제안 알고리즘이 기존 기법에 비해 우수한 성능을 보임을 알 수 있다.
-
본 논문에서는 차량에 설치된 스테레오 카메라를 이용하여 객체 후보를 검출하는 기법을 제안한다. 단일 카메라를 이용하면 색상 정보만을 획득할 수 있지만 스테레오 카메라를 이용하면 추가적으로 깊이 영상(depth image)을 획득할 수 있다. 깊이 정보를 이용하면 카메라의 주변 환경을 재구성 할 수 있으며, 객체 후보 검출의 성능을 향상 시킬 수 있다. 스테레오 매칭(Stereo matching)을 통해 획득한 깊이 영상을 열 단위 분석을 통해 객체로 판단되는 영역을 검출한다. 검출한 영역 경계 부근의 오류를 줄이기 위해 밝기 차를 분석한다. 실험을 통해 제안하는 시스템이 효과적으로 객체 후보를 검출하는 것을 확인하였다.
-
본 논문은 실내 공간을 촬영한 다수의 텍스쳐 영상이 존재 할 때, 영상혼합을 통해 실내 공간 표현의 품질을 향상시키는 기법을 제안한다. 우선 실내 공간을 메쉬로 표현하기 위해 건물 구조에 대응하는 평면을 포인트 클라우드로부터 추출하여 대응하는 메쉬를 생성한다. 메쉬의 각 면에 대해 좌표계 변환을 통하여 사영 가능한 텍스쳐 영상들을 판별한다. 판별된 텍스쳐 영상들에 대해 거리와 방향요소를 고려하여 영상혼합 가중치를 결정한 뒤, 가중치에 따라 영상을 혼합하여 최종적인 텍스쳐로 이용한다. 실험 결과는 제안하는 방법이 더 좋은 화질로 실내공간을 표현함을 보여준다.
-
HEVC(High Efficiency Video Coding)는 JCT-VC(Joint Collaborative Team on Video Coding)라는 ITU-T(VCEG)와 ISO-IEC(MPEG)가 공동으로 진행한 팀이 만들어낸 표준화이다. 이 표준화된 코덱에서 율-왜곡 최적화(RDO)는 실행함에 있어 높은 성능 향상을 보이지만 상대적으로 많은 부호화 시간이 요구된다. RDO 의 부호화 시간을 줄이기 위해서 이 논문에서는 변환 계수를 이용한 고속 인트라 예측 방법을 제안한다. 기존 HEVC 에서는 RMD(Rough Mode Decision)를 통해 상위 N 개의 후보를 구하고 MPM(Most Probable Mode)을 거쳐 나온 후보들의 수의 합을 가지고 RDO 를 구하게 된다. 여기서 제안하는 고속 인트라 예측 방법은 RDO 를 구하기 전에 나왔던 N 개의 후보에서 이산 여현 변환(DCT) 계수를 이용하여 예측 모드의 수를 한 번 더 줄임으로써 RDO 수행시간을 줄이는 방법이다. 이 방법은 기존 HEVC 부호화 방법보다 적은 손실에도 불구하고 높은 속도 향상을 보인다.
-
HEVC의 화면 내 예측에서는 35가지의 화면 내 예측 모드 중 최적의 모드를 결정하기 위한 다양한 과정이 있다. 이러한 과정 속에서 특히나 많은 비중을 차지하는 부분이 바로 RQT 과정이다. RQT 과정을 거치기 전에 35가지의 모드 중, RMD 과정을 거쳐 RQT 과정을 거칠 RD 후보 모드 군을 결정한다. RQT 과정은 각 모드 별로 RD-cost를 구하여 최적 모드가 결정되기 때문에, 많은 복잡성이 요구 된다. 본 논문에서는 최소한의 화질 열화와 함께 인코더의 빠른 부호화를 위하여 RQT 과정을 거치게 될 RD 후보들의 수를 PU 주변의 화면 내 예측 모드 정보를 이용하여 현재 PU의 방향성을 어느 정도 예측 하여 보다 빠르고 효율적인 화면 내 예측 방법을 제안한다. 실험 결과에서
${\Delta}BD$ -PSNR은 최대 0.059dB 정도의 손실만을 유지하면서, 인코더 복잡성은 최대 7.63%까지 빨라짐을 확인 하였다. -
본 논문은 AVX2 (Advanced Vector eXtension 2) 명령어 집합을 이용하여 HEVC (High Efficiency Video Coding) 복호화기의 역-변환 모듈을 고속화하는 방법을 제안한다. AVX2 명령어 집합은 256 비트 레지스터를 사용하여 다수의 데이터를 한번의 명령을 통해 병렬적으로 연산할 수 있으며 반복적인 산술 연산 혹은 논리 연산 구조에서 효율적이다. 제안하는 방법은 AVX2 명령어 집합을 이용하여
$8{\times}8{\sim}32{\times}32$ 크기의 TU (Transform Unit) 단위로 수행되는 역-변환 연산을 행렬의 곱 형태로 연산하여 고속화하였다. 실험 결과 AVX2 명령어 집합을 이용한 역-변환 연산은 Chen 알고리즘에 비해 평균 51% 속도 향상을 보였으며 SSE (Streaming SIMD Extension) 명령어 집합을 이용한 연산에 비해 평균 20%의 속도 향상 결과를 얻을 수 있었다. -
MPEG 의 Royalty-Free 비디오 코덱의 하나로 표준화 중인 IVC(Internet Video Coding)에서는 화면내(intra) 예측부호화에서 부호화 이득을 위하여
$4{\times}4$ 블록 예측 및$4{\times}4$ 블록 변환을 포함하고 있다. 반면, 화면간(inter) 예측부호화에서는$16{\times}16$ 블록에서 최소$8{\times}8$ 블록까지의 가변크기 블록에 대한 예측만 가능하다. 보다 복잡한 영상의 경우 보다 작은 블록에 대한 화면간 예측을 통하여 부호화의 성능 개선을 개선할 수 있다. 본 논문에서는 기존의 화면간 예측의 블록 크기를$4{\times}4$ 블록까지 확장하여 화면간 예측부호화 성능을 개선한다. 실험결과 제안기법은 기존의 ITM 12.0 대비 다양한 테스트 시퀀스의 휘도성분에서 평균적으로 비트율 절감의 이득은 없으나 대부분의 클래스에서 성능개선을 보였고 추가적인 최적화가 필요함을 확인하였다. -
움직임 보상 기반 프레임율 변환(Frame rate up-conversion based on motion compensation )에서 발생하는 블로킹 현상(Blocking artifact)을 줄여 영상의 화질을 높이기 위한 디블로킹 필터(De-blocking filter) 방법을 제안한다. 이 방법은 블록 단위로 동작하는 움직임 보상 과정에서 주변 블록과의 움직임이 급격히 달라지는 폐색영역에서 발생하는 블로킹 현상을 크게 줄일 수 있다. 제안하는 방법은 기존의 필터링을 하지 않는 방법보다 화질이 약 0.01db 향상하였다.
-
동영상 부호화 표준, HEVC(High Efficiency Video Coding)는 부호화 성능을 극대화하기 위해 총 35 개의 화면내 예측 모드를 사용한다. 화면내 예측 모드는 각도를 가진 모드와 각도가 없는 모드로 구성된다. 부호화 성능을 높이기 위해 사용한 다수의 화면내 예측 모드 방법은 HEVC 부호화기의 복잡도를 증대 시키는데 큰 역할을 하게 된다. 본 논문은 총 35 개의 화면내 예측 모드 중 현재 블록의 주변 블록 정보로부터 얻을 수 있는 예측 모드들 및 각도를 대표하는 예측 모드들을 선별적으로 추려서 후보 예측 모드를 결정하고, 평가 과정을 거쳐 해당 후보 모드 중에서 최종 화면내 예측 모드를 결정한다. 본 제안 방법은 35 개의 전체 화면내 예측 모드 중 소수의 후보 모드만을 평가함으로써 HEVC 표준의 화면내 예측 및 부호화 과정의 복잡도를 감소시키려 한다. 제안 방법을 다양한 테스트 시퀀스에 적용한 결과, 35 개 화면내 예측 모드를 전부 사용한 경우와 비교하여 1.1%의 BD-rates 이 증가하면서 18.7%의 부호화기 복잡도를 감소시킬 수 있었다.