한국방송∙미디어공학회:학술대회논문집 (Proceedings of the Korean Society of Broadcast Engineers Conference) (Proceedings of the Korean Society of Broadcast Engineers Conference)
한국방송∙미디어공학회 (The Korean Institute of Broadcast and Media Engineers)
- 반년간
과학기술표준분류
- 미디어/커뮤니케이션/문헌정보 > 미디어/수용자
한국방송공학회 2011년도 추계학술대회
-
본 논문에서는 UHDTV에 관련된 최근 기술 및 서비스 개발 동향을 조사하고 바람직한 기술 개발 및 서비스 도입을 위해 필수적인 고려 사항들을 분석하고 개발 방향을 제시하고자 하였다. UHDTV 분야에서 앞선 해외 사례를 소개하고, 이를 토대로 지향해야 할 기술요소들을 선정하여 개발 방향을 제시하였다. 또한 글로벌 미디어 시장에서 차세대 방송 서비스를 주도하기 위해 선결되어야 할 주요 정책적 과제를 제안하였다.
-
본 논문에서는 비대칭적 화질을 갖는 스테레오 3DTV 시스템에서 좌우 두 영상의 화질차이가 합성한 스테레오 3D 영상의 주관적 화질을 떨어뜨릴 정도로 현저한 경우, 이 화질 차이를 보상하기 위하여 조건부 대체를 포함한 양안시차 맵을 이용하는 방법을 제안한다. PSNR값 비교를 통하여 화질 개선 정도를 보았고 0.37~18dB 정도의 PSNR 개선을 확인하였다.
-
본 논문에서는 비대칭적 화질을 갖는 양안식 3DTV 시스템에서 좌우영상간의 화질차이가 크게 발생하는 경우, 열화된 우영상의 화질을 보상하기위한 부가정보로 양안시차 벡터맵을 사용하는데, 이때 넓은 대역폭을 갖는 부가정보를 효율적으로 부호화하여 전송하기위한 방법을 제안한다. 공간적인 중복성을 피하기 위해 쿼드트리 분해방식을 적용하였고, 양안시차 벡터의 시간적 중복성을 고려하여 부호화 효율을 높였다. 제안된 압축 알고리듬인 가변블록 부호화 방안을 적용한 복원영상은 비슷한 전송률을 갖는 고정블록 복원영상에 비해 개선된 PSNR을 가짐을 실험을 통해 확인하였다.
-
3D 콘텐츠를 획득하는 여러 가지 방법 중 2D-plus-Depth 구조는 다시점 영상을 얻을 수 있는 장점 때문에 최근 이에 관한 연구가 활발히 진행되고 있다. 이 구조를 통해서 고품질의 3D영상을 얻기 위해서는 무엇보다 고품질의 깊이 영상을 구현하는 것이 중요하다. 깊이 영상을 얻기 위해서 Time-of-Flight(ToF)방식의 깊이 센서가 활용되고 있는데 이 깊이 센서는 실시간으로 깊이 정보를 획득할 수 있지만 낮은 해상도와 노이즈가 발생한다는 단점이 있다. 따라서 깊이 영상의 특성을 보존하는 상환 변환을 하여야지만 고품질의 3D 콘텐츠를 제작할 수 있다. 주로 깊이 영상의 해상도를 높이기 위해서 Joint Bilateral Upsampling(JBU) 방식이 사용되고 있다. 하지만 이 방식은 4배 이상의 고 해상도 깊이 영상을 획득하는 데에는 적합하지 않다. 따라서 고해상도의 깊이 영상을 얻기 위해서 보간법을 수행하여 가이드 영상을 만든 후 Bilateral Filtering(BF)을 처리함으로써 영상의 품질을 향상시킨다. 본 논문에서는 2D-plus-Depth 구조에서 얻은 컬러 영상과 깊이 영상을 결합한 보간법을 통해서 깊이 영상의 특성을 살린 가이드 영상을 구현하는 방법을 제안한다. 실험 결과는 제안 방법이 기존 보간법보다 경계 영역 및 평활한 영역에서 깊이 영상의 특성을 잘 보존하는 것을 보여준다.
-
최근 적외선 영상 정보를 사용하여 사용자를 인식하고 인터랙션을 하고자하는 연구들이 많이 이루어지고 있다. 특히, 보안과 같은 인간을 인식/추적/감시하는 분야에서는 적외선 입력 영상에 대한 얼굴인식 기술이 점차 많이 사용되고 있다. 이는 야간이나 특수한 조명 환경에서처럼 적절한 컬러 영상 정보를 알 수 없을 때 적외선 영상 정보를 이용하면 얼굴 영상 추출이 가능한 경우가 많기 때문이다. 본 논문에서는 이러한 적외선 영상을 입력받아 컬러 영상과의 관계에 기반하여 얼굴을 인식하는 방법을 제안하고자 한다. 이 방법은 일반적인 조명 환경에 강인하면서 컬러 데이터베이스만을 사용하여 얼굴 인식이 가능하다. 따라서 주위 조명 환경에 무관하게 얼굴을 인식하여 다양한 보안 및 휴먼 인터페이스에 사용이 가능할 것으로 기대한다.
-
본 논문에서는 이동형 패럴랙스 배리어 방식의 모바일 3D 디스플레이에 응용하기 위해 개발된 시역계측알고리즘[1]을 실제시스템에 구현한 후 문제점을 분석하고, 그 문제점을 해결할 수 있는 새로운 방법을 제안한다. 본 연구팀에서 이동형 패럴랙스 배리어 방식의 모바일 3D 디스플레이에 응용하기 위해 개발한 이전의 시역계측기술[1]은 기존의 비올라-존스 얼굴 검출기[2]에 의한 얼굴검출 결과와 비올라-존스 얼굴 검출기의 단점을 보완하기 위해 새롭게 추가된 옵티컬-플로우 특징점 추적 알고리즘[3]에 의한 얼굴검출의 두 결과를 선형적으로 결합하여 시청자의 시역위치를 예측하였다. 하지만, 모바일 3D 디스플레이의 특성한 급격한 조명의 변화에서 옵티컬-플로우에 의한 특징점 추적알고리즘에 심각한 오류가 발생하는 문제점이 있다. 이러한 급격한 조명의 변화에 대한 문제점을 해결하기 위해 본 논문에서는 매 프레임마다 정확하게 옵티컬-플로우 얼굴 검출기의 정확도를 판단할 수 있는 방법을 제안하고, 다양한 실험을 통해 그 효과를 검증한다.
-
본 논문에서는 대표적인 특징점 추출 알고리즘인 SURF (Speeded Up Robust Features)와 얼굴인식에서 널리 쓰이는 Gabor 기술어를 이용한 얼굴 인식 방법을 소개한다. SURF 기반 영상인식 방법은 특징점을 찾고 해당 특징점에서 기술어를 추출한 후, 정합을 수행한다. 본 논문에서는 SURF 를 통해 추출한 특징점에서 Gabor 웨이블릿 변환을 사용해 기술어를 추출하는 얼굴인식 방법을 제안한다. 잘 알려진 ORL 데이터베이스에서의 실험에서 제안한 방법이 기존 SURF 기반의 얼굴 인식 방법에 비해 더 높은 얼굴 인식 성능을 보여줄 뿐 아니라 정합시간을 포함한 처리 속도면에서도 더 우수한 성능을 보였다. 이러한 실험 결과를 통하여 제안하는 방법이 SURF 보다 얼굴 인식에 적합함을 확인할 수 있었다.
-
아날로그 TV의 디지털화와 마찬가지로 아날로그 라디오 방송의 디지털화도 세계적인 추세이다. DRM(Digital Radio Mondiale)은 송신소의 위치, 방송 지역 및 사용하는 주파수에 따라, 동작모드가 A~E까지 5가지가 있으며, 모드 A~D는 30MHz이하 대역의 디지털 라디오 방송에 사용되는 모드이며, 모드 E는 Band I~II 대역의 디지털 라디오 방송에 사용되는 모드이다. 본 논문에서는 DRM 모드 A~E까지의 신호를 수신 및 분석 가능한 USB 타입 DRM 수신기 구현에 관하여 정리하였다. 대역 필터 및 디지털 다운 컨버터가 DSP를 이용하여 구현되었으며 PC Side에서 DRM 신호를 분석할 수 있도록 설계되었다.
-
스마트폰 2천만 시대, 라디오의 디지털 전환이 필요한지 필요성에 대해 검토해보고, 일반 이용자의 라디오 수용도 및 방송사의 디지털 전환에 대한 견해, 환경 요인 등에 대한 분석을 토대로 라디오의 디지털 전환의 위기 및 기회 요인을 분석하여 그 시사점을 도출해보고자 한다.
-
본 논문에서는 방송용주파수를 좀 더 효율적으로 활용하여 시청자가 쉽게 지상파방송을 직접 수신할 수 있도록 DTV 방송 수신환경 개선 방법에 대해 찾아보고 난시청해소와 차세대방송에 필요한 주파수 소요량을 정량적으로 제시하고자 한다. 특히 디지털전환 이후에 회수되는 700MHz 대역 (108MHz 주파수폭)에 대하여 UDTV 와 Full-HD 3DTV 기술을 적용한 차세대방송을 구축할 때 난시청해소와 시청자와 방송과 산업에 미치는 효과를 제시한다.
-
방송 시청 중 한 채널에서의 프로그램 전환 혹은 시청 채널을 전환 할 경우, 프로그램 혹은 채널 간 오디오 레벨의 불균일은 시청자들에게 불편을 야기 시킬 수 있다. 특히 방송이 아날로그에서 디지털로 전환됨에 따라 이런 현상은 더욱 심각하게 발생이 될 수 있으며, 국가 간 고속 통신망의 확산에 따른 방송서비스 및 콘텐츠 배포 환경의 고도화로 인하여 디지털 방송 프로그램의 국제적 교환이 더욱 증대되어 디지털 방송 오디오 레벨의 균일화에 대한 중요성이 더욱 부각되고 있다. 본 연구는 이런 문제를 해결하기 위해 디지털방송 오디오 레벨 제어 관련 국내 현황을 조사하고, ITU-R 등 국제 표준화와 유럽 미국 등 외국의 대응 등에 대한 조사분석을 실시하고 국내 대응방안을 제안하고자 한다.
-
우면산 산사태로 인한 EBS 방송중단으로 방송통신재난관리의 필요성에 대한 관심이 높아지고 있다. 통신재난관리는 전기통신기본법에 의하여 규정되어 지금까지 잘 수행되어 왔으나 방송재난관리는 명확한 법 규정 없이 각 방송사 내부적으로 수행하여 왔다. 그러나 방송통신융합에 따른 방송통신발전 기본법 시행으로 방송통신재난관리 규정이 신설되어 방송사들의 재난관리 업무가 법적으로 명확히 규정되었다. 본 논문에서는 방송통신발전 기본법 시행에 따라 방송재난이라는 개념을 정의하고, 주요방송사업자(KBS, MBC, SBS, YTN, MBN)의 방송통신재난관리 기본계획, 방송재난 대비, 방송재난 보고, 방송통신재난대책본부와 관련된 법 조항을 분석하였다. 통신사업자들의 경우는 재난방송 의무는 없으나 재난방송협의회 참가를 통하여 CBS 등과 같은 재난방송에 도움을 줄 수 있도록 하는 것이 필요하다.
-
깊이 영상은 가상 시점 영상을 합성할 때 사용되는 3차원 거리 정보로 깊이 영상 기반 렌더링에서 가상 시점을 합성할 때 사용한다. 따라서, 깊이 영상 부호화에서는 부호화 효율 못지않게 합성 영상의 화질이 중요하다. 깊이 영상의 화질은 합성된 가상 시점 영상의 화질에 큰 영향을 미친다. 따라서 고화질 깊이 영상이 필요한 경우, 부호화 손실이 적은 무손실 부호화를 사용한다. 하지만, 이와 같은 무손실 부호화 방법은 복호를 통해 원래의 깊이 영상을 그대로 복원할 수 있지만, 압축률이 낮다는 단점이 있다. 본 논문에서는 복호된 영상의 화질과 부호화 비트의 균형을 모두 고려하기 위해 근접 무손실 HEVC(high efficiency video coding)와 향상된 CABAC(context-based adaptive bnary arithmetic coding)을 이용한 새로운 깊이 영상 부호화 방법을 제안한다. 실험을 통해 제안한 방법이 합성된 가상 시점 영상의 화질 손실 없이, 기존의 무손실 및 근접 무손실 방법보다 더 나은 부호화 성능을 제공함을 알 수 있었다.
-
최근 HD급 이상의 해상도를 가지는 영상을 위한 차세대 코덱 표준이 연구되고 있다. 이 코덱의 특징은 압축효율을 증가시키기 위해서 시간을 많이 소모시키는 복잡한 툴들을 많이 채택하고 있다는 점이다. 이는 실시간 방송에 대한 부담감으로 작용되기 때문에, 표준을 재정하는 전문가들은 속도 개선을 위한 병렬화 연구 또한 동시에 진행을 하고 있다. 병렬화 방법 중 슬라이스 단위 병렬화와 모듈 내부 병렬화가 대표적으로 논의되고 있지만, 이 두 가지 방법은 각각 시간 지연과 추가 비트 할당이라는 단점이 있기 때문에 이를 극복하기 위한 새로운 병렬화 기법이 요구되고 있다. 본 논문에서는 시간 지연과 추가비트 할당을 극복 가능한 병렬화 기법을 연구하였는데, HEVC 코덱의 구조 분석을 통해 어떻게 병렬화 해야 단점을 극복할 수 있는지 알아보고 단점을 극복한 병렬화 기법이 속도 개선을 할 수 있는지 시간 분석을 통해 알아본다. 본 논문에서는 구조 분석을 통해 알아낸 CU 단위 병렬화 기법을 제안하고 CU 단위 병렬화 기법을 HEVC Test model reference software 2.1 decoder에 적용하여 Full HD 영상에 대해 Lowdelay에서 평균 19.83%의 속도 개선을 얻었으며, Randomaccess에서 평균 22.63%의 속도 개선을 얻었다.
-
최근ISO/IEC와 ITU는 공동 협력팀(Joint Collaborative Team on Video Coding-JCT-VC)을 구성하여 HEVC(High Efficiency Video Coding)라 불리는 새로운 비디오 압축 표준 기술을 개발하고 있다. JCT-VC의 목표 중 하나는 H.264/AVC 압축률의 2배를 향상하는 것으로 최근 HEVC 테스트 모델(HEVC Test Model - HM)을 확정했다. HM의 여러 기술 중에서 확장 블록 구조 (large block structure) 기술은 CU(Coding Unit)와 TU(Transform Unit), PU(Partition Unit)로 구성된다. CU와 TU는 압축 단위와 변환 기술을 확장한 반복적인 문법구조(recursive syntax structure)이며, PU는 H.264/AVC과 동일한 형태를 띈다. 확장 블록 구조는 CU, PU, TU의 여러 조합에 의해 다양한 모드를 지원하여 압축 성능은 높아졌지만 HM 부호화기의 복잡도는 증가한다. 본 논문에서는 HM에 채택된 확장 블록 구조 기술에 대해 설명한 후, 계층적 B프레임 구조로 부호화 되는 경우 이전 레벨의 CU Depth 정보를 이용하여 현재 레벨의 CU Depth를 효과적으로 제한하여 기존의 방법보다 빠르게 부호화하는 방법을 제안한다.
-
기존의 참조 소프트웨어인 MPEG-2, MPEG-4, H.264/AVC에서는 움직임 벡터를 찾을 때 항상 고정된 해상도를 사용하였으며 다른 참조 소프트웨어인 KTA에서는 움직임 벡터를 찾을 때 움직임벡터의 해상도를 슬라이스 단위로 성능이 가장 높은 해상도를 선택해서 사용하였다. 하지만 움직임 벡터의 해상도는 블록마다 서로 다르기 때문에 블록별로 서로 다른 해상도를 적응적으로 사용할 필요가 있다. 적응적인 움직임 벡터 해상도 부호화 방법은 이러한 점을 이용하여 블록 별로 현재 블록의 움직임 벡터가 1/4 해상도인지 1/8 해상도인지에 판단하고 그에 대한 정보를 복호기에 전송해준다. 제안하는 알고리즘은 적응적 움직임 벡터 해상도를 사용하여 부호화 할 때 1/8 해상도 움직임 벡터가 성능이 없다고 판단되는 곳에선 적응적 움직임 벡터 해상도 방식을 사용하지 않고 1/4 해상도로만 움직임 벡터를 찾는다. 이러한 경우 해상도 정보를 복호기에 전송하지 않아 부호화 효율을 높일 수 있고 또한 1/8 해상도에 대한 움직임 예측을 하지 않기 때문에 부호화기 복잡도를 낮출 수 있다. 실험결과 평균 0.2%의 성능을 얻을 수 있었으며 부호화기 복잡도는 4% 감소하였다.
-
본 논문에서는 구간선형 모델을 적용하여 낮은 복잡도를 가지는 LSC(Lens-Shading Correction) 알고리즘을 제안한다. 제안한 알고리즘은 각 화소와 렌즈 중심점으로부터 거리를 정수형으로 계산하고, 이 정수를 거리에 대한 LSC 이득값이 저장된 LUT(Look-Up Table)에 대한 주소로 적용하여, 입력 화소 값에 곱함으로써 LSC를 수행한다. 거리를 구하려면 제곱근 회로가 추가되어야 한다. LUT에 저장된 이득값은 원점으로부터의 거리에 대한 평균 이득값을 저장하고 있기 때문에, 제곱근 계산에 높은 정밀도를 할애하여도 LSC 보상된 영상의 화질에 미치는 영향은 높지 않으므로 정수형 제곱근 연산을 수행한다. 제곱근 계산은 구간 선형화하여 단지 덧셈과 쉬프트 연산만으로 제곱근 연산을 완료할 수 있도록 간략화 하였다. 제안한 알고리즘을 양산 중인 일반 카메라 모듈에 적용한 결과, 카메라모듈 제조업체의 LSC 평가 기준을 상회하는 수준으로 나타나며, 구현될 하드웨어 복잡도가 매우 낮아서 모바일 카메라 구현에 매우 적합하다.
-
본 논문에서 우리는 동영상에서 인접한 블러되지 않은 참조 프레임을 이용하여 모션 블러를 제거하는 기법을 제안한다. 기존의 디블러링 방법들은 주로 단일 영상을 이용한 방법들로 정확한 커널을 예측하는 것과 원본 영상에 준하는 영상을 복원하는 것에 한계가 존재한다. 하지만 동영상에서 부분적인 프레임에만 블러가 발생한 특수한 경우에는 인접한 위치에 존재하는 블러되지 않은 프레임을 활용하는 것이 가능하다. 제안하는 방법은 블러된 프레임과 인접한 위치에 존재하는 블러되지 않은 프레임 사이에 움직임을 추정하고, 움직임 보상된 영상을 이용하여 커널을 추정한다. 또한 움직임 오차에 따른 잔여 오차 성분에 대해서만 디컨벌루션을 적용하여 물결현상이 억제된 최종적인 결과 영상을 생성한다. 실험 결과는 제안한 방법이 기존의 디블러링 기법에 비해 에지 부분을 잘 복원시키면서 물결현상은 감소된 보다 우수한 디블러링 결과를 가져오는 것을 보여준다.
-
본 논문에서는 텍스쳐 최적화 기법을 사용하는 동영상 프레임 비율 상향 변환 방법을 제안한다. 제안하는 기법은 입력 영상의 텍스쳐 특성을 분석하여 블록 매칭에 의해 예측된 움직임 벡터의 정확도를 향상시킨다. 또한 패치 단위의 영상 합성을 통해 블록 경계에서 발생하는 화질 열화 현상을 최소화한다. 실험 결과를 통하여 제안하는 기법은 자연스러운 중간 시점 영상을 생성함을 확인한다.
-
방송 콘텐츠 제작에는 카메라, VCR, NLE, 인코더 등의 장비가 사용되고 있으며, VCR 헤더 불량, 테이프 노후화/보관불량, NLE 편집 오류, 인코더 장비 불량 등의 다양한 이유로 콘텐츠에 예기치 않은 비디오 및 오디오 오류가 발생할 수 있다. 이러한 문제점을 해결하기 위하여 콘텐츠에 포함된 다양한 비디오 및 오디오 오류를 자동으로 검사할 수 있는 자동 검사 시스템이 요구된다. 본 논문에서는 이러한 다양한 오류를 자동으로 검사할 수 있는 방법 중 특히 비디오 내에 종종 포함되는 블록 오류를 대상으로 하는 고속 오류 검출 방법을 설명한다. 제안한 방법은 비디오 내의 매 프레임의 코너 수를 계산하고, 시간 증가에 따른 코너 수의 변화량을 검사하여 블록 오류가 포함될 것으로 예상되는 후보 프레임을 찾는 1단계 과정과, 후보 프레임을 대상으로 Adaboost 인식 기술을 사용하여 학습한 분류기를 통해 최종 블록 오류가 포함된 프레임을 검출하는 2단계 과정으로 구성된다. 시스템 구현 실험 결과, 비디오 내에 포함된 블록 오류를 프레임 단위로 정확하게 고속 검출 하는 것이 가능함을 확인하였다. SD급의 경우 실시간 대비 2.3배속 가량의 고속 검사가 가능하고 HD의 경우에도 0.8배속 수준의 고속 검사가 가능하였다.
-
최근 화두가 되고 있는 스마트 폰 앱의 관심으로 스마트 TV의 앱에 대한 관심도 함께 증가하고 있다. TV시청 이용자들의 편의를 위해 증가하고 있는 수많은 채널과 콘텐츠 중, 개인 사용자의 이용 습관 및 대중의 선호 프로그램을 고려하여, 편리하게 원하는 TV프로그램에 접근하도록 해 주는 TV 앱이 있다면 이는 매우 중요한 기능으로 자리 잡을 가능성이 높을 것으로 예상된다. 이에 본 논문은 사용자의 시청 이용행태를 기반으로 주제모델링 기술의 고전적 모델인 LDA을 기반으로 협업필터링을 결합한 TV 선호 프로그램 추천 알고리듬을 제안한다. 개인의 관심 선호도는 일반적으로 특정 개수로 한정지어지는 특성을 고려하여, 개인 선호도 특성이 구별 되도록 두 가지 방법을 적용하였다. 하나는 개인 선호도 프로파일의 특정 상위 주제만을 고려하는 것이고, 또 다른 하나는 개인별 주제에 대한 선호도의 다양성이 드러나도록 비대칭 하이퍼-파라미터를 갖는 LDA를 사용 하였다. 실험 결과, 두 가지 방식에 대해 사용자의 실제 TV시청 이용내역 데이터를 기반으로 추천 성능의 향상을 평균 Precision 값을 측정하여 확인하였다. 또한, 본 논문에서는 주제 모델링을 통해 학습된 각 주제의 상위 확률의 TV 프로그램들을 분석한 결과, 하나의 주제가 개인별 시청의 특성 보다는 가족단위의 시청 특성을 드러냄을 확인할 수 있었다.
-
초고속 통신망의 발전으로 인터넷을 통한 고화질 비디오 서비스가 가능하게 되었으며 이에 따라 스마트TV, IPTV 서비스와 같은 방통융합서비스가 대중화 되고 있다. 그리고 이러한 추세에 맞추어 방송 이외의 매체를 통한 비디오 콘텐츠 소비가 증가하고 있고, IT사업자들과 가전사들이 방송 플랫폼 사업에 진출하는 등 전통적인 방송 산업 구조에도 변화가 일어나고 있다. 이와 같은 환경 변화에 대응하기 위해 KBS 기술연구소는 지상파 방송 기반의 하이브리드 TV 서비스를 연구하고 있고, 이를 OHTV(Open Hybrid TV)라는 이름으로 국내의 다른 방송사들 및 가전사 등과 함께 표준화하고 있다. 안정적이고 효율적으로 대용량 비디오를 전송할 수 있는 방송망과 양방향 특성을 가진 통신망을 같이 활용하는 하이브리드 TV 환경에서는 양방향 방송 서비스를 보다 효율적으로 제공하는 것이 가능할 것으로 기대된다. 이를 통해 TV 시청자에게는 개인화된 형태의 새로운 방송 서비스를 제공하고, 방송사에게는 전통적인 사업모델을 탈피하여 새로운 비즈니스 모델을 찾을 수 있는 기회를 줄 수 있다. 이미 유사한 개념의 서비스들이 국내외에서 다양하게 시도되고 있으며 본 논문에서는 OHTV 서비스 시나리오 및 요소기술과 이를 구현한 시스템을 소개한다.
-
2005년 12월 1일 DMB(Digital Multimedia Broadcasting) 본 방송이 실시된 이후 다양한 형태의 방송, 통신 융합 서비스가 시도되었다. 그러나 DMB가 성공적으로 시장에 정착하였음에도 불구하고 방송사 등 시장 참여자들의 수익 창출의 어려움, 속도 및 요금 측면에서의 양방향 망의 한계, 방송사, 통신사의 시스템 및 망에 종속적이며 폐쇄적인 콘텐츠 제작 및 제공 방식 등으로 인하여 성공을 거두지 못하였다. 그러나 스마트 폰과 같은 모바일 스마트 디바이스의 성공으로 방송, 통신 서비스 시장에 새로운 전기가 마련되어 다양한 융합 서비스가 시도될 것으로 예상되며, 지상파 DMB가 이러한 다양한 서비스와의 경쟁에서 우위를 점하고 중심 매체로 자리잡기 위해서는 새로운 개념의 융합 서비스 플랫폼이 필요하다. 이에 본 논문에서는 이러한 새로운 개념의 플랫폼인 'HTML5 기반 융합 모바일방송 플랫폼'을 제안하고 실제 구현 예를 통하여 그 가능성을 제시하고자 한다. 제안하는 플랫폼은 누구나 콘텐츠 제공에 참여할 수 있고, 다양한 망, 단말, 서비스 모델이 융합되며, 표준화되고 개방된 API(Application Programming Interface)를 통하여 이를 소비할 수 있도록 하는 개념으로, 방송 콘텐츠 및 이에 의해 파생된 다양한 리치 미디어 콘텐츠의 생성, 전달, 소비에 이르는 생태계 전반에 대한 것이다. 이러한 플랫폼의 가능성을 제시하기 위하여 KBS(Korean Broadcasting System)는 서비스 시스템, 수신 프로그램 개발, 시험 서비스 구현 등의 개발을 진행하고 있으며, 그 결과를 본 논문에서 소개하고자 한다.
-
본 논문에서는, 지상파 3D HDTV 방송 전송을 위한 VSB(Vestigial Side Band) 변조방식의 심벌 타이밍 및 반송파 동기부 구조를 제안하고 그 성능을 검증해 보았다. 제안하는 동기부의 동작은 다음과 같다. 먼저 반송파 주파수 옵셋에 독립적인 심벌 타이밍 복구 알고리즘으로 타이밍 동기를 이룬다. 그리고 제안하는 프레임 검출 방법으로 프레임의 시작점을 알아내고, 반송파 주파수 옵셋 복구에 필요한 훈련 열을 얻어낸다. 마지막으로, 얻어진 훈련 열을 이용하여 반송파 주파수 옵셋과 반송파 위상 옵셋을 복구한다. 컴퓨터 모의실험 결과, 제안하는 동기부 구조는 이상적으로 동기를 이루었을 때의 BER(bit error rate)성능과 근접한 성능을 나타내었다.
-
본 논문에서는 ATSC (Advanced Television Systems Committee) 지상파 DTV (digital television) 방송 시스템에서 부가 데이터 전송률을 향상시키면서 비트 오율 (bit error rate) 성능을 개선하기 위한 다중 안테나 부가데이터 전송 방식을 제안한다. 제안된 다중 안테나 전송방식은 Alamouti 기법을 사용하여 단일 안테나 전송 방식에 비해 신호대 잡음비 이득을 얻는다. 또한, 제안하는 전송 방식은 기존의 ATSC 지상파 DTV 수신기와 역호환성을 가진다는 장점이 있다.
-
본 논문에서는 다중 사용자 간섭이 존재하는 복호 후 전송 협력통신 시스템의 비트오류율에 대해 기술한다. 최근 공간 다이버시티를 위한 협력통신 시스템에 관한 연구가 활발히 진행되고 있고 모바일 사용자의 수와 요구가 점점 증가하고 있는 추세이다. 한정된 자원 및 공간에서 모바일 사용자가 증가함에 따라 사용자 간의 간섭현상이 더욱 빈번하게 나타나게 되는데 이는 무선통신 시스템의 중요한 문제 중 하나이다. 따라서 릴레이 (Relay) 기반 협력통신 시스템에서도 일반적인 무선통신 시스템과 같이 다중 사용자 간섭을 고려하는 것이 필요하다고 볼 수 있다. 본 논문에서는 다중 릴레이 기반 복호 후 전송(Decode-and-Forward) 프로토콜에서 릴레이 및 목적노드에 다중 간섭이 존재하는 경우의 비트오류율에 대해 분석한다.
-
본 논문에서는 상향링크 다중 사용자 MIMO-OFDM 시스템을 위한 새로운 자원 할당 기법을(resource allocation) 제안한다. 제안된 자원 할당 기법에서는 각 사용자별 전송전력 제한을 만족하면서 주파수 효율이(spectral efficiency) 최대화 되도록 사용자들에게 부반송파와(subcarrier) 전력을(power) 할당한다. 모의 실험 결과에서는 제안된 기법이 기존 기법에 비해 주파수 효율이 증가됨을 보이고 있다.
-
IPTV는 방통융합기술의 대표적인 매체로서 기존의 단방향 방송과는 차별화된 양방향 서비스를 특징으로 하는 새로운 방송 매체로, 우리나라는 이미 IPTV 상용 서비스를 시작하고 있다. 그러나, 초기 데이터방송 송출환경 및 애플리케이션의 방식 등이 서로 상이하여 애플리케이션의 호환성 문제가 대두 됨에 따라, IPTV 미들웨어의 표준화가 진행되고 있으며, 현재도 개정 작업이 진행되고 있다. 이렇듯 표준화가 진행됨에 따라, IPTV 서비스 플랫폼 상호호환성 확보의 핵심인 미들웨어에 대한 표준 미들웨어를 개발하여 업계에 배포 활용하게 함으로써 표준 API의 정착 및 중소 업체에 시장 진입의 기회를 부여하고자 IPTV 미들웨어 표준 참조구현을 개발하게 되었다. 미디어 재생, 그래픽 객체 표현 기능, 리모콘 가상화 등의 미들웨어 실행환경 및 IPTV 미들웨어 표준에 부합하는 API를 구현하여 Windows OS상에서 동작하도록 개발되었으며, Java VM(Virtual Machine)에서 동작하는 자바기반 미들웨어와 웹 애플리케이션 실행 플랫폼을 통해 구동되는 웹기반 미들웨어를 같이 개발영역에 포함하여 개발하였다.
-
본 논문에서는 MPEG RVC(Reconfigurable Video Coding) 프레임워크에서의 효율적인 복호화기 생성을 위한 토큰 정렬 방법을 제안한다. MPEG RVC 프레임워크는 현존하는 비디오 표준을 모듈 단위로 나누어 그에 대한 입력 및 출력의 동작을 명시하고 있다. 현재의 RVC 프레임워크 표준은 각 기능부(functional unit)들의 입력 및 출력의 행동만을 서술할 뿐 특정 비디오 코덱에서 고유적으로 정의하는 각 기능부 사이에 소비되는 토큰의 계산 모델(model of computation)을 제공하지 않는다. 이러한 점은 계산 모델이 다른 환경에서 RVC 프레임워크 솔루션을 개발하는데 큰 어려움으로 작용한다. 따라서 효율적인 RVC 복호화기의 구성을 위해 복호화 기술 정보 상의 명백한 토큰 정렬 정보를 이용하여 RVC 프레임워크의 기능부들 사이의 행동을 결정지어 주는 방법을 제안한다. 제안하는 방법은 토큰 정렬에 의해 계산 모델을 명확하게 해주고 개발자로 하여금 코덱 개발 단계에서의 디버깅 및 테스팅에 따른 부담을 줄여줄 것이다.
-
최근 스마트폰을 비롯한 다양한 스마트 기기들의 사용이 폭발적으로 늘어남과 동시에 이 기기들에서의 멀티미디어 콘텐츠 소비 또한 급격하게 늘어나고 있다. 이것은 자연스레 홈 네트워크 환경에서 사용자들의 DLNA 기기 간 미디어 콘텐츠 공유에 대한 욕구로 이어졌다. DLNA 기술이 등장하면서 이러한 욕구가 해소되기는 했지만 DLNA 제품 간의 효과적인 콘텐츠 상호 공유 및 재생을 제어하고 관리하는 전용의 S/W가 요구되고 있다. 이에 본 논문에서는 DLNA와 UPnP의 분석을 통하여 미디어 공유와 제어를 동시에 수행하는 스마트 리모컨 S/W의 구현 구조에 대하여 논한다.
-
MPEG-DASH(Dynamic Adaptive Streaming over HTTP)는 MPEG(Moving Picture Experts Group)에서 표준화 중인 HTTP를 이용한 적응형 비디오 스트리밍 기술이다. MPEG-DASH는 인터넷 방화벽에 의해 차단되는 RTP/UDP를 이용한 AV 스트리밍 대신 현재 HTTP/TCP를 이용하여 AV 스트리밍을 하는 추세에 맞춰 유무선 인터넷에서 망 환경 및 단말 환경에 동적 적응적으로 AV 스트리밍을 달성하기 위한 기술에 대한 표준이다. HTTP를 이용한 AV 스트리밍은 서버의 부담을 최소화하고 클라이언트의 지능적 처리에 전적으로 의존하는 스트리밍 방식이다. MPEG-DASH 클라이언트는 HTTP의 파일 전송 요청 또는 파일 일부 전송 요청만을 사용하여 스트리밍을 달성한다. 2011년 7월 제97차 MPEG 회의에서 MPEG-DASH DIS(Draft International Standard) 2차 버전이 승인되었다. 본 논문에서는 이 DIS 2차 버전에 따라 MP4 파일 포맷 기반의 MPEG-DASH 클라이언트를 구현하고 그 동작을 실험을 통해 검증하였다.
-
2008년 처음 IPTV 서비스가 시작된 이후 IPTV 콘텐츠 호환성 확보와 단말 이동성 확보를 통한 IPTV 서비스 활성화 및 전체적인 비용 절감을 위해 많은 표준화 이슈들이 있었고 현재까지 표준화가 일부 완료 및 진행중이다. IPTV는 짧은 시간에 급격히 발전하였고 사업이 활성화 되었기 때문에 표준의 적용을 위한 준비 기간이 짧고 표준의 검증이 이루어지지 않은 상태이다. 그래서 표준을 적용한 시스템에 문제가 생길 수 있고 이는 많은 자원 낭비와 콘텐츠 호환성과 단말 이동성이 점점 늦어지는 원인이 되고 있다. 이에 본 논문은 표준을 적용한 플랫폼과 솔루션들이 상용화 되기전에 표준 적용 개발 제품의 표준 적합성을 시험해보고 표준 기술을 검증하여 표준을 정립하기 위하여 국내 IPTV 표준 중 "IPTV 서비스 탐색 및 전송방식 표준[3]"을 적용한 플랫폼과 솔루션을 검증하기 위한 시험 환경을 구축하고 시험규격을 개발하였다.
-
본 논문에서는 연속된 프레임을 갖는 영상의 프레임간 움직임 추정 기법을 응용하여 고해상도 영상을 획득하는 초고 해상도 기법을 제안한다. 기존의 단일 영상을 이용한 초고해상도 기법의 경우 영상에서의 고주파 대역을 찾기 위해 확률 기반의 다양한 방법이 제시되었으나 연산에 사용할 수 있는 정보가 제한적이라는 문제가 존재한다. 이러한 문제를 해결하기 위해 연속된 프레임을 이용한 다양한 초고해상도 기법이 제안되었다. 본 논문에서는 주어진 영상의 전, 후의 다수 프레임을 정하여 6-tap FIR(finite impulse response) 필터를 이용하여 프레임들의 부화소(sub-pixel)를 구한 뒤에, 부화소 정밀도의 움직임 추정을 통하여 보다 정확한 고주파성분을 복원하고자 한다. 실험을 통하여 제안하는 기법이 기존의 고등차수(bi-cubic)보간법 보다 선명한 영상을 획득할 수 있었다.
-
GPU의 병렬성과 연산능력을 일반적인 공학적 문제 해결에 적용하는 GPGPU 컴퓨팅에 대한 연구가 최근 활발히 진행되고 있다. 비디오 압축과정에는 많은 양의 화소 데이터에 동일하게 반복되는 연산을 수행하는 알고리즘이 많이 적용되므로 GPGPU를 통한 고속 병렬 계산의 응용 분야로 매우 적합하다. H.264/AVC는 비디오를 압축하는 가장 최신의 국제표준으로 여러 제품군과 서비스에 대한 적용되어 시장에서 널리 사용되고 있다. 본 논문에서는 GPGPU의 응용 분야로 주목 받고 있는 비디오 압축 분야에 대한 적용으로 H.264/AVC의 화면내 예측 모드 결정과정에 GPGPU 병렬 프로그래밍을 적용하여 예측 모드 결정 속도를 향상하는 방법을 제안한다. GPU상에서의 데이터 병렬처리를 위해 CUDA C언어를 사용하였으며, CPU상에서의 연산은 C언어를 사용하여 구현되었다. GPU상에서 프레임 전체에 대한 화면내 예측 모드를 병렬적으로 결정함으로써 이에 소요되는 시간을 줄여 줄 수 있었다. 실험결과 GPU상에서 병렬적으로 예측 모드를 결정할 때 Full-HD급 영상에서 약 2.8배 정도의 속도 향상을 확인할 수 있었다. 향후 GPGPU 병렬 프로그래밍을 화면 내 예측뿐만 아니라 반복되는 연산을 수행하는 다른 알고리즘에도 적용하여 부호화기의 계산 부담을 덜어준다면 고속 실시간 비디오 압축 부호기 개발이 더욱 용이해 질것으로 기대된다.
-
고해상도 이미지 센서를 장착한 고가의 모바일 제품들이 확산되면서 중간값 필터에 기반을 둔 잡음 제거 필터의 필요성이 증가하고 있다. 이는 초박형 카메라에 내장된 이미지 센서의 물리적인 수광부 면적이 줄어듦에 따라 이미지 센서의 SNR이 떨어지기 때문이다. 게다가 영상의 해상도가 매우 높기 때문에 잡음제거 필터는 초고속으로 동작해야 한다. 따라서 잡음 제거 필터의 핵심 기능인 중간값 필터는 높은 동작주파수에서도 효과적으로 동작해야 한다. 초고속으로 동작하는 필터를 하드웨어로 구현하려면 입출력 간의 물리적 지연시간을 클럭의 주기 단위로 나누어서, 시분할하여 순차적으로 처리하는 파이프라인 구조를 가져야 한다. 파이프라인 단계는 많은 비용이 소모되는 레지스터로 구현되므로 파이프라인 단계를 줄이는 것이 바람직하다. 본 논문에서는 입력부터 출력까지의 물리적 지연시간이 데이터의 수에 비례하는 기존의 중간값 필터와 달리, 데이터 수의 로그값에 비례하는 중간값 필터의 구조를 제안한다. 제안한 중간값 필터는 서로 다른 값을 가지는 데이터 집합에서의 중간값은 자신보다 큰 원소의 수와, 작은 원소의 수가 같다는 사실을 이용하며, 버블 정렬 구조에 기반을 둔 중간값 필터에 비해서 같은 동작주파수에서의 게이트 수가 25.3% 줄어든다. 중간값 필터는 잡음제거나 위색제거 등에서도 널리 사용되고 있으므로, 제안한 구조의 중간값 필터는 초고속으로 동작하는 이미지 신호 처리기의 효과적인 구현에 적합하다.
-
240 Hz 이상의 높은 프레임율을 가지는 LCD 기반 평판 FHD급 디스플레이 시스템은 높은 프레임율로 인하여 디스플레이 패널로 전송해야하는 유효한 데이터율이 1.9GB/s까지 이르게 되며, 수평/수직 동기를 감안하면 2GB/s 이상의 데이터 전송 대역이 필요하다. DRAM을 이용하여 이런 데이터 대역폭을 제공하려면 다수의 메모리 장치를 사용해야하기 때문에, 비용 상승, 전력소모량 증가 등의 문제를 야기한다. 이런 문제를 해결하기 위하여 본 논문에서는 JPEG 기반의 정지 영상 압축 시스템을 제안한다. 제안한 시스템은 8개의 디코더가 동시에 동작하는 구조를 가지고 있으며, 단일 데이터 열로부터 8개의 데이터 열을 용이하게 구분할 수 있도록 128-bit 데이터에 정렬된 64-bit 마커를 사용한다. 제안한 64-bit 마커는 마커 에뮬레이션을 야기하지 않도록 설계되었기 때문에, 인코더와 디코더의 구현 복잡도를 낮출 수 있고 단일 데이터열을 8개의 데이터열로 분리하는 작업을 매우 용이하게 한다.
-
본 논문에서는 무선 협력 네트워크(wireless cooperative network)의 전송 신뢰성과 공정성 향상을 위한 비례공정 중계(proportional-fair relaying) 기법을 제안한다. 다중 단말과 단일 기지국이 있는 다원 접속(multiple access) 환경에서 저속 페이딩(slow fading)에 의한 성능 열화를 저감하면서 단말간 자원 사용 공정성 보장하기 위해 비례공정 전송 기법과 중계 기법 결합한다. 이를 통해 기존 기회적(opportunistic) 전송 기법의 비대칭 채널(asymmetric channel)에서의 자원 사용 불공정성을 해결하면서 깊은 페이딩(deep fading)에 의한 데이터 무선 전송 손실을 최소화 한다. 컴퓨터 모의실험 결과를 통해 제안된 기법이 공정성 제한(fairness constraint)이 있는 다원 접속 환경에서 불능 확률(outage probability) 성능을 제고함을 보인다.
-
최근 전송량 및 주어진 SNR(signal to noise ratio)에 따른 수신 성능을 향상시키기 위하여 다중 안테나(multi-input multi-output) 시스템에 대한 연구가 활발하게 이루어지고 있다. 다중 안테나 시스템은 이론적으로 송신 안테나 개수에 비례해서 전송량이 증가하거나 송 수신 안테나 개수에 비례하여 주어진 SNR에 따른 수신 성능을 향상시킨다. 이러한 MIMO 시스템의 서로 다른 송신단에서 서로 다른 성상을 전송할 때 효율적인 전력 할당은 시스템 성능 향상에 큰 영향을 미친다. 이에 본 논문은 4-QAM 및 16-QAM을 송 수신 안테나가 두 개인 V-BLAST 시스템에 적용하고, 전력을 다르게 할당하여 수신 시스템의 성능을 분석하였다. 이러한 서로 다른 전력 할당에 따른 성능 분석 결과를 이용하여 이동 통신 시스템에 적용하기 위한 가능성 및 활용성에 대하여 논의하였다.
-
기회적 중계 기술(opportunistic relaying)은 중계기를 사용하여 다이버시티 이득을 얻을 수 있는 효율적인 기술로 평가되고 있다. 기회적 중계 기술에서는 가장 좋은 중계기를 선택하여 송신기의 전송 신호를 재전송하게 되는데, 중계기 선택은 채널 정보(channel state information)를 이용하여 이루어진다. 본 논문에서는 하이브리드 ARQ 기반 기회적 중계 기술에서 중계기를 선택할 때 사용하는 채널 정보(channel state information)가 지연된 정보일 때, 시스템의 불능 확률(outage probability) 및 처리량(throughput)을 분석한다. 컴퓨터 시뮬레이션을 통해 분석이 정확한지 검증한다.
-
본 논문에서는 입체감을 보존하여 스테레오 영상의 크기를 조정하는 기법을 제안한다. 스테레오 영상의 디스패리티 데이터를 이용하여 좌우 영상의 중요 영역을 추출하고, 영상의 빈 공간을 인페인팅(inpainting) 기법을 통해 복원한다. 복원된 배경 영역의 크기를 선형적으로 조정하고, 중요 영역은 최대한 보존하도록 크기를 조정하여 배경 영역에 붙여 넣는다. 실험 결과 제안하는 알고리즘이 기존 이미지 크기 조정 기법보다 스테레오 영상의 중요 정보와 입체감을 왜곡하지 않고 보존함을 확인할 수 있었다.
-
폐색 영역의 발생은 스테레오 영상에서 발생하는 어려운 문제이다. 본 논문에서는 폐색 영역을 처리함으로 스테레오 영상에서의 변위 지도를 향상 시키는 방법에 대해서 제안한다. 변위 지도 향상을 위해서 우선 초기의 변위 지도를 생성한다. 폐색 영역은 이미 얻은 스테레오 변위 지도로부터 유일성 제약사항(Uniqueness constraint)에 의해서 계산된다. 계산된 폐색 영역은 두 가지 유형으로 분류가 되고, 이들에 각각에 적합한 폐색 영역 처리 방법이 적용된다. 주변 정보에 기반한 제안하는 방법은 보이는 영역에서의 변위 값을 폐색 영역에 위치한 화소로 확장한다. 실험 결과는 제안하는 방법이 폐색 영역에서의 잘못된 변위 값들을 보정 하여 변위 지도의 성능이 향상되었음을 보여준다.
-
본 논문에서는 SURF 알고리즘을 이용한 직교식 스테레오 카메라 영상의 칼라 불균형 보정 방법 제안한다. 제안 방법에서는 SURF 알고리즘을 이용하여 스테레오 좌, 우 영상의 대응점을 찾은 후, 찾은 대응점들의 칼라 보정 벡터를 영상 획득 모델을 기반으로 계산한다. 영상 전체에서 다양한 칼라 대응점 정보를 추출하기 위하여 본 논문에서는 분할영상을 이용하여 칼라 대응점 정보를 추출한다. 추출된 대응점 정보는 초기 칼라 보정 벡터로 변환할 수 있으며 좌, 우 영상의 모든 픽셀에 대하여 색정보가 가장 유사한 대응점의 보정 벡터를 사용하여 칼라 불균형을 보정한다. 초기 보정 벡터를 이용한 칼라 불균형 보정 후 존재하는 노이즈을 제거하기 위하여 유사한 색공간에 위치한 칼라 보정 벡터에 가우시안 필터를 적용한다. 실험 결과로 원본 영상과 보정된 영상의 칼라 히스토그램을 비교하였으며, 분할 영역의 수에 따른 보정 결과도 비교 제시하였다. 실험 결과는 제안한 방법이 직교식 스테레오 카메라 영상에 효과적인 칼라 불균형 보정 방법임을 보여준다.
-
최근 깊이센서가 컴퓨터비전 등의 영상처리 분야에서 다양하게 활용되고 있다. 그러나 깊이센서에서 생성된 깊이맵의 해상도가 낮기 때문에 고해상도로 상향변환이 필요하다. 현재까지 저해상도의 깊이맵을 고해상도의 깊이맵으로 변환하는 방법들이 많이 제안되었다. 하지만 이러한 방법들은 객체의 에지 개선에만 국한되어 있다. 따라서 본 논문에서는 객체의 에지 뿐만아니라, 객체의 내부를 개선하는 방법을 제안한다. 제안방법은 기존에서 활용되어 온 보간법들에 고주파 성분을 적용하여 개선된 고해상도 깊이맵을 얻는다.
-
본 논문에서는 이산 웨이블릿 변환(Discrete Wavelet Transform : DWT)을 이용한 새로운 초고해상도 기법을 제안한다. 제안된 기법에서는 DWT 수행 시 수반되는 다운 샘플링 과정을 수행하지 않음으로써 입력 받은 영상과 동일한 크기의 고주파 부대역(sub-band)들을 생성하고, 이 부대역들과 입력 받은 영상을 조합하여 이산 웨이블릿 역변환(Inverse Discrete Wavelet Transform : Inverse DWT)을 수행함으로써 고해상도의 영상을 획득한다. 실험을 통하여 제안된 기법이 이중 선형 보간법(bilinear interpolation)에 비해 향상된 효율을 보이며, 확률 기반의 기법들에 비해 처리시간도 줄어드는 것을 확인하였다.
-
This paper presents human perception-based video coding method using an online learning framework. In this work, we analyze the relationship between human attention regions and video quality, and also consider human memory. We classify the motion patterns based on the analysis. Then, we devise a motion pattern classification method using Hedge algorithm. Along with the motion patterns, we smooth out the specific regions or sharpen details of the regions using the regional priorities. The preprocessed sequences are applied to the video codec. The performance is excellent on the overall quality as well as the regional quality.
-
사용자에게 편리한 인터페이스를 제공하는 IT 기기가 널리 보급되면서 직관적인 인터페이스 기술에 대한 관심이 높아지고 있다. 이미지 센서로 입력된 사람의 손 모양이나 움직임을 이용하는 인터페이스가 그 중 하나이다. 한 편 이미지 센서 영상을 저장하기 위하여 H.264/AVC와 같은 영상 압축 기술이 사용된다. 영상을 압축하기 위해 부호기는 모든 Macroblock에서 움직임 추정을 수행한다. 추정된 움직임 정보는 손 움직임을 인식하는데 사용될 수 있고 이를 통해 전자 기기에 명령을 내리는 인터페이스 기술의 한 부분을 구현하는 것이 가능하다. 본 논문은 H.264/AVC 부호기의 Motion Vector를 이용하는 손 추적 알고리즘을 제시한다. 제시된 알고리즘은 손 움직임 추적의 정확도를 향상시키기 위하여 Motion Vector보다 신뢰도가 높은 Motion Density Map 정보를 사용한다. 이 정보를 이용하여 이동한 손을 포함하는 손 윈도우를 결정한다. 실험 결과를 통하여 제시된 알고리즘이 손의 움직임을 추적하는 것을 확인할 수 있다.
-
중간시점 영상은 스테레오 정합 방식을 이용하여 구한 깊이 지도를 이용하여 생성하는 것이 일반적인 방법이다. 그러나 대부분의 스테레오 정합 방식들은 좌, 우 영상의 조명환경이나 기하학적으로 수평 또는 수직방향이 일치하지 않으면 잘못된 깊이 지도를 획득하는 단점이 있다. 이러한 단점들은 정합 과정을 통해 획득한 깊이 지도를 이용하여 다시점 영상 생성 시 더 많은 홀과 경계 잡음을 생성하게 된다. 이러한 문제점을 보완하기 위하여 본 논문에서는 RGB 컬러 카메라 1 대와 깊이 카메라를 이용하여 중간 영상을 생성하는 방법을 제안한다. 제안된 기법을 이용하여 화상회의 시 사실감 및 현실감을 증대할 수 있는 eye-contact 시점 영상을 생성하고 이때 발생하는 홀과 경계잡음 제거를 실시간으로 처리하기 위한 효율적인 기법을 제안한다.
-
인간의 동작 인식은 가상 현실 시스템 및 게임 등에 적용할 수 있는 컴퓨터 비전 분야의 요소 기술 중 하나로써, 최근까지 그 연구과 활발히 진행되고 있다. 본 논문에서는 빠르고 정확한 동작 인식을 위해, 실루엣과 모션 특징이 결합된 방법을 제안한다. 제안하는 방법은 전역 특징을 이용한 후보 동작 선정 및 지역 특징을 이용한 검증 2 단계로 구성된다. 전역 특징은 Motion History Image의 Hu 모멘트를 이용해 계산되며, 후보 동작의 선정은 이들의 통계치를 이용해 결정한다. 한정된 후보 동작들 중 입력 동작을 정확히 인식하기 위해, 공간 및 방향성 비닝 기법으로 추출된 광류와 실루엣 특징을 지역 특징으로 이용한다. 최종 인식 결과는 Hu 모멘트 통계치와의 유사도 및 지역 특징의 학습을 통해 생성된 Support Vector Machine의 결과를 고려하여 결정된다. 제안하는 방법의 성능을 평가하기 위해, 실세계에서 사용 빈도가 높으며 동작의 변화가 큰 13 개의 제스처를 선정하여 데이터 셋을 구성하였다. 실험 결과 제안하는 방법의 연산 시간은 50 ms, 인식 정확도는 95%임을 확인하였다.
-
본 논문은 OLED 디스플레이를 위한 저전력 화질 개선 기법을 제안한다. 제안 기법에서는 영상의 대조비를 높이고, OLED 디스플레이 소비전력을 감소하는 기법을 선형 함수에 기반하여 유도하며, 지역적 특성을 고려하여 각 지역마다 서로 다른 매핑 함수를 적용하는 적응적 변환 함수를 구한다. 컴퓨터 모의실험을 통해 제안하는 기법이 전력 소비를 줄이는 동시에 영상의 화질을 개선하는 것을 확인한다.
-
영상 매칭은 컴퓨터 비전에서 기초적인 기술로써 영상 추적, 물체인식 등 다양한 분양에서 많이 사용되고 있다. 하지만 스케일, 시점변화, 조명 변화에 강인한 매칭점을 찾는 것은 어려운 일이다. 이러한 문제점을 보완하기 위해 SURF(Scale Invariant Feature Transform), SIFT(Speed up Robust Features) 등의 알고리즘이 제안 되었지만, 여전히 조명변화에 불안정하고 정확하지 못한 성능을 보인다. 본 논문에서는 이러한 조명변화에 대한 문제점을 해결하기 위해 히스토그램 평활화를 이용하여 영상을 보정 후, SURF를 통한 영상 매칭을 하였다. 열악한 조명환경 내에서 촬영된 영상에서 SURF를 이용하여 표현자(Descriptor)를 생성 할 때 특징점이 잘 추출되지 않는 문제점을 해결하기 위하여 히스토그램 평활화를 이용하였고, 보정 후 특징점 개수가 많이 증가하는 것을 보여 확인하였다. 기존의 SURF와 개량된 SURF를 조명이 서로 다른 영상간의 매칭 성능을 비교함으로써 제안한 알고리즘의 우수성을 확인하였다
-
최근 지진, 폭우, 해일 등의 갑작스런 재난으로 인하여 세계 많은 곳에서 피해를 받고 있다. 하지만 우리나라의 경우 각종 재난이 발생하였을 때 이를 효과적으로 알리기 위한 시스템이 존재 하지 않는 실정이다. 본 논문에서는 갑작스런 재난이 발생하였을 때 이를 효과적으로 알리기 위한 시스템으로 추가적인 주파수를 필요로 하지 않는 Water-marking 기법을 이용하여 기존의 T-DMB 대역폭에 재난 안전 방송을 추가하여 필요시 재난 상황을 알리는 시스템을 제안하고자 한다. Water-marking 기법의 경우 추가적인 대역폭을 요구하지 않으면서 기존 시스템의 성능 열화를 최소화 하는 방법으로 추가적인 통신 서비스를 가능하게 해 주는 시스템이다. 이를 위해서는 적절한 SS 송수신기 설계와 기존 시스템의 성능열화 범위를 계측할 필요가 있다. 본 논문은 기존의 T-DMB 시스템에 SS 송신기를 추가함으로써 T-DMB의 성능열화는 최소화 하는 동시에 재난안전 방송을 위한 통신 시스템을 구축하고 이에 대한 성능평가를 실시하였다.
-
최근 통신 환경의 진화와 고사양 모바일 단말기의 대중화로 인하여 모바일 통신 환경에서 동영상 서비스를 이용하는 사용자가 급증하고 있다. 사용자들은 제한적인 데이터 사용량을 이용하여 필요한 영상을 효율적으로 검색 및 탐색하기 위하여 미리보기 서비스 또는 Thumbnail을 이용한다. 이 중 Thumbnail은 동영상의 복호화 과정에서 제공되는 서비스이며, 이를 효과적으로 추출하는데 있어서 낮은 복잡도의 기술들이 사용되어야 한다. 본 논문에서는 영상의 히스토그램의 특징을 이용한 Thumbnail 추출 기법을 제안한다. 제안하는 추출 기법에서는 각 영상의 히스토그램을 비교 및 분석하여 하나의 video을 다수의 구간으로 분할하고, 각 구간의 대표 Thumbnail을 추출하는 방법을 사용한다. 다양한 영상을 이용한 실험 결과는 제안하는 알고리즘이 효과적으로 Thumbnail을 추출함을 보여준다.
-
높은 효율을 가진 비디오 압축 코덱인 H.264/AVC는 예전보다 압축 성능을 향상 시키기 위한 방법 중 하나로 율-왜곡 최적화 기법이라는 것을 사용한다. 이 기법은 압축된 결과를 가지고 손실과 압축률 두 가지를 모두 고려하여 어떤 경우가 더 최적의 압축인가 하는 것을 판별하는데, 여기서 모든 경우에 대해 압축을 수행해야 함으로 이전 보다 몇 배나 높은 복잡도를 가질 수 밖에 없다. 이러한 문제를 해결하고자 하는 노력으로 본 논문에서는 SAHTD(Sum of Absolute Hadamard Transform Difference)라는 기준을 사용하여 이를 이용해 율-왜곡 최적화 기법을 사용하지 않거나, 사용을 최소화 하면서 압축 효율을 유지하는 방법을 제시하였다. 본 논문에서는 휘도 신호
$8{\times}$ 8과$4{\times}4$ 블록을 위한 방법을 제시하고 있다. 이 두 가지 크기의 블록에 대해서 SAHTD값을 구해 SAHTD가 낮은 순으로 모드들을 정렬하고, 이것이 가장 낮은 3개의 모드를 선택해 이것 중에 MPM이 포함되지 않았을 경우에 대해서는 MPM을 포함해 4개의 모드를 선택해 압축을 수행하도록 한다. 여기서 얻은 모드들 중에 SAHTD값이 일정 값 이상 더 낮은 모드가 존재할 경우, 그 모드들에 대해서만 율-왜곡 최적화 기법을 수행한다. 이를 통해 최적의 모드일 가능성이 낮은 모드들에 대한 부가적인 연산 수행을 방지하게 된다. 휘도신호 16x16이나 색차 신호 압축의 경우에는 SAHTD를 사용하여 가장 낮은 SAHTD값을 갖는 모드를 최적의 모드로 결정한다. JM 참조 소프트웨어를 통한 실험결과 제안된 기법은 기존 JM의 방식에 비해 화면 내 프레임의 부호화 시간의 82.2% 감소와 0.042dB의 PSNR 감소율, 0.527%의 비트 증가율을 보여주었다. -
본 논문은 IEEE 802.11기반 무선 멀티홉 환경에서 은닉 노드가 존재할 때 전체 시스템의 효율 저하를 최소화 하면서도 평균 시간 지연 요구를 만족할 수 있는 경쟁 윈도우 제어 알고리즘을 제안한다. 이에 적용되는 최소 경쟁 윈도우 기준값을 주어진 topology에 따라 도출하고 각 트래픽 플로어의 QoS 요구조건 만족과 은닉노드가 존재할 경우에 성능개선을 위한 경쟁 윈도우 제어 패턴을 조절한다. 제안하는 경쟁 윈도우 제어 기법을 ns-2 시뮬레이션을 통해 검증하고, 모든 QoS 요구를 수용하면서 전체 성능 개선을 보이는 결과를 구하였다.
-
최근 3D 입체영상에 대한 소비자들의 관심 증대로 가전 업체들은 3D TV, 3D Monitor등의 제품들을 출시하고 있고, 이에 따라 3D 콘텐츠 시장도 급격히 성장할 것으로 예상된다. 또한 네트워크 인프라의 발전으로 IP(Internet Protocol)망을 통한 고화질 동영상의 유통이 가능해졌다. 하지만, QoS(Quality of Service)를 보장하지 않는 IP 기반 전송환경에서의 고화질 미디어 스트리밍 서비스는 콘텐츠를 시청하는 소비자 관점에서 필수적으로 보장되어야 하는 끊김 없는 영상서비스를 제공하는데 제약이 있다. 이러한 문제를 해결하기 위해서, IP 망 네트워크 환경을 고려하여 사용자들이 원하는 콘텐츠를 고품질 혹은 저품질로 제공 할 수 있는 Adaptive 스트리밍 서비스에 관한 기술 개발이 등장하게 되었고, 현재 국제 표준화 기구인 MPEG(Moving Picture experts Group)에서 DASH(Dynamic Adaptive Streaming over HTTP)라는 이름으로 표준화가 진행 중에 있다. 이에 본 논문에서는 DASH를 이용한 효율적 3D Adaptive 스트리밍 서비스 제공 방안을 제안한다. DASH를 이용한 3D 서비스는 사용자들에게 IP 망을 통해 다양한 품질의 3D 콘텐츠를 제공할 수 있으며, 또한 하나의 3D 콘텐츠로 다양한 디바이스에 적용 가능하다는 이점이 있다.
-
영상 압축은 멀티미디어 전송에 있어 핵심적인 기술이다. 동영상 압축 기술 중 움직임 예측은 H.264, MPEG-4 등의 압축 표준에서 시간적 중복성을 줄이기 위해 이용되고 있다. 따라서 영상의 압축 효율을 높이는 다양한 움직임 예측 알고리듬이 제안되었다. 이에 본 논문은 계산량을 줄이기 위해서 EPDS(Edge-Based Partial Distortion Search)를 기반으로 한 개선된 이단 탐색 움직임 예측 알고리듬을 제안한다. 이를 위하여 이단 탐색에서의 적응적 탐색 구간 적용 기술을 사용하였다. 제안한 알고리듬은 FS보다 98.11배 빠르다. 뿐만 아니라, PSNR을 통해 화질이 비슷하게 유지됨을 알 수 있다. 따라서 제안한 알고리듬은 고화질 디지털 영상 실시간 구현에 적합하다.
-
본 논문에서는 MPEG-4 LASeR (Lightweight Application Scene Representation) 장면기술을 활용하여 효과적인 EPG(Electronic Program Guide) 서비스를 제공하는 방안을 제안한다. EPG는 텔레비전 방송 프로그램의 편성표를 텔레비전 화면상에 표시하는 것으로, 텔레비전을 시청하는 사람은 이 편성표를 통해 원하는 프로그램을 선택하거나 시간, 제목, 채널, 장르 등을 기준으로 원하는 프로그램을 검색할 수 있는 서비스를 말한다. 국제 표준 규격인 MPEG-4에는 장면의 동적인 업데이트를 위해 다양한 명령을 포함한 장면 서술정보를 제공 할 수 있는 LASeR 기술을 제공하고 있다. 특히, LASeR 표준은 구조화된 정보의 표현 및 수정 방법을 제공하기 위한 방법으로 PMSI (Presentation Method & Structured Information)를 제정하였으며, 해당 기술은 장면 서술정보에서 구조화된 정보의 일부분을 참조하여 장면에 효과적으로 표현하는 것을 가능하게 해 준다. 본 논문에서는 MPEG-4 LASeR PMSI를 기존의 텍스트 중심의 단순 EPG에 적용하여 텍스트 뿐만이 아닌 이미지 비디오 등의 멀티미디어 데이터를 활용하여 보다 동적으로 EPG 서비스를 제공하는 방법에 대하여 제안한다.
-
본 연구에서는 SVC 기반의 HTTP 스트리밍 서비스에서 스케일러블 임의 접근 (random access) 기능을 가능하게 하는 방법을 제안한다. ISO MPEG에서는 DASH (Dynamic Adaptive Streaming over HTTP) 기술을 표준화 하고 있는데, H.264/AVC 비디오에 대한 임의 접근 기능을 지원하는 구문론 (syntax)과 의미론 (semantics)은 현재 표준의 범위에 포함되어 있는 상황이지만 SVC 비디오에 대한 임의 접근 기능에 대한 기술은 포함되어 있지 않다. 본 연구에서는 SVC의 계층적 구조(layered structure)를 고려한 스케일러블 (scalable) 임의 접근 기능을 지원하기 위한 구문론 (syntax)과 의미론 (semantics)에 대해 제안한다.
-
본 논문에서는 컬러영상의 검색을 위하여 대표색상의 통계적 특성과 그 공간적 분포를 이용하는 기법을 제안한다. 대표색상은 HSV 색상공간에서 빈도수가 가장 높은 1-8개의 색상영역으로 선택되는데, 대표색상의 값과 각 대표색상이 영상에서 어떻게 분포하느냐에 따라서 검색되는 영상의 종류와 객체의 형태가 크게 달라진다. 본 논문에서는 영상을 일정한 개수의 작은 영역으로 나누고 각 영역에서 각 대표색상이 충분히 존재하는지를 평가하여, 각 대표색상이 영상평면에서 분포한 상태를 이진화된 공간분포 지도로 표시한다. 이로부터 영상간의 대표색상마다 이진공간분포의 차이를 비교함으로써, 색상의 통계적 특성과 공간적 분포가 동시에 반영된 특징으로 영상을 검색한다. 본 논문에서 제안한 대표색상의 공간적 분포 모델을 이용한 영상검색 기법은 MPEG-7에서 정의한 대표색상 기반의 영상 검색보다 우수한 성능을 보여주었다. 이진공간분포 지도의 생성 방법 및 거리측정 파라미터에 대한 최적화가 이루어지면 영상검색 성능이 더욱 개선될 것으로 예상되며, 웹기반의 영상검색 시스템에 활용될 수 있을 것으로 기대된다.
-
In order to convert interlaced video into progressive scanning format, this paper proposed a high performance de-interlacing algorithm based on region adaptive interpolation filter design. Specifically, usage of the 6-tap filter is only for the most complex region, but for the smooth and regular edge region, much more correlated filter such as 2-tap or 4-tap filter should be used instead. According to the experimental results, the proposed algorithm has achieved noticeably good performance.
-
This paper proposes a novel deinterlacing algorithm using neighboring deinterlacing pixels directions weight, which can obtain the true deinterlacing direction of the interpolated pixel. The proposed algorithm determines the direction of the current interpolated pixel using MELA direction determination method. To obtain more accurate deinterlacing direction and increase interpolation direction correlation, the directions of neighboring pixels around the current interpolated pixel are considered. The current direction and the neighboring majority direction are compared to decide an interpolated method. But it cost slightly CPU time increasing since neighboring pixels directions determination and statistics. Experimental results demonstrate that the proposed algorithm outperforms the conventional deinterlacing methods.
-
In this paper, an area-efficient architecture of LDPC Decoder is proposed for DVB (Digital Video Broadcasting) 2.0 systems. The proposed LDPC Decoder was designed in hardware description language (HDL) and implemented with Xilinx Virtex-5 FPGA. With the proposed architecture, the number of slices for the decoder is 56122 and the number of block RAM is 135.
-
비디오 압축 기법에서 움직임 추정 (Motion Estimation)은 매우 중요한 부분을 차지하는데, 그것은 움직임 추정이 화질과 인코딩 시간에 직접적으로 영향을 미치기 때문이다. 가장 기본적인 움직임 추정 기법은 전역 탐색 기법 (Full Search Algorithm, FSA)인데, 이는 가장 좋은 화질을 보여주긴 하지만 매우 많은 계산량을 필요로 한다는 단점이 있다. 따라서 좋은 화질을 유지하면서도 계산량을 낮추기 위한 많은 고속 탐색 알고리즘들이 제안되었다. 이 논문에서는 고속 탐색 알고리듬 중 하드웨어 구현 시 많은 이점을 가진 1비트 변환 알고리듬 (One-bit Transform-based Motion Estimation, 1BT)을 소개하고 1비트 변환 알고리듬의 방법에 있어서 기존의 1비트 변환 알고리듬의 PSNR을 유지하면서 좀 더 빠른 속도로 인코딩이 가능한 커널 및 알고리듬을 제시한다. 실험결과에 따르면 우리가 제안한 알고리듬은 기존의 1비트 변환 알고리듬과 비슷한 PSNR을 유지하면서 속도가 향상된 것을 볼 수 있었다.
-
본 논문은 비디오 압축 알고리즘 중 움직임 예측에 해당하는 논문이다. 이와 관련하여 FS와 같은 PSNR을 유지하면서 계산량을 줄이는 SEA, MSEA 알고리즘이 제안되었다. 본 논문은 SEA 와 MSEA와 같은 알고리즘에서 이전블록의 sumnorm을 가지고 현재블록의 합과 차이를 구하여서 낮은 순으로 탐색 지점을 탐색하는 방법을 제안한다. 이 방법으로 SADmin을 빨리 찾게 되서 후보 탐색지점들을 높은 확률로 제거함으로써 계산량을 줄이는 알고리즘을 제안한다.
-
본 논문은 제한적인 대역폭을 가지는 무선 네트워크 환경에서 실시간 비디오 스트리밍 전송을 위한 양자화 계수 자동 조절 기법을 제안한다. 제안하는 방법은 실시간 비디오 통신을 위하여, 프레임 간 차이 연산을 이용하는 방법이다. 양자화 계수에 따라 화질이 변하는 특성에 기반 하여 프레임 간 차이 연산을 통해 데이터의 변화량을 예측하여 양자화 계수를 조절한다. 실험은 802.11n 무선 네트워크 환경에서 MFC 기반 비디오 영상 통신 모듈을 통해 양자화 계수 자동 조절 기법을 적용하였다. 양자화 계수를 실시간으로 조절하여 네트워크 전송 지연을 사전에 방지하고, 상대적으로 고정된 양자화 계수를 적용하는 비디오 통신 경우에 비하여 비디오 전송에 있어 더 원활한 통신을 가능하게 한다.
-
방송 및 통신망에서 방송 및 멀티캐스트 데이터를 효율적으로 전송하기 위해 적응변조 방식을 통해 그룹 내의 사용자 개개인의 요구 성능(QoS)을 보장해주는 기술이 고려되고 있으며, 이를 위해서는 피드백 부담을 낮출 수 있는 기술 개발이 필수적이다. 본 논문에서는 멀티캐스트 그룹 내 모든 사용자가 공유하는 1bit 피드백 채널을 사용하여 그룹 내 사용자수에 관계없이 2개 또는 3개의 1bit 피드백채널만을 사용하여 적응변조(Adaptive Modulation and Coding)동작을 하는 방법을 제안하였다. 또한 제안한 방법에 대한 시스템 레벨 모의실험을 수행하여, 사용자별로 피드백 채널을 사용하는 경우와 제안된 방식을 사용하는 경우의 전송 효율을 비교분석 하여 제안된 방식의 실용성을 보였다.
-
본 논문은 1 비트 변환(1-bit transform: 1BT) 알고리듬에 적응적 탐색 지점 조정을 추가적으로 적용한 알고리듬이다. 1BT는 정합 오차 기준을 Sum of Absolute(SAD)를 대신 하여 Number of Non-matching Point(NNMP)를 사용하여 속도를 향상시키고, 하드웨어 구현을 용이하게 했다. 하지만 정합 오차 기준만 바뀌었을 뿐, 전역 탐색(FS: Full Search)알고리듬을 사용한다. 본 논문에서는 1BT방법에 적응적 탐색 지점 조정을 적용함으로써 추가적으로 속도 향상하는 알고리듬을 제안하였다. 실험 결과에서는 기존의 1BT와 제안하는 알고리듬을 비교하여 PSNR과 시간 측면에서의 뛰어난 성능을 보여준다.
-
동영상을 고효율로 압축할 수 있는 중요한 기술 중의 하나가 움직임 추정 기술이다. 움직임 추정 기술에서 가장 널리 사용되는 탐색 방식과 정합오차를 판단하는 기준은 각각 전역 탐색(FS: Full Search)알고리듬과 Sum of Absolute Differences(SAD)이다. 하지만, FS와 SAD를 사용한 움직임 추정기술은 인코더 전체 계산량의 50%이상을 차지하게 된다. 무선 통신 및 인터넷 환경에서 사용되는 응용프로그램에 대해서는 많은 계산량이 실시간 전송을 어렵게 만든다. 이러한 이유로, 동영상 압축 기술에서 계산량을 줄이는 방법이 중요하게 되었다. 그 결과로, SAD대신 다른 정합 오차 기준을 사용하여 움직임 추정기술의 계산량을 줄이는 알고리듬들이 제안되었다. 본 논문에서는 계산량을 줄이면서 하드웨어 구현 시 많은 이점을 가진 1비트 변환 (One-bit Transform, 1BT)알고리듬과 1비트 변환의 성능을 향상시킨 제한된 1비트 변환(Constrained one-bit transform, C-1BT)을 소개하고 C-1BT방법에 있어서 기존 방식의 빠른 인코딩속도를 유지하면서 PSNR을 증가시키는 알고리듬을 제안한다. 제안하는 알고리듬에서는 기존 C-1BT에서 고정해서 사용한 파라미터 D값을 대신에 현재블록과 동일한 위치에 있는 참조영역의 블록과 그 주변블록의 움직임벡터 정보를 이용해서 블록의 움직임 정도를 판단하고, 블록단위로 D값을 적응적으로 결정한다. 실험결과는 제안하는 알고리듬이 기존의 알고리듬과 비교하여 평균 0.11dB PSNR 증가를 보여 준다.
-
H.264/AVC와 같은 동영상 압축 기술은 동영상의 압축에 필요한 연산이 대부분 부호기에서 이루어진다. 반면에 분산 동영상 압축 기법은 정보 압축에 필요한 연산이 대부분 복호기에서 수행되는 구조를 가진다. 본 논문에서는 분산 동영상 압축 기법의 구성 요소 중 오류 정정 부호기와 복호기에 사용되는 오류 정정 부호 중 LDPC 부호의 성능을 향상 시킬 수 있는 새로운 복호 기법을 제안한다. 제안하는 기법을 적용하여 추가적인 연산 없이 LDPC 부호의 오류 정정 성능을 향상시킬 수 있었다.
-
본 논문에서는 사용자의 손바닥 위에 증강되는 가상 객체와의 자연스러운 상호 작용을 제공하는 혁신적인 손 기반 인터페이스를 제안한다. 본 인터페이스에서는 한 손바닥 위에 다른 쪽 손의 손가락으로 미리 정의된 패턴을 그린 후 그 패턴을 인식함으로써 가상 객체들이 용이하게 선택되도록 한다. 이렇게 선택된 가상 객체들은 계산된 손바닥 포즈를 이용해서 손바닥 위에 증강된다. 손가락으로 그려진 패턴을 효과적으로 검출하기 위해 손가락을 감쌀 수 있는 마커를 사용하여 손가락의 궤적을 추적한다. 넓은 범위의 손바닥 포즈를 계산하고 손가락의 움직임을 인식함으로써 사용자는 다양한 시각에서 손바닥 위의 증강된 가상 객체와 자연스럽게 상호 작용할 수 있다.
-
본 논문에서는 모델 기반 카메라 추적 시 필요한, 사전 정의 된 실측 모델의 정확성이 카메라 추적의 정확성에 미치는 영향에 대하여 논의한다. 이를 위하여 모델 기반과 특징점 기반의 카메라 추적에 가중치를 두고 혼합시켜 이용하는 하이브리드 카메라 추적 방법을 사용하고, 이 방법을 활용한 상호작용형 모델링(interactive modeling)을 이용하여 실측 모델을 제작한다. 또한, 상호작용형 모델링 과정에서 생기는 실측 모델의 오차로 인해 발생하는 카메라 추적 오차를 Cramer-Rao 하한(lower bound)을 이용하여 정의하고, 이 둘의 상관관계를 실험적으로 도출한다. 이를 통해 사전 정의된 실측 모델이 가질 수 있는 오차의 하한을 실험적으로 검증한다.
-
본 논문에서는 디지털 홀로그래픽 비디오 서비스를 위한 시스템의 구조를 제안하고 이를 구현하였다. 홀로그래픽 비디오 서비스의 형태는 다양할 수 있는데 이 중에서 깊이카메라를 기반으로 하여 위상방식의 컴퓨터생성홀로그램(computer generated hologram, CGH)을 이용하는 것을 타겟으로 하였다. CGH는 고속 생성을 위하여 GPGPU(general purpose graphic processing unit)을 이용하였고, 편의상 복원은 프레넬 변환(Fresnel transform)을 이용한 소프트웨어 방식을 이용하였다.
-
자연스러운 3D 실감영상을 감상하기 위해서는 많은 시점의 영상이 필요하며 과거 스테레오 디스플레이 장치로부터 최근 그 시점 수가 크게 늘어난 디스플레이 장치로 기술 발전이 이뤄지고 있으며 이에 따라 다시점 콘텐츠를 생성하기 위한 다양한 기술이 개발되어 있다. 다시점 콘텐츠를 생성하기 위하여 ToF 카메라 및 적외선 패턴을 이용한 방법이 주로 이용되고 있으며 이를 활용한 다시점 콘텐츠 생성을 하는 시도가 이뤄지고 있다. ToF 카메라는 PMD사의 제품 및 SwissRanger 사의 제품이 대표적이며 적외선 패턴을 이용한 방식은 MS사의 Kinect가 대표적이며 본 제품들을 활용한 기술 비교를 통하여 다시점 콘텐츠 생성의 결과 및 이를 비교한 장단점을 구분하였다. PMD사의 ToF 카메라는 두 개 이상의 광원을 사용하여 Depth 추출시에 Hole 영역의 크기가 작으나 ToF 영상의 해상도가 매우 작아 고화질의 콘텐츠를 생성하기 위하여 별도의 영상처리 알고리즘이 요구되었다. 반면 MS사의 Kinect는 Depth 영상의 해상도가 상대적으로 커서 영상처리 알고리즘의 복잡도가 작아지나 Depth 추출을 위한 카메라와 RGB 카메라의 위치가 공간적으로 떨어져 있어 이를 보정하기 위한 알고리즘이 요구되며 다시점 변환시 화질에 있어 상대적으로 떨어지는 것으로 나타났다.
-
구조광을 이용하는 깊이 정보 획득 방법에서 코드화된 패턴의 색상 정보는 촬영된 영상으로부터 패턴을 해석하여 패턴의 위상 변화량으로부터 물체의 깊이 정보를 찾기 위함으로 구조광 패턴들이 대상에 정확하게 투영되는 것이 중요하다. 그러나 프로젝터의 특성에 따라 패턴의 RGB 채널들이 종종 좌표에서 어긋나는 현상이 발생하게 된다. 본 논문에서는 프로젝터의 특성에 따른 컬러 구조광의 캘리브레이션을 위한 방법을 제안한다. 제안하는 방법은 시변화 가시구조광 시스템의 캘리브레이션 과정 중에서 투사된 영상으로부터 RGB 패턴 채널을 추출하고, 추출된 패턴으로부터 각 RGB 채널에 대한 히스토그램을 통하여 패턴 채널이 어느 방향으로 번져 나갔는지를 파악하여 원 패턴에 대한 재정렬을 수행한다. 본 논문의 실험결과에 따르면, 기존의 방법에 비해 간단한 방법으로 가시구조광 패턴에 대한 캘리브레션을 수행할 수 있음을 보여준다.
-
컬러 구조광을 이용한 깊이 정보 획득 시스템에서 구조광의 패턴의 색상 정보를 정확하게 추출하는 것이 중요하다. 본 논문에서는 시변화 가시구조광 시스템을 위한 색상 패턴을 해석하는 방법에 대해서 제안한다. 제안하는 방법은 시변화 가시구조광의 패턴이 투사된 영상으로부터 투사된 색상 정보를 추출하고, 추출된 색상 정보로부터 색상 패턴의 ID를 추출한다. 추출된 정보는 물체에 대한 깊이 정보로 계산될 수 있다. 패턴 ID를 빠르고 정확하게 추출하기 위해 최초의 원 패턴 정보를 기반으로 하여 Look-up 테이블을 구성하고, 이 테이블 정보를 이용하여 초기 패턴 ID 정보를 추출한다. 이후 추출된 패턴 ID에 대해서 신뢰도를 바탕으로 비어있는 정보를 채워준다. 본 논문의 실험에서는 제안하는 방법이 기존의 방법에 비해 정확하면서도 빠르게 색상 패턴 정보를 찾을 수 있음을 보여준다.
-
본 논문에서는 ATSC (Advanced Television Systems Committee) 지상파 DTV (digital television) 방송 시스템에서 부가 데이터 전송률을 향상시키면서 비트 오율 (bit error rate) 성능을 개선하기 위한 다중 안테나 부가데이터 전송 방식을 제안한다. 제안된 다중 안테나 전송방식은 Alamouti 기법을 사용하여 단일 안테나 전송 방식에 비해 신호대 잡음비 이득을 얻는다. 또한, 제안하는 전송 방식은 기존의 ATSC 지상파 DTV 수신기와 역호환성을 가진다는 장점이 있다.
-
와이브로(Wibro) 또는 WiFI 망에서 동일한 멀티캐스트 그룹에 속한 이동 단말기들은 동일한 MBS(멀티캐스트/브로드캐스트 방송 서비스) 콘텐츠를 수신한다. 동일한 MBS 존 내의 기지국(RAS: Radio Access Station) 들이 MBS 콘텐츠 소스로부터 수신된 MBS 콘텐츠에 대한 전송 시간을 동기화할 수 있도록 기지국들은 전송 동기화 정보와 신뢰성 있는 데이터 패킷 수신을 동기 시간을 결정하기 이전에 보장받을 수 있어야 한다. 만약에 동일한 MBS 존에 속하는 다수의 기지국 중에 전송 동기화 정보를 수신하지 못하거나 패킷 데이터 일부 또는 전부를 수신하지 못한다면, 동기 전송 시간을 결정하기 전에 이미 손실된 정보와 패킷 데이터를 이동 단말기로 전송하게 됨으로써 이동 단말기가 MBS 콘텐츠를 수신하면서 동일 MBS 존 내의 다른 기지국으로 핸드오버하게 되면 MBS 콘텐츠에 대한 끊김없는 수신을 보장할 수 없을 뿐만 아니라 매크로 다이버시티(macro diversity) 이득을 얻기 위한 동일한 MBS 존에서 이동 단말기들에게 전송되는 MBS 콘텐츠들의 동기를 보장 할 수 없다. 따라서, 본 논문에서는 동기 전송 시간을 결정하기 앞서서 다수의 RAS가 전송 동기화 정보와 신뢰성 있는 패킷 데이터 콘텐츠 수신을 보장받을 수 있는 장치를 보완한 멀티캐스트/브로드캐스트 서비스 데이터 전송 동기화 방법을 제안한다.
-
본 논문에서는 지상파 3D HDTV 방송 서비스를 제공하기 위하여 기존의 유럽형 HDTV 방송 서비스인 DVB-T2 전송 시스템의 채널 부호군 중 외부부호로 쓰이는 BCH 부호를 연판정 복호가 가능한 Block Turbo Code로 대체함으로써 생기는 성능 이득과 높은 부호율을 달성하기 위한 방법을 제안하였다. 기존의 DVB-T2 시스템에서 외부부호로 쓰이는 BCH 부호의 부호율의 경우 0.994정도의 높은 부호율을 가진다. 따라서 이에 준하는 높은 부호율을 가지면서 연판정 복호가 가능한 BTC 부호를 제안하고, 기존의 BTC 보다 더 높은 부호율을 가지는 BTC 부호를 설계한다. 모의 실험을 통하여 새롭게 제안된 BTC 에서도 반복복호의 이득이 생기는 것을 확인하고 기존 DVB-T2 시스템의 BCH 부호보다 성능이 우수함을 확인하였다.
-
3DTV를 시청하는 경우 조절거리는 TV 화면까지의 거리에 해당하지만, 수렴거리는 좌 우 영상의 화면 시차에 따라 영상의 도출과 후퇴의 깊이가 변하게 되고 수렴거리와 조절거리에 불일치가 발생하게 된다. 3DTV의 입체영상을 시청할 때 발생하는 시각적 불편감은 이러한 수렴과 조절과정의 불일치가 가장 주된 원인으로 알려졌다. 본 연구에서는 입체영상의 시각적 자극으로 눈에서부터 시작된 시각피로감이 인체에 전해지는 단계, 즉 정보의 최종 통합기관인 뇌에 전달결과로서의 생체적 반응을 EEG 방법으로 측정하였다. 3DTV 시청 전 후의 뇌파측정과 뇌기능지수 분석에 의한 방법으로 실험한 결과 시각피로는
${\delta}$ ,${\theta}$ ,${\alpha}$ , SMR,${\beta}$ Low,${\beta}$ High 파 등 여러 종류의 뇌파 밴드에 영향을 미치고 있었다. -
이 논문에서 제안한 방법은 간단하게 중간 시점 깊이 영상을 생성하는 방법이다. 왼쪽 시점과 오른쪽 시점 두 가지 깊이 영상을 가지고 깊이 값을 계산 한 후 깊이 값과 시점의 이동에 따라 물체의 위치가 변화하는 상관관계를 간단한 식으로 계산해 중간 시점을 만든다. 중간 시점을 생성 한 후, 픽셀 이동에 따른 노이즈 감소 방법을 사용하는 기존 알고리즘 (1)과 이를 수정한 노이즈 감소 방법과 Occlusion영역을 채운 후, 중간 시점을 생성하는 알고리즘 (2)를 사용한다. 우리가 생성한 중간 시점의 PSNR은 알고리즘 (1)는 30.38dB이고, 알고리즘 (2)는 30.52dB이다.
-
워터마킹 알고리즘은 강인성과 비가시성을 동시에 만족해야 하고, 이를 위해서는 가장 적합한 데이터에 워터마크를 삽입해야 한다. 본 논문에서는 디지털 홀로그램을 위한 워터마킹 알고리즘의 개발을 위해 복원영역(프레넬 변환)에 대한 특성을 분석하였다. 이를 기반으로 복원영역에서는 프레넬 변환을 수행한 후 얻어지는 실수부와 허수부 데이터를 이용해 절대값 영상을 생성하고, 여기서 워터마크 삽입을 위한 좌표를 선정한 후 실수부와 허수부에 워터마크를 삽입하였다. 실험결과 제안한 워터마킹 알고리즘은 강인성과 비가시성을 충분히 만족하여 디지털 홀로그램을 위한 적절한 워터마킹 기술임을 확인할 수 있었다.
-
본 논문에서는 기존에 제시된 LB 기법을 이용할 경우 발생하는 증가한 복잡도를 감소 시키는 기법을 다룬다. LB(Large Block)는 HEVC(High Efficiency Video Coding)의 대표적인 부호화 툴로 H.264/SVC(Scalable Video Coding)에 적용한 경우에도 상당한 부호화 효율의 개선을 보인다. 그러나, LB 를 적용하면 매크로블록 레벨에서 추가적인 부호화 과정이 요구되므로, 부호화기의 복잡도가 증가하는 문제점이 발생한다. 따라서, 본 논문에서는 LB 를 적용한 SVC 의 부호화기 복잡도를 감소시키는 기법을 제시하고 모의실험을 통해 제안된 부호화 기법의 RD 성능과 부호화기 복잡도를 확인한다. 실험결과 제안된 기법을 사용한 부호화 기법이 기존의 부호화 방법에 비해, RD 측면에서 평균 1.8%의 미미한 손실이 있으나, 복잡도 측면에서 평균 12%의 이득이 있음을 확인 하였다.
-
다시점 비디오는 사용자들에게 자유로운 시점 선택 및 넓은 시점에서의 입체감을 제공하지만, 시점의 증가에 따른 데이터 량의 증가가 불가피하다. 이에 따라 최근 MPEG 에서는 재생되는 시점 수 보다 적은 수의 다시점 비디오와 그에 대응하는 깊이 영상 및 관련 파라미터를 메타데이터 형태로 제공하는 다시점 및 깊이 영상 부호화(MVD: Multiview plus Depth)에 대한 표준화를 진행하고 있다. 본 논문은 MVD 가 방송망에서 서비스되는 시나리오를 가정하여 다시점 비디오와 그에 대응하는 깊이 영상을 MPEG-2 TS(Transport Stream)로 전송하기 위한 기법을 제시한다. 제안한 기법은 기존의 단일 영상 및 깊이 영상을 전송하기 위한 부가비디오스트림 서술자(Auxiliary Video Stream Descriptor) 및 MPEG-C Part 3 표준을 확장하여 다시점 비디오와 그에 대응하는 깊이 영상간의 매핑 정보 및 각 시점의 깊이 파라미터를 제공할 수 있다.
-
본 논문에서는 허프변환 및 HSV 색변환을 이용한 효율적인 차선검출의 최적화 알고리즘을 제안한다. 차선 검출의 고속화를 위해 차선과 카메라의 위치를 감안하여 고정된 관심영역(ROI_LB)을 정하고 검출 영역을 감소시킨다. 정해진 관심영역 내에서 허프변환을 적용해 차선을 검출하고 이를 위해 Sobel Mask와 Threshold를 사용한다. 또한, HSV 색 공간을 이용하여 황색 선과 백색 선을 구별해내며 차선 이동 시에 "MOVEMENT"이라는 문자열을, 중앙선을 넘어가면 "DANGEROUS"이라는 문자열을 출력한다. 제안하는 방법의 실험 결과는 복잡한 도로 동영상에서 효과적으로 차선을 인식하고 색 구별을 하였으며 제안 방법의 유효성을 검증하기 위해 다양한 실제 차선 패턴을 대상으로 한 실험결과를 제시한다.
-
최근 스마트폰의 카메라를 이용한 시각 검색(Visual Search) 어플리케이션(Application)을 많은 사람들이 이용하고 있고, 이러한 시각 검색 어플리케이션은 여러 가지 특징 추출 방법을 사용하고 있다. 본 논문에서는 특징 추출 방법 중 하나인 Speeded Up Robust Features (SURF)를 사용하여 모바일 환경에 적합한 특징 추출 및 정합 방법에 대하여 기술한다. 모바일 기기들은 기존의 일반 PC환경에 비해 비교적 낮은 성능의 하드웨어 조건을 가지고 있다. 하지만 SURF 특징점 추출 방법 및 정합 방법은 계산량이 많고 복잡하여 실시간 및 모바일 환경에 사용하기엔 제약이 따른다. 모바일 환경에서 높은 성능을 내기 위해 기술자(Descriptor) 차원 감소와 라플라시안(Laplacian) 부호를 이용한 정합, 그리고 최적의 거리 비율로 정합하는 방법을 제안한다.
-
단말기 기술의 향상으로 과거 다시점 영상 디스플레이가 어려웠지만 현재는 다양한 3D 디스플레이 장치가 개발되고 있으며 2장의 영상을 활용한 스테레오 영상 단말 뿐 아니라 다시점 영상 단말도 개발되고 있다. 다시점 방송 및 콘텐츠를 이용하기 위한 장치는 사용자가 콘텐츠를 감상하는 거리, 각도 및 개개인의 취향에 따라 각기 다른 실감정도를 보여주고 있으며 단말 장치 및 사용자는 끊임없이 움직이게 되므로 이에 대한 대처가 필요하다. 본 논문에서는 사용자의 위치를 파악한 후 그 결과에 따라서 단말장치에서 연속적으로 사용자에게 적절한 깊이 정보를 송출하기 위한 알고리즘을 개발하였다. 사용자의 얼굴 및 눈을 검출하였으며 기존 알고리즘의 문제점인 눈이 아닌 눈썹 또는 눈 주변의 어두운 영역으로 인한 오인식의 문제점을 해결하였다. 눈썹의 위치를 인식하여 눈썹 영역과 눈 영역의 분리를 통한 정확한 눈 위치추적 알고리즘 결과 테스트스트림에 따라 최대 52%의 오차율 향상을 보였다.
-
본 논문은 원활한 차선 인식을 위한 전체 시스템 시간을 단축하는 방법에 초점을 맞추고 또한 기존의 차선 인식 시스템의 문제점을 알아보고 그 중에서 급커브에서의 문제점, 중앙선 인식이 잘되지 않는 문제를 개선하기 위한 방법과 최적의 경보를 울리기 위한 논리를 찾아보았다.
-
최근 증강현실에 대한 관심이 높아지면서 다양한 연구가 활발히 진행되고 있다. 특히, 스마트폰과 같이 고성능 모바일 장치가 대중화됨에 따라 모바일 플랫폼 기반의 증강현실 어플리케이션이 급증하고 있다. 본 논문에서는 모바일 플랫폼 기반의 증강현실을 구현함에 있어 사용자에게 증강된 가상 모델과의 촉각적 상호작용을 제공하기 위한 효과적인 시스템을 제안한다. 제안된 시스템은 모바일 환경을 고려하여 손 위에 올려놓을 수 있는 패드 형태의 진동-촉감 전달 장치를 비주얼 마커와 결합하고 마커를 이용해 증강된 가상의 모델의 움직임에 맞춰 촉감 신호를 사용자에게 전달한다. 따라서 본 시스템은 증강된 가상 모델에 대한 사용자의 시각적 상호작용과 동시에 촉각적 상호작용을 통해 보다 실재감 있는 증강현실을 제공한다. 본 논문에서는 안드로이드 플랫폼 기반의 모바일 증강현실 시스템에 이를 구현하고 그 유용함을 보인다.
-
Video stabilization is an important image enhancement widely used in surveillance system in order to improve recognition performance. Most previous methods calculate inter-frame homography to estimate global motion. These methods are relatively slow and suffer from significant depth variations or multiple moving object. In this paper, we propose a fast and practical approach for video stabilization that selects the most reliable key frame as a reference frame to a current frame. We use optical flow to estimate global motion within an adaptively selected region of interest in static camera environment. Optimal global motion is found by probabilistic voting in the space of optical flow. Experiments show that our method can perform real-time video stabilization validated by stabilized images and remarkable reduction of mean color difference between stabilized frames.
-
별개의 컨트롤러 없이 사용자의 신체만을 이용하여 다양한 게임과 엔터테인먼트를 경험할 수 있는 키넥트에 대한 관심이 높아지고 있다. 최근 재활 치료를 필요로 하는 환자가 늘어남에 따라 본 논문에서는 운동 장애를 가진 환자들이나 노인들이 고가의 장비 또는 다른 사람의 도움 없이 키넥트와 컴퓨터만을 이용하여 손 재활 운동을 할 수 있도록 하는 것을 목적으로 한다. 키넥트 영상으로부터 손 영역을 찾고, 영역의 윤곽선을 추출 한다. 이 때 손가락 중심선을 찾아 손가락과 손바닥 영역을 구분해 준다. 손가락의 개수를 확인하기 위해서 손의 중심점과 끝 점을 찾은 후 두 점을 연결함으로써 손가락의 개수를 확인할 수 있고, 실시간으로 손의 움직임을 감지하도록 한다.
-
Baek, Myung-Sun;Park, Sora;Lee, Yonghoon;Kim, Geon;Lim, Bo-Mi;Song, Yun-Jeong;Im, Chae-Hun;Lee, Yong-Tae 295
The DRM+ is the newest digital radio standard for in-band environment. Although various state of the art technologies are adopted, the performance evaluation information is not sufficient. It is hard that many countries and stations considering the DRM+ as their digital radio standard check the performance of DRM+. To evaluate the performance of the DRM+ system, this paper depicts the laboratory trial results of DRM+ standard. In the laboratory trial, the rack type DRM+ test bed is built. To reflect the practical broadcasting environment, various tests are executed. Many countries and stations can efficiently use these test results, which are considering converting their analog radio broadcasting to digital broadcasting. -
본 논문에서는 기존의 CGH수식을 이용하여 병렬화된 고성능의 CGH 생성 시 발생하는 다량의 데이터를 효율적으로 처리하기 위해 병목현상을 제거하는 하드웨어 구조를 제안한다. 하나의 가로줄에 해당하는 공통항을 연산한 후 이 값으로 임의의 가로줄에 대한 홀로그램 화소 값을 구하며 공통항과 가로줄에 해당하는 모든 업데이트 항은 객체의 모든 광원에 대하여 계산을 한다. 이 구조는 최종 홀로그램이 한 가로줄에 연산이 끝날 때 마다 생성되기 때문에 이전 연구에서 최종 홀로그램이 한번에 생성되는 구조에 비하여 병목 현상을 줄여서 동영상 홀로그램 생성에 효율적이다.
-
분산비디오압축(DVC, Distributed Video Coding) 기술은 부호화기의 복잡한 과정을 복호화기로 이동시킴으로써 경량화 비디오 부호화를 위한 새로운 방법으로 주목 받고 있다. 하지만 복호화기에서 채널 복호 과정과 움직임 추정/보상 과정이 수행됨으로써 복호화기의 복잡도가 상당히 증가하게 되며, 이에 복호화기 채널 복호 과정을 고속화하기 위한 방법이 지속적으로 제안되고 있다. 그러나 채널 복호 과정이 고속화될수록 움직임 추정/보상에 소요되는 계산량이 상대적으로 증가하게 되어, 이에 대한 연구가 필요하다. 따라서 본 논문에서는 상대적으로 증가하는 움직임 추정/보상 과정에 적응적 탐색 영역 방법을 적용하여 DVC 복호화기를 고속화하는 알고리즘을 제안한다. 제안 방법은 고정된 탐색 영역을 사용한 보조 정보 생성 방법과 비교하여 평균 76%의 시간절감이 가능하며, 성능저하는 BDBR이 약 0.31% 증가하는 정도로 크지 않다.
-
본 논문에서는 인물 위주의 스테레오 영상으로부터 깊이 정보를 추출하기 위한 영역분할 스테레오 정합 기법을 제안한다. 제안한 기법에서는 두 대의 스테레오 카메라로부터 획득된 영상에서 임계값을 이용하여 전경을 제외한 배경을 먼저 제거하고, 배경이 제거된 영상으로부터 초기 변이지도(disparity map)와 R, G, B, white 4개의 색상 성분으로 분할한 영상을 생성하게 된다. 각 색상 정보로 분할된 영상의 경계(edge) 성분을 추출하고, 추출된 경계에서 정합 창을 이용하여 변이를 추정하고 각 색상 정보의 변이지도를 적절히 조합하여 최종 변이지도를 생성하게 된다. 실험 결과 제안한 기법이 기존의 영역기반(window based) 정합기법 등보다 인물 위주의 스테레오 영상에서 더 우수한 성능을 가지는 것을 확인하였다.
-
본 논문에서는 SIMD(Single Instruction Multiple Data) 프로세서를 사용한 HEVC 부호화기의 하다마트 트랜스폼 고속화를 제안한다. 본 논문에서는 MMX와 SSE 레지스터를 사용하여 하다마드 트랜스폼을 SIMD 연산으로 대체함으로써 메모리 접근 횟수와 명령어의 수를 줄여 부호화기를 고속화하였다. 또한, HEVC의 10비트 입력에 따른 SIMD 구조의 비효율적인 구현을 해결하기 위하여 하다마드 트랜스폼의 입력 픽셀 비트수를 감소시키는 IBDD(Internal Bit Depth Decreasing)를 제안했다. HEVC 부호화기에 하다마드 트랜스폼을 SIMD 연산으로 대체한 결과 부호화 효율의 저하 없이, 부호화기의 수행 시간은 10% 감소되었다.
-
This study investigates some schemes to estimate the coding efficiency of a video sequence. The texture complexity and motion are considered as two major parameters to decide the coding efficiency, and the methods to estimate the parameters are discussed. For a fixed values of PSNR, the bit rate of a video sequence is estimated using some schemes based on the estimated parameters, and compared with the bit rate by MPEG-4 AVC.
-
영상 압축은 멀티미디어 산업의 가장 중요한 기술이며, 이 중에서도 특히, 움직임 예측은 동영상 부호화 과정에서 가장 복잡한 부분 중 하나이다. 자연 영상과 같은 우리 주위에 존재하는 대부분의 영상은 시간적, 공간적 상관도가 높고, 대부분의 압축 기술은 이 높은 상관도를 이용하는데, 그 중 움직임 예측은 시간적으로 높은 상관도를 가지는 영상의 특징을 사용하여 중복을 줄인다. 따라서 많은 연구자들이 영상 화질 손실이 적은 고속 움직임 예측을 위하여 기술을 제안하였고 성능 개선에 성공하였다. 본 논문에서는 기존의 고속 움직임 예측 알고리즘을 개선하여 영상의 품질과 압축 속도의 향상시켰다.
-
본 논문은 다중경로 페이딩 채널에서 폐루프 MIMO-OFDM 시스템을 구현할 때 효율적인 피드백 정보를 제공하기 위한 채널 품질 지시자(Channel Quality Indicator, CQI)를 결정하는 방법에 관한 것이다. 다중경로 페이딩에서 OFDM심볼의 부반송파들이 주파수영역에서 서로 다른 채널이득을 경험할 수 있고 여러 채널행렬 중에서 어느 채널행렬에 기반해서 채널 상태를 반영하는 채널대표값을 계산해야 하는지 분명하지 않다. 따라서 수신측에서 송신측으로 피드백하기 위해서 하나의 CQI정보를 생성하는데 필요한 채널 대표값이 필요하다. 채널 대표값을 구할 때 쉽게 생각 할 수 있는 방법인 기준신호의 평균 채널행렬을 이용하는 경우에는 채널상태를 정확히 반영하지 못하고 기준신호의 MMSE검출 후 SNR을 검출하는 방식은 채널상태를 정확히 반영해서 성능을 향상시키지만 많은 연산량을 필요로 한다. 이러한 문제를 해결하기 위해 허미시안 연산된 값을 채널 행렬 평균화해서 채널상태를 정확하게 반영하고 연산량을 줄이는 것에 중점을 두고 있다.
-
본 논문에서는 contourlet 변환을 이용하여 잡음을 제거하는 방법을 제안한다. 영상 센서의 발전으로 이미지의 해상도가 좋아지는 반면 잡음에 민감해진다. 그러므로 이를 전처리 단계에서 처리해주는 것이 필요하다. 잡음은 주로 자연 영상의 윤곽선에서 민감하게 반응하기 때문에 고주파대의 잡음을 최대한 정확하게 제거하는 과정이 중요하다. Contourlet 변환은 기존의 wavelet 변환의 다중 스케일과 더불어 다양한 방향 필터뱅크를 이용하여 방향 성분에 대하여 풍부한 정보를 얻을 수 있는 변환이다. 영상의 화이트 가우시안 잡음을 제거하기 위해 contourlet 변환 영역에서의 계수를 이변수 가우스 확률 모델로 설정하고 Bayes 추정법을 사용한다. Bayes 추정법에 필요한 파라미터들은 근사적으로 추정한다. 제안한 방식을 통하여 잡음이 제거된 영상에 추가적으로 Wiener filter와 cycle-spinning을 적용하여 더 높은 PSNR (peak signal-to-noise ratio)값을 얻을 수 있다. 모의실험을 통해 제안한 방식의 PSNR 값과 결과영상으로 성능이 우수함을 확인하였다.
-
비디오 압축을 위한 움직임 벡터 부호화 과정에서 최적의 예측 움직임 벡터를 율-왜곡 관점에서 선택할 경우, 차분 움직임 벡터의 정보량을 최소로 만들 수 있지만, 추가적으로 예측 움직임 벡터의 인덱스 정보를 부호화해야 한다. 본 논문은 예측 움직임 벡터 인덱스 정보에 대해 모순 검증 기술을 적용하여 전체 예측 움직임 벡터들 중 모순으로 판명된 예측 움직임 벡터를 전체 집합에서 제외시켜 부호화 효율을 증가시키는 기술에 대해서 계층적 B 영상에 대한 새로운 실험한 결과를 제시한다. 제안하는 모순 검증 방법은 Motion Vector Competition 방법과 비교하여 평균 1.26%의 전체 비트량을 절감시킨다.
-
본 논문에서는 OpenMP를 이용하여 HEVC 복호화기의 디블록킹 필터를 병렬화하는 것을 제안한다. 본 논문에서는 HEVC 디블록킹 필터를 병렬화하기 위하여 슬라이스를 병렬 처리가 가능한 코어의 개수만큼의 영역으로 균등하게 분할 한 후 각 영역에 코어를 할당하였다. 각 영역에 할당된 코어들은 자신의 영역 내의 LCU에 대해서 순차 주사 순으로 필터링을 수행하는데, 먼저 영역 내의 모든 LCU에 대하여 수평방향으로 필터링을 수행한다. 이러한 수평방향 필터링이 완료된 후 동일한 영역에 대하여 다시 수직 방향으로 필터링을 수행한다. 본 논문에서 제안하는 OpenMP를 이용한 HEVC 디블록킹 필터 병렬화를 통하여 4-Core 환경에서 복호화기에서 디블록킹 필터링의 수행 시간을 약 2.51배 감소 시켰다.
-
본 논문에서는 Markov random field (MRF) 프레임워크와 영상의 기울기(gradient) 정보를 이용한 필드영상의 공간적 디인터레이싱(deinterlacing) 알고리즘을 제안한다. 기존의 디인터레이싱 결과를 보면 때때로 에지 부분의 연결이 정밀하지 못하여 눈에 거슬리는 재깅(jagging) 현상 등의 결함이 나타나기도 하는데, 제안하는 알고리즘은 이러한 현상을 줄이고자 영상의 기울기 도메인(gradient domain)에서 디인터레이싱을 수행한다. 즉, 제안하는 방식은 필드 영상으로부터 기울기 영상을 얻고 이를 보간한 후 필드영상과 복원된 기울기 영상을 토대로 원본 영상을 복원한다. 이 과정에서 각각의 픽셀마다 기울기 영상의 보간을 위한 에지 방향의 추정이 필요한데, 이 과정에서는 MRF 모델을 기반으로 에너지 함수를 설계하고 최적화시킴으로써 보다 강건한 추정결과를 얻도록 하였다. 프레임 영상 복원은 기울기 영상과 필드 영상 정보를 사전 정보로 하여 선형 방정식을 세우고 푸는 과정으로 이루어진다. 실험한 결과, 제안된 방법의 결과가 기존 방법에 비하여 눈에 띄는 결함을 줄이고 좋은 성능을 보임을 확인할 수 있다.
-
스테레오스코픽 3D 입체영상은 좌/우 영상의 시차(視差)를 이용하여 시청자로 하여금 2D 영상에서 느낄 수 없었던 가상의 입체감을 느낄 수 있도록 한다. 이러한 가상의 입체감은 주로 좌/우 영상의 수평시차를 통해서 구현되며, 수평시차의 많고 적음에 의하여 피사체의 원근(遠近)이 조절된다. 시차가 지나치게 작을 경우 3D 입체영상은 2D와 다를 바 없이 평면으로 보이거나, 피사체의 볼륨감이 사라져서 종이인형들이 단순히 층을 나뉘어서 배열된 것처럼 보이게 된다. 반대로 시차가 지나치게 클 경우 좌/우 영상은 하나로 융합되어 입체감을 형성하지 못하고 이중상으로 관측되게 된다. 이렇듯 3D 입체영상에서 수평시 차의 크기는 핵심적인 기능을 수행하고 있음에도, 프로그램 제작시 적절한 시차를 결정하는 판단기준이 부족하며 최대 시차에 대한 기준도 모호하여, 촬영자나 컴퓨터 그래픽스 작업자의 감(感)에 의하여 입체영상 콘텐츠 제작이 이루어지고 있어, 고품질 3D 영상 제작의 장애요인이 되고 있다. 본 논문에서는 NPP(Native Pixel Parallax) 계산을 바탕으로 입체영상의 시차는 스크린 크기별로 달라질 수 있음을 살펴보고, 좌/우 영상의 시차가 가상깊이로 환산되는 과정을 분석하여, 3D 방송에 적합한 최대 시차를 제안하고자 한다.
-
본 연구에서는 EPUB기반의e-Book 콘텐츠를 스마트러닝환경에서학습객체로 활용하고자한다. 이를 위해e-Book의 표준인 EPUB을 분석하여 SCORM의 콘텐츠 모델을 적용하여 확장 설계하였으며, 더블린코어와 LOM 메타데이터를 Collection Map을 이용하여 EPUB 기반의 학습객체메타데이터인ELOM을 설계하였다. EPUB기반의 학습객체가 LMS에서 추적관리가 가능하도록 SCORM2004의 CMI 데이터 모델을 바탕으로 학습객체 특성에 맞는 기본 데이터 모델을 정의하였다. 설계된 학습객체의 운용 가능성을 평가하기 위해 EPUP기반 오픈소스 콘텐츠인 모비딕의 bodymatter를 학습객체로 재구현한 후 ADL의 SCORM2004
$4^{th}$ Test Suite1.1.1을 이용하여 검증하였다. 본 연구에서 설계된 ELOM은 스마트 스크린으로 확장하여 적용할 수 있다. -
경제성장과 기술의 수용도가 높아지면서 오픈소스 소프트웨어 시장의 수익이 연간 22.4%의 성장을 기록할 것이라고 예측했을 정도로 오픈 소스 소프트웨어의 시장성과 영향력이 나날이 커져가고 있다. 오픈소스 소프트웨어는 커뮤니티 규모의 확대, 내부협력의 향상 그리고 더 나아가 소프트웨어의 고도화를 주요 목표로 두고 있다. 본 연구에선 협업을 통한 소프트웨어의 고도화를 도모하고, 보다 나은 개발 환경을 제공하기 위해서 오픈소스 커뮤니티의 소셜 네트워크 서비스를 구성 및 제안 하고 있다. 오픈소스 커뮤니티 내에서 소셜 네트워크 서비스를 제공 할 수 있도록 커뮤니티를 구성하였다. 또한 개발자들이 사용한 API들을 이용해서 개발자간 소셜 네트워크 서비스를 구성하고, 연관 서비스를 제공할 수 있도록 구성하였다. 이를 통해 개발자에게 필요한 정보와 문제점 및 해결방안 등 개발 관련 정보를 효과적으로 공유할 수 있을 것이며, 개발상의 편이와 오픈소스 소프트웨어의 고도화를 촉진 시킬 수 있을 것이다.
-
미디어 디지털컨버전스 환경에서 교육을 수용하는 도구로서 e-Book은 향후 더 많은 확산이 기대되어진다. 본 연구에서는 학습자의 학습도구로서 e-Book과 종이책의 수용 의도를 뇌파를 분석(자기조절지수, 기초율동지수, 주의지수, 활성지수, 정서지수, 항스트레스지수, 좌우뇌균형지수, 브레인지수 분석)하여 실험하였으며, e-Book을 사용후, 성별에 상관없이 내외적 환경 요인으로 인한 육체적, 정신적 피로도에 대한 저항력을 나타내는 항스트레스 지수가 낮아지는 결과를 얻었다. 향후, 본 연구를 기반으로 개선방향을 찾을 필요가 있다.
-
본 논문에서는 모니터 상단의 일반 웹 카메라를 이용하여 사용자의 올바른 자세와 올바르지 않은 자세를 추정하고 사용자가 스스로 교정을 유도할 수 있는 새로운 개념의 어플리케이션을 소개한다. 교정의자나 허리 보호대 등의 도구가 없이 카메라 하나로 사용자가 자기 자세에 대한 인식을 할 수 있도록 제안하는 시스템이다. 정면 시점에서 바라보는 사용자의 자세는 얼굴과 어깨의 특징으로 판단하고, 초기화한 올바른 자세와 비교하여 사용자에게 경고 알림을 해주는 과정으로 진행된다. 주기적으로 자세를 확인하는 시스템을 통하여 사용자가 컴퓨터를 하는 자세에 대해 자각시킴으로써 올바른 자세를 가지도록 유도할 수 있음을 확인하였다.
-
IT 산업이 발달함에 따라 무인화 시스템 역시 발달하고 있다. 또한 인간의 수명이 늘어나면서 삶의 질을 보다 높이기 위한 활동을 중요시 여기고 있다. 따라서 일반인뿐만이 아닌 노인이나 장애인도 주변의 도움 없이 운동을 가능케 하여 삶의 질을 높일 수 있는 프로그램 연구가 활발히 진행되고 있다. 이 두 가지에 초점을 맞추어 본 논문에서는 Kinect를 이용하여 실시간으로 팔운동을 감지하는 방법을 제안한다. Kinect를 통해 사람을 구별해 낸 뒤 팔만을 감지하게 된다. Kinect를 통해 얻어지는 실시간 영상으로 팔이 움직이는 각도를 계산하기 위해 팔의 point를 찾아낸다. 팔이 구부러진 정도와 펴진 정도를 실시간으로 계산하여 사용자에게 보여주고, 횟수 또한 사용자가 별도의 count 작업을 하지 않더라도 화면에 보일 수 있도록 하였다.
-
모바일 IPTV는 이동통신망을 이용하여 방송서비스를 제공한다. 이동통신망을 통해 원활하게 방송서비스를 제공하기 위해서는 극복해야 할 기술적인 장벽이 몇 가지 존재한다. 그 중 하나로, 사용자가 기지국과 기지국 사이를 이동하는 경우 통신망은 연속적으로 서비스를 제공하기 위해 상대 기지국에 사용자의 정보를 전달하는 핸드오버 절차가 수행된다. 핸드오버 절차가 수행되면 시간의 지연이 발생하는데, 시간 지연은 방송 품질에 영향을 미칠 수 있다. 따라서 핸드오버의 발생에 따른 성능 분석은 원활한 방송 서비스를 제공하는데 있어 필수적인 과정으로 볼 수 있다. 본 논문은 핸드오버 성능을 분석하기 위하여 기본적인 무선 액세스 네트워크의 기능이 이미 구현되어 있는 NLS(Network-level Simulator)를 이용한 모의실험 방법을 제시한다. 하지만, 성능 분석에 필요한 기능이 모두 NLS에 포함되어 있지는 않다. 따라서 본 논문에서는 NLS 중 하나인 QualNet을 이용하여 핸드오버 성능 분석에 필요한 기능을 구현하는 방법을 예로 설명한다. 성능은 핸드오버 지연시간과 지연시간의 CDF(Cumulative Distribution Function) 로서 나타낸다.
-
IPTV 서비스는 사업자별로 구성되어 있는 폐쇄적 서비스망에서 VoD 및 방송서비스를 특징으로 하였다. 사업자별 폐쇄성은 사용자의 이용환경의 제약뿐만 아니라 서비스 자원의 이용효율성을 저하시킴으로써, 중복투자 등의 비용적인 부담을 초래하게 되었다. 또한, 다양한 유무선 단말의 수용과 사용자 특성을 고려한 다양한 서비스의 제공요구는 사업자간 또는 서비스 제공자간의 서비스 자원의 상호 공유의 동기를 부여하게 되었다. 이에 본 논문은 오픈 IPTV 서비스 플랫폼에서 제공하는 다양한 서비스 요소들을 융합하여 새로운 융합서비스를 생성하고 제공하는 일련의 구조에 대해 연구하였다. 본 논문에서는 주문형 비디오 서비스를 융합서비스의 예로 삼았으며, 주문형 비디오 서비스를 제공함에 있어, 사용자의 주어진 특성(예를들면, 성별, 연령대 등)에 따른 콘텐츠의 추천을 확장하여, 사용자의 사회적 성향을 반영함으로써, 성별, 연령대에 따른 획일적인 콘텐츠 제공을 극복하고 사용자의 개별적인 성향을 반영하는 콘텐츠 제공방법을 연구하였다.
-
최근 방송 시스템의 디지털화, 통신기술과 가전제품의 발전으로 스마트 TV 시대가 열리게 되었다. 이제 시청자들은 스마트 TV를 통해 기존의 디지털 방송과 IP(Internet Protocol) 통신이 융합한 하이브리드 방송 서비스가 가능해지면서 기존 방송망을 통한 실시간 콘텐츠 서비스와 더불어 IP망을 통한 VOD(Video on Demand) 서비스, 멀티뷰(Multi-view) 서비스의 이용이 가능하게 되었다. 그 중 멀티뷰 서비스는 시청자가 동일한 시간의 영상을 다양한 시점에서 동시에 볼 수 있는 서비스로서, 하이브리드 방송 환경 하에서 현 방송 규격인 MPEG-2 TS(Transport Stream) 콘텐츠와 IP망을 통해 전달되는 실시간/비실시간 콘텐츠가 멀티뷰 서비스가 이루어질 때 콘텐츠 간의 시간정보 규격이 서로 상이하여 동기화에 어려움이 있다. 따라서 본 논문에서 이종망을 기반으로 한 하이브리드 방송 환경내의 다시점 콘텐츠의 동기화 방안을 제안하고자 한다.
-
카메라 촬영시 LED방송조명 등기구를 조도 디밍하는 경우에 카메라 셔터속도가 빨라 질 경우, 카메라가 신호를 감지하며 카메라 영상에 플리커 현상이 생기게 된다. 그 현상을 없어지게 하기 위하여 LED 디머의 PWM속도를 충분히 높여주어서 카메라 셔터속도가 빨라져도 어느 정도 범위에서 감지하지 못하도록 하였다.
-
In this paper, we show that methods of perceptual image hashing which have been proposed recent years. And the disadvantages of them. Perceptual robustness, security and fragility are properties what we always discuss. Then we propose some ideas which we will do the research later.
-
In this paper, we introduce a new kind of expressions for privacy protection techniques in database, such as K-anonymity L-diversity and t-closeness. With such kind of expressions, we provide a new way to solve the privacy protection problems, such as Linear programming, Non-linear programming, Integer programming and so on. Also most of the heuristic techniques are also efficient to be adopted under the expressions given.