한국방송∙미디어공학회:학술대회논문집 (Proceedings of the Korean Society of Broadcast Engineers Conference) (Proceedings of the Korean Society of Broadcast Engineers Conference)
한국방송∙미디어공학회 (The Korean Institute of Broadcast and Media Engineers)
- 반년간
과학기술표준분류
- 미디어/커뮤니케이션/문헌정보 > 미디어/수용자
한국방송공학회 2010년도 추계학술대회
-
본 논문에서는 VSB 수신기를 위한 반송파 위상 오차에 독립적인 심벌 타이밍 옵셋 추정 알고리즘을 제안하고자 한다. 심벌 타이밍 옵셋 추정에 대표적인 알고리즘인 가드너 방법은 반송파 위상 옵셋이 포함된 VSB 수신기에서는 타이밍 옵셋을 추정할 수 없다. 본 논문에서는 수신신호의 공액 곱 연산을 통하여 신호의 스펙트럼을 확장하고 반송파 위상 옵셋을 상쇄 하였고, 그 후 가드너 알고리즘을 통하여 인접 스펙트럼 간의 중복부분을 발생시켜, 타이밍 옵셋을 추정하는 방식을 연구하였다. 시뮬레이션 결과, 제안하는 알고리즘은 VSB 수신기에서 반송파 위상 오차에 영향을 받지 않고, 정확하게 타이밍 옵셋을 추정할 수 있는 것으로 나타났다.
-
3D 콘텐츠에 대한 관심이 증가함에 따라 3D 시청 및 제작에 대한 가이드라인의 필요성도 함께 증가하고 있다. 3D 안정 시청 가이드 라인은 3D 시청으로 인한 시청자의 시각적 불쾌감이나 피로감을 방지하는데 목적을 두고 있으며, 최근 일본의 3DC에서는 과도한 수렴-조절 불일치를 방지하기 위해 양안 시차
$1^{\circ}$ 를 쾌적 시차 범위로 권고하고 있다. 하지만 이 쾌적 시차는 절대적인 수치가 아니며, 콘텐츠의 특성 및 시청 조건에 따라 변하는 것으로 추정된다. 본 논문에서는 쾌적 시차를 갖는 3D 영상 콘텐츠에서 객체의 모션으로 인해 양안시차가 시공간적으로 변할 때, 야기되는 시각적 불편함의 변화에 대하여 관찰한다. 특히, 깊이 방향 모션 및 수평 방향 모션에서 객체의 속도 변화에 대한 시각적 피로감의 정도를 주관적 평가를 통하여 측정한다. -
ATSC-M/H에서 main stream(좌영상)인 TS-M 패킷은 MPEG-2 전송 시스템을 기반이고, M/H stream(우영상)인 M/H 패킷은 RTP 기반의 전송방식을 사용한다. 이와 같이 dual-stream 시스템을 통해 좌우영상이 전송되는 경우에는 기존에 연구되었던 동종 스트림간의 동기화방안을 적용할 수 없다. 본 논문에서는 3차원 방송 서비스를 하기 위해 ATSC-M/H를 통해 전송되는 좌우영상간의 동기화 방안을 제안한다.
-
본 논문에서는 ATSC M/H를 이용하면서 기존 HD 및 모바일 서비스와 역 호환성을 유지하는 3DTV 서비스 시나리오를 고려하여 좌영상과 우영상의 부호화 방식 및 해상도가 서로 다른 상황에서 양안식 입체 영상의 화질을 평가한다. 동영상의 시공간적 특성에 따라 다소 차이가 있기는 하지만 객관적인 화질 측면에서 좌우 영상의 차이가 상당히 큼에도 불구하고 합성된 3D영상의 주관적 화질 및 깊이감은 일반적으로 만족스러운 결과를 나타낸다.
-
본 논문에서는 USB(Universal Serial Bus) 인터페이스를 이용하여 PC와 하드웨어 사이의 영상을 송수신 하는 시스템을 제안한다. 구현된 시스템은 PC에서 스테레오 캠으로부터 획득된 좌안, 우안 영상을 USB 인터페이스를 이용하여 고속으로 하드웨어에 전송해주고, 하드웨어에서 생성된 깊이 맵을 고속으로 전송받도록 구성되어 있다. Cypress사의 USB2.0 컨트롤러 칩인 CY68013A를 사용하여 구현하였으며, USB칩과 FPGA와의 인터페이스는 GPIF(General Programmable Interface)를 이용하여 병목현상이 없이, 고속의 데이터 전송을 달성하도록 하였다.
-
최근 3차원 영상 컨텐츠와 디스플레이의 증가에 따라 지상파 방송사들의 3차원 텔레비전(3DTV) 방송을 위한 준비가 시작되고 있다. 하지만 현재 지상파 방송사들이 비디오 전송을 위하여 사용하고 있는 약 18Mbps의 대역폭 제한 내에서는 고화질의 3차원 스테레오스코픽 영상을 전송하는 데 한계가 있다. 따라서 보다 고화질의 3D 영상 방송 서비스를 제공하는 동시에, 기존 2DTV 시청자를 위한 호환성을 유지하기 위하여 좌영상은 현재 지상파 방송에서 채택하고 있는 MPEG-2 기반, 그리고 우영상은 보다 압축 효율이 높은 H.264/AVC 기반의 비디오 압축 및 전송 시스템이 고려되고 있다. 본 연구에서는 이러한 지상파 3DTV 방송 조건 하에서, 이종 부호화기에서 산출되는 비트스트림의 양을 대역폭 제한에 맞게 조절하는 합동 비트율 제어 방법을 제안한다. 제안하는 합동 비트율 제어 방법은 H.264/AVC의 비트율 제어 방법인 이차 율-양자화 모델(quadratic rate-quantization model)을 MPEG-2 부호화 과정 내에 구현하여 압축된 두 비디오 비트스트림의 합이 대역폭 조건을 충족시키면서 화질왜곡을 최소화하는 양자화계수를 계산하도록 설계 되었다. 또한 좌영상과 우영상의 화질의 차이가 일정하게 유지되도록 최적화 문제에서 제약식을 추가하여 양자화계수를 계산하였다. 실험결과 제안한 지상파 스테레오스코픽 3DTV를 위한 합동 비트율 제어 알고리듬은 목표 비트율을 맞추는 동시에, MPEG-2 및 H.264/AVC의 기존 비트율 제어 알고리듬 방법에 비하여 좌/우 영상의 평균 화질 합은 비슷한 수준을 나타내었고, 화질 절대차의 평균 및 변동은 큰 수준으로 감소시켰다.
-
본 논문에서는 3차원 모니터를 시청하는 시청자의 위치를 추적한 후 시청위치에 따라 다른 시점의 영상을 제공하는 시스템을 제안한다. 본 시스템은 센서들의 신호를 제어하는 CPU, 3개의 초음파센서, 1개의 PIR(Passive infrared radiation)센서, 센서별 신호를 분기해주는 PLD(programmable logic device)로 구성되어 있다. 3개의 초음파 센서를 이용해 20개의 탐색구역 내에 있는 시청자의 정확한 위치를 추적한다. 시스템을 구현한 결과 전방 5m, 좌우 3m의 탐색범위 내에서 시청자의 위치를 정확히 추적하여 해당 시점의 영상을 디스플레이 하였다.
-
본 논문에서는 디지털 홀로그래피 방식의 비디오 서비스를 위한 서비스 시스템의 구조를 제안하고자 한다. 실사 영상의 디지털 홀로그래피 서비스를 위해서 레이저를 이용한 광학적인 홀로그램 획득이 아닌 실사 기반의 홀로그램 획득 방법을 이용한다. 실사 기반의 홀로그램 획득 방법에는 스테레오 및 다시점 카메라, 그리고 깊이 카메라를 이용하는 것들이 포함된다. 각 카메라 시스템으로 획득된 정보는 깊이와 RGB 정보로 만들어진 후에 컴퓨터 생성 홀로그램(computer-generated hologram, CGH) 과정을 거치면서 홀로그램이 된다. 생성된 홀로그램은 SLM(spatical light modulator)를 통해서 복원되어 영상 서비스를 제공한다. 또한 디지털 홀로그램 기반의 비디오 서비스를 위한 신호처리 기법들을 종합적으로 논의하고, 마지막으로 스테레오 및 깊이 카메라 기반의 홀로그램 생성 결과들을 보인다.
-
본 논문에서는 깊이정보를 조작하여 홀로그램 콘텐츠 내의 물체의 위치 및 원근감을 변화시키고, 추출한 객체의 깊이정보를 다른 콘텐츠와 결합하여 새로운 홀로그램 콘텐츠를 생성하는 방법을 제안한다. 또한 스테레오 정합방법과 깊이 카메라를 이용해 깊이정보를 획득하는 방법을 비교하고, 이를 변경하는 기법을 제안한다. 본 논문에서 제안한 기법은 향후 다양한 홀로그램 콘텐츠를 확보하는 방법으로 사용될 수 있을 것이다.
-
깊이데이터는 CG 또는 실사 영상에서 획득되는데 입체 영상 분야에서 활용도가 높다. 예를 들어 2D영상의 3D화질 개선, 입체영상의 입체감 개선 등의 활용이 되고 있다. 본 논문에서는 이러한 추세에 맞추어 홀로그램을 생성하는 입력 데이터의 전처리과정으로 통하여 CGH 홀로그램을 개선하는 영상처리 기술을 제안한다. 입력 데이터의 전처리를 통해 생성된 홀로그램 영상의 화질 개선을 제안하고, 실험을 통해 제안 방법의 우수성을 보여준다.
-
본 논문에서는 연산에 의해 디지털 홀로그램(computer-generated hologram, CGH)을 생성할 때 많은 계산량으로 속도가 지연되는 문제를 해결하기 위해 연산식을 수정하고 이를 하드웨어로 구현한다. 기존에 제시된 CGH 연산 알고리즘에 비해 제안한 알고리즘은 디지털 홀로그램의 완벽한 병렬처리가 가능하게 하여 속도지연의 문제를 해소한다. 구현 결과 하드웨어가 주어진다면 최대 3사이클에 한 광원으로부터의 홀로그램성분 전체를 연산할 수 있고, 파이프라인 기법을 사용하면 두 사이클의 지연시간 후 매 사이클마다 한 광원에 대한 홀로그램 연산결과를 얻을 수 있다.
-
본 논문은 깊이영상(depth-map image)으로 만든 3차원 객체를 가지고, 디지털 홀로그램을 고속으로 생성하는 기법을 제안한다. 디지털 홀로그램을 생성하는 과정은 여러개의 독립적 처리로 병렬화 할 수 있는 구조이기 때문에 GPU에서 병렬처리함으로써 고속화 할 수 있다. 병렬처리를 이용한 고속화의 효율을 높이기 위해 최근 NVIDIA사에서 발표한 CUDA를 이용하였다. 디지털 홀로그램의 고속 재생을 위한 중간과정에서 GPU상의 고속 메모리의 사용을 극대화하고, 알고리즘 구현을 최적화함으로써 고속화 효율을 높일 수 있었다. 결과적으로 본 논문에서는 기존 CPU에서의 처리속도에 비해 약 64배 정도 속도를 개선할 수 있었다.
-
본 논문에서는 DTV 방송 전환에 따른 주파수 이전 및 채널 재배치 시, 시스템 및 전파환경의 변화에 따라 수신 한계전계강도도출과 동등한 수준의 서비스 제공에 대한 기술적 분석 방법론을 제시한다. 전판환경 분석을 위한 전계강도 예측 모델은 ITU-R 권고 P.1546을 적용하였으며, 이를 기반으로 ATV 및 DTV의 수신한계전계강도 대한 수식을 정립하였다. 선정된 수신기의 특성에 대해 수치해석 및 결과를 고찰하였으며, 설정한 시스템에 대해 동등한 수준의 서비스 제공을 위한 시스템의 변수 보정도 방법도 제시하였다.
-
최근 3DTV 등의 3D 디스플레이의 공급으로 기존의 입체 콘텐츠뿐만 아니라, 일반 2D 영상도 자동적으로 입체 콘텐츠로 변환하여 3D로 시청할 수 있다. 이러한 콘텐츠를 시청할 때에 주로 사용하는 3D 디스플레이에는 자체적인 UI를 내장하고 있는데, 입체 모드에서의 이러한 UI를 3D로 변환하여 사용할 수 있는 3D UI기술에 대한 관심이 높아지고 있다. 본 논문에서는, 3D UI의 관심도 증가에 따라 좀 더 편리하고 이해도가 높은 3D UI의 개발 방법에 대하여 제안한다. Directshow를 이용하여, 문자와 UI 배경을 합성한다. 여기에 UI의 투명도, 시차, 밝기 등을 조절 가능하게 하여 사용자의 편의에 따라 선택할 수 있게 한다. 사전에 입체로 제작된 실험 영상을 실행하여 그 위에 메뉴 화면, 메뉴 글씨 등을 띄워 입체감 있는 3D UI를 제작, 증강을 체험할 수 있는 3D UI 플레이어를 구현한다.
-
스마트 폰의 선풍적인 인기에 힘입어 TV 산업에서도 스마트TV가 출현해 시장 영역을 넓히고 있다. 이에 따라 TV 리모컨 또한 새로운 방식의 유저 인터페이스를 지원하는 하나의 스마트 리모컨으로 업그레이드 되고 있으며, 스마트 리모컨을 통한 홈 멀티미디어 디바이스의 통합 제어와 미디어 공유에 대한 여러 가지 시도가 이루어지고 있다. 이에 본 논문은 DLNA 환경 속 스마트 리모컨과 TV 디바이스의 역할에 대해 재 정의하고, 이를 기반으로 DLNA 및 UPnP 디바이스 아키텍처에 제시된 컨트롤 포인트와 디바이스 간 제어 및 미디어 공유 절차에 따라 스마트 리모컨을 통한 TV의 제어 기법을 제안한다. 제안된 스마트 리모컨을 통한 TV의 제어는, 크게 사용자와 무관한 백그라운드 스레드로 처리될 제어 준비 단계와 사용자의 입력을 통해 실질적인 제어를 수행하는 제어 단계로 나뉘고, 각각의 단계에 해당하는 UPnP 미디어 네트워크 단계에 맞춰 진행된다. 제안된 DLNA 환경 속 TV 제어 방법의 구현을 위해서는 선행적으로 TV OSD 제어를 위한 코드에 연동해 TV 디바이스 서비스 서술자의 확장이 이루어져야 할 것이다.
-
최근 3D HDTV (3-Dimensional High Definition Television)에 대한 연구가 활발히 진행되고 있다. 국내에서도 3D HDTV 방송 서비스를 위하여 기존의 ATSC (Advanced Television Systems Committee) 8-VSB (8-Vestigial Side Band) 시스템을 수정하려는 연구가 진행되고 있다. 그 중에서도 프레임 생성 과정에서 프레임 헤드 부분에 PN (Pseudo-Noise)심볼을 사용하는 새로운 시스템의 개념을 제안하고, 이 시스템을 수정된 ATSC 시스템이라 부를 것이다. 수정된 ATSC 시스템은 기존 ATSC 8-VSB 시스템에서 사용되던 VSB 변조방식을 사용한다. 본 논문에서는 수정된 ATSC 시스템에 적용 가능한 반송파 주파수 복구 방식을 제안한다. 제안된 반송파 주파수 복구 방식은 Fitz 알고리즘을 사용하는 거친 주파수 복구부와 간단한 PN심볼 상관 알고리즘을 사용하는 미세 주파수 복구부로 구성된다. 그리고 진폭만을 변조하여 사용하는 VSB 변조 방식의 경우 심볼 정보가 동위상 채널에만 존재하고, 직교위상 채널은 단순히 동위상 채널의 힐버트 변환된 값에 지나지 않는다. 그러므로 VSB 변조된 심볼은 QAM 변조된 심볼 처럼 일정한 배열을 가지지 않고, 반송파 주파수 옵셋에 더욱 민감하게 된다. 이를 극복하기 위하여 수신된 PN심볼에 대한 위상 보정 과정을 수행하고, 이 과정은 수정된 ATSC 시스템의 반송파 주파수 복구 시 성능을 향상 시킨다.
-
최근 방송용 모니터링 스피커 시스템은 디지털 방송 기술과 반도체 기술의 급속한 발전에 힘입어 보다 질 좋은 오디오 앰프를 싼 가격과 소형화 기술을 적용하여 앰프와 스피커 매칭의 문제점을 안고 있는 패시브 크로스오버 사용의 멀티웨이 스피커를 대체하여 액티브 크로스 오버를 사용한 멀티 앰핑의 액티브 스피커로 진화 하고 있다. 방송 스튜디오에서 많이 사용되고 있는 2웨이 액티브 스피커를 모델로 국악콘텐츠 모니터링에 최적화된 액티브 모니터링 스피커 구현을 위한 크로스오버 회로를 설계하고 전자회로 시뮬레이션 프로그램인 Pspice를 이용하여 최적의 국악콘텐츠에 적용하기위한 크로스오버 주파수구현을 위한 소자 값들을 찾아내어 실제 제작회로에 적용 시 경비 절감과 개발시간을 단축 한다.
-
본 논문에서는 단일 채널 디지털 오디오 신호에서 스펙트로그램과 영상 처리 기법을 이용하여 크래클 잡음을 검출하는 알고리즘을 제안한다. 오디오 신호의 주파수 특성을 효율적으로 분석하기 위해 스펙트로그램을 특정 컬러맵을 이용하여 컬러 영상으로 변환한 후 영상 처리 기법을 적용하여 크래클 잡음이 존재하는 구간을 검출하여 디지털 오디오 복원에 이용한다. 특히 고전영화에 나타나는 크래클 잡음은 에너지와 신호 길이가 음성이나 음악 신호와 유사하여 기존의 스펙트럴 음성 검출 기법으로는 검출에 어려움이 있다. 이에 비해 스펙트로그램 영상에서는 크래클 잡음이 다른 신호들과 구분되는 특성을 나타내므로 영상 처리 기법을 적용하여 경계 검출과 Hough 변환에 의한 선 검출을 이용하여 크래클 잡음을 검출한다. 제안된 알고리즘은 고전 영화 디지털 오디오 복원에 적용하였으며 크래클 잡음 검출에 우수한 성능을 보여준다.
-
소셜 네트워크가 웹 2.0의 대표적 서비스로 자리 잡으면서 이를 이용한 다양한 서비스가 등장하고 있으며 그 중 포탈 서비스도 예외는 아니다. 하지만 포탈과 소셜 네트워크의 융합은 마이크로 블로그 형태의 소셜 네트워크 서비스를 포탈 화면에 실시간 검색으로 공개하는 정도에 그치고 있을 뿐이다. 본 논문에서는 마이크로 블로그의 open API 서비스를 이용하여 사용자의 인적 네트워크와 윈도우업 데이터를 추출한 후 키워드 도출 가중치 식을 통해 소셜 네트워크 내의 이슈가 되는 키워드를 도출한다. 도출된 키워드는 포탈 서비스에 융합되어 사용자의 소셜 네트워크 내 이슈 키워드와 관련된 정보제공서비스를 할 수 있다.
-
UCC 제작자에겐 기존의 추천 서비스와는 차별화된 저작권과 저작 목적 등을 고려한 별도의 추천서비스가 필요하다. 본 논문에선 UCC를 제작하는데 있어 발생하는 저작권문제를 효과적으로 해결하기 위해 UCC 제작 시 참조된 UCC들의 정보를 메타데이터의 reference 요소로 기재할 수 있도록 하였으며, UCC 제작 사용자에게 특화된 추천서비스를 제공하기 위해 제작된 UCC의 참조 데이터를 이용한 협업 필터링 기반의 추천 시스템을 구성하고 있다. 추천시스템은 메타데이터의 tag, reference 요소를 이용해 참조된 UCC 그룹군에서 제작자가 참조한 UCC와 유사한 참조 UCC를 추천 리스트로 만들어서 제공한다. 향후 본 시스템의 효율성 검증을 통해 UCC 제작에 있어 보다 효율적이고 제작자 편이성이 높은 제작자 맞춤형 UCC 추천 서비스가 IPTV, SmartTV등의 융합형 방송서비스 통해 제공될 수 있을 것 이다.
-
디지털 기술의 발달로 인해 세계 각국에서 지상파 DTV 방송망을 핵심인프라로 활용하기 위한 노력이 지속되고 있다. 하지만 국내 지상파 DTV 표준인 ATSC방식은 주파수 이용관점에서 효율적이지 못한 단점을 가지고 있다. 이러한 단점을 해결하기 위해 그 동안 동일채널 중계기술이 많이 연구되어 왔다. 그러나 동일채널간섭으로 인한 신호품질 저하, 긴 처리시간, 송출전력 제한 등의 제약조건으로 인해 실제 방송망에서는 동일채널 중계기술이 활용되지 못하고 있는 실정이다. 이에 본 논문에서는 DAB용 간섭제거 기반 동일채널 중계기를 ATSC 시스템에 적용하였다. 제안하는 동일채널 중계기는 타이밍 옵셋 보상을 위한 위상 전 왜곡기법, 파일럿 성분 추정 및 제거를 위한 직류 제거기, 송/수신신호 간의 상관도를 기반으로 궤환신호의 지연시간을 추정하는 기법이 적용되었으며, 전산 모의실험을 통해 그 성능을 확인하였다. 전산 모의실험을 통해 주 송신신호보다 간섭신호가 큰 환경에서 제안한 동일채널 중계기의 간섭제거 능력을 확인하였고, 이에 따라 동일채널 중계기의 송출능력을 개선하는 동시에 짧은 처리 지연시간 및 양호한 신호품질을 얻을 수 있었다.
-
본 논문은 차세데 3D-TV 방송을 위해 수정된 ATSC (Modified Advanced Television Systems Committee) 시스템 [1]에서 파일럿 (Pilot)을 이용한 채널 추정 대신, PN 시퀀스 (Pseudo-Noise Sequence)를 이용한 채널 추정 방식의 문제점에 대하여 2가지 방법으로 연구하였다. PN 시퀀스를 이용하여 채널을 추정하는 TDS-OFDM (Time Domain Synchronous - Orthogonal Frequency Division Multiplexing)시스템은 QAM (Quadrature Amplitude Modulation) 변조 방식을 사용하기 때문에 수신측 PN 시퀀스의 위상 변화가 일어나지 않는다. 하지만 수정된 ATSC 시스템에서 사용하는 VSB (Vestigial Side Band)변조 방식에서 직교위상 (Quadrature) 채널을 통해 전송되는 값은 동위상 (In-Phase) 채널을 통해 전송되는 값의 단순한 힐버트 변환 (Hilbert Transform)에 의해 생성되어 불규칙한 위상 변화가 발생한다. 따라서 수정된 ATSC 시스템에서 채널 추정을 위해 PN 시퀀스를 사용하게 된다면 상관 (Correlation) 특성을 잃어버릴 것이며 올바른 채널 임펄스 응답 (Channel Impulse Response)을 얻을 수 없다.
-
최근 자동차 업계와 IT 기술의 융합이 새로운 트렌드로 자리 잡으면서 전자제어 기술뿐만 아니라 영상처리 기술이 융합된 지능형 자동차 개발에 대한 연구가 활발히 진행되고 있다. 차선 또는 번호판을 대상으로 하는 인식 알고리즘은 이미 다양한 방법으로 연구가 진행되어 왔으며 이미 몇몇 기술은 상용화 단계에 있다. 본 논문에서는 Viola-Jones 알고리즘을 이용하여 차량의 사각 지대에 위치하는 차량을 감지하고 이의 대략적인 거리 정보를 추정하는 것을 목표로 하여 차량의 형태 정보를 바탕으로 차량을 감지하는 알고리즘을 제안한다. 기본적인 방법은 Adaboost와 Harr-like 특징을 사용하여 얼굴을 성공적으로 검출한 Viola-Jones 알고리즘[1]을 차량에 적용하였다.
-
요즘 감시카메라 시장은 전 세계적으로 이슈가 되고 있다. 감시카메라는 적은 인원으로 많은 장소를 한 눈에 감시할 수 있고, 문제가 발생했을 때, 녹화 저장된 영상을 통해 그 상황을 다시 볼 수 있다. 이렇게 다양한 기능과 편리함으로 우리에게 도움을 주는 감시카메라이지만, 마스크나 선글라스, 또는 여러 가지 잡음에 의해 얼굴 영상의 부분이 훼손되는 상황에서는 신원 확인을 하기가 어렵다. 때문에 가려진 얼굴을 제대로 인식하기 위해 영상 처리 분야에서 얼굴의 가려진 영역을 찾아 그 부분을 재구성하고자 하는 연구가 활발히 진행되고 있다. 이에 본 논문은 기존 PCA 방법을 이용하여 가려진 영역을 찾아내고, PCA를 반복적으로 사용하여 재구성하는 대신 상관관계를 이용하여 얼굴의 가려진 영역을 자동적으로 검출하고 복원하는 방법을 제안한다. 본 논문에서는 두 눈의 중심이 고정되어 있는 BioID 데이터로 상관계수를 구하고 얼굴의 특정 부분을 임의로 가려 실험을 수행하였다. 제안된 방법의 결과는 PCA 방법으로 수행한 결과와 함께 비교되어 원본 영상과의 오류 값이 더 작게 나오는 것을 확인할 수 있었다.
-
본 논문에서는 안테나 당 전력제한 조건 하의 다중 입출력 빔포밍 시스템을 위한 위상 추적 코드북을 제안한다. 위상 추적 빔포밍 방식은 인접한 프레임 정보의 차이만을 활용한다는 점에서 기존의 위상 조정 방식과 차별화 되며, 궤환 정보량의 감소 이득을 얻을 수 있다. 이러한 위상 추적 코드북 구성을 위하여 위상 조정 코드북의 목적함수를 새롭게 변형하여 Lloyd-Max 알고리듬에 적용한다. 성능평가를 위하여 위상 조정 코드북과의 신호 대 잡음비의 비교 수행하며, 이를 이용하여 제안하는 코드북의 효율성을 입증한다.
-
다시점 비디오 부호화기(MVC)는 다양한 블록 크기 기반의 움직임 추정과 변이 추정을 수행한다. 또한 2개 이상의 다중 참조 영상 움직임 추정 기술을 사용한다. 이 기술들을 통해 MVC는 높은 부호화 효율을 얻을 수 있지만 실제 적용하기에는 너무 높은 부호화 복잡도가 걸림돌로 작용한다. 본 논문에서는 MVC의 부호화 복잡도를 감소시키기 위하여 효율적인 참조 영상 선택 알고리즘을 제안한다. 부호화에 사용된 참조 영상들은 인접한 블록들 간에 높은 상호 연관성을 가지므로, 부호화된 이웃 블록들의 참조 영상 정보를 기반으로 현재 블록의 참조 영상을 효율적으로 선택할 수 있다. 실험을 통해 제안된 알고리즘이 부호화 시간을 기존의 MVC에 비해 최대 73.3%, 평균 57.3% 감소시키며 부호화 효율의 감소는 무시할 만한 수준임을 확인하였다.
-
In this paper, we propose an efficient and effective selective protection scheme to SVC that exploit the propagation of protection effect by protecting significant frames that can give the maximum visual quality degradation. We model SVC dependency coding structure as a directed acyclic graph which is characterized with an estimated visual quality value as the attribute at each node. The estimated visual quality is calculated by using our model based on the proportions of intra- and inter-predicted MBs, amounts of residual, and estimated visual quality of reference frames. The proposed selective protection scheme traverses the graph to find optimal protection paths that can give maximum visual quality degradation. Experimental results show that the proposed selective protection scheme reduces the required number of frames to be protected by 46.02% compared to the whole protection scheme and 27.56% compared to the layered protection scheme.
-
인터넷의 급속한 발달과 이미지 콘텐츠 개발 기술의 발달로 현재 누구나 쉽게 이미지 콘텐츠의 공유 및 배급이 용이해졌다. 그러나 이로 인해 누드나 포르노와 같은 불건전한 유해 이미지들의 접근 역시 쉬워지고 있다. 특히, 스마트 폰이나 스마트 TV 등 멀티미디어 기능이 가능한 휴대장치 및 단말기의 비약적인 발전으로 인하여, 언제 어디서나 우리들은 유해 이미지의 노출되어 있다. 따라서 유해 이미지 시청이 적당하지 않은 연령층까지 무방비 상태에 놓여 있기 때문에 이를 막을 수 있는 시급한 대책이 요구되고 있다. 본 논문에서는 이중 피부 화소 검출에 이용하여 인체 영역 검출해내고 이것을 이용하여 유해 이미지 분류를 위한 방법을 제안하고자 한다. 일반적으로 피부 화소 검출 기법은 오차율을 가지고 있기 때문에 정확한 검출이 힘들다. 따라서 우리는 검출에 대한 강도를 조절하여 이중으로 피부 화소를 검출하여 좀더 정확한 피부 영역을 획득한다. 또한 기존의 방법들은 대체로 일차적인 피부 영역 검출에 초점을 둔 반면, 유해 판별의 주된 기준이 되는 가슴이나 성기, 엉덩이 등을 좀 더 중점적으로 찾으려 하지 않았다. 따라서 본 논문에서는 검출된 피부 영역에서 유해 부위를 좀 더 집중적으로 찾아 유해 판별 성능을 높이는 방법을 제안하고 실험으로 증명을 하고자 한다.
-
본 논문에서는 회귀문제를 위한 비선형 특징 추출방법을 제안하고 분류문제에 적용한다. 이 방법은 이미 제안된 선형판별 분석법을 회귀문제에 적용한 회귀선형판별분석법(Linear Discriminant Analysis for regression:LDAr)을 비선형 문제에 대해 확장한 것이다. 본 논문에서는 이를 위해 커널함수를 이용하여 비선형 문제로 확장하였다. 기본적인 아이디어는 입력 특징 공간을 커널 함수를 이용하여 새로운 고차원의 특징 공간으로 확장을 한 후, 샘플 간의 거리가 큰 것과 작은 것의 비율을 최대화하는 것이다. 일반적으로 얼굴 인식과 같은 응용 분야에서 얼굴의 크기, 회전과 같은 것들은 회귀문제에 있어서 비선형적이며 복잡한 문제로 인식되고 있다. 본 논문에서는 회귀 문제에 대한 간단한 실험을 수행하였으며 회귀선형판별분석법(LDAr)을 이용한 결과보다 향상된 결과를 얻을 수 있었다.
-
기존의 HDR (high dynamic range) 영상취득 기법은 한 장의 HDR 영상을 얻기 위해 여러 장의 LDR (low dynamic range) 영상을 취득하기 때문에 영상 취득에 많은 시간이 소요된다. 본 논문에서는 이런 단점을 보안하기 위해 두 장의 LDR 영상을 이용하여 평균 밝기 값에 대한 노출 곡선을 추정한다. 그리고 추정된 노출곡선을 이용하여 밝은 영상과 어두운 영상 각각의 최적의 노출 시간을 취득하는 기법을 제안한다.
-
계층적 부호화 구조는 H.264/AVC의 부호화 효율을 최대화하고 시간적 스케일러빌리티를 지원하는 등 다양한 장점을 제공한다. 이러한 구조에서 비트 할당 및 비트율 제어 기술은 비디오 코덱의 성능을 향상시킬 수 있는 중요한 요소들이다. 기존의 비트율 제어 기술에서는 계층적 구조의 특성을 고려하지 못한 비트율-양자화 모델을 사용하여 비디오 코덱의 성능을 최적화하기에 어려움이 있었다. 따라서, 본 논문에서는 계층적 구조에서도 효율적으로 비트 할당 및 비트율 제어를 할 수 있도록, 기존보다 향상된 비트율-양자화 모델을 제안한다. 그리고 실험을 통하여 제안하는 비트율-양자화 모델이 기존 기술에 비해 정확함을 보인다.
-
기존의 비디오 부호화 표준에서는 참조영상을 보간하여 해상도를 증가시킨 후, 고정된 움직임 벡터 해상도로 영상 전체를 부호화 한다. 참조 영상의 해상도를 증가시킨 만큼 움직임 보상에 의하여 예측에러가 줄어들지만, 움직임 벡터 해상도가 증가한 만큼 움직임 벡터의 부호화 비트량이 증가한다. 고정된 해상도의 움직임 벡터로 부호화하는 경우, 영상의 지역적인 움직임 특성이 다른 경우 부호화 효율이 떨어질 수 있다. 따라서 본 논문에서는 기존의 비디오 부호화 표준들이 영상의 지역적인 특성을 고려하지 않고 고정된 해상도의 움직임 벡터를 사용하여 부호화하는 문제점을 극복하기 위하여 슬라이스 단위로 1/4 화소 해상도 또는 1/8 화소 해상도 또는 움직임 벡터 단위로 적응적으로 화소 해상도를 결정하는 것 중에서 최적의 슬라이스 움직임 벡터 해상도를 결정하여 부호화하는 방법을 제안한다. 제안한 방법을 사용하여 부호화하면 움직임 벡터의 부호화 비트의 낭비를 막고, 예측 에러도 줄어들어 부호화 효율을 높일 수 있다. 제안하는 방법을 사용하여 부호화 하는 경우 H.264/AVC와 비교하여 평균 1.97%의 BD-RATE을 감소한다.
-
H.264/AVC 부호화 표준은 영상의 특성을 반영하기 위해
$16{\times}16$ 부터$4{\times}4$ 크기의 가변적인 블록을 이용하여 부호화 효율을 높인다. 하지만 이로 인해 부호기의 복잡도가 증가된다. 부호기 복잡도를 증가시키는 여러 요인 중, H.264/AVC의 모드 결정은 부호기의 복잡도를 증가시키는 주요인이다. 본 논문에서는 IPPP구조에서 비트율 왜곡값을 이용하여 고속으로 매크로블록의 모드를 결정하는 방법을 제안한다. 인트라 화면에서의 인트라$4{\times}4$ , 인트라$16{\times}16$ 의 비트율 왜곡 평균값으로 영상에 적응적인 최대 임계값과 최소 임계값을 결정한다. 다음,$16{\times}16$ ,$16{\times}8$ ,$8{\times}16$ 인터 모드의 비트율 왜곡값이 최대 임계값과 최소 임계값으로 분할한 범위 중 어느 곳에 해당하는지를 살펴보고, 이에 따라 인트라 모드 결정 단계를 선택적으로 결정한다. 제안하는 알고리즘은 기존의 H.264/AVC에 비해 부호화 효율의 큰 감소 없이 평균 27.42%의 부호화 시간을 감소시켰다. -
In this paper we propose a method of detecting moving object in H.264/AVC bitstream by representing the
$4{\times}4$ block partition units as nodes of graph. By constructing hierarchical graph by taking into account the relation between nodes and the spatial-temporal relations between graphs in frames, we are able to track small objects, distinguish two occluded objects, and identify objects that move and stop alternatively. -
H.264/AVC는 기존의 동영상 압축 표준안보다 훨씬 뛰어난 압축 효율을 보이나 상대적으로 높은 계산 복잡도를 보인다. 또한 최근 모바일 어플리케이션 및 DTV 등에서의 실시간 구현의 수요가 급증함에 따라 하드웨어 구현보다 상대적으로 flexible한 구조인 DSP 환경에서의 최적화 연구가 활발히 진행 중이다. 본 논문에서는 기존의 다중 참조 픽처 고속 움직임 보상 알고리즘에 대하여 DSP 환경에 맞게 구현 및 최적화를 통하여 실시간 구현 및 최적화 경향파악을 하고 있다. 수행된 DSP 최적화를 통하여 움직임 추정 평균 계산량을 픽셀 당 약 56.17%로 크게 감소시켰다.
-
본 논문에서는 H.264/AVC의 부호화 효율을 향상 시킬 수 있는 방법을 제안하였다. 제안하는 알고리즘은 확장된 매크로 블록에서 향상된 인트라 예측 및 인터 예측 블록 혼합 코딩 방법을 사용한다. 그리고 인터 블록부터 먼저 부호화 및 복호화하여 인트라 예측 시 참조 픽셀로 사용하는 것을 제안한다. 기존의 인트라 예측 방법에서는 현재 블록의 우측 픽셀들과 하단에 위치한 픽셀들을 이용하지 못하기 때문에 예측 정확도가 높지 않았다. 따라서 본 논문에서는 현재 부호화하려는 블록의 상단과 좌측뿐만 아니라 우측 또는 하단의 복호화가 완료된 픽셀을 이용하여, 예측을 수행하는 확장된 인트라 예측 방법을 제안한다. 그리고 실험을 통하여 제안하는 방법이 기존 기술에 비해 효율적인 것을 보인다.
-
최근 3D 비디오 서비스에 대한 관심이 고조되고 있는 가운데, 지상파 DMB 및 위성 DMB에서도 스테레오스코픽 비디오 서비스를 제공하기 위한 노력이 진행되고 있다[1]-[3]. DMB-AF 파일 포맷[4]은 MPEG에서 제정한 DMB 파일 포맷 국제 표준이다. 이 표준 제정 당시에는 스테레오스코픽 비디오 콘텐트를 지원하는 기능이 들어 있지 않았다. 본 논문에서는 DMB-AF 한 파일 내에서 2D 비디오, BIFS에 의해 스테레오스코픽 이미지가 오버레이된 2D 비디오, 스테레오스코픽 비디오 등이 시간적으로 혼용될 수 있는 방법을 제안한다. 또한 이 방법은 기존 2D 비디오의 재생만 지원하는 기존 DMB-AF 플레이어와의 호환성을 보장한다. 따라서 기존 DMB-AF 플레이어가 BIFS에 의해 스테레오스코픽 이미지가 오버레이된 2D 비디오 또는 스테레오스코픽 비디오가 포함된 DMB-AF 파일을 재생할 때에는 2D 이미지 또는 2D 비디오로 재생할 수 있다. 제안한 방법은 한 프레임을 좌우로 반으로 나누어 좌안 및 우안 비디오를 좌우로 배치한 화면분할(side-by-side) 포맷에 의한 스테레오스코픽 비디오뿐만 아니라 좌안 또는 우안 비디오 중 하나는 2D 재생용의 기준 비디오로 다른 하나는 스테레오스코픽 비디오를 위한 부가 비디오로 사용하는 기본 포맷에 의한 스테레오스코픽 비디오도 지원한다. 후자의 경우, 부가 비디오는 가로 해상도가 기준 비디오의 1/2인 선택사항 포맷도 지원한다. 스테레오스코픽 비디오를 지원하기 위해, 기존 DMB-AF 표준의 확장을 최소화하는 방법을 제안한다.
-
본 논문에서는 SVC(Scalable Video Coding) 및 MVC(Multiview Video Coding) 등의 다계층 비디오의 효율적인 적응 HTTP 스트리밍을 위한 MPEG-2 TS(Transport Stream) 헤더의 확장을 제안한다. 먼저 TS로 다중화한 SVC/MVC를 HTTP를 통하여 스트리밍 할 경우 계층별 적응 스트리밍을 지원하기 위한 기존 TS의 한계점을 분석하고, TS 헤더의 확장을 통하여 TS 레벨에서 효율적인 적응을 제공하는 시그널링 기법을 제시한다. 본 논문의 제안 기법은 TS 헤더의 private_data를 추가적으로 정의하여 스케일러빌리티 및 뷰 정보를 기술함으로써 TS 단위로 스케일러블 계층 및 뷰 간 적응 스트리밍을 제공한다.
-
고해상도의 고품질 비디오 서비스가 보편화됨에 따라 최근 초고해상도(UHD: Ultra HD) 비디오 부호화 연구가 진행되고 있으며, 향후 융합환경에서의 HD 및 UHD 비디오를 동시에 제공하기 위하여 초고해상도에 적합한 스케일러블 비디오 부호화도 진행될 것으로 예상된다. 본 논문에서는 UHD/HD 비디오를 제공하기 위한 H.264/SVC의 확장 부호화 기법으로, 현재 표준화가 진행 중인 HEVC(High Efficiency Video Coding)의 대표적인 부호화 툴인 Large Block 개념을 적용한 SVC 부호화 기법을 제시하고 그 성능을 분석한다. 실험결과 Large Block을 적용한 SVC가 기존의 SVC에 비하여 17% 정도의 부호화 이득이 있음을 확인하였다.
-
MIMO(multi-input multi output) 기법은 여러 개의 안테나를 이용하여 채널의 다이버시티를 증가시켜 주파수 대역폭의 확장 없이 채널 용량을 증가시키는 기법이다. 그러나 MIMO 기법은 수신단의 복잡도가 높으며, 심볼간의 간섭 및 다중 경로 채널에 취약하다. 이런 MIMO 기법의 단점을 상호 보완 부호를 적용하여 극복함으로써 수신 SNR 성능을 향상시키는 방법을 제안한다. 상호 보완 부호를 MIMO 기법에 적용하면, 수신단에서 상관관계를 이용하여 심볼 간의 간섭을 완벽하게 제거할 수 있으며 다중 경로 채널에서도 강인한 장점이 있다. 제안된 알고리듬은 각각 컴퓨터 시뮬레이션으로 검증하였다.
-
디지털 제작, 압축 기술의 발전, 유무선 인터넷 보급 확산, 다양한 전송 및 서비스 플랫폼의 등장, 전송 기술의 광대역화, 단말 기술의 발전, 라이프스타일 변화와 킬러 서비스 등장으로 미디어 시장은 급속도로 발전하고 있다. 지상파 방송은 아날로그에서 디지털로 전환하고 있으며, 고화질, 다채널, 모바일, 3D 서비스를 제공하거나 제공할 예정에 있다. 현재 디지털 TV는 아날로그 TV와 동시 방송 형태로 제공되고 있지만 2012년말 디지털 TV로 완전한 전환을 앞두고 있으며, 모바일 TV인 DMB는 2005년말 본방송을 시작하여 전국 서비스를 제공하고 방송 커버리지를 확장하고 있다. FM과 AM의 디지털화를 위한 디지털 오디오 방송도 방식 선정을 위한 절차가 진행 중이다. 전파는 송신소에서 단말까지 전송되는 도중 신호레벨 감쇠, 페이딩, 왜곡, 잡음 유입 등을 겪게 된다. 양질의 지상파 방송을 제공하기 위해서는 전파가 수신 가능한 상태 이상의 양호한 상태로 시청자에게 전달되어야 한다. 이를 위해 방송사는 방송 수신 품질을 측정하고 수신이 불량한 지역에 대해서는 송신기 설치, 송신 출력 증강, 중계기 설치 등을 통해 양질의 서비스 제공이 가능한 방송 서비스 영역을 확대한다. 다양한 지상파 방송 매체에서 수신 품질 평가를 위해 가장 많이 측정하는 항목은 전계강도이다. 대부분의 경우 어떤 지역의 전계강도가 해당 매체가 요구하는 기준 레벨 이상이면 해당 지역을 양호 지역으로 평가한다. 본 논문에서는 다양한 지상파 방송 매체에 대한 전계강도를 측정하고 이를 분석할 수 있는 시스템을 제안하고자 한다. 제안 시스템을 이용하면 자동화된 절차에 의해 최단 시간에 다양한 지역에 대한 방송 수신 품질을 측정하고, 그 결과를 분석하여 방송 서비스 영역에 대한 평가를 내릴 수 있으며, 측정결과를 DB로 관리하여 동일 채널에 대한 이전 측정결과와 비교 분석, 다른 채널과 전계강도 비교 분석을 통해 특정 송신기 출력이 감소되거나 특정 안테나 출력에 문제가 발생한 경우에도 이를 쉽게 감지하여 최적의 방송망 구축 및 관리가 가능하다.
-
채널의 다중경로를 통과한 신호들은 지연확산 영향으로 심하게 왜곡이 되거나 Inter-Symbol Interference(ISI)가 발생하므로 왜곡된 채널을 추정하여 보상해야 한다. 기존 iterative 채널 추정 방식에서는 채널 시간 지연 길이 밖으로 zero padding함으로 노이즈 성분을 제거하는 알고리즘이다. 반면에 본 논문은 채널 시간 지연 길이 안으로 있는 노이즈 성분까지 노이즈 제거 문턱 값 추정(noise elimination threshold estimation: NETE) 알고리즘을 사용하여 노이즈를 효과적으로 제거한다. 시뮬레이션 결과는 채널의 mean square error(MSE)를 통하여 제안된 기법을 적용할 경우 채널 추정 성능 개선이 나타남을 확인할 수 있었다.
-
H.264/AVC는 부호화 효율을 높이기 위해 다양한 모드를 사용한다. 이런 다양한 모드들은 모두 부호화를 해봐서 발생하는 비용이 계산한다. 발생하는 비용은 영상의 화질과 비트로 구성되어 있으며, 영상의 화질이 좋고 발생비트가 가장 적은 모드가 선택 되어 복호기에 전송된다. 하지만 영상의 화질을 계산할 때 디-블록킹 필터의 효과를 무시해서 계산하기 때문에 정확한 모드를 선택하지 못하게 된다. 따라서 본 논문에서는 모드 결정시 디-블록킹 필터를 적용하여 정확한 영상의 화질을 계산하여 모드를 결정하는 방법을 제안한다. 그 결과 평균 1.021%의 BD-Rate를 감소시켰다.
-
분산 비디오 부호화(distributed video coding)는 분산 소스 부호화의 대표적인 응용분야로서 부호화 복잡도가 부호화기에서 복호화기로 이동되어 저전력 부호화 환경에 매우 적합하다. 본 논문에서는 분산 비디오 부호화의 성능 향상에 있어 가장 중요한 보조 정보의 효과적인 생성 방법을 제안한다. 우선 보조 정보 생성을 위한 키 프레임들 간의 블록 움직임 추정에 있어 기존 방법들이 대체적으로 가정하고 있는 선형적인 움직임 이동에 따른 잘못된 예측을 해결하기 위해 두 장 이상의 키 프레임을 사용하여 블록 움직임을 추정한 후, 선형 회귀(linear regression)를 이용하여 보조 정보 상의 블록 움직임 궤적을 추정한다. 이때 움직임 추정을 위한 키 프레임 번호를 증가하며 선입선출(FIFO)형 버퍼에 저장 및 삭제하여 동일한 보조정보에 해당하는 여러 움직임 벡터 필드와, 기존의 선형적인 움직임이 가정된 움직임 벡터 필드를 동시에 생성한다. 다음으로 보간(interpolation)하려는 보조 정보 프레임 내의 임의의 블록에 가장 가깝게 통과하는 움직임 벡터 필드를 선택하여 해당하는 블록의 최종 움직임 벡터로 선택한다. 실험결과 제안하는 보조 정보 생성 방법은 기존의 방법과 비교했을 때 비대칭성 움직임 벡터 사용만으로 평균 PSNR이 0.216dB 만큼 증가하는 것을 확인할 수 있었다.
-
LDPCA 부호는 부호율-적응적인 특성과 함께 뛰어난 압축률을 가지고 있어 분산 소스 부호화 시스템에서 사용되는 오류정 정부호로서 많이 사용되고 있다. 하지만 소스와 보조정보 사이의 상관관계가 낮은 영역에서는 급격한 성능열화가 일어나게 된다. 본 논문에서는 기존 LDPCA 부호에 특정 압축률 이상의 단계에서 추가 누적 신드롬 대신 변수노드와 일대일로 연결되어 있는 차수-1 신드롬을 전송하는 방식을 적용하여 이 영역에서 급격하게 발생하는 성능열화를 줄였다. 또한 차수-1 신드롬과 연결할 변수노드 집합을 선택할 때 복호화기에서 사용하는 LDPCA 부호의 검사노드 차수 분포를 집중시키는 알고리즘을 제안하여 성능을 더욱 향상시켰다.
-
본 논문에서는 고속, 저전력 비디오 부호화에 적합한 변환영역 Wyner-Ziv 분산비디오부호화기를 더욱 고속화하기 위한 병렬처리 방법을 제안한다. 기존에는 변환영역 Wyner-Ziv 분산비디오부호화를 위해 양자화 정보를 비트플레인단위로 분해후 이를 순차적으로 LDPCA 부호화하여 전체 부호화기 연산량에서 LDPCA의 복잡도가 약 54% 정도 차지하였고, 이는 고비트율로 부호화 할수록 더욱 증가하였다. 제안방법은 이를 개선하기 위해 여러 개의 비트플레인을 하나의 심벌 (symbol)로 묶어서 LDPCA 부호화를 수행하여 한 번의 연산으로 여러 개의 데이터를 동시에 처리할 수 있게 한다. 일종의 단일 명령 복수 데이터 처리 (SIMD, Single instruction, multiple data)에 의한 고속화 방법이다. 이를 통해 제안방법은 기존의 순차적 처리 방법에 비해 저비트율에서는 8배, 고비트율에서는 55배까지 LDPCA의 부호화 속도를 향상시켰다. 결과적으로 전체 부호화에서 LDPCA의 상대적인 복잡도 비율은 4%정도로 낮아지게 되었으며 Wyner-Ziv 영상의 부호화 속도도 약 1.5 ~ 2배까지 향상되었다. 제안방법은 LDPCA를 사용하는 다른 Wyner-Ziv 분산비디오부호화 구조에도 적용 가능할 것으로 기대한다.
-
본 논문은 저복잡도 비디오 부/복호화를 위한 엔트로피 부호화 기반의 분산 비디오 코딩 방법을 제안한다. 제안하는 엔트로피 부호화 기반의 분산 비디오 코딩은 복호기의 복잡도를 줄이기 위하여 기존의 분산 비디오 코딩에서 사용하는 채널코딩을 이용하는 것이 아니라 엔트로피 코딩을 이용하여 부호화를 수행한다. 제안하는 방법에서 복호가는 움집임 추정을 수행하고 그 결과인 움직임 백터를 부호기로 전송하며, 부호기는 전송받은 움직임 백터를 초기 움직임 백터로 하여 움직임 백터 값의 갱신을 수행한다. 제안한 방법의 성능을 평가하기 위하여 기존의 분산 비디오 코딩 방법과 복호기 복잡도를 비교한 결과 99%의 복잡도 감소가 있었고, H.264/AVC의 All Intra 방법과 비교하여 20.3%의 비트율 감소가 있었다.
-
영상 촬영기능을 갖는 휴대 단말의 보편화로 비디오 압축 방식의 새로운 접근 방법의 필요성이 대두되고 있다. 부호화기의 복잡도가 낮은 장점을 가진 분산 비디오 압축 기술은 이러한 필요성에 부합하는 기술로서 활발히 연구가 이루어지고 있는 분야이다. 본 논문은 분산 비디오 압축 기술에서 사용하고 있는 균일 양자화와 Deadzone을 알아보고, Deadzone의 크기를 조절하는 방법을 제안하여 율 왜곡 성능을 개선시키고, 제안 방법의 효과를 분석하였다.
-
3차원 메쉬는 전송과 저장에 많은 저장 공간을 필요로 한다. 따라서 3차원 메쉬의 효과적인 전송 및 렌더링을 위해서는 3차원 객체에 대한 압축이 필수적이다. 이에 본 논문은 점진적 전송을 위한 기하 정보 압축 기법을 제안한다. 제안하는 알고리즘은 점진적 전송에서 각 레벨마다 추가되는 점의 기하 정보를 예측하는 효과적인 방법을 사용한다. 구체적으로 제안하는 기법은 상위 레벨의 점들을 이용하여 2차 곡면을 추정하고, 추정된 곡면을 통해 기하 정보를 예측 부호화한다. 실험 결과는 제안하는 알고리즘이 기하 정보 압축률을 향상시킬 수 있음을 보여준다.
-
본 논문에서는 3차원 스테레오 영상에서의 시각적 피로도와 안구의 운동량과의 상관관계를 도출하고 시각적 피로도 측정 시스템을 제안한다. 제안한 측정 방법은 3차원 스테레오 영상 시청자의 피로도가 누적되었을 때, 안구의 단속성 운동(saccade)이 감소할 것이라는 가정에 기반을 둔다. 액티브 셔터글라스 방식의 3D 안경을 착용한 시청자의 동공을 검출하고 추적하기 위해 적외선 광원 및 적외선 카메라를 이용한다. 획득한 영상에 대해 이진 임계화를 적용하고 타원 피팅을 수행하여 동공의 위치를 검출한다. 피팅된 타원의 이심률과 크기 및 위치를 제한하여 검출 오류를 줄인다. 검출된 동공의 위치를 바탕으로 안구의 단속성 운동량을 측정한다. 실험에는 변이 정도가 크지 않아 편안하게 시청 가능한 스테레오 영상과 과도한 변이를 가져 시청하는데 불편한 영상이 분리되어 사용되었다. 이들 영상에 대해 각각 실험자의 단속성 운동량을 측정하였다. 실험 결과에서 안구의 단속성 운동량이 변이가 큰 영상에서 그렇지 않은 영상에 비해 감소하는 경향이 나타났다.
-
기존의 협력통신 관련 연구는 주로 단일 송 수신기와 다중 중계기가 존재하는 시스템 상에서 최적의 중계기를 선택하여 협력전송을 하거나 다중 중계기 모두를 이용한 협력통신이 이루어지고 반대로 단일 수신기, 중계기와 다중 송신기가 존재하는 시스템에서 최적의 사용자를 선택하는 것에 관한 것이 대부분 이었다. 하지만 실질적으로 보았을 때는 시스템 전체적인 관점에서 보았을 때 각각의 사용자에 대하여 최선의 중계기를 선택할 경우 오히려 전체적인 시스템 성능은 떨어질 수 있다. 본 논문에서는 다중사용자 협력시스템에서 각각의 사용자들이 자신들의 중계기 역할을 할 사용자를 선택하는 기법에 대하여 알아본다. 각 사용자에 대하여 자신이 중계기 역할을 할 경우 복호및재전송 기법을 이용하여 중계역할을 하고 그렇지 않을 경우 자신의 신호를 재전송한다. 제안된 시스템에서의 각 사용자에 대한 불능확률을 구하고 그것을 기반으로 사용자를 선택하게 된다. 모의실험을 통해 제안된 시스템에서의 사용자 선택 기법들의 성능을 알아보았고 이를 평균 불능확률로 나타내었다. 모의실험 결과 제안된 시스템에서 랜덤선택은 협력통신을 하지 않은 경우보다 안 좋은 성능을 보였고 나머지 기법들의 경우 협력통신을 하지 않은 경우보다 월등히 좋은 성능을 보였다.
-
본 논문은 SC-FDE 기반 3D-HDTV 지상파 방송을 위한 MISO 구조의 SFN을 구성하고 STBC방식의 데이터 송신기업과 방송망 내 수신기의 위치에 따라 발생하는 두 개의 송신신호의 도달 시감의 차이를 극복하기 위한 채널추정기법을 제안한다. 모의실험을 통하여 브라질 채널에서 두 개의 송신신호의 차이에 따른 제안된 기법의 성능을 확인하였다.
-
급증하고 있는 이동 멀티미디어 방송 콘텐츠 서비스의 수요에 발맞추어 이 서비스를 이용하는 사용자들을 효율적으로 관리하는 방안에 대해 관심이 집중되고 있다. 1991년 Chaum과 van Heyst에 의해 소개된 그룹 인증 관리 기법은 익명성의 보장이나, 관리상의 편의로 인해 앞에서 언급된 문제를 해결하는 데 중요한 역할을 할 것으로 예상되었다. 하지만, 이후 소개된 몇개의 그룹 인증 관리 기법들이 실제로는 익명성을 보장하지 못 하거나, 외부 그룹에 의해 악용될 수 있다는 점이 증명되어, 그룹 인증 관리 기법을 실제로 응용하기 이전에 안전성 보장을 위해 요구되는 적합한 기준들을 선정하고, 이 기준에 부합하는지를 살펴보는 일이 더욱 시급한 문제로 대두되었다. 이에 본 논문은 이동 멀티미디어 방송 콘텐츠 서비스를 이용하는 사용자들을 그룹 인증 기법으로 관리하는 데 있어, 요구되는 안전성 조건과 이에 적합한 그룹 인증 기법을 소개하고, 실제로 소개한 그룹 인증 기법이 본 논문에서 선정한 안전성 조건에 부합하는지를 증명하였다. 더불어, 그룹 인증 기법을 실제 효과적으로 응용할 수 있는 비즈니스 모델을 제안하여 그룹 인증 기법의 효용 및 앞으로의 개발 방향을 제시하였다.
-
본 논문에서는 2D 영상에서 다시점 영상 생성 시 가상 시점을 만드는 과정에서 발생하는 가려짐 영역(occlusion) 보상 기법을 제안한다. 제안된 기법에서는 영상이 가지고 있는 주요한 특성을 유지하면서 가려짐 영역을 보상한다. 기존에 제안되었던 가려짐 영역 보상 방법은 가려짐 영역이 발생한 주변의 화소를 그대로 채워 넣는 방식을 사용하거나 평군값 필터 또는 중간값 필터와 같은 기존의 보상 필터를 이용하기 때문에 시차의 분포 특성을 고려하지 않는다. 따라서 오차는 줄일 수 있으나, 교정된 시차의 정확성은 보장되지 않는다. 본 논문에서 제안하는 가려짐 영역 보상 기법에서는 영상의 주요한 특성을 함께 고려하여 정확성을 높였다. 다양한 영상에 적용하여 제안된 기법의 성능을 테스트하였고, 그 결과 기존의 보상 방법에 비해 가려짐 영역을 비교적 정확하게 보상하는 것을 확인하였다.
-
본 논문에서는 현재 상용화 되어있는 WCDMA용 ICS (Interference Cancellation System) 중계기의 성능 개선을 위한 개선된 LMS 알고리즘을 연구하였다. ICS 중계기의 수신으로 입력되는 신호는 수신 신호와 궤환되어 입력되는 신호로 구성된다. 이렇게 입력되는 궤환 신호를 LMS와 같은 적응형 채널 추정 알고리즘을 통해 제거하는 기술이 ICS 중계기의 핵심 요소이다. 중계기의 저비용 및 단순화를 위해서는 기존에 사용되어온 적응형 채널 추정 알고리즘의 단순화가 필요하다. 실험을 통해 기존 NLMS 알고리즘 및 계산 복잡도 감소를 위해 수정된 LMS 알고리즘을 MSE (Mean Square Error) 기준에서 성능 비교를 하였다.
-
잡음 분산 값은 SNR(signal-to-noise ratio) 추정이나 MMSE(minimum mean square error) 계산, 채널 임펄스 응답의 추정 등에 사용되는 중요한 파라미터이다. 채널이 시간에 따라 변하는 무선 통신 환경에서, 신호와 섞여 있는 잡음과 간섭 신호의 정확한 추정에는 그 한계가 있으며 이로 인해 발생하는 추정 오차는 수신기의 데이터 검출 성능을 저하시킨다. 훈련열을 이용하여 채널을 추정하였을 경우 추정된 채널 임펄스 응답 신호 중 다중 경로 신호는 소수에 불과하고 나머지 대부분의 계수는 잡음 성분만을 포함하는 신호이다. 이러한 특징을 이용하여 채널의 추정 계수로 잡음 분산을 추정하는 방법이 기존에 제시되어 있다. 여기서 제안하는 알고리즘은 기존 알고리즘인 PSA(partial sample average)와 비교해 연산량에서 차이가 거의 없이 구현되며, 3GPP TDD[1]에서의 모의 실험을 통하여 기존 알고리즘보다 더 정확한 분산 값을 찾아냄을 확인하였다.
-
무선 통신 환경에서 간섭과 잡음으로 인한 채널 추정 오류는 데이터 검출을 위한 등화 성능을 현저하게 저하시킨다. 포스트 프로세싱은 채널 추정 이후에 이러한 추정 오류를 줄이기 위한 작업이며, 여기서는 소수의 채널 계수만이 무선 채널의 다중 경로에 의한 신호 성분을 갖는 무선 채널의 특성을 이용하여 신호 성분을 포함하지 않은 계수를 선별하고 이를 제거함으로써 채널 추정 오류를 줄이는 방법을 위한 순환 알고리즘을 제안한다. 기존 알고리즘은 잡음 분산을 기준으로 문턱값을 결정하고, 그 문턱 값보다 작은 계수는 신호성분을 포함하지 않는다고 간주하여 이를 제거하였다. 제안된 순환 알고리즘은 잡음 분산의 추정치를 반복이 진행됨에 따라 갱신하여 이를 기준으로 구한 문턱값을 이용한 포스트 프로세싱을 반복함으로써 채널 추정 성능을 개선시킨다. 제안된 방법은 기존의 방법과 유사한 복잡도를 갖는 반복 횟수를 적용하는 경우에 월등히 성능이 개선되며, 특히 반복 횟수를 조절함으로써 처리 시간과 채널 추정 성능을 최적화할 수 있는 유연성을 갖고 있다.
-
본 논문에서는 MPEG 의 3차원 비디오 시스템의 표준 깊이정보 맵에 대한 효율적인 부호화를 위하여 전처리 방법을 제안한다. 현재 3차원 비디오 부호화(3DVC)에 대한 표준화가 진행 중에 있지만 아직 깊이정보 맵의 부호화 방법에 대한 표준이 확정되지 않은 상태이다. 제안하는 기법에서는 우선, 입력된 깊이정보 맵에 대하여 원래의 히스토그램 분포를 가우시안 혼합모델(GMM)기반의 EM 군집화 기법에 의한 방법으로 분리 후, 분리된 히스토그램을 기반으로 깊이정보 맵을 여러 개의 영상으로 분리한다. 그 후 분리된 각각의 영상을 배경과 객체에 따라 다른 조건의 mean shift filter로 필터링한다. 결과적으로 영상내의 각 영역 경계는 최대한 살리면서 영역내의 화소 값에 대해서는 평균 연산을 취하여 부호화시 효율을 극대화 하고자 하였다. 실험조건은
$1024{\times}768$ 영상에 대해서 50 프레임으로 H.264/AVC base 프로파일로 부호화를 진행하였다. 최종 실험결과 bit rate는 대략 23% ~ 26% 정도 감소하고 부호화 시간도 다소 줄어드는 것을 확인 할 수 있었다. -
본 논문은 MIMO 시스템에서 Comb 방식의 파일럿 구조를 이용한 채널 추정에 관해서 논의한다. 기존의 채널 추정은 시간영역에서 정해진 구간의 평균 이용하여 계산량이 아주 작은 방법을 사용한다. 본 논문은 각각의 안테나에 존재하는 파일럿에 직교코드를 넣어 기존의 알고리듬 보다 긴 채널 추정을 가능하게 하였다. 제안된 알고리듬은 컴퓨터 시뮬레이션을 통해 기존 방식보다 긴 채널을 추정함을 알 수 있다.
-
본 논문에서는 객체의 색상 정보와 차영상을 이용한 동영상 내 객체 추적 기법을 제안한다. 제안하는 기법은 연속적은 프레임 간에 객체의 색상 정보의 변화가 크지 않다는 것을 가정하여 비슷한 색상 정보를 찾아 현재 프레임의 객체 영역을 얻는다. 입력한 이전 프레임의 초기 객체 정보를 사용하여 객체와 배경의 색상 히스토그램을 구한다. 또한 현재 프레임과 이전프레임의 차영상을 생성한다. 마지막으로 객체와 배경의 색상 히스토그램과 차영상을 사용하여 현재 프레임의 각 화소를 객체 또는 배경 영역으로 구분하여 현재프레임의 객체 영역을 얻는다. 생성된 현재 프레임의 객체 정보는 다음 프레임의 객체 추적에서 다시 사용한다.
-
본 논문에서는 움직임 추정(Motion Estimation, ME), 색상 라벨링(Labeling) 그리고 Non-Local means 필터 등을 이용하여 2D 영상을 3D 입체 영상으로 변환하는 기법을 제안한다. 제안하는 기법에서는 프레임 간의 움직임 추정 방법을 사용하여 물체의 움직임 벡터를 추출하며 색상 라벨링 작업을 통해 세밀한 객체를 추출한다. 객체를 추출한 후 영상을 이동시켜서 우영상을 생성한다. 우 영상을 생성하는 과정에서 채워지지 않은 화소들이 발생하는데 전체 화소의 상관도를 고려하는 Non-local means 필터를 사용하여 이 부분을 처리한다. 생성된 우 영상과 원본 영상인 좌 영상으로 비월주사(interlace)하여 최종 3D 입체 영상을 생성한다.
-
The study investigated the optimal configuration of SVC (Scalable Video Coding) to apply to the satellite broadcasting service, and compared the performance of the SVC with that of the AVC (Advanced Video Coding). To get the optimal configuration, we analyzed the optimal bit rate allocation between the layers and the optimal scalability which requires the least bit rate for the required PSNR for various kinds of contents using JSVM. As a result of investigation, we found that the optimal bit rate allocation occurs when the bit rate of the base layer is minimum, and the spatial scalability shows the best performance. The performance of SVC is similar to that of AVC for spatial scalability, but it depends on contents.
-
영상 정보의 정확성을 필요로 하는 다양한 서비스 및 여러 학문 분야의 적용성으로 인해 물리적인 한계성을 극복할 수 있는 고해상도 영상처리 기법의 요구가 대두되고 있다 뿐만 아니라, 인터넷 상의 디지털 콘텐츠 중의 하나인 동영상 UCC의 제작환경이 보편화됨으로써 비전문적인 제작으로 인한 다양한 형태의 해상도 저하 및 영상의 왜곡 현상이 발생하여 고품질의 영상을 추구하는 사용자들의 요구를 충족시키지 못하고 있다. 이러한 문제점을 해결하기 위한 압축 동영상의 개선 된 영상 정보를 획득하기 위한 연구가 이루어지고 있지만 다음과 같은 문제점이 있다. 기존의 방법은 일반적으로 저역 통과 필터 기법과 정규화 영상 복원 방식으로 구분되어 연구되고 있으며, 저역 통과 기법은 계산량 측면에서 장점이 있으나, 영상과 양자화 정도에 따라 적응적이지 못한 단점이 있다. 또한 정규화 복원 방식은 압축 영상의 시각적으로 불편한 현상의 완화 정도를 결정하는 정규화 매개변수를 일괄적으로 모든 화소에 적용해, 화소의 위치에 대한 적응도가 낮고 정규화 매개 변수 선택 시 원 영상에 대한 정보를 알고 있다는 가정을 사용했으므로 실제 사용이 불가능하며, 영상들 사이의 불균일로 인해 적응적으로 처리하지 못하는 단점이 있다. 본 연구에서는 이러한 문제점을 극복할 수 있도록 압축 정보 활용을 통한 POCS 방식을 사용한 coding artifact 제거 방식에 대해 기술한다.
-
본 논문에서는 영상처리 기능을 통해 손 제스처를 인식하는 알고리즘을 개발하고 이를 활용하여 로봇의 움직임을 원격으로 제어하는 시스템을 구현하였다. 전체 시스템은 손 영상을 획득하는 카메라, 영상처리를 수행하는 컴퓨터, 그리고 LEGO Mindstorm 로봇으로 구성되며, 컴퓨터와 로봇 사이의 통신은 Mindstorm에 내장된 블루투스 기능을 사용하였다. 카메라에서 획득한 영상에서 사람의 손에 해당하는 영역만을 추출하기 위해 먼저 컬러 필터링을 수행하였으며 영상의 신뢰성을 향상시키기 위해 잡음을 제거하는 보정 작업을 거친다. 그리고 무게중심 연산을 통해 손의 중심점을 추정하고 이로부터 일정 거리에 있는 손가락 영역을 추출한다. 마지막으로 펼쳐진 손가락 개수를 구하고 그 개수에 따라 미리 설정된 명령을 로봇에 전송한다. 실험을 통해 조명 상태가 양호하고 배경이 복잡하지 않은 대부분의 환경에서 로봇 원격제어가 성공적으로 이루어짐을 확인하였다.
-
블록 기반의 적응적 루프 필터(BALF : Block Adaptive Loop Filter)는 압축 성능에 있어서 상당히 높은 효율을 보이는 기술 중 하나이다. BALF는 복원된 영상을 원본 영상에 최대한 유사하게 만드는 Weiner 필터계수와 해당 필터가 적용될 영역에 대한 정보를 복원된 영상에 적용함으로써 화질을 높일 수 있다. 그러나 BALF는 단위블록 전체에 대해 하나의 필터를 생성하여 적용하는 방법으로, 블록 내부에서 구분되는 신호적 특성을 따로 분류하지 않는다. 그러므로 BALF는 높은 부호화 성능을 보이는 반면, 높은 복호화 복잡도를 요구한다는 단점이 있다. 본 논문에서는 필터가 적용될 블록을 내부와 경계 영역으로 나누어 경계 영역을 위한 필터를 구분하여 생성하는 루프필터를 제안한다. 제안하는 알고리즘은 기존의 BALF에 비해 부호화 성능이 저하되지만, 필터를 적용할 영역을 선택 가능하게 함으로써 복호화 복잡도를 조절할 수 있도록 하였다. 제안한 방법의 실험결과, 기존의 방법인 BALF에 대하여 블록의 경계 영역 필터를 사용할 경우, 약 3.77%의 부호화 성능 저하에 대하여 약 33.76%의 필터링 속도 향상을 보였다.
-
H.264/AVC의 화면내 예측 부호화 기술에서 예측 모드 정보를 부호화하기 위해 최우선 모드를 이용하며 최우선 모드의 선택율은 매우 높다. 또한 일반적으로 자연 영상이나 동영상의 경우 균일한 특성을 나타내는 영역을 많이 포함하고 있으며, 이러한 영역은 주변 블록과의 상관도가 매우 높다. 따라서 주변 블록의 예측 모드, 화소 에지의 방향성을 이용하면 복호화기에서도 현재 블록의 최적의 예측 모드를 결정할 수 있다. 본 논문에서는 화면내 부호화 효율을 향상시키기 위해 예측 모드 정보를 전혀 전송하지 않는 복호화기 예측을 이용한 화면내 예측 모드 SKIP 부호화 모드를 제안한다. 제안하는 방법은 주변 블록의 정보만을 이용하여 예측 모드를 결정하고 기존의 예측/변환 방법을 이용하여 부호화를 실시하며 예측 모드 정보는 전혀 전송하지 않는다. 실험 결과 제안하는 방법은 H.264/AVC의 참조 소프트웨어인 JM 17.0에 비하여 CIF 영상에서 1.40%, 720p 영상에서는 3.24%의 비트 감소를 나타내었다.
-
본 논문에서는 최종 변이영상의 정확도를 높이기 위해 영상의 특징점을 이용한 적응적 가변 정합창 방법과 교차 일치성 검사의 신뢰도를 높이는 방법을 제안한다. 제안한 적응적 가변 정합창 방법은 색상정보를 이용하여 영상을 분할하고 분할된 각 영상의 특징점을 찾아 그 특징점들의 유무에 따라 정합창의 크기를 적응적으로 가변시키는 방법이다. 또한 제안한 알고리즘을 GPU를 기반으로 구현하여 연산속도가 평균 128배 빨라졌다.
-
오래된 영상에는 여러 가지 물리적 요인에 의하여 스크래치가 발생하고 이 스크래치는 화질의 열화를 야기한다. 이러한 스크래치는 다양한 길이, 다양한 너비로 발생하므로, 이를 반영하기 위하여 본 논문에서는 스크래치를 리지로 간주하고 scale space에서 리지를 검출한다. 검출된 리지는 영상의 화질이 좋지 않아 조각난 채로 검출되므로 본 논문에서는 검출된 리지를 수직 방향으로 그룹핑하여 최종적으로 스크래치를 검출한다.
-
본 논문에서는 직교 주파수 다중화 (OFDM) 신호의 새로운 peak to average power ratio (PAPR) 감쇄 기법을 제안한다. 제안 기법은 시간영역에서 OFDM 심볼의 동상 (in-phase) 성분 및 직교 (quadrature) 성분을 회전시키고 재조합한다. 제안 기법은 기존의 partial transmit sequence (PTS) 기법과 비교하여 계산량을 현저히 줄일 수 있는 장점이 있었음에도 모의 실험을 통해 얻어진 PAPR의 complementary cumulative distribution function (CCDF)는 PTS와 비교할 때 거의 같은 성능을 보였다. 더욱이 제안된 기법은 additive white Gaussian (AWGN) 채널 및 다중 경로 페이딩 채널 (multi-path fading channel)에서 일반적인 OFDM 신호를 전송할 때와 거의 같은 BER (bit error rate) 성능을 보였다.
-
본 논문에서는, 다중송수신안테나 직교주파수분할다중화 (MIMO-OFDM) 시스템에서 심볼 기반 빔포밍을 위한 제한 피드백 기법을 고려하였다. 공간적 상관도가 존재하는 다중전달경로 채널에서, 심볼 기반 빔포밍을 위한 제한 피드백 기법과 코드북을 제안하였다. 모의실험 결과를 통해 제안한 기법이 낮은 복잡도를 가짐에도 불구하고 기존의 iterative 알고리즘을 기반으로 하는 심볼 기반 빔포밍을 이용한 제한 피드백 기법보다 우수한 성능을 보임을 확인하였다. 또한, 제안한 코드북이 랜덤 벡터 양자화 코드북보다 우수한 성능을 보임을 확인하였다.
-
본 논문은 3-사용자 X 채널 상황에서 다중안테나를 이용하여 간섭을 완벽하게 제어하는 기법에 대해 제안한다. 기존에 제안된 방식이 빔포밍(beamforming) 벡터를 다수의 채널을 사용하여 만드는데 따른 비현실적인 문제와 간섭을 완벽하게 제어하기 위한 무한한 채널 사용의 필요성에 따른 문제점을 본 논문에서는 다중안테나를 이용하여 공간적 특성을 이용한 빔포밍 벡터를 형성하고 채널의 확장 없이 간섭을 완벽히 제어하도록 하는 시스템을 제안한다. 제안한 시스템은 9개의 DOF(Degrees of freedom)을 얻을 수 있음을 모의실험 결과를 통해 확인할 수 있다.
-
OFDM시스템의 대안으로, SC-FDE시스템은 주파수 선택적 페이딩 환경에서 구현상의 복잡도가 크지 않으면서 낮은 PAPR로 다중 경로 지연에 의한 영향을 완화시키기 위한 기술로 연구되어 왔다. SC-FDE시스템에서 보호 구간으로 PN신호를 훈련 심볼(Training Sequence)로 둠으로써 CP에 비해 빠른 동기화와 채널 추정에 사용될 수 있는 장점이 있으며, 채널 추정을 위해 Correlation과 LMS기법을 동시에 적용함으로써 에러가 최소가 되기까지 수렴 시간을 줄일 수 있다. 본 논문에서는 PN시퀀스를 기반으로 추정한 채널 값으로, ISI를 효과적으로 제거할 수 있는 MMSE-FDE 등화 기법을 제안한다. SFN 채널 환경과 같이 스펙트럼 널이 강한 다중 경로 페이딩환경에서 ISI를 선 제거 하는 ISI cancellation 기법을 통해 정확한 SNR추정을 할 수 있고, 이를 통해 MMSE-FDE 등화 성능을 향상 시킬 수 있다.
-
본 논문에서는 형상 분해(Shape Decomposition)를 이용한 손동작 인식 방법을 제안한다. 형상 분해 방법을 손동작 인식에 적용함으로써 다양한 동작에 대해서 유연한 인식이 가능하며, 기존의 형상 분해 방법을 손 형상 분해에 적합하게 효율적으로 개선함으로써 실시간 연산이 가능하도록 하였다.
-
본 논문은 CoMP 기법이 적용된 다중 사용자 MIMO-OFDMA 시스템을 위한 자원할당 알고리즘을 제안한다. 제안된 알고리즘에서는 eNode B가 RRE와 UE간의 채널 정보를 이용하여 전체 송신 전력 제한을 가지면서 전체 데이터 레이트가 최대가 되도록 자원을 할당한다. 자원할당 알고리즘을 통해 얻어진 결과를 이용하여 부반송파에 다수의 UE들이 할당된다. 할당된 UE들은 각각 MIMO 채널을 통해 다수의 공간경로를 갖고 각 공간경로에서는 할당된 전력에 따라 QPSK, 16QAM, 64QAM 중 하나를 선택하여 전송한다.
-
비디오 압축 기법에서 움직임 추정(Motion Estimation)은 매우 중요한 부분을 차지하는데, 그것은 움직임 추정이 화질과 인코딩 시간에 직접적으로 영향을 미치기 때문이다. 가장 기본적인 움직임 추정 기법은 전역 탐색 기법(Full Search)인데, 이는 가장 좋은 화질을 보여주긴 하지만 매우 많은 계산량이 필요하다는 단점이 있다. 따라서 좋은 화질을 유지하면서도 계산량을 낮추기 위한 많은 고속 탐색 알고리즘들이 제안되었다. 이 논문에서는 현재 프레임의 매크로블록과 이전프레임의 매크로블록간의 Sum of Absolute Difference를 이용하여 탐색영역을 변경하는 새로운 예측 방법을 제시한다. 실험결과에 따르면 우리가 제안한 알고리듬은 FS와 비슷한 PSNR을 유지하면서 속도가 크게 향상된 것을 볼 수 있었다.
-
영상 압축은 멀티미디어 실시간 전송에 있어서 핵심적인 기술이다. 동영상 압축 기술 중 움직임 예측 부분은 가장 계산량이 많고 가장 복잡한 부분으로 실시간 전송을 위해서는 고속 알고리즘이 필요한 부분이다. 본 논문은 기존의 움직임 예측 알고리즘의 하나인 이진 블록 정합 움직임 예측 알고리즘 중 2bit 변환을 개선하여 더욱 빠른 알고리즘을 제안한다. 기존의 2bit 변환 알고리즘은 현재 프레임과 이전 프레임의 블록에 윈도우를 씌어 각 프레임의 윈도우에서 구한 평균과 표준편차를 가지고 각각 2bit 변환을 하였다. 그러나 본 논문은 현재 프레임과 이전 프레임의 블록에 윈도우를 씌우고 현재 프레임의 윈도우에서 구한 평균과 표준편차를 이전 프레임에 적용을 시켜 같은 평균과 표준편차를 이용하여 기존의 알고리즘을 개선한다. 제안하는 알고리즘은 계산량의 감소와 동시에 화질을 유지시킨다.
-
얼굴검출기술이 발달함에 따라 보안 프로그램에서부터 게임에까지 얼굴검출기술이 적용된 다양한 프로그램들이 개발되고 있으며, 휴대단말기기에까지 접목되었다. 휴대단말기기를 통한 얼굴검출의 경우, 검출율을 높이기 위한 높은 대비 개선 알고리즘은 물론이고, 낮은 프로세서의 성능 때문에 적은 연산량의 알고리즘이 필수적으로 요구된다. 본 논문에서는 영상의 조명 정도를 분석하여 저 조도, 일반 조명, 과다 노출의 3분류로 나누고, 각 조명에 가장 알맞은 대비 개선 알고리즘을 사용함으로써, 휴대단말기기에 적합한 적은 연산량과 얼굴검출에 알맞은 높은 대비 개선율을 갖는 알고리즘을 제안한다. 실험 결과, 휴대단말기기인 UMPC(Ultra Mobile PC)에서 30fps의 속도를 보였으며, 기존 방법들과 비교하여 가장 좋은 얼굴검출성능을 확인하였다.
-
분산 비디오 기술의 대표적인 기술 중 하나는 와이너 지브 부호화 기술이다. 와이너 지브 부호화 구조에서 보조정보는 인트라 복호화된 키 픽처들을 이용하여 생성한다. 키 픽처의 객관적 화질은 보조정보의 성능에 많은 영향을 끼치고, 잡음이 많은 보조정보를 복호화에 이용할 경우 부호화로부터 많은 패리티 비트를 요구하게 되어 율 왜곡 성능을 저하된다. 기존의 부호화 기술은 키 픽처 부호화 시 Quantization Matrix에 따라 미리 정의된 양자화 계수를 이용한다. 본 논문에서는 미리 정의된 양자화 계수 보다 낮은 계수 값을 사용하여 부호화 하는 방법을 제안한다. 제안방법은 키 픽처의 객관적 화질이 높아짐에 따라 보조정보의 화질을 향상시킨다. 잡음이 적은 보조정보는 와이너 지브 복호화 시 율 왜곡 성능을 향상시킨다. 실험결과는 기존 방법에 비해 최대 0.7dB에 이르는 성능향상을 보인다.
-
최근 3D 콘텐츠의 관심 증가는 Display 장치, 모바일 기기 등의 하드웨어적인 발전을 가져왔고, 이에 따른 입체 콘텐츠의 필요성이 대두되고 있다. 또한 단순히 영상을 비 실시간으로 처리하여 입체로 변환하는 것 외에, 방송이나 모니터 자체에서의 입체변환에 대한 기술은 3D콘텐츠 산업에서 또 다른 이슈로 부각되고 있다. 본 논문에서는 깊이 필터와 움직임 예측을 이용한 깊이맵 생성 기법을 제안한다. 영상에서 Y 버퍼를 추출하고, 이에 깊이 필터를 적용시킨 후 블록단위 움직임 예측을 적용한다. 이렇게 구해진 움직임 벡터에 노이즈 제거 등을 통하여 물체의 영역을 추출한 후, 최종적으로 깊이맵을 생성한다.
-
현대 사회에서 영상 콘텐츠 (contents)의 사용량이 급증함에 따라 영상압축 기술은 이동통신이나 DMB 등의 시스템에 필수적인 기술이 되었으며 이에 따라 MPEG-x와 H.26x 등 국제적인 표준들이 존재한다. 전역 탐색 알고리듬은 주어진 검색 범위(search range) 내에서 모든 후보들의 변위의 에러 기준에 따라 최솟값을 이용해 위치를 검색하는 알고리듬이다. 그러나 전역 탐색 알고리듬은 각 화소에 대해 엄청난 양의 계산 로드를 가지며 이로 인해 심각한 문제를 발생시키는 단점이 있다. 1비트 변환 (one-bit transform) 을 이용한 고속 움직임 추정 알고리듬은 참조 프레임과 현재 프레임을 1비트, 즉 0 또는 1만 갖는 값으로 변환하는데, 이에는 exclusive-OR 연산을 통해 블록 매칭 에러 (block matching error)를 계산하는 과정과 변환하는 과정이 포함된다. 본 논문에서는 다양한 커널 (kernel)들을 이용한 1비트 변환과 움직임 추정에 대해 다루었으며, 기존에 있었던 1비트 변환에 이용된 커널과는 다른 다양한 커널을 이용한 움직임 추정 결과들을 비교해봄으로써 화질열화를 최소로 하는 커널을 찾는 것에 대해 연구했다.
-
현재의 멀티미디어 서비스는 기존의 텍스트 위주의 사용자 환경에서 벗어나 오디오, 비디오뿐만 아닌 이미지, 그래픽, 텍스트 및 미디어 관련 정보 등의 다양한 데이터를 포함하는 멀티미디어 서비스 환경으로 변화하고 있다. 이러한 멀티미디어 서비스는 과거 TV와 컴퓨터 등 한정된 기기에서만 제공되었지만, 최근 휴대폰, MP3 플레이어, PMP 등 미디어 기기의 발전에 따라, 다양한 단말을 대상으로 서비스를 확장하고 있다. 이러한 멀티미디어 서비스를 다양한 단말을 대상으로 제공하기 위하여, 기존의 기술에서는 동일한 콘텐츠를 각각의 단말의 환경에 따라 서로 다른 서비스를 통해 제공하였다. 그러나 IPTV와 홈 네트워크 시스템 등 방송과 통신이 융합되고, 유선과 무선 간에 자유롭게 데이터를 주고받는 환경에서 단말 마다 서로 다른 서비스를 제공하는 것은 서비스 시나리오의 복잡도를 높이고, 다양한 단말을 사용하는 사용자에게 통합되지 않은 서비스를 제공 받게 되는 결과를 가져오게 된다. 이에 본 논문에서는 콘텐츠의 메타데이터를 활용하여 동일한 멀티미디어 서비스를 단말기의 다양한 환경에 따라 맞춤형 서비스를 제공할 수 있는 방법인 적응적 장면 기술을 제시하고, 그 효율성에 관하여 검증한다.
-
H.264/AVC는 P 슬라이스에 2개의 인트라 모드, 4개의 인터 모드 그리고 SKIP모드, 총 7개의 모드를 허용한다. 다양한 블록 모드들을 효율적으로 이용하기 위하여 RDO를 통하여 최적의 모드를 결정한다. 그러나 SKIP 모드의 RD 점과 다른 모드들의 RD점 사이의 간격이 넓은 문제점이 있다. 이러한 문제점은 부호화 성능에 영향을 미친다. 본 논문에서는 SKIP 모드와 4개의 인터 모드 사이의 RD 성능의 중간 성격을 지니는 새로운 인터 모드를 제안한다. 제안하는 방법은 inter16x16의 움직임 정보와 inter16x16의 움직임 정보를 이용하여 찾은 예측 블록에 대한 잔차 블록의 평균 에너지만을 보내준다. 실험 결과 제안하는 방법은 H.264/AVC의 참조 소프트웨어인 JM 17.0에 비하여 WQVGA 영상에서 평균 0.71%의 비트 감소를 나타내었다.
-
최근 감시시스템 구축에서 디지털 비디오 레코더(DVR)를 이용하는 방식이 주를 이루고 있다. 영상압축 기술의 발전에 따라 디지털 비디오 레코더는 H.264/AVC 인코더를 기반으로 저장 공간 대비 고화질의 영상 저장이 가능해졌다. 또한, 다수 채널의 동시 처리가 가능해졌을 뿐만 아니라 영상 압축 및 저장 기능 외에 지능형 감시를 위한 기능이 요구되고 있다. 본 논문에서는 H.264/AVC 압축 비트열에서 움직임 벡터 추출 및 분석을 통한 영상내 이동 물체 검출 방법을 제안한다. 압축 비트열에서 현재 프레임과 이전 프레임의 움직임 벡터들의 크기와 각도를 비교하여 임계값 이하인 움직임 벡터들을 추출하여 이동 물체를 검출하였다. 이동 물체 검출 성능 평가를 위해 H.264/AVC의 참조 프로그램인 JM 15.1을 사용하여 인코딩 및 비트열 분석을 수행 하였고, 움직임이 검출된 시간 구간만을 디코딩 후 저장하는 알고리즘을 구현하였다. 제안된 방식은 디코딩 부분의 연산량 감소뿐만 아니라 저장소의 물리적 공간 절약이 가능하다.
-
본 논문에서는 지상파 3D HDTV 방송 서비스를 제공하기 위해 수정된 ATSC (Advanced Television Systems Committee) 전송 시스템 [2]을 위한 시변다중경로채널에 강인한 프레임 구조를 제안하고 성능을 측정하였다. 수정된 ATSC 전송 시스템 [2]은 기존 ATSC 전송 시스템[1]의 채널 부호화부를 수정하고, 변조 성상도를 증가 시키면서 적정한 수준의 TOV (Threshold of Visibility)에서의 전송 용량 증대 가능성을 확인하였다. 이를 토대로, 증가된 전송 데이터 전송률에 대한 순수 데이터 전송률을 최대한 보장하면서 시변다중경로채널에서 효율적으로 채널을 추정하고 복구하기 위해, ISI (Inter Symbol Interference)를 방지하기 위한 프레임 헤더의 보호구간에 알려진 PN (Pseudorandom Noise) 심벌을 삽입하였다. PN 심벌을 보호 구간에 이용할 경우 시간 영역에서 채널 임펄스 응답 (CIR: Channel Impulse Response)을 추정하여, 주파수 영역에서의 채널 보상을 가능케 하여 정확한 채널 추정 및 보상을 수행할 수 있다. 또한 수신기의 속도에 따른 다양한 최대 도플러 주파수가 존재하는 채널에 강인한 프레임 구조들을 제안하였다. 컴퓨터 시뮬레이션을 통해 수정된 ATSC 전송 시스템에 제안된 프레임 구조를 적용하여 TU (Typical Urban)-6 채널에서의 SER (Symbol Error Rate) 성능을 측정하였다.
-
본 논문에서는 제작된 콘텐츠에 배경음을 간편하고 효과적으로 혼합하기 위해서 녹음된 신호(전경음)를 분석하여 배경음 에너지를 적응적으로 조절하는 배경음혼합 알고리즘을 제안한다. 이를 위해, 제안된 알고리즘은 등청감 곡선 (equal-loudness curve) 및 linear prediction (LP) 분석에 기반하여 전경음신호의 청감 에너지 및 음성신호 존재여부를 결정한다. 이에 따라 전경음에 음성신호가 존재하는 경우에는 음성이 명확하게 들릴 수 있도록 혼합된 배경음의 에너지를 하향 조절하고, 반대로 전경음에 음성신호가 존재하지 않는 경우에는 배경음이 명확하게 들릴 수 있도록 혼합된 배경음의 에너지를 상향 조절한다. 제안된 알고리즘의 효율성을 검증하기 위해, 고정 가중치를 이용하여 배경음을 혼합하는 경우와의 음질 선호도 조사를 실시한 결과, 제안된 알고리즘에 대한 높은 선호도를 보였다.
-
본 논문에서는 그래픽 하드웨어와 그래픽 프로그램 기술을 이용하여 고속으로 스테레오 영상의 시차를 추정하는 기법을 제안한다. 우선, 컬러 스테레오 영상에 대하여 mean-shift 기법을 이용하여 컬러를 이용한 영역분할을 수행한다. 분할된 컬러 영역 단위로 가중치를 계산함으로써, 화소단위로 가중치를 계산하는 기존의 방식에 비하여 속도를 높일 수 있다. 블록정합함수를 계산하는 과정에서는 슬라이딩 윈도우 방식을 채택하여, 새로 블록안으로 들어오는 화소열과 빠져나가는 화소열의 정합함수값을 가감하여 화소마다 반복적으로 합산되는 정합함수의 계산량을 크게 줄인다. Middlebury 스테레오 영상을 이용하여 실험 및 평가를 수행한 결과, VGA 급 스테레오 영상을 기준으로 10 프레임 이상을 처리하면서도 기존의 적응적인 가중치를 갖는 블록정합 방식의 성능과 유사한 결과를 확인하였다. 이러한 고속화 방법을 통하여, 기존의 적응적인 가중치를 이용한 블록정합 방식에 비하여 훨씬 고속으로 스테레오 정합을 수행할 수 있으며, 실시간 시차추정이 필요한 시스템에 적용하는 것이 가능하다.
-
급속한 정보 통신 기술의 발달로 인해 멀티미디어 재생 개발 기술들은 단순히 수동적으로 보고 듣는 재생 기술에서 벗어나 청취자 감성, 취향 등에 따라 보다 실감 있고 사용자가 능동적으로 재생할 수 있는 기술로 진화 하고 있다. 지금까지의 오디오 서비스는 음원 개발자 중심의 오디오 서비스, 즉 보컬 및 모든 악기가 믹스된 단일음원이기 때문에 사용자는 단순히 오디오 음원 개발자나 음반 제작사가 발매한 단일 음원을 일방적으로 수동적 청취할 수밖에 없다. 하지만 사용자 능동형 오디오 서비스에서는 사용자가 능동적으로 자신이 원하는 음악적 취향에 따라 능동적으로 각각의 객체 기반의 독립 음원을 선택, 감성에 따른 음원 효과 추가, 최적의 음원 청취 위치(Sweet Spot) 변경, 음원 및 스피커 재생 공간 및 위치 변경 재생 등을 할 수가 있다. 본 논문에서는 디지털 음원들을 입력받아 임의의 필터링을 실행하고, 사용자 음원 보정 정보, 출력 유닛의 공간적, 음향적 특성을 상위제어기로부터 입력받아 전신호경로 상에 디지털 신호처리 하여 출력신호를 생성하는 DSP 시스템 플랫폼 및 알고리즘에 관하여 소개한다.
-
스케일러블 비디오 부호화(SVC: Scalable Video Coding)는 하나의 비트스트림 결과물로부터 둘 이상의 다중 비트율 및 해상도, 프레임율을 추출할 수 있도록 MPEG의 스케일러블 비디오 코딩 국제 표준을 준수하여 부호화한 비디오 비트스트림을 의미한다. 우리는 SVC(Scalable Video Coding)기반기술을 이용하여 하나의 콘텐츠를 통해 소비환경에 적응적인 비디오 스트리밍 서비스를 IP망을 기반으로 적용하기 위한 응용기술을 개발하고 있다. 본 논문에서는 단말로 부터 전송채널에 대한 상태를 전송받아 이에 맞게 콘텐츠를 적응변환 하고 다양한 품질의 단말에서의 스트리밍을 제공하는 SVC 미디어 서버를 관리하는 SVC 서버 관리 제어기의 설계 및 그 구현에 관한 내용이다. 이와 같이 SVC 서버 관리 제어기의 개발을 통해서 SVC의 다양한 콘텐츠 적응레벨을 설정하고 관리할 수 있다.
-
디지털 기술의 발달로 콘텐츠 서비스 방식에 대한 융복합화 현상이 두드러진다. 플랫폼, 네트워크, 디바이스 등의 발달과 함께 이루어지는 서비스 방식의 다양화는 콘텐츠 제작 및 소비에 있어 사용자의 참여를 가속화시킨다. 최근 들어 동영상 콘텐츠에 양방향성의 특징을 반영하는 서비스가 주목받고 있으며, 이에 따라 양방향 동영상의 확장된 비즈니스 모델을 고려한 신규 서비스 운용 모델이 요구된다. 이에 본 논문은 전자상거래를 지원하기 위한 기본 비즈니스 모델인 Imprimatur Business Model을 기반으로 양방향성이 반영된 동영상 비즈니스 모델을 재정의하고 그 운용에 필요한 구성 요소를 도출하였다. 서비스 운용 모델은 생성, 처리, 소비의 단계를 갖는다. 각 단계별로 세부 운용 요소를 설계하여 운용 시스템과의 연결성을 고려하였다. 이는 XML 다이어그램으로 표현되었으며 디지털 아이템의 생성, 처리, 소비에 필요한 기능을 제어하고 처리할 수 있도록 하기 위해 각 단계별 생성자(creator)와 핸들러(handler)를 정의하였다.
-
Web2.0의 고도화와 소셜미디어의 진화에 따라 웹 기반 콘텐츠에 대한 다양한 활용이 시도되고 있다. 또한, IPTV 부분에서는 기존의 TV기반에서 Web기반, Mobile기반 서비스로 확산되고 있다. 이러한 멀티디바이스 환경과 웹기반 콘텐츠의 IPTV 활용 서비스를 위해서는 콘텐츠에 대한 정의와 이를 표현하기 위한 메타데이터에 대한 정의가 필요하다. 이를 위해서 관련 표준화 단체를 분석한 후 이들이 제공하는 콘텐츠 메타데이터의 연관관계를 비교 분석하였다. IPTV 서비스를 위한 콘텐츠 메타데이터는 TV AnyTime Phase1 을 바탕으로 각 표준기구의 네트워크 상황과 서비스 방식에 따라 선택적으로 적용하고 있으며, VOD 서비스를 위해서는 CableLab의 ADI 메타데이터를 적용하고 있다. 향후 멀티디바이스 환경에서 IPTV 서비스를 위해서는 메타데이터에 대한 확장 연구가 필요하다.
-
협력 통신을 위한 프로토콜로 제안된 Hybrid relaying은 Source로부터 relay로 전송된 정보의 복호 성공 여부에 따라 증폭 후 전송 (AF) 기법과 복호 후 전송 (DF) 기법을 선택적으로 이용하여 전송한다. 최근 초고속 근거리 무선통신을 위한 테라 헤르츠 대역의 반송파를 이용한 연구가 활발해 지면서 Rician fading 채널 기반의 통신 기법 연구들이 중요 해 지고 있다. 본 논문에서는 각 노드간의 채널환경이 Rician fading 으로 모델링 되는 경우에 Hybrid relaying을 이용한 협력통신 기법의 outage probability를 분석한다.
-
1962년 Gallager에 의해서 처음 제안된 LDPC 부호는 터보부호(turbo codes)와 마찬가지로 Shannon의 채널용량 한계(channel capacity limit)에 가까운 성능을 보였지만 당시 기술력으로 구현이 불가능한 복잡도로 인해 오랫동안 잊혀져왔다. 1995년 Mackay 와 Neal은 이를 재발견하였고 간단한 확률적 복호법을 이용하여 LDPC 부호의 성능이 매우 우수함을 보였다. 또한 1997년 Mackay는 q>2일 때 LDPC 부호를 GF(q)상에서 구성할 경우에 성능이 더 좋아짐을 보였다. 본 논문에서는 이진 bit로 구성된 같은 길이의 정보 비트(information bit)를 통해 16-QAM 변조를 사용했을시 Binary LDPC 부호와 Non Binary LDPC 부호의 성능을 비교 분석하고, 최적의 성능을 가지는 LDPC 부호의 설계에 대해 제안한다.
-
본 논문에서는 기존 오류정정부호의 복호 과정에 사용되는 Belief propagation (BP) 알고리즘을 이용한 저밀도 양자 오류정정 부호의 복호 기법에 대해 기술한다. Depolarizing 채널 가정하에 기존 오류정정부호와 다르게 양자 오류정정 부호가 갖는 초기 채널 오류 확률에 의한 성능 열화를 개선하기 위해 초기 채널 오류 확률 정보를 개선하는 기법을 적용하였다. 테너 그래프를 바탕으로 각 체크 노드의 신드롬과 노드의 연결 상태를 고려하여 오류가 발생한 위치를 추적하고 BP 알고리즘에 입력되는 초기 채널 오류 확률 정보를 수정하여 반복 복호 시 발생할 수 있는 성능 열화를 개선하였다.
-
PAM이나 QAM과 같은 변조 방식을 이용한 비이진 채널은 BPSK 변조 방식을 사용한 이진 채널과는 다르게 심볼 정보를 이진 확률 정보로 marginalization 하는 과정에서 비이진 심볼을 구성하는 비트 정보 사이의 상관관계 정보가 손실되어 성능 저하를 야기한다. 본 논문은 차세대 3D-HDTV 시스템이 요구하는 높은 전송 효율을 확보하기 위해 사용되는 비이진 채널에 적합한 LDPC 부호화 및 복호화 알고리즘을 소개한다. 또한 GF(q)에서 정의된 비이진 BP 알고리즘이 이진 BP 알고리즘에 비해 보이는 배의 복호 복잡도를 개선하기 위한 대안으로 Coded Marginalization 기법을 제안하고 시뮬레이션을 통해 그 성능을 분석한다.
-
H.264/AVC의 인트라 예측모드는 가변 크기 블록과 예측 부호화를 사용하여 압축효율을 높이고 있다. 인트라 예측 모드는
$16{\times}16$ 블록,$4{\times}4$ 블록에 대해 수행되며, 예측 모드는 참조픽셀의 위치와 예측 방향에 따라 구분된다. 기존의 예측모드는 왼쪽과 위쪽의 참조 픽셀을 가지고 예측을 하게 된다. 이 경우, 참조 픽셀과의 거리가 먼 픽셀들의 예측 정확도가 떨어진다. 본 논문에서는 예측 정확도를 향상시켜 부호화 효율을 최대화 할 수 있는 인트라 예측 방법을 제안한다. -
ITU-T와 ISO/IEC의 공동 작업으로 제정 된 H.264/AVC는 기존 비디오 표준들에 비해 동일한 화질에서 약 30%~70%의 비트 량을 절감할 수 있으며, 동일한 비트 량으로 PSNR이 2~3dB 가량 우수한 영상을 제공할 수 있다. H.264/AVC는 인트라 부호화 효율을 높이기 위해 공간 영역에서 주변 화소를 이용하여
$4{\times}4$ luma 예측의 9가지 모드와$16{\times}16$ luma 예측의 4가지 모드에 대한 비트율-왜곡 최적화 기법을 사용하여 최적의 인트라 예측 모드를 선택한다. 본 논문에서는 프레임 내에서 공간 중복 성을 더 많이 줄이기 위해 9가지 모드의$4{\times}4$ luma 예측에 7가지 모드를 추가하여 총16가지의$4{\times}4$ luma 예측 모델을 제안한다. 그리고 실험을 통하여 제안하는 인트라 예측 모델이 기존 기술에 비해 높은 압축효율을 보인다. -
H.264/AVC 무손실 인트라 압축을 위하여 사용되는 픽셀 예측 방법은 Sample by Sample DPCM (SbS DPCM) 으로서 이 방법에서는 각각의 픽셀을 주변 픽셀로부터 예측하고 그 오차를 전송한다. 본 논문에서는
$4{\times}4$ 블록에 대한 Multiple Partition 예측과 SbS DPCM을 이용하여 H.264/AVC 의 무손실 인트라 압축 효율을 증가시키는 방법을 제안한다. 제안하는 방법은 각$4{\times}4$ 블록을$4{\times}4$ ,$4{\times}2$ ,$2{\times}4$ ,$2{\times}2$ ,$1{\times}1$ 크기의 sub-partition 을 가지는 다양한 partition 으로 예측한다. 이 때 각 sub-partition 들은 SbS DPCM을 이용하여 예측되고 이 때 사용하는 예측 방향의 개수는 예측 방향 정보량을 고려하여 sub-partition 크기에 따라 조절한다. 실험 결과에 의하면 제안하는 방법은 기존 H.264/AVC에 비하여 최대 17.02 %p, 평균 13.29 %p 의 압축율 개선을 보여주며 SbS DPCM만 사용하는 방법에 비하여 최대 4.74 %p, 평균 3.62 %p 정도의 압축율 개선을 보여준다. -
최근 전자업계의 중요한 화두 중 하나는 3D이다. 3D 입체 영상 기술은 미디어 환경을 변화시키고, 이에 발맞춰 방송환경 또한 변하고 있다. 고화질 3D 입체 방송은 기존의 2D 방송 서비스와 호환성을 유지하면서 시간적으로 2D 프로그램과 3D 프로그램이 혼용되어 제공되는 입체 방송 서비스가 될 것이다. 기존의 2D 기반 디지털 방송 서비스 환경에서 고화질 3D 입체 방송을 할 수 없다. 현재 국제 표준기구인 MPEG에서는 3D 서비스 방안으로 ISO/IEC 23002-3(MPEG-C part.3)이 표준화되었다. MPEG-C part.3에서 부가데이터인 depth map과 parallax map을 사용한다. 하지만 공간 주파수가 높은 영상의 depth map과 parallax map은 객체의 경계가 확실하지 않아 3D 입체 구현 시 객체의 경계면이 뭉개질 수 있다. 따라서 본 논문은 고화질 3D 입체 방송 서비스를 위한 전송 방안을 제시하고 있으며, MPEG-C part.3를 이용한 스테레오스코픽 영상 전송방안에 대해 소개한다.
-
본 논문에서는 고속으로 홀로그램을 생성하기 위해 새로운 컴퓨터 생성 홀로그램(computer-generated hologram, CGH) 수식을 제안하고, 셀 기반의 VLSI(very large scale integrated circuit) 구조를 제안하였다. 기본 CGH 수식에서 가로 또는 세로 방향의 연산 규칙을 찾아낸 후 가로 또는 세로 방향의 홀로그램 화소를 병렬적으로 구할 수 있는 수식을 유도하였다. 제안한 수식을 바탕으로 초기 파라미터 연산기(initial parameter calculator)와 업데이트-위상 연산기(update-phase calculator)로 구성된 CGH 셀의 구조를 제안하고 하드웨어로 구현하였다. 수식의 변형을 통해서 하드웨어를 간략화 시킬 수 있었고, CGH의 확장을 통해 가로 방향으로 병렬화시킬 수 있는 하드웨어 구조도 보였다. 실험에서는 하드웨어에 사용된 자원을 분석하였다. CGH 커널과 프로세서의 구조는 이전 연구에서 사용된 플랫폼을 그대로 사용하였다.
-
지금까지는 영화나 3DTV같은 대형 모니터에 사용하기 위하여 입체영상이 제작되어 왔다, 하지만 최근 3D 디스플레이가 스마트폰이나 태블릿PC와 같이 작은 디스플레이 사이즈와 해상도를 가지는 휴대용 기기들에도 적용되어 다양한 형태로 보급되어 보다 많은 관심을 받고 있다. 하지만 모바일 기기와 같은 경우 영화와 고해상도 영상에서와 같은 3D 입체감을 느끼기 어려운 경우가 종종 발생한다. 본 논문에서는 작은 디스플레이 사이즈와 해상도를 가지는 모바일 기기와 같은 장치에서 3D 효과 향상을 위한 깊이맵 재구성의 방법으로 레이어의 개수를 제안하여 3D 효과를 향상 시키는 방법을 제안한다. 이를 위해 고해상도 영상에서 깊이값에 따른 레이어를 6개에서 2개까지 수를 줄여 깊이맵을 생성하였고 영상의 크기를 줄여 영상의 크기와 깊이 레이어에 따라 달라지는 입체 효과를 확인하였다.
-
본 논문에서는 워크벤치 시스템과 가상현실 햅틱 인터페이스를 이용한 가상현실 시뮬레이션 시스템을 제시한다. 이 시스템은 사용자가 워크벤치를 통해 3차원 입체 영상으로 구현된 모델을 바라보며 SensAble 사의 PHANToM Omni 햅틱 디바이스를 이용하여 물체에서 느낄 수 있는 촉각을 재현한다. 그리고 시뮬레이션의 실제감을 증대시키기 위해 새로운 워크벤치의 설계 방법을 제시하였다.
-
본 논문에서는 패턴 분석 기반의 비접촉 사용자 인터페이스 제어 기법을 제안한다. 본 기법은 카메라가 장착된 기기에서 입력 받은 실시간 영상을 사용하여 패턴의 정보를 분석한다. 정의된 패턴을 기반으로 최초의 패턴 위치를 예측하고, 특징점 추출 기반 추적 기법을 통해 패턴의 위치를 갱신한다. 휴대용 기기의 다양한 사용 환경에 적합하도록, 정규 상관 계수와 특징점 추출 정보를 사용하여 패턴의 예측, 추적을 수행함으로써 밝기 변화에 강인한 사용자 인터페이스 기법을 제안한다. 실험을 통하여 본 논문이 제안하는 알고리즘이 기존의 방법에 비해 우수한 성능을 나타냄을 확인한다.
-
최근 3D 영상에 대한 대중화가 급속히 진행되고 있음에도 불구하고 한 번 만들어진 영상/비디오를 재사용하거나 조작하여 다양한 형태의 콘텐츠를 만들지 못하고 있다. 본 논문에서는 깊이영상과 양안(스테레오) 영상 또는 깊이영상과 단안 영상이 주어졌다고 가정하고 깊이영상을 조작하여 양안 시차(parallax)를 변화시키는 방법을 제안한다. 시차변화의 대상은 부분영상이며, 특정 개체를 추출하여 깊이정보를 수정하고, 이를 바탕으로 스테레오 영상을 재구성한다. 본 논문에서는 정지영상만을 대상으로 하며, 동일한 방법을 동영상에 적용하면 동영상 또한 시차를 변화시킨 결과를 얻을 수 있다. 실험은 Middlebury의 테스트 영상들을 대상으로 제안한 방법을 적용하여 자연스러운 스테레오 영상을 얻을 수 있음을 보인다.