Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)
The Korean Institute of Broadcast and Media Engineers
- Semi Annual
Domain
- Media/Communication/Library&Information > Media/Consumers
2012.07a
-
Haze is an extreme reason of the reduction of contrast when capturing image in the outdoor. Recently, there are several single image dehazing techniques, but they are not robust in dynamic variations of natural environment caused by the thickness, coverage of haze and appearance of sunlight. In this paper, we propose an effective and robust method to enhance luminance for image dehazing depending on histogram analysis. Compare with conventional methods, our proposal have better performance in term of contrast, and computation time.
-
본 논문에서는 히스토그램 분석을 통한 안개 강도 측정과 제거, 그리고 HSI채널에서 색상을 보정하는 방법을 제안한다. 이를 위해 영상에서 안개가 많은 지역과 적은 지역을 히스토그램을 통해 분석하고 안개 강도 맵을 만들어 안개의 양에 따라 안개를 제거한다. 안개로 인하여 악화된 영상의 색상은 HSI 공간에서 분석하여, 안개 강도에 따른 보정을 한다. 제안하는 기법은 기존의 기법들과 비교하여 색상의 편향성을 보정하여 가시성뿐만 아니라 영상 내에 색상이 자연스럽게 조화된 결과를 얻었다.
-
기존의 무손실 컬러 이미지 압축 연구에는 하나의 색상 채널을 압축한 뒤에 이를 이용하여 나머지 색상 채널의 값을 예측하여 압축을 수행하는 방법이 많다. 또한, 각각의 채널을 독립적으로 압축하는 경우, 무손실 색상 변환(reversible color transform을 먼저 수행하는 것이 유리하다는 연구 결과도 있다. 본 논문에서는 무손실 컬러 이미지 압축을 위한 새로운 색상변환 방법을 제안한다. 새롭게 제안하는 색상 변환은 R, G, B 색공간에서 표현된 이미지를 YCuCv 색공간으로 변환하는데, 기존의 방법에 비해 채널 간 상관관계를 효과적으로 제거한다. 실험 결과, 제안하는 방법은 기존의 무손실 색상 변환 방법에 비해 평균 2.6% 엔트로피를 감소시키는 성능 향상을 보인다.
-
본 논문에서는 깊이 영상의 해상도를 향상시키는 기법을 제안한다. 최근 TOF(time-of-flight) 방식의 깊이 센서가 깊이 영상 획득에 많이 사용되고 있다. 그러나 TOF 깊이 센서가 제공하는 깊이 영상은 대부분 저해상도이기 때문에 고해상도의 콘텐츠 제작을 위해서는 깊이 영상의 해상도를 향상시켜주는 것이 필수적이다. 본 논문에서는 깊이 영상의 해상도를 높이기 위하여 적응적 가중치 보간법을 적용한 후, Bilateral 필터링을 수행하여 품질을 높인다. 일반적으로 영상의 해상도를 높일 때 보간법을 많이 사용하는데, 본 논문에서는 이러한 보간법들을 사용하여 깊이 영상의 해상도를 높였을 때보다 제안하는 기법의 성능이 우수함을 실험을 통해 확인하였다.
-
본 논문에서는 SVC 와 MVC 를 통합하여 스케일러블 다시점 비디오 부호화를 구현할 때, SVC 부호화의 계층간 움직임 추정을 위해서 다른 시점의 비디오 정보를 활용함으로써 압축의 효율을 증대시킬 수 있는 움직임 예측 구조를 제안한다. 제안된 예측 구조의 적용으로 스케일러블 다시점 비디오 부호화의 부호화 효율을 1% 가량 향상시킬 수 있다.
-
MPEG 3DV 그룹에서는 재생되는 시점 수 보다 적은 시점의 다시점 비디오와 그에 대응하는 깊이영상 및 관련 파라미터를 하나의 비트스트림으로 부호화하는 다시점 및 깊이영상 부호화(MVD: Multiview Video plus Depth) 표준화가 진행 중에 있다. 본 논문은 3DV MVD 비트스트림 포맷을 MPEG-2 TS 로 다중화하기 위한 TS 다중화 확장기법을 제안한다. 또한, MVD 재현 시나리오에 따른 효율적인 TS 전송 구조를 제시하고, TS 다중화 SW 툴의 설계 및 구현을 통하여 그 장단점을 고찰한다. 제안된 기법은 프로그램 및 ES 에 대한 정보를 함께 다중화하여 MVD 의 다양한 재현 시나리오 적응 및 효율적인 복호화 및 가상시점 합성을 지원할 수 있다.
-
Bang, Min-Suk;Lee, Seoung-Joo;Jo, Jung-Sik;Lee, Dong-Hee;Kim, Sung-Hoon;Lee, Joo-Young;Choo, Hyun-Gon;Choi, Jin-Soo;Kim, Jin-Woong;Kang, Dong-Wook;Jung, Kyeong-Hoon 34
본 논문에서는 비대칭적 화질을 갖는 스테레오스코픽 영상에서 화질개선을 위해 사용되는 부가정보를 효율적으로 부호화하기위한 방안을 제안한다. 부가정보의 대부분은 좌영상과 우영상의 높은 상관도를 기반으로 하는 양안시차 벡터맵으로 구성되며, 이것을 부호화하기 위해 분포 특성을 분석하였고, 이에 맞는 엔트로피 부호화 방식인 지수 골롬 부호를 적용하였다. 또한, 양안시차 벡터맵의 공간적 데이터의 중복성을 없애기 위해 DPCM을 적용하여 부호화의 효율성을 높였다. -
ITU-T와 ISO/IEC의 공동 작업으로 제정된 H.264/AVC는 기존 비디오 표준들에 비해 동일한 화질에서 약 30%~70%의 비트 량을 절감할 수 있으며, 동일한 비트 량으로 PSNR이 2~3dB 가량 우수한 영상을 제공할 수 있다. H.264/AVC는 인트라 부호화 효율을 높이기 위해 공간 영역에서 주변 화소를 이용하여
$4{\times}4$ luma 예측의 9가지 모드와$16{\times}16$ luma 예측의 4가지 모드에 대한 비트율-왜곡 최적화 기법을 사용하여 최적의 인트라 예측 모드를 선택한다. 본 논문에서는$4{\times}4$ luma 예측에서 발생하는 정보량을 줄이기 위해 사용하는 MPM을 기존의 방법과는 다르게 연산을 통해 상관도를 높임으로써 보다 정확한 MPM 결정으로 부호화 효율을 높이는 방법을 제안하였다. 실험결과, 제안한 방법은 기존의 방법과 비교하여 BD-RATE 평균 약 -1.4%의 성능 개선 효과를 보였다. -
3차원 영상 기술은 방송, 영화, 게임, 의료, 국방 등 다양한 기존 산업들과 융합하며 새로운 패러다임을 형성하고 있으며, 고품질 및 고해상도의 3차원 영상 획득에 대한 필요성이 강조되고 있다. 이에 따라, 최근에는 3차원 입체 영상을 제작 하는 방법 중 하나인 2D-plus-Depth 구조에 대한 연구가 활발히 진행되고 있다. 2D-plus-Depth 구조는 Charge-Coupled Device(CCD) 센서 등을 이용한 일반 카메라와 깊이 카메라를 결합한 형태로써 이 구조로부터 얻은 깊이 영상의 해상도를 상향 변환하기 위해서 Joint Bilateral Upsampling(JBU)[1], 컬러 영상의 정보를 활용한 보간법[2] 등의 방법들이 사용된다. 하지만 이 방법들은 깊이 영상을 높은 배율로 상향 변환할 경우 텍스처가 복사되거나 흐림 및 블록화 현상이 발생하는 문제점이 있다. 본 논문에서는 2D-plus-Depth 구조에서 얻은 고해상도 컬러 영상에서 보간 정보를 구하고 이 정보를 저해상도의 깊이 영상에 적용하여 상향 변환된 가이드 깊이 영상을 제작한다. 이 가이드 깊이 영상을 Bilateral Filtering[8]을 이용함으로써 고품질의 고해상도 깊이 영상을 획득한다. 실험 결과 제안하는 방법으로 해상도를 상향 변환을 할 경우에 기존의 보간법들에 비해 깊이 영상의 특성을 잘 보존함을 확인할 수 있고, 가이드 깊이 영상에 필터링을 처리한 결과가 JBU의 결과보다 향상됨을 확인할 수 있다.
-
Depth map를 구하는 방법 중 많이 사용되어지는 방법으로 stripe 패턴을 이용하는 방법이 존재한다. 이 방법은 Pro-Cam 시스템을 이용하며 프로젝터로 조사한 패턴을 카메라로 촬영하여 원래의 패턴과 촬영된 패턴간의 기하학적인 관계를 구하여 depth map를 구하는 방법이다. 본 논문에서는 이와 같이 구조광을 이용하여 depth map 획득 시스템을 효과적으로 multi-thread를 사용하여 실시간 처리하는 것을 제안한다. 일반적으로 자주 사용되는 multi-threading 기법에는 CPU의 thread를 이용하는 OpenMP와 GPU의 thread를 이용하는 CUDA가 있다. 이 두 가지 기법은 수행하는데 차이점이 존재하기 때문에 상황에 따라 OpenMP가 더 좋은 효율을 보이는 부분이 있고 CUDA가 더 좋은 효율을 보이는 부분이 있다. 때문에 우리는 이 두 가지에 대해서 각 부분의 특성에 맞게 더 좋은 효율을 보이는 multi-thread를 이용하였다. 결과적으로 우리는
$1280{\times}800$ 의 영상에 대해 25fps 이상의 depth map를 획득하였다. -
스테레오스코픽 3D 동영상의 콘텐츠 부족을 해결할 수 있는 간단한 방법 중의 하나는 스테레오스코픽 3D 동영상 콘텐츠를 크기 변환 방법을 통해 다양한 3D 디스플레이에서 볼 수 있게 하는 것이다. 이를 위해 본 논문에서는 스테레오스코픽 3D 주의 시각 모델을 바탕으로 관심 영역을 설정하고, 이를 동영상으로 확장시키기 위해 장면 전환을 기준으로 영상을 그룹화한 후, 동일 관심 영역 윈도를 적용시켜 이를 목표 디스플레이에 맞게 크기 변환하는 방법을 제안한다. 실험 결과, 제안한 방법을 이용한 결과 영상이 보다 효율적으로 스테레오스코픽 3D 영상을 목표 디스플레이에서 보여줄 수 있음을 알 수 있다.
-
본 논문에서는 스테레오스코픽 비디오 응용 포맷(Stereoscopic video Application Format)을 기반으로 IP환경에서 3차원 광고, 홍보 및 교육 등에 직접적으로 적용될 수 있는 3D Push 서비스 시스템을 제안한다. 스테레오스코픽 비디오 응용 포맷은 모바일 및 고정형 환경에서 스테레오스코픽 비디오 저장 및 전송을 위한 파일 포맷으로서 다양한 3D 디바이스에 공통으로 적용될 수 있으며 국제표준(ISO/IEC 23000-11)으로 채택되었다. 제안한 시스템은 스테레오스코픽 콘텐츠를 토대로 프로그램 저작을 위한 저작 및 저장을 위한 저작도구, 저작된 프로그램을 스케줄링하고 각 클라이언트의 요청에 따라 전송 관리하는 서버 및 프로그램에 따라 자동 3D 디스플레이 및 사용자 인터랙션을 제공하는 플레이어로 구성된다. 또한, 제안하는 시스템은 국제표준을 토대로 다양한 3D 디바이스와 호환성을 제공하며 모바일 및 고화질 3차원 서비스를 제공할 수 있으며, 각 사이트 과금에 따라 3D 프리미엄 서비스 및 Non-tapeless기반의 원격관리 3D Push 서비스를 제공하는 장점을 가진다.
-
본 논문은 사용자의 각종 멀티미디어 콘텐츠 소비 히스토리를 수집하여 체계화 및 패턴 분석을 수행하고, 이를 바탕으로 사용자가 선호할 것으로 예측되는 멀티미디어 콘텐츠들을 추출하여 제공하는 콘텐츠 추천 시스템에 관한 연구이다. 본 논문에서는 콘텐츠 소비와 연관된 사용자 로그와 엔진에서 자동 추출한 사용자 그룹을 통하여 콘텐츠 추천을 수행한다. 각 사용자들의 선호정보 데이터를 분석하여 선호정보 패턴이 유사한 사용자들을 사용자 그룹으로 정의하고, 각 사용자들이 속한 사용자 그룹의 사용자 로그를 활용하여 사용자별 선호 콘텐츠를 예측한다. 본 시스템은 웹 또는 모바일 환경에서 음악, 방송, 광고, 기사 등의 방대하고 다양한 콘텐츠를 복합적으로 사용자들에게 선별하여 제공해 주며, 이들의 연관성과 사용자의 콘텐츠 선호패턴을 반영한 개인 맞춤형 콘텐츠 추천 엔진은 사용자가 선호할만한 콘텐츠들을 추천하여 사용자의 콘텐츠 소비 시의 만족도를 높여줄 수 있다.
-
본 논문에서는 이산 코사인 변환한 결과를 기반으로 필터링을 통해 디모자이킹 하는 알고리듬을 제안한다. 이산 코사인 변환한 결과로 에너지가 에지방향의 정보를 나타내는 분포 특성을 활용하여 가중치를 부여할 수 있는 효율적인 방법을 제안하고 이를 통해 필터링 하는 방법을 제안한다. 실험결과에서는 기존의 양선형 보간법에 비해 PSNR 측면에서의 뛰어난 성능을 보여준다.
-
최근 치안 관련 강력 범죄 발생이 사회 이슈화가 많이 된다. 이에 대한 해결책으로 CCTV가 기하급수적으로 보급, 설치되고 있다. 하지만 현재의 CCTV 기술은 단순 녹화의 수준에서 머물고 있기에 범죄 발생 사후에나 사용되고 있는 실정이다. 영상보안 분야에서 현재 진행되고 있는 지능형 영상 분석 기술은 영상 감시, 분석을 인력으로 사용하는 방식에서 벗어서 실시간으로 시스템에서 상황판단을 하여 경보하여 줌으로써 범죄의 예방 및 조속한 해결을 가능하도록 발전하고 있다. 본 논문은 지능형 영상 분석 시스템을 구성하는데 있어서 영상 분석 기술의 인터페이스를 공통화를 적용, 모듈화 함으로써 각각의 감시사이트에 적용 가능한 최적의 비전 기술 모듈만을 시스템 관리자에 선택에 따라 해당 시스템에 적용할 수 있도록 하였다. 또한 각 비전 모듈을 개별 프로세스로 동작하게 하고 모듈간의 통신을 네트워크화 함으로써 분산 환경으로 동작할 수 있도록 개발하였다.
-
본 논문에서는 고정된 카메라로 촬영한 동영상에서 수퍼픽셀(superpixel)을 이용하여 전경 객체 영역을 효과적으로 검출하는 기법을 제안한다. 기존의 픽셀 기반 전경 객체 검출 기법들은 단위 픽셀에 대한 전/배경 판단을 수행하므로 실제 전경 객체 영역에 대한 정확한 검출이 어려운 단점을 지닌다. 수퍼픽셀은 성질이 유사한 픽셀들의 집합을 의미하며 영상의 과도한 분할에 주로 사용되었다. 본 논문에서는 이러한 수퍼픽셀을 이용하여 동영상의 각 프레임을 과도 분할하고, 분할된 각각의 수퍼픽셀을 전경 객체와 배경의 판단 단위로 이용한다. 제안하는 알고리듬을 적용하여 실험한 결과 기존의 픽셀 단위 검출 기법에서 나타났던 오검출을 줄임과 동시에 전경 객체의 형태를 보다 충실하게 검출함을 확인 할 수 있다.
-
본 논문에서는 컬러영상과 깊이영상을 이용하여 여러 명의 얼굴을 검출하고 추적하는 알고리즘을 제안한다. 제안하는 알고리즘은 얼굴 검출부와 추적부로 나뉘어져 있으며, 얼굴 검출 방법은 기존의 Adaboost를 이용하지만, 속도 개선을 위해 깊이정보와 컬러정보를 이용하여 탐색영역을 얼굴이 존재하는 영역으로 제한하여 얼굴은 검출한다. 얼굴 추적 방법은 템플릿 매칭 방법과 나선형 탐색방법을 사용하며, 그리고 조기 종료 기법을 사용하여 수행시간을 줄였다.
-
본 논문에서는 새로운 문자 분할 알고리즘을 제안한다. 고전적인 문자 분할 알고리즘은 학술적인 문서영상과 같이 단순한 구조를 가진 문서영상을 대상으로 하여 좋은 성능을 보였지만 다양한 문자 크기와 색상, 그림, 복잡한 배경 등으로 구성된 문서영상에서는 좋지 못한 성능을 보인다. 최근에 제안고 있는 방법들은 복잡한 문서영상에서도 좋은 성능을 보이도록 다양한 기법들을 적용하여 우수한 성능을 보이고 있지만, 대부분의 방법들이 영상을 일정한 크기의 블록으로 나누어 문자분할을 하기 때문에 세밀한 부분에서는 성능이 어느 정도 한계를 보인다. 따라서 본 논문에서는 블록의 크기에 제한을 갖지 않는 새로운 방법으로서, watershed 알고리즘을 이용한 문자분할 방법을 제시한다. 구체적으로, watershed 알고리즘을 이용하여 문서영상의 구조(docstrum)를 파악하고 이를 기반으로 문자를 분할한다. 제안하는 방법은 크게 엣지 검출, distance transform, watershed 알고리즘을 이용한 docstrum 분석, 문자 분할의 네 단계를 거친다. 실험 결과 블록에 기반한 기존의 방법들이 놓치는 세밀한 부분에서도 제안된 알고리즘은 올바른 분할결과를 얻을 수 있음을 확인하였다.
-
본 논문에서는 키넥트(Kinect)에서 깊이 영상 생성 시 발생하는 홀(hole)들의 물리적 원인에 대해 분석하고, 원인에 따라 홀을 분류한다. 즉, 실험 영상을 통해 키넥트 적외선 패턴의 유무를 확인할 수 있으며 이를 이용하여 깊이 영상에서 나타나는 홀의 물리적 발생 원인을 확인 할 수 있다. 분류된 각각의 홀의 종류에 따라 각 홀에 적합한 홀필링 방법에 대해 논의한다.
-
컴퓨터 비전에서 영상 매칭 기술은 다양한 분야에 응용될 수 있는 기초적인 기술 중에 하나이다. 강인한 영상 매칭을 위해서는 정확하고 독특한 특징점을 검출하는 과정이 중요하다. 기존의 SIFT나 SURF 등 영상 매칭 알고리즘은 등방성 가우시안 필터링을 사용한 스케일 공간을 생성하여 특징점을 검출한다. 이러한 기존의 특징점 검출 방식은 스케일 공간에서 영상의 경계선을 모호하게 만들어 정확한 특징점 검출을 어렵게 만들고 영상 매칭의 성능을 떨어뜨리는 문제점을 가지고 있다. 본 논문에서는 SIFT 알고리즘의 강인한 특징점 검출을 위하여 양방향 필터링을 사용하여 스케일 공간 생성을 제안한다. 이러한 스케일 공간 생성 방식은 스케일 공간에서 영상의 경계선을 보존해 줌으로서 강인한 특징점 검출을 가능하게 하여 영상 매칭 성능을 향상시킨다. 특히 왜곡이 존재하는 영상들의 매칭에서 제안하는 특징점 검출 방법이 적용된 SIFT 알고리즘은 기존의 SIFT 알고리즘보다 우수한 영상 매칭 결과를 보여준다.
-
본 논문에서는 다양한 변이 추정 방식 중 영역기반(Area-based) 알고리듬과 특정기반(Feature-based) 알고리듬을 결합한 하이브리드(Hybrid) 변이추정 알고리듬을 제안한다. 제안하는 알고리듬은 Features from Accelerated Segment Test(FAST) 코너 점 추출기[2]를 이용하여 좌, 우 영상 각각의 특징 점을 추출한 후, 특징 점들의 정보를 이용한 스테레오 정함을 통해 신뢰도 높은 초기 변이지도(Disparity map)를 생생하게 된다. 그러나 생성된 초기 변이지도는 조밀하지 못하므로, 조밀한 변이 지도를 획득하기 위해 특징점이 추출된 영역에 대해서는 추정된 초기 변이 값을 이웃 픽셀과의 색 유사도를 고려하여 전파시키고 특징 점이 추출되지 않은 영역에 대해서는 이진 윈도우(Binary window)를 활용한 영역기반 변이추정 알고리듬[1]을 이용하여 변이 값을 추정한다. 이를 통해, 제안 알고리듬은 특징 기반 알고리듬에서 발생할 수 있는 보간법 문제를 해결함과 동시에 신뢰도가 높은 초기 변이지도를 사용함으로써, 영역 기반 알고리듬의 정합 오차를 줄여 신뢰도 높은 변이지도를 생생할 수 있다. 실험 결과 추정된 초기 변이지도는 ground truth와 비교 시 약 99%이상의 정확도를 보이며, 특징 점이 추출된 영역에서 기존의 영역기반 알고리듬보다 더 정확한 변이 값이 추정되었음을 확인하였다.
-
본 논문에서는 깊이 변화에 강인한 스테레오 비디오의 변이 탐색 범위 추정 방법을 제안한다. 정확한 스테레오 비디오의 변이 탐색 범위는 3D 영상 분야에서 다양한 응용으로 사용되는 변이 지도를 보다 정확하게 추정하는데 도움이 된다. 기존의 변이 탐색 범위 추정 방법은 인접한 프레임 간의 변이 히스토그램의 유사도를 이용함으로써 보다 안정적인 변이 탐색 범위를 추정할 수 있었지만, 시간의 흐름에 따라 깊이가 변하는 부분에서는 상당히 취약한 문제점을 가지고 있다. 이에 본 논문에서는 기존 방법의 이러한 문제점을 개선한 새로운 방법을 제안한다. 제안하는 방법은 변이 히스토그램의 유사도뿐만 아니라 프레임 간의 시간적 유사도를 고려하며, 비디오의 장면 전환에 의한 급격한 깊이 변화 또한 고려한다. 이에 추가적으로 변이 히스토그램의 유사도를 계산하기 위해 기존의 방법과는 달리 히스토그램 확산 거리를 이용하였으며, 서로 다른 개수의 대응점을 가지고 있는 프레임간의 변이 히스토그램이 대응점의 개수에 영향을 받지 않고 균일한 중요도를 갖도록 하였다. 실험 결과로 기존 방법과 제안한 방법의 변이 탐색 범위 추정 결과를 비교하였으며, 비교한 결과는 제안한 방법이 기존 방법에 비해 스테레오 비디오의 깊이 변화에 강인함을 보여준다.
-
본 논문에서는 3D 콘텐츠 제작에 있어 입체피로를 최소화하기 위한 영상의 수직시차 제거과정에 있어 사진측량기반의 강인기법을 제안하고자 한다. 영상의 수직시차 제거 과정은 크게 기하추정 단계와 에피폴라 변환 단계로 구성된다. 본 논문에서는 기하추정을 위해 사진측량에서 널리 활용되고 있는 공면조건 기반 상대표정 알고리즘을 적용한다. 이 때 상대표정 알고리즘에는 자동 정합점 추출에 따른 오정합과 위치오차에 강인성을 확보하기 위해 제약조건을 도입한 베이지안 접근방식을 적용하고자 하며, 이를 바탕으로 수행되는 에피폴라 변환에는 영상의 왜곡과 원 영상 대비 변형을 최소화하기 위해 공선조건기반의 중심투영변환기법을 적용하고자 한다. 알고리즘의 성능검증을 위한 비교 알고리즘으로, 기하추정에는 8점 알고리즘과 스테레오 캘리브레이션 기법이 사용되었으며 에피폴라 변환에는 Hartley 방법과 Bouguet 방법이 사용되었다. 실험결과는 제안알고리즘의 높은 정확도와 강인성, 그리고 활용적 가치를 보여주었다.
-
본 논문에서는 DCT 변환 공간상의 배경휘도와 주파수를 고려한 2차원의 개선된 광-적응 효과(luminance adaptation: LA) JND 모델을 제안한다. 기존의 LA JND 모델은 배경 휘도가 중간점인 회색에 가까울수록 JND가 낮고, 배경 휘도가 어두워지거나 밝아질수록 JND 값이 증가하는 U자형의 1차원 함수형태를 보였다. 그러나 기존 LA JND 모델은 주파수에 따른 영향이 반영되지 않았기 때문에 DCT와 같은 주파수 공간상 JND 모델로는 부정확 한 단점이 있다. 본 논문에서는 주파수와 배경휘도에 따른 2차원 LA JND 모델을 제안한다. 주파수에 따른 LA JND 값을 실제 실험을 통해 획득하였다. 실험 방법은 9가지 크기의 배경 휘도가 다르고 공간적 복잡도가 없는 균일한 영상을 대상으로
$8{\times}8$ 실수형 DCT를 수행한 다음, 15가지 경우의 주파수 크기가 다른 계수들에 대해 사람이 인지 할 때 까지 노이즈를 증가시켜서 JND 값을 찾는 방식을 사용하였다. 실험 결과 4 cpd(cycle per degree) 보다 작은 주파수 대역 에서는 기존의 LA JND 모델과 유사한 결과를 얻었지만 4 cpd보다 큰 주파수 대역에서는 오히려 배경휘도가 작은 값을 가질수록 JND가 감소하는 형태를 보였다. 수행한 실험 결과를 반영하여 주파수가 반영된 2차원 LA JND 모델을 제안한다. -
본 논문에서는 하나의 타임 슬롯이 홉 수보다 적은 수의 페이즈로 분할되는 새로운 다중 홉 통신 시스템을 제안한다. 또한 제안한 시스템의 성능을 분석하고 최적화하는 방법을 제안한다. 컴퓨터 모의실험을 통하여 시스템 성능 분석의 유효성을 확인할 수 있으며, 기존의 다중 홉 통신 시스템보다 향상된 성능을 확인할 수 있다. 특히, 경로 손실 지수가 증가할수록 성능 향상 폭이 큰 것을 확인할 수 있다.
-
본 논문에서는 다중 사용자 증폭재전송(amplify-and-forward) MIMO 중계 시스템을 위한 프리코딩(precoding) 기법을 제안한다. 제안된 프리코딩 기법에서는 블록 대각화(block diagonalization)를 통해 사용자간 간섭(inter-user interfereence)을 제거하고 기지국과 중계기에서의 전송전력(transmit power) 제한을 만족하면서 사용자 데이터 전송률(data rate)의 합이 최대화 되도록 한다. 모의실험결과를 통해 제안된 기법이 기존 기법에 비해 더 높은 사용자 데이터 전송률의 합을 달성함을 보이고 있다.
-
본 논문에서는 단일 반송파 MIMO 시스템 기반의 PN 시퀀스를 이용한 반송파 주파수 오차 추정 방법을 제안한다. 제안하는 방법은 송신되는 각각의 PN 시퀀스들의 위상을 회전시켜 전송하여, 일부 PN 시퀀스들이 서로 상쇄되어 버리는 것을 방지한다. 수신한 PN 시퀀스와 수신기에서 자체 생성한 PN 시퀀스의 공액곱셈 연산을 통해 변조를 제거한 뒤, 다수의 자기 상관기를 이용한 ML 알고리듬 계열의 L&R[3]을 이용하여 반송파 주파수 오차를 추정한다. 컴퓨터 모의실험을 통해, 송신 및 수신 안테나가 두 개인
$2{\times}2$ MIMO 시스템에 제안하는 기법을 적용하고 L&R 알고리듬을 이용하여 AWGN (Additive White Gaussian Noise) 채널에서의 분산 성능을 측정하였다. 그 결과 MIMO 시스템에서의 분산 성능이 SISO 시스템에서의 성능과거의 동일함을 보였다. -
본 논문에서는 수신단에서 간섭 단말들의 채널상태정보가 불완전한 무선 애드혹 네트워크에서 비모수 선형 MMSE 수신기를 사용하여 네트워크 전송 용량을 향상시키는 기법을 제안한다. 비모수 선형 MMSE 수신기는 수신신호의 자기 상관을 이용한다. 지정된 채널정보를 간섭과 잡음으로만 이루어진 관측들에 포함시킴으로써, 제안된 기법은 최적의 MMSE 전송 용량의 상당한 부분을 달성한다. 실제적인 애드혹 네트워크 시스템의 전송용량 모의실험을 통해 제안된 기법이 기존의 수신 알고리즘에 비해 상당한 성능 이득을 얻을 수 있음을 확인하였다.
-
본 논문에서는 홀로그램을 실시간으로 생성하기 위하여 수정된 디지털 홀로그램(computer-generated hologram, CGH) 수식을 재정의 하여 3단계로 나누고 2차원 블록 단위 기반의 컴퓨터 생성 홀로그램 생성기의 하드웨어 구조를 제안하였다. 유효광원의 대한 z축 항에 대하여 연산하는 공통항 연산기와 x,y축을 연산하는 죄표값 연산기 마지막으로 각 화소의 대하여 연산하는 화소값 연산기로 이루어진 하드웨어를 제안하고 구현 하였다. 구현한 하드웨어는
$32{\times}32$ 중간 블록의 구조를 가질 때 기존 연구에 비하여 86%이상의 DSP블록을 줄일 수 있다. -
본 논문에서는 국내 디지털 저작권 보호 업체 혹은 대학 및 연구소에서 개발하고 생산하는 포렌식마크 기술의 품질을 객관적으로 평가할 수 있는 평가절차와 평가지표를 정량적으로 제시하였다. 포렌식마크 기술을 객관적으로 평가하기 위해서 본 논문에서는 우선, 구매자 정보(포렌식마크라)가 삽입된 테스트 영상의 공격 항목과 수준을 정하고, 포렌식마크 정보의 추출 성능을 평가하기 위한 평가절차로서 평가항목, 평가기준, 평가절차를, 그리고 인증을 위해서는 포렌식마크 기술의 신뢰성에 대한 통계정보를 포함하는 인증서를 생성하기 위한 인증절차를 포함하였다. 이러한 포렌식마크 기술의 평가 및 인증 지침은 기술 개발자에게는 자신들이 개발한 포렌식마크 기술에 대한 객관적인 평가결과를 미리 알아볼 수 있어서 기술의 상품성을 점검할 수 있고 소비자 입장에서는 객관적이고 보편타당성 있는 평가 결과에 대한 신뢰를 가질 수 있다. 평가자 입장에서는 표준 평가를 통해 객관적이고 정량적인 평가 결과를 얻을 수 있어서 상대적인 우열을 가리기가 용이해지는 편리성을 얻을 수 있다. 이를 통하여 포렌식마크 기술의 발전과 디지털 저작권 보호 시장의 활성화에 일조를 할 수 있을 것으로 사료된다.
-
최근 차세대 영상 기술로 홀로그래피가 많은 주목을 받고 있다. 컴퓨터를 이용한 홀로그램 생성 방법(computer generated hologram, CGH)을 많이 사용하고 있는데 CGH는 많은 연산량이 요구되기 때문에 실시간의 CGH를 위해서 FPGA나 GPU를 이용한 연산 방법이 주로 사용되고 있다. 하드웨어를 기반으로 하여 구현할 경우에 내부 시스템의 비트 제한으로 인하여 S/W와 같은 품질을 얻을 수 없다. 따라서 본 논문에서는 품질의 저하를 최소화하면서 하드웨어의 자원을 최대한 감소시킬 수 있는 하드웨어 비트 너비를 분석하여 가이드라인을 제시하고자 한다.
-
본 논문에서는 토픽 모델링 기반 TV 프로그램 유사 시청 사용자 그룹핑 및 이를 이용한 TV 프로그램 콘텐츠 추천 알고리듬을 제안하였다. 제안 기술은 토픽 모델링 기법 중 Latent Dirichlet Allocation(LDA) 방법을 이용하여 TV프로그램 시청 기록 내에서 은닉된 유사 사용자들을 그룹핑하고 이러한 유사 시청 사용자 그룹 정보를 이용하여 사용자에게 선호 TV 프로그램 콘텐츠를 자동으로 추천하는 알고리듬이다. 제안된 자동 추천 알고리듬의 성능평가를 위해 실제 TV 시청기록 데이터를 이용하여 훈련 기간과 검증 기간을 나누어 훈련 기간 동안 제안한 알고리듬을 이용하여 사용자 개인에 대한 추천 TV 프로그램 콘텐츠 목록을 생성하여 검증 기간 동안에 실제 추천된 TV프로그램을 얼마나 시청했는지를 측정하여 추천 정확도를 검증하였다.
-
본 논문에서는 2D-to-3D 변환을 위한 기하구조 기반 깊이 추정에 적합한 소실점 검출 기법을 제안한다. 3D 공간에서 평행한 직선들은 2D 공간으로의 투시영상에서 시점에서 멀어질수록 간격이 좁아지고, 결국에는 한 점으로 수렴하게 된다. 수렴된 점을 소실점(vanishing point)이라 하고, 소실점을 거쳐 지나는 직선들을 소실선(vanishing lines)이라고 한다. 일반적으로, 인간은 소실선과 소실점을 추정한 2D 영상에서 소실점이 관찰자 시점으로부터 제일 먼 지점이라는 인식을 이용하여 깊이 정보를 인지할 수 있다. 전경영역과 배경영역 간의 경계에서는 수직성분을 가진 선들이 생성되어 올바른 소실점을 검출하는데 방해가 될 수 있다. 그렇기 때문에 본 논문에서는 수직성분을 가진 선들을 제거하여 소실점을 탐색하는 기법을 제안한다.
-
3차원 동영상은 수많은 응용분야에서 차세대 멀티미디어 콘텐츠로 큰 주목을 받고 있지만 2차원에서 3차원 콘텐츠로의 과도기인 현 시점에서 3차원 콘텐츠의 부족현상은 관련 산업분야의 큰 문제점으로 떠오르고 있다. 2D-to-3D 변환 기술은 높은 비용 없이 기존의 방대한 2차원 콘텐츠를 3차원 콘텐츠로 재사용하는 것이 가능하기 때문에 3차원 콘텐츠의 부족 문제를 해결할 수 있는 기술로 큰 관심을 끌고 있다. 본 논문에서는 블록 단위 초점 정보의 보간을 통한 새로운 초점 기반 3차원 변환 기법을 제안한다. 기존의 화소 단위 초점 측정치를 그대로 깊이 정보로 이용하는 경우나 분할 영역 단위 초점 측정치를 깊이 정보로 활용하는 경우는 이웃 화소간 깊이정보의 불연속성이 발생할 수 있지만 제안방식은 블록 초점 측청치의 보간수행으로 인해 이웃 화소 사이에서 뿐만 아니라 블록경계 혹은 영역경계에서도 특별할 스무딩필터 처리 없이도 화소간 깊이정보의 불연속성이 발생하지 않게 된다. 실험결과를 통해 제안한 방식이 기존의 방식들 보다 더 자연스러운 깊이 정보 추출 성능을 보여준다는 것을 알 수 있다.
-
본 논문에서는 자유시점 또는 오토스테레오스코픽 비디오나 홀로그래픽 비디오 서비스 들을 목표로 가상시점 영상을 빠르게 생성하는 방법을 제안한다. 이 방법에서 좌/우 깊이영상이 주어졌다고 가정하고, 두 깊이 영상을 이용하여 깊이 값과 변위를 계산 한 후 깊이 당 변위증분을 계산하여 사용한다. 계산된 깊이 값 당 변위증분과 해당 픽셀의 깊이정보를 이용하여 텍스쳐 이미지를 원하는 가상 시점으로 이동시킨다. 좌영상과 우영상을 원하는 가상시점으로 각각 생성한 후, 잡음과 disocclusion을 효과적으로 제거하기 위하여 두 영상을 결합한다. 그 다음 남은 홀을 효과적인 hole-filling으로 제거하여 가상 시점 영상을 생성한다.
-
최근 3D 입체 영화 및 3D 방송 기술의 개발과 더불어, 사용자의 몰입감을 극대화하기 위하여, 3D 입체영상과 사용자의 인터랙션 효과를 융합하는 3D 증감 방송 기술에 대한 요구가 높아지고 있다. 본 논문에서는 3D 증강방송을 위해, 3DTV 환경에서의 사용자 인터랙션 서비스에 대한 시나리오에 대해서 분석하고, 이를 바탕으로 제한된 시나리오를 위한 객체 인지 및 제어 기술에 대해서 소개한다. 본 논문에서 깊이 정보와 연계된 3D방송 환경을 가정하고, 이를 TV 환경에 적용했을 경우의 인터랙션 시나리오에 제시하였으며, 다 수의 깊이 카메라를 이용하여 시나리오에 필요한 객체 인지 방법에 대해서 제시한다. 키넥트 카메라를 이용한 구현을 통해 객체 인지 및 시점 전환 구현 결과를 보여준다.
-
최근 ATSC방식의 디지털 방송에서 HD급의 3D 방송 서비스에 대한 관심이 증가 되고 있는 추세이다. HD급의 3D 방송 서비스(이하 3D HDTV)를 제공하기 위해 [2]에서는 ATSC 전송 시스템을 확장하고 BCH 부호와 IRA 타입의 LDPC를 사용하는 수정된 ATSC 전송 시스템을 제안하였다. 본 논문에서는 BCH와 IRA 타입의 LDPC 부호 대신 Reed Solomon 부호와 Block LDPC 부호를 사용하고 16QAM 변조를 사용하여 전송 용량을 증대할 수 있다는 사실을 확인하였다. AWGN 채널에서 모의 실험한 결과 BCH부호와 LDPC부호 및 4PAM을 적용한 수정된 ATSC 전송시스템의 TOV는 약 7dB로 19.33Mbps로 전송되지만[2] 본 논문에서 제안한 RS(207, 187)과 부호율 3/4인 Block LDPC 및 16QAM의 TOV는 약 5.4dB로 29Mbps로 전송되어 기존시스템에 비해 약1.5배의 전송 용량 증대가 가능한 것으로 확인되었다. 이로서 6MHz의 한정된 대역에서 HD급의 3D 방송서비스 실현이 한층 더 가까워지게 될 것으로 예상된다.
-
본 논문에서는 보다 정밀한 깊이 정보를 추출하기 위하여, 밝기 차이에 강인한 스테레오 정합 기법을 개발한다. 우선 촬영된 환경에 따라 발생하는 스테레오 영상의 노출 차이를 보상하기 위하여, 전체 영상에 대하여 전역적으로 히스토그램 기반의 3 차원 누적 분포 함수를 계산한다. 계산된 3 차원 누적 분포 함수를 기반으로 순위 영상을 생성하고, 밝기 기반의 강인한 초기 정합을 수행한다. 다음으로 지역적인 밝기 변화에 강인하도록, 초기 깊이 정보를 바탕으로 EM 알고리즘을 수행하여 객체와 배경에 해당되는 깊이 정보를 분리한다. 분리된 영역 정보를 기반으로 각각의 영역의 대하여 다시 히스토그램 기반의 3 차원 누적 분포 함수를 계산한다. 이를 기반으로 최종적으로 전경과 배경의 차등적인 정합을 수행하여 지역적인 밝기 차이에 강인한 스테레오 정합기법을 개발한다. 다양한 실험을 통하여 본 논문에서 제안하는 기법의 성능을 확인한다.
-
최근 영상분야의 키워드는 초고품질화, 초실감화, 스마트화로 대표될 수 있다. 그 중에서도 무안경식 3D는 초실감화를 이루기 위한 핵심응용분야 중 하나이다. 하지만 무안경식 3D 단말기가 성공적으로 보급되기 위해서는 연구되어야 할 분야가 여전히 존재한다. 그 중에서도 본 논문에서는 고화질의 무안경식 3D 스마트 콘텐츠 제작에 필요한 자동 스테레오 정합 기법을 제안하였다. 이전까지 연구된 변이지도 추출을 위한 알고리즘은 전역적 최적화 방법을 사용할 시 영상의 해상도와 깊이 정도에 따른 연산량의 증가로 많은 수행시간이 요구되었다. 또한 좌/우 영상의 intensity 정보만으로는 정확한 변이지도 추출이 어렵다는 한계점이 존재하였다. 이러한 이유로 본 논문에서는 스트림 영상에서 프레임 간의 정보를 이용하여 신뢰지도와 경계정보를 생성하였으며 belief propagation 스테레오 정합 방법을 이용하여 고화질의 정확한 변이지도를 추출하였다. 또한, 알고리즘의 연산량에 대한 문제를 해결하기 위한 고속화 방안으로, 최근 많은 연구가 이루어지고 있는 GPU(graphics processing units) 를 이용한 병렬처리를 연구하였다. 마지막으로 연구결과의 신뢰성을 향상하기 위하여 다양한 데이터를 이용한 실험을 통해 고화질의 영상정보를 고속으로 추출할 수 있음을 확인하였다.
-
T-DMB는 개인용, 휴대용, 이동형의 디지털방송매체로서의 특징을 가지고 있으며 최근들어 수신기 보급 증가로 새로운 재난방송 매체로 부상하고 있다. 그러나 현재의 T-DMB 기반 재난방송 기술은 T-DMB를 시청하고 있어야만 재난정보 수신이 가능하다는 한계를 갖고 있다. 이에 본 논문은 기존 T-DMB를 시청해야만 재난정보 수신이 가능한 기존 T-DMB 재난방송 서비스의 한계를 뛰어 넘어 재난발생시 수신기가 자동으로 재난방송신호를 인지하여 T-DMB를 시청하지 않더라도 재난정보를 제공하고 평상시 지역정보, 날씨 등 공공서비스 정보를 제공하는 T-DMB 재난방송 서비스 기술을 소개한다.
-
2005년 국내에서 본방송을 실시한 DMB는 모바일 방송이라는 새로운 방송 이용 환경을 창출하였다. 더불어 기존 TV를 통한 재난 방송의 사각지대로 거론되어 온 야외, 정전, 해상, 이동 환경에서 재난정보를 전달할 수 있어 방송 매체로 평가되면서, 다양한 기술 개발이 진행되었다. KBS는 DMB를 통한 재난경보방송 기술을 구현하여 2008년 제주도 지역 실험방송과 2009년 전국 실험방송을 거쳐 2010년 8월부터 본방송을 실시하는 등, DMB 재난경보방송 체계 마련을 위해 노력하여 왔다. 이러한 과정에서 차기 국가 모바일 재난경보 체계 마련의 필요성과 방향성에 대한 경험적 안을 제시해 본다. 본 연구는 급변하는 미디어 환경을 고려하여 모바일 재난 정보 전달체계에서 통신망의 역할을 강화하여 방송과 융합한 모델을 마련하고, 조속히 범국가적 재난정보의 표준 규격을 마련할 것을 촉구하며, 궁극적으로 뉴미디어 도입 정책에서 재난 정보전달에 관한 공공성 정책이 우선되어야 함을 제시하였다.
-
우주전파환경이란 지구 전리층, 열권, 자기권 및 행성간의 공간 등 통칭한 전파 전달 환경을 말하며 주로 태양의 활동에 영향을 받는다. 태양은 막대한 복사 및 입자 에너지를 방출하여 지구의 자기권과 전리층에 영향을 주어 방송 통신, 전력, 항법, 위성 등 여러 분야에 걸쳐 피해를 줄 수 있다. 그러므로 우주전파에 취약한 국가주요시설을 분류하여 따로 지정하고 관리해야 한다. 본 논문에서 우리나라의 국가 주요시설은 "국가기반시설", "국가주요시설", "국가보안목표 시설"로 크게 3가지로 조사하였다. 국가중요시설은 "적"이라는 위기요인으로부터 보호해야할 대상이며, 보안 목표시설은 "파괴/태업/비밀누설"이라는 위기요인으로부터 보호해야 할 대상이다. 즉, 국가주요시설과 보안목표시설은 위기요인에 의해 정의된 시설이다. 하지만 국가기반시설은 위기요인이 아니라 r 피해가 국가적으로 핵심적인 시설들로 정의된다. 따라서 우주전파재난을 위한 보호체계는 가장 포괄적인 국가기반시설의 테두리에서 다루어야 한다.
-
2011년 3월 11일 일본 혼슈 센타이 부근 해역에서 발생한 규모 9.0의 지진에 의한 쓰나미로 동북부 지역에 엄청난 피해가 발생함에 따라 우리나라에서도 지진을 비롯한 각종 대규모 자연재해 대비를 위해 재난방송에 대한 체계를 전반적으로 재점검해야 한다는 의견이 나오고 있다. 지금까지 우리는 재난이 발생하면 TV나 라디오 등 전통적인 매체에 의존하고 있으며 실제 이러한 매체는 지금까지 국민들에게 신속하게 재난정보를 알리는 중요하고도 충실한 역할을 담당해 오고 있다. 그러나 지난해 일본의 쓰나미와 같이 인간의 능력으로 감당하기 힘든 대규모 재난이 발생하였을 경우 이러한 전통적인 재난 방송 매체만으론 역 부족이 될 수 있고, 실제로 일본에서 효과를 나타낸 것은 인터넷 전화(VoIP)와 SNS(Social Network Service) 등 뉴미디어로 구글, 페이스 북과 국내의 NHN, 다음 등은 실종자 정보와 피난처 정보를 제공하고 피해자의 안위를 확인할 수 있는 서비스 하는 등 필요한 정보를 실시간으로 알리는 새로운 매체로 큰 역할을 했다는 평가를 받았다. 본 논문에서는 뉴미디어를 재난방송 전달 매체로 활용하기 위해 현재 운영되고 있는 재난방송 체계 및 시스템의 조사를 통해 개선되어야 할 사항을 도출한다.
-
'재난방송' 이라고 하면, 어떻게 하면 재난정보를 신속하게 피해주민들에게 전달하여 그 피해를 최소화 할 수 있을까 하는데 목적이 있는 것으로 생각하고 있다. 그러나 이는 단지 재난정보를 전달하는 재난전달시스템에 불과하다고 하겠다. 실제로 '재난방송' 이라고 말하면 재난이 발생했을 때 '무엇을' '어떻게' 방송하는 것이 재난피해를 최소화 할 수 있을 것인가에 대한 논의가 본래의 재난방송의 의미라고 하겠다. 즉, 재난방송은 전달하는 내용이나 전달 방법에 따라서 전달효과(impact)가 달라서 재난방송은 사전에 충분히 준비하고 준비된 방송내용과 전달방법이 필요하다고 본다. 본고는 2011년 3 11 동일본대진재 당시 일본의 텔레비전방송은 실제로 '무엇을' '어떻게' 방송했는지를 자세하게 분석해 본다. 구체적으로 일본의 주요방송 3사인 NHK, 니혼TV, 후지TV의 3일간 실시한 재난방송의 (1)기본화면과 (2)전달내용 등을 분석 해 보기로 한다. (1)NHK의 경우는 아나운서나 기자, 해설위원 등 자국 직원이 전달하는 비율이 80%를 넘고 있다. 외부 전문가는 4.4%로 소수에 불과하다, (2)니혼TV는 자국 직원이 대응하는 비율이 75.6%로 비교적 높은 편이나, 외부 전문가도 8%나 된다. 후지 TV의 경우는 직원이 대응하는 비율이 71.4%로 방송 3사 중 가장 낮은 비율을 보이고 있다. 그러나 외전문가로는 13.3%로 NHK에 비해 3배 정도로 외부 전문가를 이용해 객관성을 높이고 있다. NHK 재난방송은 원고로써 정리된 정보를 주로 아나운서나 기자, 해설위원이 전달하는 형태를 취하는 것을 기본패턴으로 하고 있다.
-
본 논문의 목적은 "재난"에 대해 정의하는 것이다. 이를 위해 우리나라에서 사용해 왔던 정의에 대해 알아보았다. 다음으로 국제 기구에서 제안된 정의를 분석하였다. 재난을 정의하기 위해 필수적인 위기모델을 설명한 후 재난을 정의하였다. 최근 전세계적인 재난과 이에 대처하기 위한 국제적인 노력이 많이 이루어지고 있다. 이러한 상황에서 전세계적으로 통일된 용어의 사용이 매우 중요할 것이다.
-
업믹스(Upmix) 기술은 홈시어터와 같은 다채널 스피커 재생 환경에서 콘텐츠의 대부분을 차지하는 스테레오 음원을 다채널 환경에 재생하기 위한 채널 포맷 변환 기술을 말한다. 업믹스를 위한 전처리 단계로서 특정 방향으로 패닝된 주(primary)성분과 잔향 및 배경음과 같은 Ambient 성분을 분리하는 과정이 필요하다. Primary와 Ambient를 분리하기 위한 방법으로 채널 간의 상관도, 적응 필터 및 주성분 분석법(principal component analysis, PCA)이 널리 이용되고 있다. 이에 본 논문에서는 비교적 정확하게 Primary와 Ambient를 분리한다고 알려진 주성분 분석법을 이용하여 신호를 분리해 내고 이 때 주성분 분석법이 가지는 문제점을 해결한 향상된 Primary-Ambient 분리 알고리즘을 제안하였다. 제안된 알고리즘은 분리 성능이 Primary 성분이 패닝된 각도에 영향을 받지 않으며 또한 Primary 성분에 섞인 잔여 Ambient를 제거함으로써 기존의 주성분 분석법 보다 더 정확하게 Primary와 Ambient를 분리 할 수 있고 상관성이 없는 Ambient 특성을 좀 더 정확하게 반영한다.
-
In this paper, we proposed a method for extracting predominant melody of polyphonic music based on harmonic structure. Harmonic structure is an important feature parameter of monophonic signal that has spectral peaks at the integer multiples of its fundamental frequency. We extract all fundamental frequency candidates contained in the polyphonic signal by verifying the required condition of harmonic structure. Then, we combine those harmonic peaks corresponding to each extracted fundamental frequency and assign a rank to each after calculating its harmonic average energy. We run pitch tracking based on the rank of extracted fundamental frequency and continuity of fundamental frequency, and determine the predominant melody. For the query by singing/humming (QbSH) task, we proposed Dynamic Time Warping (DTW) based matching engine. Our system reduces false alarm by combining the distances of multiple DTW processes. To improve the performance, we introduced the asymmetric sense, pitch level compensation, and distance intransitiveness to DTW algorithm.
-
본 논문에서는 박자 분류 방법을 사용하여 다성 음악 신호의 템포 쌍을 검출하는 방법을 제안한다. 템포를 검출하는 방법은 음의 시작점을 추출하여 음악의 주기적인 흐름을 파악한 뒤, 그 주기를 템포로 변환하는 과정으로 구성된다. 제안한 기술은 템포로 추측되는 배수 관계의 템포 후보를 추출한 뒤, 템포 후보를 박자에 따라 분류하고 곡의 빠르기를 고려하여 최종 템포 쌍을 검출한다. 제안한 방법을 사용하여 높은 정확도로 템포 쌍이 검출되는 것을 확인하였다.
-
본 논문에서는 최근 MPEG 오디오 서브그룹에서 활발히 논의 중인 3D Audio 표준화 동향에 대해서 소개하고, 관련한 국내외 기관들의 기술개발 현황에 대해서 알아본다. MPEG 3D Audio 는 NHK 22.2 채널방송과 같은 실감 오디오 서비스를 고다채널(High-Order Multichannel)로 특징짓고, 이러한 서비스를 위한 다채널 오디오 부호화 및 복호화 기술과 다양한 출력채널 환경에 적응할 수 있는 렌더링(rendering) 기술을 표준화 대상으로 규정하고 있다.
-
본 논문에서는 가정용 TV 환경에서 실감효과를 향상시키기 위한 정면 수직음상정위에 기반한 오디오 시스템을 제안하고 이를 구현한다. 제안된 시스템은 가정용 대형 TV 환경에서 TV 하단에 배치된 오디오 시스템으로 인해 음상이 TV 의 하단에 맺히게 되어 재생되는 영상과 위치적인 불일치 문제를 해결하기 위하여, 오디오 신호에 정면 수직음상정위 기법을 적용하여 고도감이 향상된 신호를 생성해 준다. 본 논문에서의 정면 수직음상정위 기법은 청취자의 신체적 특성을 반영하기 위한 머리전달함수 모델, 고도에 따라 달라지는 주파수 특성을 반영하기 위한 spectral notch 및 특정 주파수 대역 boosting 으로 구성된다. 제안된 오디오 시스템의 정면 수직음상정위 기법의 성능을 평가하기 위하여 원음과 이 원음에 정면 수직음상정위 기법을 적용하여 생성한 음원을 TV 오디오 시스템으로 재생한 후의 청취 선호도 조사를 수행하였으며, 그 결과 정면 수직음상정위 기법을 포함하는 제안된 오디오 시스템을 통해 청취한 음원에 대한 선호도가 높았다.
-
사람의 음성을 압축하는 방법으로 Code Excited Linear Prediction (CELP) 코더가 주로 사용되어 왔다. CELP 코더의 수신단에서는 양자화 된 여기신호를 LPC 필터로 합성하여 신호를 복원한다. LPC 합성필터의 영향으로 양자화 된 여기신호의 보로노이 셀 모양이 변형되는 문제점이 있기 때문에 이런 문제점을 해결하기 위해서 Karhunen-Loeve-Transform based Classify vector Quantization (KLT-CVQ) 코더가 제안되었다. 기존 KLT-CVQ 코더는 KLT 변환과 class 선택을 위해서 Eigen Value Decomposition (EVD)을 이용해서 eigen vector와 eigen value를 계산한다. 본 논문에서는 EVD 대신에 UTV Decomposition (UTVD)을 이용하여 KLT-CVQ의 계산량 문제점을 개선하는 방법을 제안한다.
-
본 논문에서는 유럽의 디지털 라디오 전송 규격인 DRM(Digital Radio Mondiale)의 Band II 대역 전송 모드인 모드 E의 전송률 향상 기법을 제안한다. DRM 모드 E는 FM 방송과의 동시방송 등의 문제를 고려하여 100kHz 대역폭에서 186kbps의 전송률을 제공한다. 하지만, 이 전송률은 모바일TV 등 멀티미디어 서비스를 제공하기 위해서는 부족하기 때문에 전송률의 향상이 요구된다. 논문에 제안된 전송률 향상기법은 기존의 DRM 모드에 변조방식 및 부호방식을 추가하는 방식으로 최대 350kbps의 전송률 제공이 가능하며, FAC(Fast Access Channel)의 예약필드에 신규 방식에 대한 정보를 전송함으로써 기존 시스템과 호환성을 유지할 수 있다. 모의실험 결과에서, AWGN(Additive White Gaussian Noise) 채널의 비트오류율 le-4를 기준으로 223kbps의 전송을 위해서는 13dB의 SNR(Signal-to-Noise Ratio)이 요구되며, 351kbps의 전송률 제공을 위해서는 약 18dB의 SNR이 요구됨을 확인할 수 있다. 또한, 다중경로 페이딩 채널환경에서 부호율이 1/2인 경우에는 이동속도보다는 지연확산이 성능에 영향을 주지만, 부호율이 1/2 보다 크며 150Km/h이상 증가하면 오류마루가 발생함을 확인할 수 있다.
-
본 논문에서는 DVB-NGH 시스템에서 수직-수평 편파 안테나를 이용한
$2{\times}2$ MIMO SM 기법 중 두 안테나에 서로 다른 변조 차수를 가진 신호를 전송할 경우 비균등 전력을 이용하여 수신 성능을 향상시키는 기법을 제안한다. 이를 위해 기존의 MIMO SM 구조와 비교해 서로 다른 변조 차수를 가진 신호에 비균등 전력을 포함하는 송수신 시스템의 구조를 도입하였다. 전산실험 결과 LDPC 부호율이 각각 4/9, 2/3에서 비트오류율이$10^{-4}$ 의 조건에서 0.2, 0.5 dB의 성능 향상이 있음을 확인할 수 있다. -
동일 주파수를 이용하여 방송신호를 송출하는 동일채널중계기의 신호 송출 타이밍과 파워를 조절함으로써 신호 중첩지역에 위치한 수신기의 성능 열화를 최소화 할 수 있다. 이를 위해 방송망을 구성하는 각각의 동일채널중계기에 고유의 TxID를 부여하여 DTV 신호에 낮은 파워로 삽입하여 송출한다. 본 논문에서는 동일채널중계기에 삽입된 TxID 신호의 검출 성능을 향상시키기 위한 방법을 제안하고 모의실험을 통해 제안된 방법의 효과를 검증한다.
-
단일주파수방송망을 이용하여 지상파 3D-HDTV 전송 시 단일주파수방송망에서 발생하는 다중경로채널은 지상파 3D-HDTV 수신성능을 열화시킨다. 최대 다중경로채널의 길이는 단일주파수방송망 내 송신기간 거리에 의해 결정되며, 최소 다중경로 개수는 수신기에 근접한 송신기 개수에 의해 결정된다. 이에 본 논문에서는 다중경로채널의 각 경로 입사각을 추정하기 위한 스마트안테나기반 수신기를 설계하고, beamforming과 nulling 기법 적용 시 지상파 3D-HDTV 수신성능을 분석하였다.
-
단일 주파수 방송 시스템에서 이레이저 현상이 생길 경우 기존의 공간 다중화 기법은 큰 성능 저하가 발생한다. 이에 본 논문에서는 라이시안 이레이저 페이딩 채널 환경에서 기존의
$2{\times}2$ 공간 다중화 기법에 직교 선부호기를 직렬 연접한 공간 다중화 기법의 성능을 분석하고, 수신 SER 성능을 최대화하는 선부호기 최적화를 수행한다. 전산 실험 결과, Rician 이레이저 페이딩 채널 환경에서 최적의 선부호화 공간 다중화 기법은 수신단에서 성상 모호성을 줄여 기존의 공간 다중화 기법에 비하여 우수한 성능 향상을 보였다. -
본 논문은 소규모 지역에서의 데이터 통신을 이용한 하이브리드 방송 송출 시스템 및 수신 시스템에 관한 것으로 보다 상세하게는 전시회나 박물관 등 지역적 범위가 제한되는 환경에서 와이파이 등의 근거리 인터넷망을 이용하여 해당 범위 내의 사용자만 신규 서비스를 볼 수 있도록 하는 시스템 및 방법에 관한 연구로, 제안된 하아브리드 방송 서비스 송출 시스템은 방송 데이터 수신부, DMB 전송 프레임 멀티플렉서, DMB 전송 프레임 송출부, 부가 정보 송출부로 구성되며, 방송 데이터 수신부는 신규 서비스에 대한 방송 데이터 및 부가 정보를 수신한다. 또한, 송출 시스템의 DMB 전송 프레임 멀티플렉서는 방송 데이터를 이용하여 신규 서비스 앙상블(Ensemble)을 구성하는 DMB 전송프레임을 생성하며, DMB 전송 프레임 송출부는 생성된 DMB 전송 프레임을 송출하고, 부가 정보 송출부는 수신된 신규 서비스의 부가 정보를 인터넷망을 통해 송출한다. 따라서, 제안된 하이브리드 방송 시스템의 경우, 전시회나 박물관 등 지역적 범위가 제한되는 환경에서 와이파이 등의 근거리 인터넷망을 이용하여 해당 범위 내의 사용자만 신규서비스를 볼 수 있으며, 관람객이 아닌 일반 사용자들 본인의 단말기가 채널스캔을 실행했을 경우, 원하지 않는 행사관련 방송 데이터가 수신 채널 목록에 저장되지 않도록 할 수 있다.
-
MB-OFDM UWB시스템은 TFC(Time-Frequency Code)를 이용하여 시간/주파수 호핑을 수행한다. 이를 통해 주파수 영역에서 다이버시티 효과를 갖는 동시에 사용되는 다른 piconet간의 간섭을 최소할 수 있다. 송신단에서는 프리앰블을 전송할 때부터 해당 TFC에 맞게 호핑을 하면서 전송을 하기 때문에 수신단에서는 신호의 시작을 추정하는 패킷 검출은 매우 중요한 과제이다. 따라서 본 논문에서는 MB-OFDM UWB시스템을 위한 간단하고 효율적인 패킷 검출 방법을 제안하였다. 시뮬레이션 수행 결과 제안된 방법은 기존 방법보다 약 0.5 dB의 SNR 개선 결과가 있는 것으로 밝혀졌다.
-
본 논문은 함정의 대규모 임무지향시스템에서 전술 데이터를 전송할 때 발생할 수 있는 인코더와 디코더 언더플로우를 방지하고, 트래픽이 프레임 별로 역동적으로 발생할 수 있는 환경을 고려하여 트래픽 스무딩을 수행한 전송 시스템에 대하여 설명한다. 기존의 H.263, H.264의 전송 표준 방식인 on-off policing 방법은 인코더의 목표 비트 전송률(Target Bit Rate)에 따라서 일정한 값으로 정해지는 것과 달리, 프레임을 인코딩함으로써 발생한 프레임의 전체 셀 량과 슬라이스 별로 발생하는 데이터 셀의 역동성을 반영하여 프레임마다 전송시간과 전송률을 반영해주면 부드럽게 전술 데이터의 전송이 일어난다. 또한 기존의 on-off policing과 제시한 대규모 임무지향시스템에서의 트래픽 스무딩 알고리듬의 성능을 비교하여 분석한다.
-
최근 멀티미디어 분야에서 다양한 입/출력 장치들이 개발됨에 따라 입/출력 장치와 사용자 사이의 향상된 상호작용(AUI : Advanced User Interaction)을 위한 방법들이 연구되고 있다. AUI에서 정의되는 데이터는 입/출력 장치와 다양한 객체(비디오, 오디오, 2D 그래픽 객체, 애니메이션 등)로 표현되는 Scene Description 사이에서 서로 정보를 주고받기 위한 매체이다. 따라서 다양한 입/출력 장치와 사용자 사이의 향상된 상호작용을 위해서는 AUI 데이터 형식이 공통적으로 정의되어야한다. 이를 위해 ISO/IEC JTC1/SC29/WG11 Moving Picture Experts Group(MPEG)에서는 XML(Extensible Markup Language) 문서로 AUI 데이터 포맷을 표준화하기 위한 MPEG-U 프로젝트를 진행 중이다. 본 논문에서는 MPEG-U의 표준을 소개하고, 이의 타당성을 검증하기 위해서 MPEG-U 참조 소프트웨어를 설계하였다. MPEG-U 참조 소프트웨어는 크게 UID(User Interaction Device)의 데이터를 처리하는 사용자 인터페이스 입/출력부와 XML 문서를 처리하는 MPEG-U XML 생성/해석부로 구성된다. 사용자 인터페이스 입력부에서는 사용자의 손동작을 인식하여 AUI 파라미터로 저장하고, 이 파라미터를 MPEG-U XML 생성부에서 MPEG-U 표준 XML 스키마 구조로 서술하여 표준화된 AUI 데이터 포맷을 생성한다. 다시 표준화된 XML 문서를 읽어 MPEG-U XML 해석부에서 파라미터를 얻고, 사용자 인터페이스 출력부에서 GUI(Graphic User Interface)에서 그래픽 객체로 표현한다. 본 연구에서는 MPEG-U 참조 소프트웨어로 MPEG-U의 용용 예를 제시하고, 구현된 소프트웨어가 표준에 적합한지를 보였다.
-
본 논문에서는 모바일 방송망과 무선통신망이 연계한 Hybrid 모바일 망에서의 망 연동 서비스에 대해서 기술을 하고, 서비스의 일환으로 Hybrid 모바일 방송망에서의 컨텐츠 seamless 서비스 방법에 대해서 논한다. 독립적인 서비스가 제공되는 방송망과 통신망에서, 단방향 성의 방송망 서비스와 양방향 성의 통신망 서비스가 연계 된 컨텐츠를 생생하여 각각 송출을 하는 경우, 기존 단말에서는 서로 독립적인 서비스를 제공 받을 수 있을 뿐 만 아니라 hybrid 서비스용 모바일 수신 플랫폼에서는 연계된 서비스를 제공 받을 수 있게 된다. 이 때, 동일한 컨텐츠에 대해서, 방송 컨텐츠를 제공하는 방송 서버와 컨텐츠용 통신 서버에서 두 스트림간 동기화 정보를 공유할 수 있도록 설계하고, 수신 플랫폼에서는 망 상황에 따라 선택적으로 스트림을 수신 후 서비스간 동기화를 수행하게 되면 연속적인 서비스 시청이 가능해 진다. 본 논문에서는 무선통신망과 연계된 Hybrid 모바일 방송망에서의 망 핸드오버 시 장면 연결을 위한 seamless 서비스용 시스템을 소개 하고, 핸드오버 및 장면 연결을 위한 검증용 플랫폼 개발 현황과 테스트 결과에 대해서 논한다.
-
최근 스마트폰과 태블릿 PC동 고해상도 모바일 단말기 보급이 급격히 늘어남에 따라 고화질 및 다양한 서비스 제공이 가능한 모바일 방송에 대한 요구가 급증하고 있다. 이러한 요구에 맞춰 T-DMB와 역호환성을 유지 하면서 기존의 T-DMB와는 달리 계층변조 방식을 적용해 동일 주파수 대역에서 최대 2배의 채널 용량을 증대시키는 AT-DMB 방송기술 개발을 완료하였다. AT-IDMB는 채널 용량의 증대에 따라 서비스 채널을 늘리거나 고화질 서비스 동을 추가로 제공할 수 있게 되었고 사용자와 DMB 사업자들의 요구를 충족 시켜줄 수 있게 되었다. 본 논문은 정지 환경에서 수행한 AT-DMB의 성능 측정 결과를 보여준다.
-
하이브리드 스마트 홈 클라우드 플랫폼/서비스 기술은 가정 내 외 클라우드와 연계하여 실시간으로 수정되는 다양한 콘텐츠, 응용 프로그램, 스마트 가전, 개인 생활 정보들을 융합 관리 함으로써 멀티미디어, 어플리케이션, 스마트 가전 등을 통하여 다양한 스마트 융복합 서비스를 제공해 줄 수 있는 기술이다. 이에 본 논문은 데이터의 프라이버시, 안정성, 보안성, 종속화등 Public Cloud에 대한 거부반응을 해소하기 위해 개인 또는 흠단위로 스마트 콘텐츠를 서로 공유할수 있는 댁내 Private 클라우드와 다양한 스마트 홈 서비스를 제공하는 사업자 및 소셜 그룹간의 공유가 가능한 댁 외 Public 클라우드와 연계하여, 실시간으로 수집되는 다양한 콘텐츠, 용용 프로그램, 스마트 가전, 개인 생활 정보들을 통합 관리하고, 서비스 가상화 기술을 이용하여 다양한 경량화 스마트 가전(Thin/Zero Client)에 동시 적용 가능한 "하이브리드 홈 클라우드 단말 서버 플랫폼 기술을 연구하였다.
-
최근 홈 네트워크의 활성화는 대부분 홈 네트워크를 구성하는 인터넷 공유기에 기반하고 있으며, 이러한 인터넷 공유기를 통하여 홈 네트워크의 기기에 접근하기 위해서는 NAT(Network-Address Translation) 기법을 공유기상에 설정하는 게 보편적이다. 하지만 이러한 NAT 기법은 비록 UPnP를 통한 자동화 기법이 지원되고 있음에도 불구하고 여전히 일반 사용자의 설정이나 정근이 쉽지 않은 게 사실이다. 본 논문에서는 홈 게이트웨이를 통한 콘텐츠 리스트 제공 방법을 제안한다. 제안되는 기법은 UPnP를 통하여 홈 네트워크의 콘텐츠 리스트를 통합하여 관리하는 기법과, 이렇게 수집된 정보를 홈 게이트웨이를 통하여 인터넷으로 접근하는 방법을 기술한다.
-
반도체 기술 및 방송통신기술의 발달에 따라 소비자는 복잡하고 다양한 서비스 환경을 접하고 있으며, 개인당 소비되는 콘텐츠의 양은 기하급수적으로 증가 되고 있다. 스마트폰과 같은 멀티미디어기기의 발전으로 기존의 단순 시청에서 벗어나 멀티미디어 검색과 추천과 같은 다양한 서비스들이 제공되고 있으며, 웹과 인터넷을 기반으로 하는 정보기술은 모바일 전자 기술의 발달에 따라 데스크톱이라는 공간적인 한계를 벗어나 유기적인 유비쿼터스 환경으로 변화하고 있다. 이와 같이 소비자들이 접하는 멀티미디어의 양이 증가됨에 따라, 멀티미디어를 검색하기 위한 다양 서비스들이 사업자들을 통해 제공되고 있다. 그러나 사업자들이 구축한 서버들은 공유되어지지 못하며, 공유되더라도 공유하기 위한 방법이 제각각이다. 이에 MPEG에서는 멀티미디어 콘텐츠를 검색하기 위한 질의 구조를 표준화 하여, 서비스 제공자 및 소비자들에게 유용한 검색 인터페이스를 제공하였다. 이에 본 논문에서는 MPEG Query Format에 기반 하여 임베디드 환경에서 광대한 양의 음악 콘텐츠에서 사용자가 원하는 허밍 질의를 편리하게 검색하기 위한 방법을 성계 및 구현한다.
-
본 논문은 무손실 데이터 은닉 기법중 주변 화소의 통계적 특성을 이용하여 어떠한 추가적인 맵 정보 없이 키 파라미터로써 원본 영상과 삽입한 데이터를 정확히 분리해 내는 기법이다. 오버/언더 플로우에 더 강한 데이터 은닉을 위해, 데이터 삽입에 대한 변수로 작용할 수 있는 주변 화소값들의 범위 뿐만 아니라 주변 화소값들의 표준 편차와 평균값을 모두 키 파라미터의 인자로 사용하여 화소값이 낮은, 즉 영상의 밝기가 어두운 부분에 더 많은 데이터를 삽입할 수 있는 기법을 제안하였고, 실험을 통하여 기존 기법 대비 평균 2배 이상의 삽입 용량이 증진된 것을 확인하였다.
-
본 논문에서는 듀얼 스트림 기반의 지상파 양안식 3DTV 서비스를 위하여, 상용제품의 MPEG-2 인코더와 AVC/H.264 인코더를 이용하여 부호화할 경우, 두 개의 인코더에서 출력되는 MPEG-2 전송스트림을 입력받아 좌우 영상의 스트림을 프레임단위로 동기화하는 방법을 제안한다. 제안하는 동기화 방법은 좌우 HD-SDI 신호의 수직 보조 데이터 공간(VANC-Vertical ANCillary data space)에 동기정보를 삽입하고, 이 동기정보를 바탕으로 2 개의 DTV 인코더에서 출력되는 좌우영상의 전송스트림을 동기화할 수 있도록 한다. 따라서, 본 논문에서 동기정보는 기존의 상용 DTV 인코더에서 프레임 단위로 부호화를 지원하는 폐쇄자막(Closed caption) 구문에 따라 VANC 에 삽입하는 방법을 제안한다.
-
무선 사운드 스피커는 서로 다른 위치에 배치되어 송신기와의 채널 환경이 서로 다르게 되어 송신기와의 거리가 상대적으로 먼 후방 스피커의 경우 사람이나 구조물에 의해 채널 환경이 열악하게 되어 전방 스피커에 비해 데이터 오류 발생 확률이 높다. 본 논문은 Multi-band orthogonal frequency division multiplexing (MB-OFDM) 기반의 무선 오디오 전송 시스템에서 무선 채널 환경이 우수한 스피커에서 무선 채널 환경이 열악한 스피커로 데이터를 전달하는 스피커 릴레이 기법을 사용할 때, packet error ratio (PER) 성능을 향상시키며 전송 시간을 감소시킬 수 있는 효율적인 스피커 릴레이 기법을 제안한다.
-
ITU와 ISO/IEC가 공동으로 UHD(Ultra High Definition)급 영상 부호화를 위해 표준화를 진행하고 있는 HEVC(High Efficient Video Codec)는 H.264/AVC 대비 2배 이상의 압축 효율을 갖는 것을 목표로 정하고 있다. HEVC는 다수의 개선된 기술을 사용하고 있기 때문에 부호화효율을 크게 향상시켰는데 여기에 비트 할당 및 비트율 제어 기술사용을 비디오 코덱의 성능을 향상 시킬 수 있는 중요한 요소들이다. 기존 H.264/AVC의 비트율 제어 기술에는 HEVC의 특성을 고려하지 못한 비트율-양자화 모델을 사용하여 HEVC의 성능을 최적화하기에 어려움이 있었다. 따라서 본 논문에서는 HEVC에서 효율적으로 비트 할당 및 비트율 제어를 할 수 있도록, 기존보다 향상된 비트율-양자화 모델을 제안한다. 그리고 실험을 통하여 제안하는 비트율-양자화 모델이 기존 기술에 비해 정확함을 보인다.
-
HEVC 비디오 코덱에서는 인터 예측을 수행할 때 고정된 지수 골룸 코드를 사용하여 차분 움직임 벡터를 부호화한다. 그러나 고정된 Exp-Golomb 코드를 사용하게 되면 영상의 움직임을 고려하지 않고 영상의 국지적인 특성을 반영하는데 어려움이 있다. 본 논문에서는 현재 블록의 MVP와 예측된 MV에 따라 적응적인 Exp-Golomb 코드를 결정하는 방법을 제안한다. 현재 블록의 MVP에 따라 현재 MV를 예측하는 MV모델링을 통하여 Exp-Golomb 코드를 결정한다. HEVC의 참조소프트웨어인 HM6.0을 이용하여 실험한 결과, Random Access 부호화 구조에서는 평균적으로 약 0.9%의 성능 향상을 얻을 수 있었으며, Low Delay 부호화 구조에서는 약 0.6%의 BD-rate의 감소를 확인할 수 있었다.
-
본 논문에서는 최근 표준화 활동이 진행 중인 HEVC(high efficiency video coding) 표준의 무손실 부호화 모드를 위한 효율적인 계수 주사 방법을 제안한다. 일반적으로 무손실 비디오 부호기에서는 부호화 손실을 없애기 위해 변환 및 양자화 모듈이 제거된다. 이 경우 부호화해야 할 잔여데이터는 양자화된 변환 계수가 아닌 예측 후의 차분 화소이므로 잔여데이터의 확률 분포가 변화된다. 제안한 방법에서는 무손실 부호화에서 화면내 예측 모드 별 잔여데이터의 발생 확률을 분석하고, 이를 고려해 역방향 모드 기반 차분 화소 주사 방법을 사용한다. 일반적으로 참조 화소와의 거리가 멀어질수록 예측 정확도가 떨어져 잔여데이터의 발생 확률이 높아지기 때문에 제안한 역방향 주사 방법을 사용하면 잔여데이터 부호화에서 이득을 얻을 수 있다. 실험을 통해, 제안한 방법이 HEVC 무손실 부호화에 비해 약 1.7%의 부호화 성능을 향상시키는 것을 확인했다.
-
본 논문에서는 HEVC 코덱에서 프레임 단위로 수행되던 디블록킹 필터를 하드웨어 구현 시에 LCU 단위로 처리되는 파이프라인 구조를 적용하여 병렬적으로 수행할 수 있는 방법을 제안한다. 파이프라인 구조에서는 현재 처리되고 있는 하나의 LCU 에 대해 디블록킹 필터를 수행하기 위해서 현재 처리하고 있는 LCU 뿐만 아니라 주변의 LCU 의 화소 값 등의 정보가 필요하며 주변의 LCU 의 화소 값을 모두 저장하는 것은 불필요한 메모리소모를 야기해 HEVC 코덱의 복잡도를 증가시킬 수 있다. 또한 현재 처리되는 LCU 의 경계에 디블록킹 필터를 수행하는 경우 현재 처리되는 LCU 이전의 수정할 수 없는 LCU 의 화소 값도 수정되어야 한다. 따라서 본 논문에서는 이를 해결하기 위해 수평 버퍼 와 수직 버퍼의 개념을 도입하여 처리되는 LCU 의 왼쪽 LCU 의 오른쪽 끝 4 열의 화소와 위쪽 LCU 의 아래쪽 끝 4 행의 화소만을 저장하여 메모리를 합리적으로 사용하는 방법을 제시하고 평행이동 LCU 개념을 적용하여 수정 불가능한 화소 값들을 처리하는 방법을 제시한다. 제안된 구조에 따라 구현된 소프트웨어 상에서 기존의 참조 소프트웨어인 HM6.0 과 동일한 결과를 얻을 수 있었다.
-
세계 방송장비 시장은 아날로그 방송시대부터 소수의 다국적 기업이 독과점 구도를 형성하여 온 진입장벽이 매우 높은 시장이었으나 그간 시장을 장악해오던 다국적 기업들이 방송장비 시장에서 어려움을 겪는 반면, 글로벌 IT 업체들과 이러한 환경 변화에 발빠르게 대응하고 있는 중견기업들이 성장의 기회를 맞고 있다. 본 논문은 국내 방송장비 제조업의 현황과 글로벌 방송장비 산업의 현황을 비교하여 대표적인 글로벌 방송장비 업체에 대한 벤치마킹을 통해 향후 국내 업체들의 포지셔닝 방안에 대한 시사점을 제공하고자 한다.
-
본 보고서는 지상파방송 디지털 전환 과정에서 아직 전송방식조차 선정하지 못하고 있는 라디오의 디지털화 추진과 관련하여 AM 라디오의 DRM 전송방식에 의한 실험방송 조기 추진의 필요성과 의미를 설명하고, FM의 디지털화 역시 DRM+ 전송방식 중심으로 TV채널 5번과 6번 LOW-VHF 밴드 주파수 대역에서의 OUT-OF-BAND 방법으로 검토해 봄으로써 기존 FM송신기 및 안테나와 콤바인이 쉽고 우수한 신호 전달력을 가진 LOW-VHF대역 주파수를 효과적으로 활용할 수 있으며 각 사업자별로 출력지정과 권역설정이 자유로워 디지털시대에 맞는 새로운 서비스 환경 구축과 AM/FM대역 동일방식 디지털 라디오 보급을 할 수 있는 특징으로 인해 라디오의 디지털화 추진에 유리한 방안임을 확인해 보고자 한다.
-
스마트 미디어 시대에 이용자들의 미디어 이용행태 조사 결과, 미디어의 이용시간이 증가하고 이용하는 매체수도 증가하고 있는데, 기존 매체와 달리 스마트 미디어간에는 보완적인 활용이 증가할 것으로 분석된다. 스마트 미디어는 플랫폼을 중심으로 판매자와 구매자가 거래를 하는 전형적인 양측시장에 속한다. 양측시장의 사업자들은 구매자와 판매자를 모두 자사의 플랫폼으로 끌어들이기 위해, 구매자와 판매자의 수요 탄력성을 고려하여 손해를 감수하고 투자를 하는 부분과 실질적으로 수익을 창출하는 전략을 취하지만 아직 스마트미디어에서는 이러한 비즈니스 모델이 본격적으로 출현하지 않은 것으로 보인다. 특히 제조사들의 경우는 TV 판매만으로도 충분한 수익원이 될 수 있어 콘텐츠의 공급자와 구매자 네트워크를 키우기 위한 비즈니스 모델을 선택하는 데에 소극적일 유인이 높다. 유료방송사업자와 인터넷 포털의 스마트STB 도입은 이러한 제조사에 대한 견제 주체가 될 수 있으나 이러한 견제가 유효하기 위해서는 플랫폼간의 표준화 및 호환성이 보장되어야 할 것이다.
-
최근 3D콘텐츠에 대한 주목, N-Screen 환경조성, 종편사업자등장 등의 환경 변화를 배경으로 방송영상콘텐츠산업이 급성장 하고 있다. 그리고 그 중심에 스마트 콘텐츠가 있고, 스마트 콘텐츠를 제작하는 과정에 중요한 역할을 하는 CG, VFX 로 대표되는 특수 영상분야가 주목받고 있다. 고양시는 이러한 시대변화를 앞서 읽고 CG/3D 기업육성, 아쿠아스튜디오 조성 등 타지자체와 차별화된 정책을 추진하여 관련 분야에 경쟁력을 확보하여 지역경제 활성화를 위한 블루오션을 개척하였다. 이에 본 논문은 고양아쿠아스튜디오의 현황 및 향후 가능성을 보고자한다. 고양아쿠아스튜디오가 단순한 개별시설로서 활용되는 것이 아니라 고양시의 방송영상 로케이션, 후반작업 등 문화산업의 가치사슬인 기획-제작-후반작업-배급 등과 연계되어 상승작용 하므로 지역경제 활성화 기여할 수 있는 가능성에 대해 고민하였다. 고양아쿠아스튜디오의 가능성으로 문화산업기반 조성 확대, 폐정수장을 문화산업을 테마로 재활용하는 도시재생의 시범사례 그리고 기업의 방송영상제작환경 제고와 고양아쿠아스튜디오의 테마(Theme)공원화 등을 제시한다.
-
본 논문에서는 MPEG-D 오디오 서브그룹에서 진행 중인 Unified Speech and Audio Coding (USAC) 표준의 Linear Prediction Domain (LPD) 복호화기 모듈을 고정소수점 알고리즘으로 제안한다. USAC 부호화기는 두 개의 최신 음성-오디오 부호화기가 융합된 형태로, 음성 및 오디오 신호에 대하여 우수한 성능을 갖는 부호화기이다. USAC의 표준 완료와 본격적인 서비스화에 앞서서 USAC LPD 복호화기의 구조적인 특성을 분석하고, Digital Signal Processor (DSP)구현을 위한 LPD 복호화기의 고정소수점 알고리즘을 구축하는 동시에 모듈의 복잡도를 측정하고자 한다. 또한 고정소수점 알고리즘으로 구현된 LPD 복호화기와 기존의 부동소수점 복호화기의 성능을 비교하고, LPD 복호화기의 두 가지 부호화 모드에 따른 복잡도 이슈를 다루도록 한다.
-
이 논문에서는 실험을 통해서, 기존에 제안하였던 쿼리-바이-싱잉/허밍 (Query-by-singing/humming, QbSH) 시스템의 매칭 엔진의 강인성을 검증하고 그 결과를 제시한다. QbSH 시스템은 디지털 음악의 사용이 보편화되면서 음악 검색의 방법으로 많은 연구가 진행되어 오고 있다. QbSH 시스템은 입력으로부터 멜로디의 특징을 추출하는 부분과 추출된 특징을 매칭하는 부분으로 나눌 수 있는데, 매칭 단계에서 특징이 추출된 두 개의 멜로디 사이의 유사도 또는 거리를 계산하여 가장 유사한 멜로디를 데이터베이스에서 찾게 된다. 이 논문에서는 이 중, 기존에 제안하였던 매칭 엔진 부분의 강인성을 알아보기 위해서 입력으로부터 멜로디의 피치 시퀀스를 추출하는 과정을 간략히 하여 그 결과를 살펴보았다. 즉, 기존에 제안한 매칭 엔진이 특정한 피치 시퀀스 추출 과정에서만 좋은 성능을 보이는 게 아님을 실험을 통해서 살펴보았다. 실험 결과, 피치 시퀀스를 추출하는 과정이 극도로 간략해지더라도, 매칭 엔진을 좋은 성능을 보여주었다.
-
본 논문에서는 Unified Speech and Audio Coding (USAC)에 적용된 Noise Filling의 부호화 과정에서 음질 왜곡 정도에 따라 Noise level을 설정하는 방법을 제안한다. USAC는 Moving Picture Experts Group (MPEG)에서 표준화한 최신의 음성/오디오 통합 코덱으로 현존하는 코덱 중에 최고의 성능을 가지고 있다. 하지만, 복호화기 기술만 표준화하여, 인코더를 설계하는 방법에 따라 음질의 차이가 존재한다 현재 오픈 소스 기반으로 진행되고 있는 프로젝트 JAME에서는 이러한 음질 차이를 극복하고, USAC에 적용된 핵섬 인코더 기술의 성능을 최대화 할 수 있는 여러 가지 방법을 포함하고 있다. 그 중 Noise Filling은 저 전송률 부호화 과정에서 양자화 되지 않는 스펙트럼에 대하여 일정한 noise level을 넣어 인지적으로 음질을 향상시키는 방법이다. 제안된 Noise Filling 부호화 방법은 현재 프레임의 음질 왜곡 정도를 반영하여, noise-like 신호 성분을 더욱 정교하게 부호화 할 수 있게 하였다.
-
In this paper we propose a new deinterlacing method with block classification and motion vector smoothing. The proposed method classifies a block, then depending on the region it belongs to, the motion estimation or line averaging is applied. To classify a block its variance is calculated. Then, for those blocks that belong to simple non-texture region the line averaging is done while motion estimation is applied to complex region. The motion vector field is smoothed using median filter what yields more accurate interpolation. In the experiments for the subjective evaluation, the proposed method bas shown satisfying results in terms of computation time consumption and peak signal-to-noise ratio. Due to the simplicity of the algorithm computation time was drastically decreased.
-
영상신호의 보간을 위해서 다양한 기법이 제안되었고 H.264와 HEVC 동영상 부호화 표준 기법에서는 움직임 추정의 정확성을 높이기 위해서 1/2과 1/4 위치의 부화소 보간을 위한 보간 필터를 사용한다. 본 논문에서는 lapped transform을 이용하여 1/2과 1/4 위치의 부화소 보간을 위한 효율적인 기법을 제안한다. 제안하는 기법은 영상의 크기 변환과 보간과의 관계를 이용하여 부화소를 효율적으로 보간하는 기법이다. 제안하는 기법 및 H.264, HEVC에서 사용되는 보간 필터를 사용하여 영상을 보간한 경우의 성능을 비교한다.
-
Features which exhibit scale and rotation invariance, such as SIFT, are notorious for expensive computation time, and often overlooked for real-time tracking scenarios. This paper proposes a descriptorless matching algorithm based on motion vectors between consecutive frames to find the geometrically closest candidate to each tracked reference feature in the database. Descriptor-less matching forgoes expensive SIFT descriptor extraction without loss of matching accuracy and exhibits dramatic speed-up compared to traditional, naive matching based trackers. Descriptor-less SIFT tracking runs in real-time on an Intel dual core machine at an average of 24 frames per second.
-
음성 신호처리에서 많이 쓰이는 음성구간 검출은 주로 음향신호의 분석을 통하여 음향 신호에 음성이 존재하는지 여부를 판단한다. 그러나 음향신호를 이용한 방법은 음성 또는 비음성 잡음이나 주위 음향 환경에 의하여 성능이 결정된다는 단점이 있다. 음향 환경 변화에 강인한 음성구간 검출을 수행하기 위하여, 영상정보를 이용한 음성구간 검출 방법들이 최근에 연구되어 왔는데 기존 방법들은 입술 모양의 변화를 추정하기 위하여 입술 모델 등을 이용하거나 구강(oral cavity) 영역에 해당하는 픽셀 수의 변화를 이용하여 음성 구간을 검출하였다. 위 방법들은 입술의 모양을 추정하는 데 복잡한 계산이 필요하거나, 입술 모양 추정 없이 구강 영역픽셀 수만 이용하기 때문에 다소 정확도가 떨어진다는 단점이 있다. 본 논문에서는, 입술 모양의 변화를 추정하기 위해 밖으로 드러나는 구강 영역의 모양을 타원 근사법으로 추정하고, 타원의 넓이와 높이의 변화를 이용하여 음성 구간을 검출하는 방법을 제안하였다. 비교 실험 결과, 제안하는 방법은 구강영역 픽셀 수의 변화만 이용하는 방법에 비해 우수한 성능을 보임을 확인할 수 있었다.
-
본 논문에서 2D-3D 자동 영상 변환을 위하여 2D 상으로부터 깊이 지도(depth map)을 생성하는 방법을 제안한다. 제안하는 방법은 보다 정확한 깊이 지도 생성을 위해 영상의 전경 깊이 지도(foreground depth map)와 배경 깊이 지도(background depth map)를 각각 생성 한 후 결합함으로써 보다 정확한 깊이 지도를 생성한다. 먼저, 전경 깊이 지도를 생성하기 위해서 라플라시안 피라미드(laplacian pyramid)를 이용하여 포커스/디포커스 깊이 지도(focus/defocus depth map)를 생성한다. 그리고 블록정합(block matching)을 통해 획득한 움직임 시차(motion parallax)를 이용하여 움직임 시차 깊이 지도를 생성한다. 포커스/디포커스 깊이 지도는 평탄영역(homogeneous region)에서 깊이 정보를 추출하지 못하고, 움직임 시차 깊이 지도는 움직임 시차가 발생하지 않는 영상에서 깊이 정보를 추출하지 못한다. 이들 깊이 지도를 결합함으로써 각 깊이 지도가 가지는 문제점을 해결하였다. 선형 원근감(linear perspective)와 선 추적(line tracing) 방법을 적용하여 배경깊이 지도를 생성한다. 이렇게 생성된 전경 깊이 지도와 배경 깊이 지도를 결합하여 보다 정확한 깊이 지도를 생성한다. 실험 결과, 제안하는 방법은 기존의 방법들에 비해 더 정확한 깊이 지도를 생성하는 것을 확인할 수 있었다.
-
로컬 히스토그램 평활화(LHE)는 영상에서 로컬 정보를 강조하기 위한 효율적인 알고리즘 중 하나이다. 그러나 이 알고리즘은 스펙클 노이즈를 증폭시키는 단점을 가진다. 따라서, 기존의 로컬 히스토그램 평활화 기법을 확장한 다중 레이어 블록 오버랩 히스토그램 평활화 기법을 이용하여 기존 로컬 히스토그램 평활화 기법들의 문제점을 해결하고자 하였다. 이 방법은 3단계-컨트라스트 향상 단계, 노이즈 제거 단계, 통합 단계로 이루어진다. 제안된 방법에서는 기존 방법의 컨트라스트 향상 단계에서 일반적인 로컬 히스토그램 평활화 방법이 아닌 컨트라스트를 제한하는 적응적인 히스토그램 평활화 기법을 적용하고, 노이즈 제거 단계에서 새로운 바이레터럴 필터를 적용하였다. 즉, 기존 방법의 문제점들을 해결하도록 알고리즘을 변형하여 기존 알고리즘의 성능을 개선하였다. 실험 결과는 제안된 방법이 기존의 방법 및 잘 알려진 로컬 히스토그램 평활화 기법들과 비교하여 좋은 성능을 내는 것을 확인하였다.
-
최근 ISI(intersymbol interference)를 제거하는 성형 펄스로 BTRC(better than raised-cosine), MRC(mirrored raised-cosine), 그리고 TPZD(trapezoidal) 등이 제안되었다. 본 연구에서는 동일채널 간섭신호가 존재하는 환경에서 BTRC, MRC, TPZD, 그리고 RC(raised-cosine) 성형 펄스를 적용한 무선통신 시스템들의 성능을 컴퓨터 모의실험을 통하여 비교 분석하였다. 실험 결과, 필터의 길이가 심볼 길이의 3이하로 짧은 경우에는 사용된 성형 필터에 따른 성능차이가 있으며, MRC 필터가 가장 우수한 성능을 가지고 RC 필터가 가장 열화된 성능을 가짐을 관찰하였다. 그러나 필터의 길이가 충분히 확보된 경우에는 성능의 차이는 거의 없었다. 그러므로 하드웨어의 제약으로 인하여 필터의 길이를 길게 할 수 없는 시스템에서는 MRC 필터를 성형 필터로 적용하는 것이 바람직하다고 판단된다.
-
본 논문은 3차원 깊이 정보를 이용하여 감시카메라에서 움직이는 사람을 검출하고 추적하는 방법을 제안한다. 제안하는 방법은 GMM(Gaussian mixture model)을 이용하여 배경과 움직이는 사람을 분리한 후, 분리된 영역을 CCL(connected-component labeling)을 통하여 각각 블랍(blob) 단위로 나누고 그 블랍을 추적한다. 그 중 블랍 단위로 나누는 데 있어 두 블랍이 합쳐진 경우, 3차원 깊이 정보를 이용하여 두 블랍을 분리하는 방법을 제안한다. 실험을 통하여 제안하는 방법의 결과를 보인다.
-
본 논문에서는 기존 AVC 보다 50% 압축성능 향상을 목표로 표준화가 진행되고 있는 차세대표준인 HEVC 부호화기의 속도를 높이기 위한 방안으로, HEVC 의 기술 중 화면 분할 기술인 타일(Tile)을 기반으로 효율적으로 부호화기를 병렬화하는 구조를 제안한다. 부호화기에서 복잡도가 높은 율왜곡 기반 모드 결정 과정을 멀티코어 병렬프로그래밍으로 구현하고, 병렬처리에 의한 속도 개선 결과를 제시한다. 타일은 병렬처리를 지원하기 위해 HEVC 가 채택한 구조로, 화면을 여러 개로 분할하여 부/복호화 할 수 있어 병렬처리 단위로 적합하며, 표준화의 기고서를 통해 화면분할로 인한 압축성능 변화량은 여러 차례 보고되고 있다. 본 논문의 결과에 의하면 타일의 수만큼 쓰레드를 생성하여 각 타일 단위로 율왜곡 기반 부호화 모드 결정을 하도록 병렬화 하였을 때 기존 참조 소프트웨어 대비 12 개의 쓰레드 생성 시 6 배의 속도 개선을 보인다. 향후 병렬로 처리할 수 있는 모듈을 확장하면 쓰레드 수 증가에 따른 속도개선 효과가 증대되어 부호화기 실용화를 위한 실시간 부호화기 개발에 한 걸음 다가갈 수 있을 것이라 기대한다.
-
본 논문에서는 컬러 영상의 검색을 위하여 영상을 색상 정보에 기반한 pixel layer (cluster)의 집합체로 모델링하고, 두 layer 간의 유사도를 각 layer 를 이루는 pixel 들의 색상 분포에 따른 공간적 분포를 이용하여 측정하는 기법을 제안한다. 먼저 pixel layering 단계에서는 HSV 색 공간에서 mean-shift clustering 알고리즘을 통해 초기 layer 들을 얻고, 비슷한 색상의 layer 들은 합쳐 영상의 soft segmentation 과 유사한 결과를 얻는다. 비교할 두 영상에서 pixel layering 을 한 후, 각 layer 를 이진화된 공간분포 지도로 형성하고 그 차이를 비교함으로써 유사도를 측정한다. 이 때, 사용하는 가중치로서 HSV 색 공간 분포의 비슷한 정도를 정의하는데, 이는 HSV 색 공간을 XYZ 의 3 차원 좌표로 설정하고, overlap 되는 pixel 수로 정의하였다. 본 논문에서 제안한 pixel layer 들 간의 색상 공간 분포에 따른 공간적 분포를 이용한 영상 검색 기법은 MPEG-7 에서 정의한 대표색상 기반의 영상 검색보다 우수한 성능을 보여주었다.
-
This paper presents a graph-based method of detecting and tracking moving objects in H.264/SVC bitstreams for video surveillance applications that makes use the information from spatial base and enhancement layers of the bitstreams. In the base layer, segmentation of real moving objects are first performed using a spatio-temporal graph by removing false detected objects via graph pruning and graph projection, followed by graph matching to precisely identify the real moving objects over time even under occlusion. For the accurate detection and reliable tracking of moving objects in the enhancement layer, as well as saving computational complexity, the identified block groups of the real moving objects in the base layer are then mapped to the enhancement layer to provide accurate and efficient object detection and tracking in the bitstreams of higher resolution. Experimental results show the proposed method can produce reliable results with low computational complexity in both spatial layers of H.264/SVC test bitstreams.
-
평면 추적(planar tracking) 기반의 카메라 추적에 있어, 특징 검출자의 반복성과 특징 기술자(descriptor)의 정합 성능에 따라서 떨림 현상(jitter)이 발생한다. 특히, 모바일 환경에서와 같은 연산력이 부족한 환경에서 고속화를 위해 특징 검출 및 기술 알고리즘을 간략화 시킬 경우, 이러한 떨림 현상은 심각한 문제가 된다. 본 논문에서는 이러한 문제를 해결하기 위해 입력 영상을 워핑(warping)하여 특징 점을 재검출한 후 카메라 영상과 참조 영상(reference image) 사이의 호모그래피를 보완하는 방법을 제안한다. 실험을 통해 제안된 방법이 특징 검출 및 기술 알고리즘의 성능을 보완하여 떨림 현상을 크게(70% 이상) 감소시킴을 확인하였다.
-
본 논문은 특징 클러스터에 대한 묘사에 기반한 새로운 특징 기반 영상 정합을 제안한다. 추출되는 특징들을 모두 동등하게 처리하는 기존 방법은 반복 패턴이 존재하는 영상에서는 매칭이 종종 실패하거나 적은 일치점만을 제공한다. 그 이유는 서로 닮아 있는 반복 패턴들로 인해 기하학적으로 일관되지 않은 매칭점들이 발생하거나 거리 비율 테스트를 통과하지 못하기 때문이다. 이에 반해 제안하는 방법은 더 많은 수의 일치점들을 발견할 수 있다. 이를 위해 제안하는 방법은 먼저 추출된 특징들을 반복 패턴으로부터 온 것들과 그렇지 않은 두드러진 특징들로 분리한다. 그런 후 support vector data description을 이용하여 각 반복 패턴들을 묘사한다. 동일하지 않은 영상이 매칭되는 경우를 제거하고 기하학적으로 일관된 일치점들을 제공하기 위해 매칭된 쌍에 대한 기하학적인 단서가 추가된다. 실험을 통해 제안하는 방법은 반복 패턴으로부터 추출된 특징들에 대해 일치점을 제공함으로써 더 많은 수의 일치점을 제공하게 되어 더 정확한 영상 정합을 수행한다는 것을 증명하였다.
-
본 논문에서는 3차원 입체 비디오처리 기술의 최종목표인 디지털 홀로그램을 생성하는데 필요한 정보인 객체의 좌표와 색상정보를 얻기 위해서 간단하게 장면이 정확히 일치하는 RGB image와 depth image를 생성할 수 있는 시스템을 구축하는 방법을 제안하였다. 가시광선과 적외선의 파장을 이용하여 파장에 따라 투과율이 달라지는 cold mirror를 사용하여 같은 시점에 대한 RGB + depth image를 얻은 후, 전처리 과정에서 카메라 왜곡에 대한 lens correction과정을 걸친 후, 해상도를 맞추기 위한 resolution resize과정을 마친 후, 디지털 홀로그램으로 구현 할 object를 추출한다. 그 다음 CGH(computer-generated hologram) 알고리즘으로 추출한 object를 CGH로 만든다.
-
본 논문에서는 고해상도 팬크로매틱 영상과 저해상도 다중분광 영상을 융합하기 위하여 고해상도 팬크로매틱 영상에서 MRF 모델링을 기반으로 에지 방향 정보를 추출하는 방식파 추출된 에지 방향 정보 및 고해상도 팬크로매틱 영상의 기울기 정보를 이용하여 위성영상을 융합하는 방법을 제안한다. 에지 방향 추출은 레이블링(labeling) 문제로 다루어 처리하는데, 이는 MRF 모델링을 통하여 에너지 함수를 설계하고 최소화시킴으로써 풀 수 있다. 또한 고해상도 다중분광영상 합성 시, 저해상도 다중분광영상의 픽셀 값을 정계조건으로 하고 팬크로매틱의 기울기 및 에지 정보를 이용하여 선형방정식을 세워서 풀어내는데, 이를 용하여 색상왜곡을 줄일 수 있으며 영상의 세부 부분을 더 잘 표현할 수 있다 실험 결과, 제안하는 방법이 기존방식에 비하여 좋은 성능을 보임을 확인할 수 있다.
-
본 논문에서는 의료영상 영역화 기법으로 이용되는 레이블 융합 기법을 기반으로, 정합 기법을 이용했을 시 빈번하게 발생하는 경계에서의 오차를 크게 줄여줄 수 있는 기법을 제안한다. 패치 기반 레이블 융합 기법은 패치 간의 밝기 값의 유사도를 기반으로 융합 가중치를 계산하였지만 이는 밝기의 분포가 상대적으로 다른 자기공명영상에 적합하지 못한 경우가 많았다. 본 논문에서는 밝기 값과 함께 밝기 값의 경사도 유사도를 추가적으로 계산하여 융합 가중치를 얻어내는 기법을 제안한다. 밝기의 분포가 다른 영역에서도 밝기의 경사도 분포는 대부분 유사하기 때문에, 오차가 많은 모호한 경계에서 향상된 결과를 얻을 수 있었다. 제안하는 기법의 성능평가를 위해 50 개의 SKI10 무릎 관절 데이터 셋 내에서 대퇴골을 영역화 하였다. 실험 결과를 통해 제안하는 기법이 밝기 값 유사도 정보만을 이용했던 기법에 비해 개선된 성능을 보이고 있음을 확인할 수 있다.
-
Sparse한 신호 복원 방법으로 underdetemined system에서 11-minimization을 이용한 compressive sensing의 연구와 함께, 11-minimization 비해 간단한 greed 알고리듬도 활발히 연구되고 있다. 이에 본 논문은 greed 알고리듬의 대표적인 orthogonal matching pursuit기법에서 iteration 마다 support 선택 개수에 따른 성능을 연구한다. 모의 실험을 통해 OMP의 iteration 단계에서 하나의 support만 선택하는 것보다 다수의 support를 선택하는 것이 더 낮은 sparsity의 신호를 복원할 수 있고 더 낮은 계산량의 이득을 가져오는 것을 확인 할 수 있다.
-
Lee, Dong-Hee;Bang, Min-Suk;Cho, Jung-Sik;Lee, Seung-Joo;Kim, Sung-Hoon;Lee, Joo-Young;Choo, Hyun-Gon;Choi, Jin-Soo;Kim, Jin-Woong;Jung, Kyeong-Hoon;Kang, Dong-Wook 319
3DTV 방송 서비스를 위한 다양한 방법 가운데 좌우영상의 해상도가 서로 다른 하이브리드 방식이 제안된 바 있다. 이 방식에서 양안시차 정보를 활용하면 낮은 해상도 영상의 화질을 개선할 수 있는데, 본 논문에서는 3D 영상에서 수평적 양안시차와 함께 수직 방향의 변이를 함께 고려하면 영상의 화질 향상 효과가 더 커짐을 보였으며 이를 추정하기에 적합한 양안시차 탐색범위의 형태를 제안한다. -
본 논문은 선명도를 향상시킨 고해상도 깊이맵을 생생 방법을 제안한다. 현재 저해상도 깊이맵으로부터 생성되는 고해상도 깊이맵은 원 깊이맵과 유사도를 높이는 것에 초점이 맞춰져 있다. 본 논문은 기존 보간법들을 바탕으로 깊이맵에 고주파 성분을 사용하여 깊이맵의 선명도를 증가시킨다. 제안 방법은 저해상도 깊이맵으로부터 고주파 데이터를 생성 후, 깊이맵에 고주파 성분을 적용한 다음에 보간을 통하여 깊이맵을 고해상도 깊이맵으로 변환한다.
-
Cho, Jung-Sik;Bang, Min-Suk;Lee, Seung-Joo;Lee, Dong-Hee;Kim, Sung-Hoon;Lee, Joo-Young;Choo, Hyun-Gon;Choi, Jin-Soo;Kim, Jin-Woong;Kang, Dong-Wook;Jung, Kyeong-Hoon 323
서로 다른 해상도의 좌, 우 영상으로 구성된 3DTV 시스템에서는 낮은 화질의 영상을 높은 화질의 해상도로 확대하여야 한다. 본 논문에서는 3종류의 보간기법을 실험 대상으로 하였으며 부호화기 및 부호화기에 각각 적용한 경우의 PSNR을 기준으로 성능을 분석하였다. 3종류의 보간 기법 중 SVC의 normative upsampling(JVT-R006) 보간기법의 성능이 우수함을 확인 하였다. -
최근 국내외 디지털 가전 업체들은 다양한 3D 기술을 앞세워 가정 내에서도 편하게 즐길 수 잇도록 다양한 3DTV를 출시하고 있다. 이러한 3DTV에서 입체영상을 시청하기 위해서는 입체콘텐츠가 제작되어 전송되어야 한다[1]. 이러한 입체 콘텐츠는 RGB 영상과 깊이맵을 이용하여 생성할 수 있는데, 이때 깊이맵은 사용자의 용도에 따라 다양한 형태로 변환될 수 있다. 최근엔 이러한 깊이맵과 3D 영상의 컬러를 변환하여 지각 깊이감을 개선하는 영상처리 기술에 대한 관심이 높아지고 있다. 이에 따라, 본 논문에서는 기존의 컬러 변환을 통한 2D 영상의 지각 깊이감 개선을 입체영상에 적용하여, 3D 지각 입체감을 동시에 향상시키는 방법을 제안한다. 이를 위해 대조 변환 및 배경 다크닝 방법을 제안하고, 실험을 통해 제안 방법이 상기 목적을 얻을 수 있는 것을 검증하였다.
-
분산 비디오 복호화 기술은 저 용량 저 전력 시스템을 위한 초경량 복호화기를 제공할 수 있어 최근 많은 이슈가 되고 있다. 그러나 분산 비디오 복호화 기술은 피드백 채널을 이용하여 반복적인 패리티 비트 제어 방법을 주로 사용하기 때문에 전체 복호화 시간이 매우 길다는 단점을 가지고 있다. 따라서 분산 비디오 복호화 시스템의 고속화가 반드시 필요하며 이를 위해 많은 연구가 진행되어 왔다. 본 논문에서는 분산 비디오 복호화의 고속화를 위하여 보조정보와 LDPCA 프레임의 율-왜곡을 이용하여 패리티 비트 요구량을 예측하는 방법을 제안한다. 모의실험을 통해 제안하는 방법을 이용함으로써 분산 비디오 복호화에 소요되는 전제 복호 시간 대비 약 80% 시간 절감 효과를 보인다.
-
H.264/AVC를 비롯한 대부분의 동영상 압축 표준에 의해 부호화 및 복호화된 영상은 블록화 현상(blocking artifacts)이 생긴다. 이러한 화질 열화 현상은 블록 기반의 정수형 이산코사인 변환(Integer DCT)을 수행한 후 계수를 양자화 하기 때문에 발생한다. 이러한 블록화 현상을 줄이기 위해 H.264/AVC에서는 디블록킹 필터를 이용한다. 본 논문에서는 H.264/AVC의 디블록킹 필터의 복잡도를 감소시키면서 화질을 유지하는 알고리듬을 제안하고 실험을 통한 평가를 제시한다. 복잡도를 줄이기 위해 제안하는 알고리듬에서는 블록 경계강도(Bs) 결정 과정에서 한 화소 줄의 경계강도를 이용하여 네 화소 줄 모두에 적용한다. 실험결과 경계강도 결정의 계산량을 줄이면서 주관적, 객관적 화질 또한 향상되는 결과를 보였다.
-
본 논문은 2.4GHz 대역을 사용하는 WBAN(Wireless Body Area Network)환경에서 동일 채널을 사용하는 경우에 발생하는 간섭을 제거하기 위해 MMSE(Minimum Mean Square Error), OC(Optimal Combining), ML(Maximum Likelihood)을 비교 분석하였으며, IEEE 802.15.6에서 정의된 시나리오 및 채널 모델에 대해서 분석하였다. 모의실험 결과 ML 알고리즘이 가장 우수한 성능을 나타내는 것을 알 수 있었다. 하지만 ML과 OC의 경우 원하는 신호의 채널 정보뿐만 아니라 간섭채널의 정보를 알아야 하기 때문에 채널을 추정하기 위한 훈련 심볼의 자리를 수신노드에서 알고 있어야 하므로 WBAN환경에 적용하는데 어려움이 있다. 따라서 복잡도와 성능사이에 적당한 trade-off를 만족하는 간섭 제거 알고리즘을 연구해야 할 것이다.
-
다중 안테나 전송 기술은 추가적인 대역폭의 필요 없이 다이버시티 이득을 얻을 수 있는 장점이 있다. 이러한 이유로 차세대 방송기술 및 이동 통신기술에서는 대용량 데이터 전송을 위하여 다중 안테나 전송기술을 채택하고 있다. 또 다른 차세대 무선 통신 시스템의 큰 특징은 무선 통신 환경에서 발생하는 다중 경로 및 무선 경로 페이딩에 의한 성능 저하를 극복하기 위하여 연판정 검출 값을 반복적으로 사용하는 오류정정부호의 사용에 있다. 이 경우에 수신단에서 MIMO 검출 후 수행되는 터보 부호에 대한 복호 과정에서 연판정 입력이 필요하고, 이 연판정 입력 값이 복호 성능에 큰 영향을 미치기 때문에 효율적인 연판정 검출 값이 필요로 한다. 본 논문에서는 MIMO 검출 후 M-ary QAM 복조시 경판정 경계를 이용한 연판정 검출방법을 이용하여 적은 연산을 요구하는 M-ary QAM 의 연판정 검출 방식을 제안한다.
-
증강방송 서비스는 하이브리드 방송(Hybrid Broadcasting) 환경 하에서 IP망을 통해 전송받은 증강 콘텐츠를 방송 프로그램과 같이 보여줌으로써 스마트TV와 같은 단말을 통해 증강 현실을 제공하는 서비스이다. 증강방송 서비스를 제공하기 위해서는 증강 콘텐츠의 위치(서버), 증강 콘텐츠가 표시될 화면상의 위치 및 시간 정보 등의 증강 콘텐츠 연동정보가 필요하다. 본 논문에서는 MPEG-2 SYSTEM: Transport Stream의 서술자(Descriptor)를 통해 증강 콘텐츠 연동정보를 전송하는 방법 및 IP망의 증강 콘텐츠를 이용한 증강방송시스템을 제안한다.
-
추천 엔진의 지속적인 성능 향상을 위해서는 객관적 성능 평가가 이루어져야 하지만, 콘텐츠 추천 기술은 평가 데이터 구축이 어렵고 평가를 위한 심도 깊은 연구가 이루어지지 못하여 많은 어려움을 가지고 있다. 본 논문은 콘텐츠 추천 시스템의 객관적인 평가를 시스템 구축에 대한 연구이다. 추천 알고리즘의 효율적이고 객관적인 성능 평가를 위하여 기존 연구들을 분석하여 대표적인 성능평가 양식들을 구현하였다. 통계적인 평가를 위한 사용자 데이터를 수집하였으며 데이터 크기, 평가방식, 추천 알고리즘의 모듈 별 성능 추이를 쉽게 변경하고 관찰할 수 있도록 인터페이스를 설계하였다. 이러한 평가 시스템의 도입으로 콘텐츠 추천 알고리즘의 지속적인 성능 보완을 기대 할 수 있을 것이다.
-
디바이스 사용 환경이 다양해지면서 이를 고려한 반응형 UI/UX 개념이 대두되고 있다. 이를 위해 기존 데스크탑 기반의 UI에 국한되지 않고 다양한 모바일 디바이스 환경 및 사용자 특성을 고려한 적응적인 UI/UX를 제공해야 한다. 본 논문에서는 MPEG-21을 기반으로 반응형 웹 UI/UX를 제공하는 새로운 프레임워크를 제안한다. 기존 반응형 웹 디자인은 주로 조합한 여러 단위 기술을 이용하여 해상도의 변화에 반응하여 엘리먼트를 적응 시키는 방법을 사용한다. 제안하는 기술은 단일 프레임워크를 이용하여 컨텐츠 및 리소스를 보다 다양한 환경 정보를 사용하여 적응시킨다. 이는 기존 방법과 비교하여 서비스 제공자가 많은 종류의 리소스 및 데이터를 서비스 함에 있어 3rd 파티 컨텐츠 프로바이더의 참여 및 수정이 용이하도록 하였으며 자동으로 사용자 환경을 파악하여 맞춤형 컨텐츠 제공이 가능하도록 한다.
-
본 논문에서는 ATSC 지상파 DTV시스템에서 계층변조를 사용하여 재난 방송용 부가 데이터를 전송하는 기법을 제안한다. ATSC 지상파 DTV시스템에서 계층변조를 사용하는 방식으로는 ADT(Augmented Data Transmission) 방식과 대역확산방식이 있다. ADT방식은 상대적으로 높은 데이터 전송율을 가지지만 신호가 도달할 수 있는 커버리지가 좁은 반면 대역확산방식은 낮은 데이터 전송률을 가지지만 신호가 도달할 수 있는 커버리지가 넓은 장점이 있다. 따라서, 재난 발생시 넓은 커버리지에 신속하게 긴급경보 방송을 송신하기 위해서는 대역확산기반의 계층변조 방식이 유리하다. 본 논문에서는 ATSC 지상파 DTV시스템에서 긴급경보 방송을 위해 대역확산기반의 계층변조 방식을 사용한 경우 전송용량 및 전계강도와 도달할 수 있는 전송 거리를 분석한다.
-
최근 인터넷 및 디지털 방송 서비스 환경 변화에 따라 사용자에게 제공되는 디지털 콘텐츠가 기하급수적으로 증가하게 되었고, 스마트 TV, 스마트 패드, 스마트폰 등 디지털 콘텐츠를 이용할 수 있는 기기들이 다양화 되어지고 있다. 또한, 사용자가 디지털 콘텐츠를 수집하는 경로와 이용하는 환경도 다양해지고 있다. 하지만, 현재 사용자가 제공되어 지고 있는 디지털 콘텐츠들은 특정 단말 및 사용환경에 종속된 형태로 제작되어 서비스되어지고 있으며, 다양한 성능을 가지는 단말들의 특성과 디지털 콘텐츠를 이용하는 사용자의 사용환경에 최적화된 서비스를 제공하지 못하고 있는 실정이다. 이에, 본 논문에서는 단말의 특성 및 사용자 사용환경에 최적화된 서비스를 제공할 수 있는 스케일러블 데이터 서비스를 제공하기 위한 프레임워크 기술과 스케일러블 데이터 서비스를 기술하기 위한 언어인 SADL(Scalable Application Descript Language)를 소개하고, 사용자가 사용하는 단말 특성과 사용환경에 최적화된 서비스를 제공하기 위한 SADL기반 콘텐츠를 저작할 수 있는 저작도구를 제안한다.
-
본 논문에서는 Full-HD 영상에서 사용되는 H264/AVC의 정수 단위 고속 움직임 예측 방법을 제안한다. 제안되는 알고리즘에서는 다중 해상도 고속 움직임 예측 기법에 기반을 두어 두 계층이 각기 탐색된다. 낮은 해상도의 계층에서는 움직임 벡터 예측자를 중심으로 좁은 탐색 영역을 2 단계로 탐색하여 최적의 점을 찾는다. 높은 해상도의 계층에서는 4 단계로 탐색을 하여 탐색점의 개수를 줄인다. 그리고 두 계층에서 각기 구해진 탐색점들의 비용을 비교하여 매크로블록의 최종 움직임 벡터를 구한다. 시뮬레이션 결과에서는 기존의 연구 결과보다 JM을 기준으로 BD-Rate는 1.55 % 높았고, BD-PSNR은 0.05 dB 낮아진데 비해 시간은 63% 만큼 감소하여 높은 속도를 낼 수 있었다.
-
본 논문에서는 새로운 율모델을 기반으로한 프레임 단위 HEVC 율제어 기법을 제안한다. 기존의 비디오 압축표준과는 달리 HEVC 는 계층 구조를 지닌 쿼드트리 기반 움직임 예측 및 변환 부호화를 수행한다. 본 논문에서는 쿼드트리 계층의 깊이에 따라 신호의 통계적 특성이 매우 달라지는 것은 이용하여 라플라시안 확률 모델을 각 쿼드트리 계층에 독립적으로 이용한 새로운 율모델을 이용한 율제어 기법을 제안한다. 제안방법에서는 계층적 부호화 단위인 CU 를 계층 깊이에 따라 세 가지 카테고리로 분류하고 각 카테고리에 따라 변환 계수에 대한 라플라시안 확률 분포 함수를 율-양자화 모델을 만든다. 제안된 율모델은 특성이 매우 다른 각 CU 깊이에 따라 독립적인 라플라이안 확률 분포 함수를 이용하기 때문에 매우 정확하고 적응적인 비트율 예측이 가능하므로 보다 안정적이고 정확한 율제어가 가능하다. 실험결과는 제안된 율제어 기법이 단일 확률 분포 함수를 사용했을 경우보다 평균 0.16dB 의 PSNR 향상이 있었음을 보여주었으며 제안된 방법은 각 프레임에 대한 목표 비트에 보다 안정적으로 부호화하는 것을 보여주었다.
-
MPEG과 ITU-T에서 최근 표준화가 진행되고 있는 HEVC는 H.264/AVC에 비해, CU(coding unit), PU(prediction unit), TU(transform unit)의 다양한 형태 분할 단위를 갖는 것을 큰 특징으로 한다. 이 중, CU와 TU는 쿼드트리 형태의 재귀적 분할 구조를 가지도록 구성되는데, 압축 효율은 향상시키지만 높은 부호화 복잡도를 갖는 단점이 있다. 본 논문에서는 이러한 재귀적 분할 구조를 변환하여 가장 작은 CU의 정보를 병합하여 큰 CU의 정보를 빠르게 결정하는 방법을 제안한다. 제안한 방법을 HEVC의 CU 부호화에 적용한 결과, 부호화 복잡도를 32-45% 가량 감소시키면서 압축 효율 하락은 0.6-0.9%로 억제할 수 있었다. 또한, HM6.1에 구현되어 있는 고속 탐색 알고리즘과 비교 할 경우, 압축 효율 하락을 0.2-0.3%로 억제하면서 부호화 복잡도를 8-12% 감소시킬 수 있었다.
-
하이브리드 양안식 비디오 부호화 방식은 한정된 대역폭 내에서 MPEG-2 기반의 기존 2D 디지털 방송서비스를 지원하면서, 동시에 추가적인 시점 영상을 MPEG-2 가 아닌 비디오 부호화 표준을 사용함으로써 3DTV 방송 서비스를 가능하게 한다. 본 논문에서는 기존의 2D 디지털 방송 서비스를 위한 좌안 영상은 MPEG-2 로 부호화되어 지상파로 전송되고, 3DTV 방송에 필요한 우안 영상은 HEVC 로 부호화되어 인터넷으로 전송되는 방송 상황을 가정한다. 또한 MPEG-2 로의 좌안 영상 부호화 시의 파생 정보를 활용하여 HEVC 로의 우안 영상 부호화 시의 성능 향상을 도모한다. 이를 위해 우선 기존 HEVC 를 움직임 벡터에 기반한 예측 부호화뿐 아니라 변이 벡터에 기반한 시차간 예측 부호화가 가능한 구조로 확장한 후, 움직임 벡터 부호화를 위해 HEVC 에 포함된 AMVP 기술을 변이 벡터가 사용됨에 따라 발생할 수 있는 여러 상황을 고려하여 확장한다. 실험결과 제안하는 하이브리드 양안식 부호화기로 우안 영상을 부호화할 경우에, 단독으로 HEVC 를 사용하여 우안 영상을 부호화하는 경우와 비교하여 BDBR 측면에서 평균 34.49%의 성능 향상을 관찰할 수 있었다.
-
본 논문에서는 이중 홉 무선 네트워크에서 누적분포함수(cumulative distribution function) 기반 중계기 선택 기법을 제안한다. 제안된 기법은 수신 신호대잡음비(signal-to-noise ratio)의 누적분포함수 값에 따라 중계기를 선택한다. 본 논문에서는 제안한 기법의 중계기 공정성에 대한 분석을 통해 제안된 기법이 엄격하게 공정성을 달성할 수 있음을 보인다. 그리고 모의 실험에서는 round-robin 기법과 기회적 중계 기법을 제안된 기법과 총 타임 슬롯에 대한 각 중계기별 타임 슬롯 분배율, 평균 공정성, 불능확률 비교를 통해 제안된 기법이 엄격하게 공정성을 달성하는 것과, 기회적 중계 기법과 거의 동일한 기울기로 불능확률이 떨어지는 것을 확인한다.
-
본 논문은 협력 네트워크(cooperative network)에서 무선 채널의 보안성(security) 강화를 위한 자가 전파방해(self-jamming) 기반 기회적 중계(opportunistic relaying) 기법을 제안한다. 단일 송신 단말 (source)과 단일 수신 단말(destination)이 다중 중계 단말(relay)의 협력을 통해 송수신하는 이중 홉(dualhop) 네트워크에서 도청 단말(eavesdropper)에 의한 정보 절취를 최소화하기 위해 자가 전파방해 기법과 기회적 중계 기법을 결합한다. 이를 통해 무선 채널의 방송(broadcasting) 특성에 기인한 도청 용이성을 저하 시키고, 다중 중계 단말의 송신 전력을 최소화하여 협력 네트워크의 수명(lifetime)을 연장한다. 컴퓨터 모의실험 결과를 통해 제안된 기법이 다중 중계기가 있는 이중 홉 협력 네트워크에서 보안 전송률(secrecy rate)의 불능확률(outage probability) 성능을 제고함을 보인다.
-
Multiple-Input Multiple-Output (MIMO) 시스템의 복잡도를 감소시키는 방식은 실생활에서 MIMO 시스템을 활용하는 데에 있어 중요한 부분이다. 널리 사용되는 Maximum Likelihood (ML) 복호기의 경우 낮은 에러오율 (BER) 을 보여주지만 복잡도가 높다. 실생활에 활용하기 위하여 ML 복호기의 복잡도를 감소시킬 필요가 있고 이에 Sphere Decoding Algorithm (SDA) 이 제안되었다. 이를 발전시킨 List Sphere Decoding(LSD) 은 여러 종류가 있다. 그 중에 넓이 우선 탐색 방식인 K-Best LSD 알고리즘은 각 레이어에서 리스트의 크기가 복잡도와 밀접한 연관이 있다. 본 논문에서는 기존의 K-Best LSD 알고리즘에 기반하여 초기 반지름 설정 및 선형적으로 리스트 크기를 감소시키는 방식으로 K-Best LSD 알고리즘의 복잡도를 기존 알고리즘에 비해 크게 낮추면서도 비트 오율 성능 열화가 적은 알고리즘을 제안하고 전산 실험을 통해 이를 검증한다.
-
격자 감소 (lattice reduction) 알고리즘은 주어진 기저 벡터를 직교에 가까운 기저 벡터로 바꾸어 준다. 그중 대표적인 알고리즘으로 LLL (Lenstra, Lenstra & Lovasz) 알고리즘이 있다. 격자 감소 알고리즘을 이용하여 다중 안테나 입출력 (MIMO) 통신시스템의 선형 수신기(linear detector)의 성능을 향상 시킬 수 있다. 스피어 복호 알고리즘 (sphere decoding algorithm)은 MIMO 통신 시스템에서 사용되는 복호기중 최대 우도 복호기 (Maximum Likelihood Detector)와 비슷한 BER(bit error rate)성능을 가지고 복잡도를 줄일 수 있어서 많이 연구되어 왔다. 이때 스피어의 반지름의 설정이나 트리 검색 구조 방식 등은 복잡도에 큰 영향을 미친다. 본 논문에서는 LLL 알고리즘에 기반하여 스피어의 반지름 설정 및 트리 검색 노드 수를 제한하는 방식으로 스피어 복호 알고리즘의 복잡도를 기존 알고리즘에 비해 크게 낮추면서도 비트 오류률 (BER) 성능 열화를 최소한으로 한 알고리즘을 제안하고 전산 실험을 통해 검증한다.
-
모바일 기기에서 연속적으로 입력되는 영상을 파노라마 합성을 하여 사용자에게 실시간으로 결과를 보여주는 기존의 실시간 파노라마 기법은 트래킹을 기반으로 하고 이미 채워진 영역은 재투영 하지 않기 때문에, 정렬 오류가 누적되고 누적된 정렬 오류가 결과 영상에 그대로 반영되는 문제가 있다. 이를 해결하기 위하여 본 논문에서는 실시간으로 합성된 파노라마 결과에서 정렬 오류가 존재하는 부분과 장면에서 움직이는 물체가 투영된 부분을 판별하고 이 부분만을 다시 투영하는 방법을 제안한다. 정렬 오류가 발생한 부분을 판별하기 위하여, 시간차가 존재하는 여러 장의 영상을 정렬한 후 같은 위치의 픽셀에 속하는 컬러 값을 큐에 저장한다. 정렬 오류가 발생하거나, 움직이는 물체가 존재하는 경우 큐에 저장된 컬러 값의 차이가 커지게 되고 이러한 부분은 다시 투영하여 파노라마 결과 영상에서 오류를 보정하게 된다. 또한 정렬 오류를 최대한 보정하기 위하여 두 단계로 이루어진 블렌딩 방법을 제안한다. 제안하는 방법은 실시간으로 동작하연서 정렬 오류가 발생한 부분을 효과적으로 판별하여 기존의 방법에 비하여 정렬 오류가 줄어듦을 확인하였다.
-
본 논문에서는 스테레오 기반 카메라 추적 방법을 이용하여 3차원 모바일 디스플레이 상의 증강현실에서 증강된 가상 객체의 3차원 효과가 올바르게 나타나도록 하는 방법을 제안한다. 3차원 디스플레이에 가상 콘텐츠를 증강시키기 위해서는 카메라의 정확한 위치와 자세를 추정하는 것도 중요하지만, 증강된 가상 콘텐츠의 시각적 3차원 효과가 올바르게 나타나도록 하는 것도 중요하다. 이를 위해서는 좌우 카메라의 3차원 공간상의 관계가 유지되도록 양측 카메라의 위치 및 자세를 동시 추정(joint estimation)할 필요가 있다. 제안된 방법은 스테레오 카메라와 패럴렉스 배리어 방식의 3차원 디스플레이가 장착된 안드로이드 스마트폰에서 구현되고 실험되었다.
-
본 논문에서는 동영상을 시공간적 중요도 기반으로 요약하는 기법을 제안한다. 동영상 내에서 각 프레임의 중요도를 평가하여 높은 우선순위를 가지는 구간들의 집합으로 요약을 수행한다. 화면내의 얼굴면적의 비율, 영상의 복잡도를 통하여 각 프레임이 가지는 공간적 중요도를 분석하고 인접한 프레임간의 비교를 통해 밝기 히스토그램과 움직임(motion)의 양을 추정함으로써 시간적 중요도를 구한다. 에지 보존 스무딩 필터를 밝기 히스토그램에 적용하여 장면 전환을 검출한다. 분리된 장면들로 과분할 구조를 가지는 계층적 트리를 생성하여 사용자가 요구한 재생길이를 가지는 동영상을 자동으로 저작한다. 본 논문에서는 동영상 분석 및 저작을 제한적인 환경인 스마트폰에서 효과적으로 작동하도록 구현 및 최적화를 수행하였다.
-
IT산업은 한정된 공간에서 사용되던 과거에서 벗어나 최근에는 이동성과 서비스가 결합된 스마트 산업으로 변모하였다[1]. 추세에 맞추어 3D산업도 대형 디스플레이에서 이동성이 있는 3D게임기와,3D 스마트폰과 같이 소형 디스플레이로 초점이 옮겨지고 있다. 하지만 아직 3D영상을 스마트폰으로 처리하기에는 많은 연산량으로 인하여 제약이 있다. 이에 본 논문은 입체 시청이 가능 3D스마트폰을 이용하여 입체 영상을 구현하여, 스마트폰에서의 3D 영상처리의 가능성과 향후 개선방법을 제안한다.
-
영상에서의 화질 평가는 학술적으로나 산업적으로나 중요한 문제이지만 지금까지 주로 쓰여온 PSNR 과 같은 방법은 실제 사람이 인식하는 평가에 잘 부합하지 못하는 문제점이 있었다. 본 논문에서는 모든 밝기 영역에서 영상을 평가할 수 있는 HDR-VDP2 와 주목도 지도를 결합하여 범용적으로 사용이 가능하며 성능도 뛰어난 화질 측정 방법을 제시하고, 다양한 주목도 지도에 대하여 그 성능과 화질 평가 성능 사이의 관계를 살펴본다. 구현에는 주목도 지도를 가중치로 사용함으로써 간단하게 더 좋은 성능의 화질 평가 시스템을 만들었고 이를 실험으로 보였다. 또한 주목도 지도의 성능과 화질 평가 시스템의 성능 사이에는 약한 양의 상관관계가 있는 것으로 나타났는데 주목도 지도와 함께 구조적 특징점들의 정보를 성능 평가 시스템에 포함시키면 더 좋은 결과를 얻을 것으로 기대된다.
-
멀티미디어 장치와 사용자의 욕구가 다양해짐에 따라 이를 충족시키기 위하여 이미지 크기는 장치에서 지원하는 해상도나 사용자의 욕구에 맞게 조정되어야 한다. 이미지 업샘플링 방법은 크게 공간 도메인과 주파수 도메인에서 수행될 수 있다. 일반적으로 공간 도메인에서의 업샘플링 방법은 주파수 도메인의 업샘플링에 비해 상대적으로 주관적인 화질 측면에서 좋은 성능을 나타내지만 객관적인 성능이 낮다. 반대로 주파수 도메인에서의 업샘플링 방법은 객관적인 화질이 좋고 주관적인 화질 측면에서 상대적으로 성능이 낮게 나타난다. 본 논문에서는 공간 도메인과 주파수 도메인에서의 업샘플링 방법을 블록의 특성에 따라 적응적으로 업샘플링 방법을 선택하는 알고리듬을 제안한다. 제안하는 방법은 객관적 성능 뿐 아니라 주관적 성능까지도 향상 시킬 수 있다. 실험 결과를 통해 제안하는 알고리듬이 기존의 알고리듬에 비해 PSNR 측면에서 0.87dB~1.15dB 증가하고, 주관적 화질도 향상됨을 알 수 있다.
-
최근 3D에 대한 관심이 집중되면서 고품질의 3D영상을 얻기 위해 고품질의 깊이 영상이 필요하고 이를 구현하기 위한 연구가 활발히 진행되고 있다. 깊이 영상을 얻기 위해서 Time-of-Flight(ToF)방식의 깊이 센서가 활용되고 있는데 이 깊이 센서는 실시간으로 깊이 정보를 획득할 수 있지만 낮은 해상도와 노이즈가 발생한다는 단점이 있다. 따라서 깊이 센서로 생성된 저해상도 깊이맵을 고해상도로 변환해야 한다. 주로 깊이 영상의 해상도를 높이기 위해서 Joint Bilateral Upsampling(JBU) 방식이 사용되고 있다. 따라서 본 논문은 JBU 방식을 보강하여 블록단위로 분산에 따른 참조 영상의 가중치를 다르게 두어 깊이 영상의 품질을 향상시키는 방법을 제안한다.
-
기존 얼굴 인식 알고리즘은 단일 특징 기반의 전역적 방식이었다. 정확도를 향상시키기 위해 복수의 특징점을 이용하는 방법들이 제안되었으나 이는 알고리즘의 복잡도가 증가하고, 계산 속도가 느린 단점이 있다. 본 논문에서는 대표적인 특징점 추출 알고리즘인 SURF (Speeded Up Robust Features)를 이용한 얼굴 인식 방법을 제안한다. SURF 를 통해 기술어를 추출하고, Gabor 특징과 LBP 특징을 이용해 해당 특징점에서 기술어를 추출함으로써 기존 알고리즘보다 경량화할 수 있고, 수행시간을 줄일 수 있다. 잘 알려진 ORL 데이터베이스에서의 실험에서 제안한 방법이 정합시간을 포함한 수행 시간에서 약 16%의 감소를 보였고, 정확도 또한 약 34% 향상되었다.
-
본 논문에서는 H.264 부호기의 복잡도를 낮추기 위한 고속 움직임 탐색 기법을 제안한다. H.264 부호기는 움직임 탐색 알고리즘 및 다양한 모드 결정으로 인해 매우 높은 복잡도를 갖기 때문에 고해상도 영상의 압축에 시간적 부담을 준다. 따라서, 우리는 비디오 프레임에 계층적으로 양자화를 적용한 뒤, 각 단계마다 움직임 탐색 영역을 적절히 분배함으로써 최적의 움직임 벡터를 예측하는 기법을 제시한다. 제안 기법은 H.264 부호기의 한가지 예측 모듈로 제안되며, 부가적으로 움직임 벡터 예측자 주변을 탐색하는 모듈이 수행된다. 실험 결과에서 제안 알고리즘이 기존의 H.264 부호기에 비해 매우 빠르면서 안정된 비트율-왜곡 성능을 가짐을 보인다.
-
최근 모바일환경에서 영상검색을 위한 연구가 활발히 진행됨에 따라 MPEG에서도 국제표준을 위한 연구가 진행되고 있다. 그러나 모바일의 제한된 성능환경과 외부적인 실외환경변화에 강인한 알고리즘개발이 시급하다. 따라서 본 논문에서는 다양한 환경변화에 강인한 영상검색 알고리즘을 개발하기 위하여 기존의 영상검색으로 많이 사용되고 있는 SIFT와 SURF 알고리즘의 성능을 분석하고자 한다. 실험에 사용된 데이터베이스는 MPEG에서 표준영상으로 채택된 ETRI dataset을 이용하였다. 실험결과, 기존의 알고리즘은 특징점 검출과 그 서술자가 서로 의존적임을 알 수 있었다.
-
본 논문에서는 디지털 홀로그램의 저작권 보호를 위한 영상암호화 알고리즘을 제안한다. 이 기술은 자연영상과는 상이한 특성을 보이는 디지털 홀로그램의 화소분포를 고려하여, 디지털 홀로그램을 복원영역으로 변환한 후 데이터의 일부분을 암호화 하는 기법이다. 실험결과 제안한 암호화 알고리즘은 디지털 홀로그램 데이터의 일부분만을 조작하여 홀로그래픽 복원영상을 효율적으로 은닉하는 것을 확인할 수 있었다.
-
영상의 화질을 향상시키기 위한 다양한 방법이 제안되어 왔는데 DCT 영역에서 영상의 화질을 향상시키는 방법은 각 블록별 특성을 효율적으로 이용할 수 있고 JPEG, MPEG 등 표준 압축 기법으로 압축된 영상에 적용이 용이한 장점이 있다. 본 논문에서는 DCT 영역에서 contrast measure를 이용한 화질 향상 기법에서 발생할 수 있는 blocking effect를 크게 감소시키는 lapped transform 영역의 화질 향상 기법을 제안한다. 모의 실험을 통해서 제안하는 기법이 영상의 contrast를 향상시키면서 blocking effect를 크게 감소시키는 것을 보인다.
-
모델 기반 카메라 추적에서 추적을 위한 3 차원 객체 모델의 정확도는 매우 중요하다. 하지만 3 차원 객체의 실측 모델링은 일반적으로 정교한 작업을 요구할 뿐 아니라, 오차 없이 모델링 하기가 매우 어렵다. 반면에 오차를 포함하고 있는 객체 모델을 이용하더라도 실제 추적 환경에서 사용자가 느끼는 성공적인 추적의 허용 오차는 실제 추적 오차와 다를 수 있다. 따라서, 본 논문에서는 모델 기반 카메라 추적에서 모델링 오차에 따른 모델과 영상 정보 간의 실제 정합 오차와 육안으로 판단되는 정합의 허용 오차를 사용자 평가를 통해 비교 분석하고, 3 차원 객체 모델링의 허용 오차 범위에 대해 논의한다.
-
본 논문에서는 3차원 데이터를 이용한 효율적인 실내 공간 표현 기법을 제안한다. 제안하는 기법은 3차원 데이터의 획득과 실내 구조 및 영상 정보를 표현하기 위한 표현 복원으로 구성된다. 3차원 데이터는 레이저 거리 측정기(laser range finder, LRF)와 전방향(omni) 카메라를 통해 획득한 포인트 클라우드 공간 정보와 전방향 텍스쳐 영상으로 구성된다. 실내 구조를 복원하기 위해, 획득한 포인트 클라우드를 복셀 격자 기반의 샘플링 기법을 통해 균일화하고 포아송 표면 재구성(Poisson surface rocoostruction) 기법을 통해 3차원 메쉬를 생성한다. 그리고 전방향 텍스쳐 영상과 3차원 메쉬외 기하학적 관계를 이용한 텍스쳐 매핑 기법을 통해 최종적으로 3차원 메쉬 표면을 복원한다. 실험 결과를 통해 제안하는 기법이 실내 공간을 효과적으로 표현함을 확인한다.
-
최근, 인간과 컴퓨터 간의 상호작용을 위해 카메라의 정확한 포즈를 추정하고자 하는 연구가 많이 이루어지고 있다. 이러한 연구들은 인간의 움직임을 추적하기 위하여 카메라 영상으로부터 인간의 포즈를 추정하여 주된 인터랙션으로 활용하고자 한다. 그러나 기존의 움직임 추정 방법은 주로 내부(ego) 혹은 외부(exo)의 단일 카메라만을 이용하기 때문에 미세한 움직임을 분석하기 어렵다. 본 논문에서는 외부 카메라뿐만 아니라 내부 카메라를 혼합하여 사용함으로써 미세한 움직임도 추정할 수 있는 하이브리드 비전 기반 움직임 추정 방법을 제안한다. 실험 결과는 단일 카메라만을 이용한 결과와 비교해 더 정확한 포즈 추정을 보인다.
-
본 논문에서는 스테레오 영상의 중요 부분과 깊이 정보를 유지하며 영상의 크기를 변경하기 위한 새로운 warping 기반의 리타겟팅 기법을 제안한다. 단일 영상을 이용하는 기존의 알고리즘들은 스테레오 영상간의 일관성을 고려하지 않기 때문에 독립적으로 리타겟팅을 수행한 결과 영상의 3 차원 정보가 왜곡 된다. 반면 제안하는 알고리즘은 스테레오 영상에 격자를 생성하고 격자의 정점 매칭을 이용해 두 영상의 일관성을 유지한다. 또한 영상 내의 중요 물체가 유지되는 성능을 높이기 위해 sparse disparity map 을 생성한다. 다양한 스테레오 영상을 이용한 실험을 통해 제안하는 알고리즘이 다른 알고리즘에 비해 중요 물체와 3 차원 정보를 잘 보존하는 것을 확인한다.
-
H.264/AVC 는 움직임 예측/보상을 수행할 때, 하나 이상의 다중 참조영상을 허용하여 예측 정확성을 높임으로써 높은 압축효율을 얻을 수 있지만, 부호화기가 높은 복잡도를 갖는 단점이 있다. 본 논문에서는 H.264/AVC 부호화기의 높은 복잡도를 줄이기 위하여 이미 부호화된 주변 블록의 부호화 정보와 현재 부호화하는 매크로블록(MB)의
$16{\times}16$ 화면간 예측 결과를 적응적으로 이용하여 현재 부호화하는 매크로블록의 참조영상 후보의 수를 줄이는 고속 부호화 알고리즘을 제안한다. 모의실험을 통하여 제안한 알고리즘은 JM17.2 에 비해 평균 47% 정도의 부호화 시간을 감소시키며, 이때 평균 비트율은 1.4%로 부호화 효율의 감소가 미미함을 확인 하였다. -
Korea View 는 지상파 디지털 TV 의 새로운 서비스 프레임워크로 6MHz 의 지상파 방송 대역폭 내에서 하나의 HD 채널만 서비스되던 것을 향상된 비디오 압축 기술을 이용하여 1 개의 HD 채널과 3 개의 SD 채널, 총 4 개의 채널을 서비스하는 지상파 다채널 디지털 TV 서비스를 의미한다. 본 논문에서는 Korea View 서비스 프레임워크에 H.264/SVC 를 이용하여 SD 급으로 전송되던 3 개의 채널에 대해 SVC 의 공간 계위를 갖도록 부호화 한 HD 급 향상계층 비디오 부호화 스트림을 광대역 망을 통해 전송하는 다채널 하이브리드 HDTV 방송서비스 프레임워크를 제안하고 이를 위해 H.264/SVC 의 부호화 성능을 평가하고 분석한다. 이를 위해 본 논문에서는 H.264/SVC 기본계층에 해당하는 3 개의 SD 채널에 대해 1.5Mbps 목표 비트율로 부호화 하는 동시에 H.264/SVC 의 향상계층에 해당하는 HD 비디오의 부호화를 수행하여 SD 급 기본계층과 HD 급 향상계층의 부호화 성능을 평가 및 분석하였다. 실험을 통해 SD 급 기본계층에서 34.5dB 이상의 화질로 서비스 가능한 수준의 객관적 화질임을 확인하였고, HD 급 향상계층에 대해서는 12Mbps 비트율로 부호화 된 MPEG-2 영상의 화질을 제공하기 위해 690kbps 이상의 비트율이 필요하다는 것을 제시한다.
-
시간 흐름에 따라 TV 프로그램 스케줄은 변화하고 스케줄의 변화는 사용자 선호에 영향을 미친다. 이러한 스케줄 변화에 따른 토픽의 흐름이 사용자 선호도에 미치는 영향 외에도, 개성에 따른 선호도의 변화는 개인별 차이가 크다. 본 논문은 사용자 선호도 변화에 적응적으로 대응하면서 시간 변화에도 일정한 관심을 보이는 사용자의 선호도에는 가중치를 더한 모델을 목표로 한다. 따라서 제안 모델은 현재의 시청 데이터를 기준으로 한 사용자별 선호도의 선행 정보(prior)로 이전 시청선호를 두었고, 선호도 변화와 일관성을 고려하여 하나의 시청길이에 대한 선호도뿐만 아니라 여러 시청 길이의 선호도를 결합한 선호도를 구성할 수 있는 확장성 있는 모델을 제시한다. 선호도의 일관성에 대한 가중치 연산에 있어 전체 확률모델의 확률을 향상시키는 연산을 통해 정교성을 더한 모델을 제시한다. 실제 사용자들이 시청한 데이터인 2011 TNMS데이터를 기준으로 제안 모델의 성능을 확인한 결과, 기존의 LDA, MDTM모델 보다 나은 성능을 보임을 확인할 수 있었으며, 1주일 단위 추천결과, 5개 추천 시, 최대 67.9%의 추천 정확도를 확인할 수 있었다.
-
본 논문에서는 최근 모바일 디바이스에서 제공되고 있는 증강현실 서비스를 방송환경에 접목할 수 있는 서비스 시나리오에 대한 소개와 이를 실현하기 위한 증강방송 메타데이터에 대하여 소개한다. 방송환경이 모바일 환경과 다르기 때문에 완벽한 증강 서비스를 제공하는데 있어서 한계가 있다. 한편 TV 의 대 화면과 양질의 TV 프로그램, 스마트 TV 로의 발전에 따른 웹 환경 지원과 모션/음성 인식 인터페이스, 그리고 스마트 TV 애플리케이션의 등장은 증강방송의 가능성을 한층 높이고 있다. 이를 가능하게 하기 위하여 증강방송 메타데이터를 설계하였으며, 증강방송 메타데이터는 증강영역 및 시간, 증강 콘텐츠, 정합 정보 등을 포함한다. 증강방송 메타데이터를 방송환경에 적합하게 전송하기 위하여 스트리밍 서비스에 적합하도록 메타데이터 구조를 정의하였다.
-
3D 영상 산업과 더불어 3D가 적용됨으로써 유망한 산업 분야 중 하나가 바로 게임이다. 2D에서 3D 그래픽으로 그리고 현재는 3D 입체영상으로 진화하면서 이용자로 하여금 깊이감을 제공함으로써 더 큰 즐거움을 주고 있다. 본 연구에서는 게임에서의 입체영상 및 안경 착용여부가 영상의 특성, 프레즌스 그리고 피로도 등에 어떠한 영향을 미치는지 알아보고자 했다. 실험결과 디스플레이와 안경착용의 상호작용효과는 인지된 특성 구성요소 중 입체감과 프레즌스 구성요소 중 시간관여에서 유의미하게 나타났다. 입체감과 시간관여의 경우 모두에서, 3D 영상에서 게임을 플레이했을 경우 안경 미착용자가 착용자 보다 더 잘 인지하는 것으로 나타났다.
-
본 논문은 스테레오 3D 비디오 시청 시 나타날 수 있는 불편감이나 어지러움 증상을 유발하는 요인들을 찾아내어 분석하는 것을 목적으로 한다. 그 방법으로 2가지의 스테레오 3D 콘텐츠를 피험자들이 시청을 하고, 시청하는 동안 불편감이나 어지러움 증상이 나타나면 키를 누르게 하여 측정을 하였다. 콘텐츠에 대해서는 관심영역(ROI, Region of Interest)에 대하여 변위의 크기와 변화정도에 대한 데이터 정보를 도출하였다. 그래서 각 콘텐츠에 대해서 도출한 정보를 가지고 피험자들이 콘텐츠를 시청하면서 느낀 불편감과 어지러움에 대한 원인들을 분석하였다.
-
본 논문은 최근 수요와 관심이 급증하고 있는 초고선명 4K-UHD 영상의 방송TV 서비스 도입시에 영상의 시청환경 및 신호규격 선정의 가이드라인을 제공하는 것을 목표로 HEVC 코덱(HM5.0 참조 소프트웨어)으로 부/복호화 한 4K-UHD 영상에 대한 주관적 화질평가를 결과를 제시한다. ITU-R BT.500의 권고에 따라 DSIS 방법으로 실험 하였으며, 원본 영상 대비 목표 비트율(18, 23, 36 Mbps), 컬러 포맷(YUV444, YUV420), 시청거리(0.75H, 1.5H) 변화에 따른 주관적 화질 평기를 수행하였다. 실험결과 시청거리가 가깝고 비트율이 18Mbps로 낮게 책정한 조건에서도 평균 의사 점수(MOS)는 4.65로서 피 실험자들은 화질 차이를 거의 느끼지 못하는 것으로 나다났다. 또한 동일한 비트율 조건에서 컬러 포맷을 YUV444와 YUV420에 대한 비교 실험에서 각각 MOS 값은 4.71과 4.81로 측정 되었으며, 평가자들은 채도(Chrominance)의 해상도 보다 전체적인 PSNR이 높을수록 높은 MOS 값을 주었다. 이는 동일 비트율 대비 YUV444보다 YUV420의 컬러 포맷이 더 높은 주관적 화질을 가짐을 의미한다. 본 실험을 통해 HEVC 코덱을 사용하여 현재의 방송 대역폭 조건에 UHD 영상도 충분히 고품질로 전송 가능하며, 영상의 컬러 포맷은 YUV420가 YUV444 방식보다 동일 비트율 대비 더 높은 화질을 가질 것이라고 예상 할 수 있다.
-
PDP, LCD, IED 등의 디스플레이 패널 재료를 회두로 생장해 오던 디스플레이 장치 시장이 최근 3D라는 어플리케이션이 화두가 되어 시장 성장을 이끌어 오고 있다. 3D 디스플레이 장치 시장의 규모 및 성장속도에 비해 이를 이용할 수 있도록 하는 3D 서비스는 상대적으로 부족하다. 3D 디스플레이 장치를 확보하는 소비자가 늘어남에 따라 지속적으로 증가하는 3D 서비스에 대한 잠재 수요에 대응하기 위해 다양한 형태의 3D 서비스가 계획되고, 다양한 형태의 콘텐츠 제작이 이루어지고 있다. 3D 디스플레이 장치 및 서비스 시장의 지속적인 성장을 위해서는 제작 및 서비스되는 3D 콘텐츠에 대한 품질 평가 방법에 대한 연구가 선행되어야 한다. 이에 본 논문은 3D 비디오에 대해 사람들이 느끼는 주관적 품질 평가 방법을 제안한다. 하나의 영상 도메인에 표현되던 2D 영상과 달리 스테레오스코픽 비전 방식의 3D 입체 영상은 오른쪽과 왼쪽, 두 개의 영상 도메인에 각 각 표현된다. 또한 양쪽 영상의 차이로 인해 깊이감을 인식할 수 있게 된다. 본 논문에서는 양안에 입력되는 영상의 품질을 각각 측정하고, 두 영상의 차이가 이끌어내는 깊이감을 분석하여 입체영상 전체의 품질 평가에 이용하는 방법을 제안한다.
-
최근 멀티코어 프로세서의 사용이 증가함에 따라 영상처리나 대용량 처리가 필요한 기술과 같은 다양한 분야에 OpenMP, SIMD 등과 같은 다양한 병렬화 기법들이 적용되고 있다. 특히, 영상처리 분야에서 Full-HD, UHD, 3D TV 등과 같이 높은 복잡도를 갖는 컨텐츠들의 수요가 높아짐에 따라 기존의 싱글코어 기반의 코덱에 병렬화를 적용하는 여러가지 기법들이 제안되어왔다. 본 논문은 기존의 OpenMP와 SIMD와 같은 병렬처리 기법을 H.264/AVC 코덱의 참조 소프트웨어 JM 18.2의 디코더에 적용함으로써 Full-HD영상을 실시간으로 디코딩하는 기법을 제안한다. 실험결과는 평균 38.338 fps의 프레임 율을 보이며 병렬처리시 평균 2배 이상 프레임 율이 증가함으로써 Full-HD 영상의 실시간 처리가 가능하다는 것을 보여준다.
-
본 논문에서는 저비트율 환경에서 화면내 예측 모드 정보를 적응적으로 부호화하는 방법을 제안한다. 저비트율 환경에서의 예측 모드의 확률정보에 기반하여 특성을 분석한 후 기존의 방법과 제안된 방법을 적응적으로 선택하여 예측 모드 정보를 부호화 한다. 제안된 방법에서는 기존의 MPM을 대체하여 하나의 MB내에서 MPM과 일치하지 않는 블록에 대한 개수에 대한 정보, 해당 블록의 위치 정보, 실제 모드 정보를 부호화하는 방법을 사용하였다. 실험 결과를 통해서, 제안된 기술은 저비트율 환경에서 평균적으로 0.10dB의 BD-PSNR 증가 또는 1.72%의 BD-bitrate를 감소시킴으로써 H264/AVC의 효율을 향상시킴을 확인할 수 있다.
-
스마트폰과 같은 휴대용 멀티미디어 장치의 보급으로 사용자들은 고용량의 멀티미디어 데이터를 끊김없이 서비스 받길 원한다. 무선랜 기반 방송시스템은 한정적인 무선자원을 다수의 사용자들에게 원활하게 서비스하기 위해 유니캐스트 패킷이 아닌 방송 패킷을 이용한다. 하나의 패킷을 다수의 사용자들에게 한번에 전송할 수 있는 방송패킷은 효율적이지만, 손실복구가 어렵다는 단점을 가지고 있다. 이러한 단점을 극복하기 위해 일반적으로 FEC와 같은 방법으로 손실을 복구한다. 그러나 이러한 FEC와 같은 방법은 원본 데이터를 전송하기 위해 추가적인 데이터를 같이 전송해야한다. 이러한 전송은 대역폭의 증가를 가져온다. 그래서 본 연구진은 FEC와 같은 방법대신 전송의 특징을 고려한 x.264코딩 기법만으로 코딩된 동영상 데이터를 전송하여 동영상 품질수준에서 제안한 방법의 우수성을 검증하려한다.
-
Jung, Soon-Heung;Jun, DongSan;Kim, Younhee;Seok, Jinwuk;Choi, Jin Soo;Kwak, Jin Suk;Lee, MinSuk;An, Sangbu 462
본 논문에서는 HEVC 기술로 부호화된 비디오 비트스트림(HEVC 비트스트림)을 분석하고, 그 결과를 보여주는 방법에 대해서 제안한다.[1] HEVC 기술은 Coding Unit(CU), Prediction Unit(PU), Transform Unit(TU)을 기반으로 부호화가 이루어지므로 부호화 정보를 효과적으로 사용자에게 보여주기 위해서는 CU, PU, TU 를 기반으로 GUI(Graphic User Interface)가 디자인되어야 한다. 제안된 HEVC 비트스트림 분석기에서는 이러한 부호화 구조를 반영하여 사용자 친화적으로 HEVC 비트스트림의 부호화 정보를 편리하게 확인할 수 있도록 하였다. -
DMB 는 이동 중에 멀티미디어를 시청할 수 있는 이동 멀티미디어 방송이다. 기술의 발전으로 최근 출시되고 있는 휴대용 기기에는 기본적으로 DMB 를 수신할 수 있고, 사용자는 어디든 이동 하며 DMB Contents 를 즐길 수 있다. 하지만 사용자가 DMB Contents 를 수신할 수 없는 지역으로 이동하면 DMB Contents 를 수신 할 수 없다. 이러한 단점을 극복하기 위해서, 휴대용 기기는 기본적으로 장착되어 있는 무선 네트워크 모듈을 통하여 Internet 의 DMB System 에 접속하고, DMB System 은 사용자 요구에 따라 DMB Contents 를 전송할 수 있는 Hybrid DMB System 이 필요하다. 이러한 Hybrid DMB System 은 Internet 을 통하여 DMB Contents 를 전송하게 되고, 결국 휴대용 기기는 장착되어 있는 무선 네트워크를 이용하여 DMB Contents 를 수신한다. 하지만 휴대용 기기에 장착되어 있는 무선 네트워크 모듈이 다양하기 때문에, 각 무선 네트워크의 전송 특성을 살펴볼 필요가 있다. 본 논문에서는 다양한 무선 네트워크 중 802.11 에서 DMB Contents 를 전송하고, 네트워크의 전송 특성을 살펴본다.
-
본 논문에서는 High Efficiency Video Coding (HEVC)을 하드웨어로 구현하기 위해서 파이프라인 방식을 인-루프 필터에 새롭게 도입된 기술인 Sample Adaptive Offset (SAO)에 적용하여 병렬화 처리하는 방법을 제안한다. 현재 HEVC 에서 SAO 의 입출력이 프레임단위로 구현되어 있는데, 이를 파이프라인 방식의 하드웨어 설계시에는 Largest Coding Unit(LCU)단위로 입출력이 가능하도록 수정해야 한다. SAO 에서 사용하는 두 가지 방식으로 Edge Offset(EO)과 Band Offset(BO)모드가 있으며, 이 중 EO 모드가 주변 화소값을 이용하므로 주변 화소값 정보가 없는 LCU 경계에 위치한 화소들을 버퍼에 저장한 뒤, 다음 LCU 블록의 입력과 함께 SAO 를 수행한다. 또한, SAO 앞 단의 인-루프 필터 기술인 디블록킹 필터(Deblocking Filter)에서도 LCU 단위로 입출력이 수행되므로 디블록킹 필터에서 저장하는 버퍼를 고려하면, SAO 입력에서 사용가능한 데이터는 LCU 가 천이된 형태가 된다. 따라서 SAO 입력의 천이된 형태와 버퍼 사용에 따라 총 9 가지 타입을 갖게 되며, 이 중 경계에 위치한 블록을 제외한 타입들의 경우 서로 다른 정보를 가진 SAO 를 4 번 수행해야 한다. 이러한 점을 반영한 파이프라인 방식을 SAO 에 적용하여 하드웨어에 적합한 구조를 구현할 수 있다.
-
The active shape model(ASM) is one of the most popular methods among the shape prior based segmentation methods based on its strong shape constraints using the statistic of shape information which is acquired from the training set. ASM has a few drawbacks, such as, the lack of shape variability, and the sensitivity for false locally searched points. In this paper, we suggest the patch-wise robust ASM to overcome the limitations of the ASM. In addition to the SSM, we introduce the patch-wise SSM, to reduce the shape inflexibility and to search reliable points with the point reliance measurement. The quantitative and qualitative results show the robustmness and the accuracy of the proposed method.
-
Sparse한 신호 복원 방법으로 underdetermined system에서 ll-minimization을 이용한 compressive sensing의 연구와 함께, ll-minimization비에 간단한 greed 알고리듬도 활발히 연구되고 있다. 이에 본 논문은 greed 알고리듬의 대표적인 orthogonal matching pursuit기법에서 iteration 마다 후보 support를 유지하는 알고리듬을 연구한다. 모의 실험을 통해 OMP의 iteration 단계에서 하나의 support만 선택하는 것보다 후보 support를 유지하는 것이 sparse 신호를 복원하는 경우는 OMP와 비슷한 성능을 보이지만 덜 sparse한 신호복원에서는 더 좋은 성능을 보임을 확인 할 수 있다.