Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)
The Korean Institute of Broadcast and Media Engineers
- Semi Annual
Domain
- Media/Communication/Library&Information > Media/Consumers
2013.11a
-
최근 다양한 모바일 디바이스의 개발 및 대중화로 인해, 사용자가 콘텐츠에 노출되는 시간이 급증하고 있다. 이와 함께, 사용자가 필요한 정보를 선택적으로 제공하기 위한 사용자 맞춤형 서비스의 개발도 많은 관심을 받고 있다. 이를 위해서는 콘텐츠가 내포하는 정보를 자동적으로 추출하여 인식하는 기술이 필수적이며, 채널 정보는 지능적 상황 인지를 위해 방송 영상이 가지는 중요한 정보 중 하나이다. 이에 본 논문은 영상 정보 기반의 채널 로고 인식 기법을 제안한다. 본 기법은 채널 로고가 포함된 동영상에서 색상 정보와 그라디언트를 추출하여 동영상 내의 각 좌표가 로고에 해당할 가능성을 의미하는 Logosity 개념을 정의한다. Logosity를 기반으로 채널 로고 후보 영역을 탐지하고, 각 로고 후보에 대해 채널 종류를 판단하는 분류를 수행한다. 실험을 통하여 제안하는 알고리즘이 다양한 채널의 영상에 대해 뛰어난 인식 및 분류 성능을 나타냄을 확인한다.
-
We proposed a method for increasing visibility of dehazed images by enhancing luminance component of dehazed image. For this purpose, we analyze shape of luminance histogram in multi bunches and observe that increasing visibility those bunches does not bear over contrast enhancement. From the analysis and observation, histogram equalization intends to increase visibility of each bunch with less computation.
-
본 논문은 기존의 고정블록 알고리즘에서 발생할 수 있는 객체 추적의 문제점을 보안한 다중 블록을 이용한 적응적 블록 정합 알고리즘을 제안한다. 기존의 고정블록을 이용한 정합 알고리즘은 추적 대상 객체의 크기와 블록의 크기가 추적 성능에 미치는 영향이 크기 때문에 객체 추적에 실패하는 경우가 발생한다. 본 논문에서는 고정된 블록 정합 알고리즘의 문제점을 해결하기 위해 다중 블록을 이용하여 객체 내의 포함된 블록들을 효과적으로 선택하고 선택된 블록들의 특성으로부터 효과적인 가중치를 부여하여 추적 성능을 향상시킨다. 제안된 알고리즘은 블록 정합 알고리즘 중 가장 정확도가 높다고 알려진 전역 탐색 방법을 이용하여 정확도를 평가 하였다.
-
We implement the foveation and frequency sensitivity feature of human visual system in discrete cosine transform (DCT) domain. Resolution of human visual perception decays as distance from the eye-focused point, known as foveation property, and the middle frequency components give most pleasant image quality to human than the low and high frequency components, which is the frequency sensitivity property of human visual system. For satisfying the foveation property, we enhanced the local contrast at the focused regions and smoothed local contrast at the non-focused regions in the DCT domain without bringing the blocking and ringing artifacts. Moreover, the energies at each DCT frequency components is modified with various degree to fulfill the frequency sensitivity property. The proposed method is verified by the subjective and objective evaluations that it can the improve the human perceptual visual quality.
-
최근 UHD TV 출시와 HD급 영상의 보편화로 영상에 대한 해상도 변경 기술의 중요성이 높아지고 있다. 본 논문에서는 기존의 cubic convolution 기법을 응용하여, 영역별 특성에 따라 적응적인 가변 커널 길이의 cubic convolution으로 화면 해상도를 변환하는 기법을 제안한다. 제안하는 기법은 영상의 화질을 개선시키면서도 상황에 따라 하드웨어의 line memory를 절약할 수 있도록 설계를 하여 화질 개선뿐만이 아니라 하드웨어적으로도 더 효율적으로 사용이 가능하다. 또 tuning parameter 를 최적화 하는 방법을 통해 기존의 cubic convolution 기법보다 더 좋은 화질의 영상을 얻을 수 있다.
-
최근의 방송은 고화질, 고품질, 실감화 등으로 방송통신융합과 신규 서비스가 나오게 됨으로서 멀티플랫폼으로 발전하고 있다. 뿐만 아니라 디지털 전환에 따른 방송장비의 진화로 장비수요가 증가하고 있는 추세이다. 국내는 주로 방송장비산업체가 중소기업 위주로 이루어져 있어, 정부차원의 적극적인 지원과 국내 외의 표준화를 통한 국산 방송장비의 원천 기술 확보 및 방송사업자의 적극적인 활용을 통한 검증으로 경쟁력 강화가 함께 이루어질 수 있도록 하여야 할 것이다. 또한 정부의 지원으로 기 개발된 장비는 개도국과 선진국으로 분류하여 차별화된 방송장비로 공략하고, 개도국에 중복된 지원을 단일 창구화하여 공략할 수 있도록 정부차원의 정책이 필요할 것으로 보인다.
-
본 논문에서는 시간영역에서 Golay 시퀀스를 이용한 주파수 분할 다중화(orthogonal frequency division multiplexing; OFDM) 시스템의 채널 추정 기법을 제안하였다. 두 개의 시퀀스를 하나의 쌍으로 Golay 시퀀스 쌍은 이상적인 비주기 자기상관 특성을 가지며, 다중경로 채널 환경에서 직교성이 유지되는 강인한 특성을 가진다. 이러한 Golay 시퀀스 기반의 시간영역 채널 추정 기법은 시면 채널에서의 시간동기에 용이하며, Golay 시퀀스의 이상적인 자기상관 특성으로 인하여 채널 추정 시 수신단의 복잡도를 낮출 수 있는 장점을 갖는다. 그리고 OFDM 기반 시스템에서의 PAPR(peak to average power ration) 문제를 해결할 수 있다. 그러므로 본 논문에서는 Golay 시퀀스의 특성을 이용한 전송 구조 제안 및 채널 추정 성능을 시뮬레이션을 통하여 분석하였다.
-
최근 방송사에서는 사용하는 고화질 제작용인 대용량 영상파일의 사이트간 전송을 위해 Public IP Network 을 많이 사용하고 있으나, 특히 장거리 Public IP Network 는 QoS 를 보장되지 않는 다양한 원인으로 인해서 전송성능이 저하가 심각하게 발생한다. 본 논문에서는 방송 디지털미디어의 대용량 HD 영상파일을 장거리 전송하는데 발생하는 성능 저하의 원인을 분석하고, 고속 파일전송을 위하여 Parallel TCP Application을 이용해서 다중세션으로 호스트간 Network 을 연결을 하는 방법을 통해서 Network 사용 효율성을 극대화하고 이용하는 구현 사례를 알아본다. 그리고 대용량 HD 영상파일의 고효율 고속 전송시스템을 방송사에서 사용한 결과를 실증하여 IP network 을 사용하는 효율적인 영상전송방식을 검증한다.
-
본 연구는 지상파TV의 디지털전환 완료 이후 아날로그 AM과 FM라디오의 디지털 전환과 새로운 UHDTV방송 도입을 위해 VHF 상위대역과 700MHz 대역에서의 효율적인 주파수 할당과 활용방안을 제시하고 있다. 아울러 방송은 UHD 영상과 디지털오디오 등 고품질 서비스도 중요하지만 무엇보다 수신이 잘되고 편리해야 하므로 강인한 신호 전송과 수신환경 개선 방안도 함께 제시하고자 한다. 특히 VHF 상 하위 대역과 AM/FM 라디오 대역 및 DTV 대역 그리고 700MHz 대역 등 방송주파수 전체 대역에서 UHDTV방송과 디지털라디오방송 환경을 구축하는데 서로 충돌 없는 합리적인 주파수 할당과 SFN 전송망 구축에 의한 효과적인 주파수 이용 방안을 제시하고 있다.
-
본 내용은 2013년에 접어 들면서 아날로그 방송이 디지털 방송으로 완전 전환되어짐에 따라 디지털 방송 전송의 표준인 MPEG 압축 및 다중화에 대해서 자세히 살펴보고 그에 대한 검증을 살펴보고자 준비된 것이다. MPEG은 오랜 동안 준비되고 선진 각국에서 다양한 방법으로 시험이 진행되어 상당히 안정된 압축 및 전송 표준으로 준비가 된 것이다. MPEG 1,2,3,4로 계속 진화하면서 그 성능이 점점 좋아지고 있으며, 향후에 더 많은 데이터의 압축 및 전송을 위하여 새로운 표준들이 준비되고 있다. 현재 UHD TV를 위한 더 효율적인 압축과 전송을 위한 새로운 방식 들이 거론되고 있으며, 이러한 표준이 확정이 되지 않은 지금, 현재 상용화되어 사용되고 있는 MPEG 압축 및 전송에 대해서 다시 한번 정리해 보고 기존의 아날로그 방송에서의 신호 검증과 어떤 차이가 있는지 살펴보고자 한다.
-
방송시스템의 환경변화는 SDTV에서 HDTV, UHDTV로 방송콘텐츠 데이터 용량이 실감미디어를 향하여 크게 증가 하는 추세이다. 디지털방송 환경에서 파일 Encoding이 종료된 후 Transcoding 등의 미디어 처리 Process를 수행하면 대기 시간이 데이터 용량에 따라 증가할 수 밖에 없다. 따라서 본고는 기존의 Media Process 처리시 장시간의 대기시간을 절감하기 위한 방안으로 Encoding과 동시에 Transcoding, Quality Checking, Scene Detecting 등의 Media Processing 작업을 동시에 수행함으로써 사용자의 대기 시간을 최소화 할 수 있는 방법을 실험을 통하여 워크플로우 개선 방안을 제시한다.
-
기존 연구에서 무선 인지 네트워크의 성능 분석에 관한 연구는 많았지만 무선 인지 네트워크에 차량 통신을 접목시킨 무선 인지 차량 네트워크의 성능 분석에 관한 연구는 많지 않았다. 또한 최근 실질적인 채널환경을 고려하기 위해 불완전한 채널정보를 가잔 시스템에서의 성능 분석에 대한 연구가 많이 진행되고 있는데 무선 인지 차량 네트워크에서의 연구는 아직 진행되지 않았다. 본 논문에서는 불완전한 채널정보가 존재하는 인지 차량 네트워크의 성능 분석을 한다. 본 논문에서는 언더레이 (underlay) 무선 인지 네트워크를 가정하고 차량간 통신이 일어나는 2차 사용자 네트워크의 채널들을 double Rayleigh fading으로 모델링한다. 성능 분석의 지표로 불능 확률을 사용하고 컴퓨터 모의실험을 통해 분석된 불능확률 값이 상관계수가 변화함에 따라 어떠한 변화가 있는지 확인하였다.
-
음악 장르 분류 분야에서는 다양한 특징을 모아서 사용하는 방법과 support vector machine (SVM) 분류기가 주로 사용되고 있다. 이 논문에서는 거리 함수 학습를 음악 장르 분류에 적용하여 성능 향상을 꾀한다. 여러 거리 함수 학습 방법 중 하나의 방법을 선택하고, 일반적으로 많이 사용되는 특징 셋을 활용하여 다양한 특징 셋에 대해서 적용하였을 때, 실제 성능 향상이 있는지를 알아본다. 세 종류의 특징 셋을 사용하여 실험한 결과 두 가지 특징이 같이 있는 특징 셋에 대해서만 성능 향상이 있었으며, SVM보다 높은 성능을 보이지 못 했다.
-
최근 IT를 포함한 모든 산업 및 기술 영역에서는 융복합화(Convergence) 현상이 두드러지고 있으며, 이와 같은 현상은 모바일 시장을 필두로 방송 시장에도 본격적으로 도입 및 확산되는 추세이다. 현재 모바일 분야에서 플랫폼 기반으로 스마트폰 생태계를 주도해 온 구글 애플이 구글 TV iTV 등을 통해 스마트 TV 영역으로 플랫폼 확산을 추진 중이며, 삼성전자 LG전자와 같은 기존 TV 제조사들도 자체 개발 플랫폼을 기반으로 하여 스마트 TV 플랫폼 확산을 추진 중이다. 하지만, 각 제조사 및 유료방송 사업자별로 독자 플랫폼 기반의 독자 앱스토어 구축 시도로 인해 시장 파편화 현상(각기 다른 플랫폼 제공, 플랫폼별 제한적인 가입자 기반의 앱 및 개발자 부족, 차별화된 콘텐츠 부족)으로 인해 스마트TV 앱 생태계 구축에 있어서 글로벌 업체와 경쟁할 수 있는 규모의 경제 확립이 불가능한 상황이다. 이에 본 논문은 국내 케이블 방송 사업자들의 스마트 플랫폼 준비 상황 및 앱 생태계 구축 및 활성화를 위한 공동 앱스토어 추진 현황에 대해 연구하였다. 이를 위해 각 케이블 가입자가 채택한 스마트 플랫폼별 주요 특징, 공동 앱스토어 구축을 위한 표준화 진행 현황, 앱스토어 구축 현황 및 계획을 정리하였다.
-
본 논문에서는 문서 영상 처리의 중요한 전처리 과정인 텍스트 라인 추출을 위하여 가우시안 필터링 및 피크 검출을 이용하는 방법을 제안한다. 이는 문서 영상 내의 글자 영역의 픽셀 강도와 텍스트 라인 사이의 간격에 해당하는 강도의 차이로 인해 문서 영상의 각 열마다 높은 피크와 낮은 피크가 번갈아 가며 나타나는 것에 기반으로, 제안하는 알고리즘은 필터 스케일 추정, 필터량 및 피크 검출, 라인 성분 그룹화의 세 단계로 구성된다. 필터 스케일 추정 단계에서는 여러 초기 값으로 필터링하여 피크 차이 간의 히스토그램을 만듦으로써 글자 크기를 대략적으로 예축하며, 필터링 및 피크 검출 단계에서 앞서 예측된 스케일의 가우시안 필터를 이용하여 필터링 한 후, 각각의 열마다 피크를 검출한다. 마지막으로 라인 성분 그룹화를 통하여 검출된 피크를 서로 연결하여 하나의 텍스트 라인을 구성하는 성분들로 그룹화시켜 텍스트 라인을 추출한다. 실험 결과를 통하여, 제안하는 알고리즘은 이진화 과정을 거치지 않음으로써 균일하지 못한 조명환경 등으로 이진화 성능이 좋지 못할 경우에도 텍스트 라인을 추출할 수 있으며, 텍스트 라인 간격이 인정하지 않고 휘어진 라인을 포함하는 경우에도 적용할 수 있음을 확인 할 수 있다.
-
본 논문은 안경착용 얼굴영상을 위한 실시간 눈 인식 알고리즘을 제안한다. 학습 알고리즘에 기반한 기본의 눈 인식 방법은 안경을 착용한 얼굴영상이 입력으로 주어질 경우 안경의 다양한 크기와 색깔, 형태로 인해 알고리즘의 학습 효율이 크게 떨어져 낮은 눈 인식 성능을 갖게 된다. 제안하는 방법은 모폴로지 연산을 통해 얼굴영상에서 안경이 포함된 부분을 검출하여, 안경으로 인한 눈 인식 알고리즘의 성능저하를 막는다. 성능평가를 위해 제안하는 방법을 Viola & Jones의 눈 인식 학습 기반 눈 인식 알고리즘에 적용하였으며 Spacek의 얼굴영상 데이터베이스를 실험 영상으로 사용하였다. 실험 결과, 제안하는 방법은 기존 눈 인식 알고리즘의 처리속도를 15fps (frames per second)에서 14.2fps로 하락시키면서 인식률을 75%에서 96.3%로 향상하였다.
-
In the satellite system design, the processes from the initial design to launch take about 5 years and the broadcasting satellite lifetime goes over 15 years. Furthermore, global warming phenomenon causes rainfall rate increasing more and more in some regions on the earth. Consequently, at the stage of the satellite link design, we need to consider the future rain attenuation over 20 years. In this paper, we investigated two time-series system models for forecasting to consider the future rainfall rate for the satellite broadcasting service. We found that rainfall rate of the future 30 years is increasing continuously.
-
Saliency는 인간의 시각에서 관심 영역이나 객체를 찾기 위한 기법으로 최근 영상 리타겟팅, 영상분할 등에 다양하게 활용되고 있다. 기존 제안된 방법들을 전체영상을 대상으로 saliency map을 구하게 되어, 복잡한 객체들의 구성, 큰 전경객체들의 존재 등의 경우에는 성능이 저하되는 문제점이 있다. 따라서 본 논문에서는 배경이 존재하는 영상들을 대상으로 기존 방식중의 하나인 histogram based contrast(HBC)을 개선하는 방법을 제안한다. 배경영역의 빈도확률을 HBC에 적용하여 배경에 존재하는 픽셀값의 saliency을 감소하면, 상대적으로 전경에 존재하는 픽셀들의 saliency는 증가하게 된다. 실험에서는 제안한 기법으로 배경의 saliency는 감소하고, 전경객체는 증가하는 것을 증명하였다.
-
스캔된 어문/만화 저작물은 종이책을 스캔하여 PDF 및 EPUB 형태의 전자책으로 변환되지만, 아무런 복제방지조치를 취하지 않아 불법복제의 위험성이 매우 높다. 또한 사적으로 복제된 저작물들도 아무런 저작권 보호기술도 취해지지 않은 상태로 웹하드 등을 통해 불법유통되고 있다. 본 논문에서는 이러한 문제를 해결할 수 있는 어문/만화 저작물 식별 및 복제 방지 시스템을 제안하였다.
-
최근, 합법적 또는 비합법적 경로를 통한 만화 도서의 유통이 확산되고 있다. 만화 저작권자들의 권리를 보호하기 위해, 유통되는 만화 도서를 식별하는 기술은 매우 중요하다. 하지만, 만화 식별기술은 이제 연구가 시작되는 단계이며, 상업적인 활용을 위해서는 정확도 및 신속성 측면에서 많은 개선이 필요하다. 본 고에서는, 만화 도서의 콘텐츠 특성 기반의 핑거프린트 추출 기법을 제안하고, 만화 식별 시스템에 적용함으로써 제안하는 핑거프린트 추출 기법의 성능을 검증하였다.
-
최근 다양한 방송 및 영상 분야에서 사람의 행동을 인식하여는 연구들이 많이 이루어지고 있다. 영상은 다양한 형태를 가질 수 있기 때문에 제약된 환경에서 유용한 템플릿 방법들보다 특징점에 기반한 연구들이 실제 사용자 환경에서 더욱 관심을 받고 있다. 특징점 기반의 연구들은 영상에서 움직임이 발생하는 지점들을 찾아내어 이를 3차원 패치들로 생성한다. 이를 이용하여 영상의 움직임을 히스토그램에 기반한 descriptor(서술자)로 표현하고 학습기반의 판별기(classifier)로 최종적으로 영상 내에 존재하는 행동들을 인식하였다. 그러나 단일 판별기를 이용한 다양한 영상 인식을 수용하기에는 힘들다. 최근에 이를 개선하기 위하여 다중 판별기를 활용한 연구들이 영상 판별 및 물체 검출 영역에서 사용되고 있다. 따라서 본 논문에서는 행동 인식을 위하여 support vector machine과 spare representation을 이용한 decision-level fusion 방법을 제안하고자 한다. 제안된 논문의 방법은 영상에서 특징점 기반의 descriptor를 추출하고 이를 각각의 판별기를 통하여 판별 결과들을 획득한다. 이 후 학습단계에서 획득된 가중치를 활용하여 각 결과들을 융합하여 최종 결과를 도출하였다. 본 논문에 실험에서 제안된 방법은 기존의 융합 방법보다 높은 행동 인식 성능을 보여 주었다.
-
본 논문은 UCC(User Created Contents)라는 새로운 유형의 방송의 일종이 대두됨에 따라 모바일 기기를 주로 사용하는 UCC의 특성을 분석하여 UCC 서비스를 이용하는 모바일 기기의 인코딩과 업로딩에 따르는 에너지 소비를 계산하고 에너지를 효율적으로 사용할 수 있는 방식을 제안한다. 또한 제안한 방식의 에너지 효율을 시뮬레이션을 통해 입증한다.
-
본 논문에서는 실제 수술환경에서 자연스러운 손 동작을 이용해 의료영상을 제어하고 동시에 관심 있는 환부의 영상을 획득할 수 있는 인터페이스를 제안한다. 특히 제안하는 인터페이스는 손을 들어올리는 등의 수술을 방해하는 동작을 강요하지 않음으로써 자연스러운 상호작용을 가능하게 하며, 또한 수술 영역에 수술 부위를 표시하고 저장하는 것과 같은 부가적인 기능을 제공하여 의사의 수술여건과 편의를 보장한다.
-
본 논문에서는 클라이언트가 아닌 클라우드에서 공간 해상도를 더 늘리는 작업을 하는 것에 대해서 다루고 다루고자 한다. 그 방법은 Spatial Resolution Up Conversion (SRUC)하는 것이다. SRUC 란 SD 비디오를 더 높은 해상도인 HD 비디오로 전환하는 것을 의미한다. 클라이언트 장치에서의 SRUC 는 에너지 소비와 복잡도를 증가시킨다. 따라서 클라우드에 이러한 변환 작업을 분담해서 하게 하는 것은 클라이언트에서의 에너지 소모와 복잡도를 감소시키킬 수 있도록 한다. 통상적으로 HD 급 영상을 활용하는 모바일에서도 적용할 수 있는 방법이다.
-
본 논문에서는 HEVC(high efficiency video coding)의 후처리 필터 중 하나인 적응적 샘플 오프셋(sample adaptive offset, SAO) 기술을 고속화 하는 방법을 제안한다. 기존의 SAO 는 원 영상과 복원된 영상간의 오차를 최소화하기 위해 각 블록마다 오프셋 값을 계산하므로 연산 복잡도가 매우 높다. 따라서 제안한 방법에서는 다양한 입력 영상에 대한 오프셋 사용빈도를 알아보고, 그 통계를 기반으로 불필요한 오프셋 연산을 생략한다.
-
차세대 동영상 표준 코덱인 High Efficiency Video Coding(HEVC)은 기존의 AVC/H.264 보다 동일 화질 대비 최대 약 2배의 압축 성능을 보여준다. 이러한 HEVC의 성능을 얻기 위하여 복잡한 연산이 많은 기법이 도입되었고 이로 인하여 HEVC의 시간 복잡도는 AVC/H.264보다 더욱 증가하였다. HEVC의 시간 복잡도를 줄이기 위해서 다양한 고속 알고리즘이 논의되고 있고 인트라 예측 모드에서의 고속 알고리즘 연구 또한 많은 연구가 이루어지고 있다. 본 논문에서는 인트라 예측 모드 결정과정에서 HEVC에 구현된 Rough mode decision(RMD)와 Most probable mode(MPM)의 결과를 활용하여 고속화된 최종예측 모드 결정 방법을 제안한다. 실험 결과, HM 10.0의 All Intra 환경을 기준으로 BD-rate에서 약 0.9%의 손실과 함께 평균 24%의 속도 향상을 얻을 수 있었다.
-
최근 3D의 발전으로 다음 세대의 3D 기술로 디지털 홀로그램을 지목하고 있다. 본 논문에서는 프레넬릿 변환을 이용하여 디지털 홀로그램 압축을 위한 효과적인 양자화 방법에 대하여 제안하였다. 효과적인 양자화 방법을 위해 각각의 부대역의 특성에 고려하여 우선순위를 정하고 양자화를 적용하였다. 또한 PSNR을 높이고자 예외 인덱스를 적용하였다. 그 결과 2dB 정도 높아지는 것을 확인할 수 있었다. 실험결과에서는 최소 약 6:1부터 최대 약 181:1까지 압축을 수행하였고, PSNR을 이용하여 압축된 영상에 대하여 수치적인 결과를 분석하였다.
-
화면해설방송이란 시각장애인들이 TV 프로그램, 영화와 같은 미디어에 접근할 수 있도록 해주는 서비스로써 화면을 볼 수 없는 시각장애인들을 위해 상황 변화적 요소와 자막, 그래픽 등의 시각적 요소들을 설명하여 프로그램 내용의 이해를 도와주는 서비스이다. 이러한 화면해설은 대사나 효과음이 없는 부분에 전체 프로그램의 이해를 저해하지 않는 수준에서 삽입된다. 본 논문에서는 화면해설방송 제작을 위한 무 대사 구간 검출 방법을 제안한다. 본 방법은 방송스트림에 포함되어 있는 오디오와 자막 정보를 분석함으로써 화면해설을 삽입할 수 있는 구간을 검출한다. 실제 방송컨텐츠를 이용한 실험을 통해 본 방법을 검증하고 성능을 확인한다.
-
최근 범죄의 급격한 증가로 인해 사회적 불안감이 고조되고 있다. 이에 사람들의 범죄 예방에 대한 관심이 높아지고 있으며 지능형 CCTV의 발전에도 큰 영향을 미치고 있다. 본 논문에서는 일상적인 환경 잡음 데이터를 분석하였다. 수행 방법은 환경잡음 데이터를 주파수 영역으로 추출하였다. 향후 환경 잡음 데이터를 분석한 결과를 토대로 위험상황을 감지할 수 있도록 하여 보다 효과적인 범죄 예방을 기대한다.
-
본 논문에서는 환경 잡음에서 사람들의 비명소리를 검출하여, 위험상황을 식별하는 방법용 시스템을 구축하기 위해 비명소리의 특징을 분석한다. 비명 소리는 놀랬을 때, 다급할 때, 아플 때, 세 가지 상황으로 나누어 녹음을 진행하였고, 이를 주파수 신호로 바꾸어 분석을 하였다. 비명소리 데이터에서 amplitude 가 가장 크게 나타나는 주파수 대역을 분석하고, 상황 별로 비명소리에 대한 주파수 분포의 차이, 남성과 여성의 주파수 대역과 분포의 차이를 분석한다.
-
방송 콘텐츠의 판매수익은 한류 열풍, DMB, IPTV등 다양한 전송 매체의 등장으로 계속 증가 하고 있다. 콘텐츠 재판매를 위해선 콘텐츠에 있는 광고, 예고편 등과 같이 본 내용에 해당하지 않는 불필요한 부분을 제외한 본 내용만 원하는 포맷으로 재 인코딩 한다. 각 방송사는 이 작업을 수동으로 처리 하고 있다. 본 논문에서는 원 콘텐츠 변형 없이 영상 분석과 콘텐츠의 부가 데이터를 통해서 본 내용만 자동으로 검출 재 인코딩하는 시스템을 제안 한다. 또한 본 시스템은 자막도 재가공시 자동으로 삽입 할 수 있다.
-
Kim, Kwang-Yong;Lee, Yong-Hoon;Kim, Gun;Park, So-Ra;Pack, Myung-Sun;Lim, Bo-Mi;Lim, Hyoungsoo;Lee, Yong-Tae 92
최근 기상청에서는 대국민 지진조기경보 전달매체를 통하여 지진 관측 후 지진속보 혹은 지진통보 시간을 획기적으로 줄일 수 있는 '국가 지진 조기 경보 체계'를 2020년까지 구축하고자 하는 기본 계획을 수립하였으며, 본 계획의 일환으로 메시지 전달매체 중의 하나로 고려되고 있는 개인용, 이동형인 방송매체인 T-DMB 방송망과의 연계에 대한 연구가 진행되고 있다. 이에 본 논문은 지진 조기 경보 시스템과 지상파 DMB 방송망을 연계하여, 지진 재해와 같은 재난발생시 기존의 단순 속보형태로의 전달이 아니라, 수신기가 자동으로 재난방송 신호를 인지하여 사용자의 시청 유무와 상관없이 지진조기경보 정보를 제공할 수 있는 지진재해 자동인지 조기경보 서비스 기술 및 송수신 시스템을 소개한다. -
본 논문에서는 초고해상도(UHD) 비디오 캡처/재생 시스템을 위한 MXF 파일 포맷 기반 콘텐츠 입출력 방법에 대해 논의한다. 초고해상도 비디오의 경우, 기존 고해상도(HD) 대비 4배에서 16배 가량의 데이터를 송수신해야 하기 때문에 고속의 데이터 인터페이스를 필요로 할 뿐만 아니라, 디지털 방송에서 사용하는 MXF 파일 포맷에 기반한 콘텐츠 파일을 제공해야 한다. 이와 같은 문제점을 해결하기 위해 MXF 규격에 기반한 외부 에센스 구조를 바탕으로 실시간으로 초고해상도 비디오를 캡처/재생하는 방법을 제시한다. 따라서 제안하는 방식을 적용하여 초고해상도 비디오를 실시간 캡처/재생하는 효율적인 방송 시스템을 구축할 수 있을 뿐만 아니라 압축된 비디오에 적용할 경우 더욱 향상된 성능의 시스템을 구축할 수 있게 된다.
-
스마트폰과 스마트TV와 같은 다양한 콘텐츠 소비 단말들이 급속히 보급되는 최근의 IT환경에서는 콘텐츠 제작, 유통, 소비에 있어서 예전과는 다른 패러다임을 요구하게 되었다. 예를 들어 각기 다른 해상도, 연산량, 사용자환경 등의 다양한 조건들에 대한 고려가 중요한 문제로 부각되고 있다. 이를 해결하고자 단일 서비스 콘텐츠 패키지로 여러 단말들에게 적응적인 서비스를 제공하는 Scalable Application Description Language(SADL)에 기반한 스케일러블 어플리케이션 프레임워크가 제안되었다. 본 논문에서는 이러한 스케일러블 어플리케이션 프레임워크에서 적응형 서비스 콘텐츠를 쉽게 생산하고 패키징 할 수 있도록 이클립스 공개소스 플랫폼 기반의 저작도구를 제안 및 개발하였다. 개발한 저작도구는 유지 보수 및 확장성을 고려하여 모델-뷰-컨트롤러에 기반한 Graphical Editing Framework(GEF)를 이용했다. 제안하는 저작도구는 다양한 운영체제에서 작동하며, 유지보수 및 확장성이 우수하다. 또한 서비스 콘텐츠 개발을 위해 이클립스 플랫폼이 지원하는 다양한 플러그인 도구들을 그대로 활용 가능하다는 장점을 갖는다. 뿐만 아니라 본 저작도구는 기능의 추가적인 확장을 통해 홈 내 가상화 장치들을 위한 응용 프로그램 제작에도 활용할 수 있다.
-
본 논문에서는 사용자가 뉴스나 스포츠 중계 등의 라이브 방송을 제외한 녹화방송 프로그램 및 VoD콘텐츠를 시청하는 중에 화면 상의 상품에 대한 관심이 유발되었을 때, 객체의 좌표정보를 통해 사용자의 입력을 받아 객체의 부가정보를 실시간 검색하고 부가정보 데이터를 생성하는 방법을 통해 사용자에게 해당 객체의 부가 정보를 제공하는 방법을 제안한다.
-
단일 반송파 시스템은 다중경로를 가지는 무선채널을 통과할 때 심볼 간 간섭(Inter-symbol Interference, ISI)에 의한 영향을 크게 받으며 이를 보상하기 위한 등화방식은 그동안 많이 연구되어왔다. 본 논문에서는 단일 반송파 시스템에서 심볼 간 간섭의 영향을 보상하기 위해서 잡음 예측기와 결합된 이중 피드백 구조의 등화 방식을 제안한다. 또한, 제안된 등화 방식이 기존 반복 결정 궤환 등화기에 비해 향상된 성능을 가지는 것을 이론적 분석과 모의실험을 통해서 분석한다.
-
최근 들어 무선 통신 트래픽이 급증하고 있다. 때문에 주파수, 시간 등과 같은 무선 통신 자원의 효율적 활용이 매우 중요해 지고 있다. 이러한 관점에서 스펙트럼 효율이 낮은 단방향 중계 시스템에 비해 이론적으로 약 2배에 가까운 스펙트럼 효율을 갖는 양방향 중계 기술에 대한 연구가 최근 들어 활발히 이루어지고 있다. 하지만 양방향 중계 시스템이 갖는 높은 스펙트럼 효율을 극대화하기 위해서는 단방향 릴레이 시스템에 비하여 증가하는 오버헤드의 증가량을 최소화하면서 요구 성능을 만족하는 것이 매우 중요하다. 이러한 문제를 해결하기 위한 하나의 대안으로 본 논문에서는 증폭 후 재전송(amplify-and-forward) 양방향 중계시스템에서 결합적 간섭제거 및 채널 등화를 위한 적응형 수신기를 제안한다. 제안하는 수신기는 적은 오버헤드만을 갖기 때문에 양방향 중계기술이 갖는 높은 스펙트럼 효율을 그대로 유지할 수 있으며, 복잡도가 높은 역행렬 연산 없이 채널 추정 기반 최소평균자승에러 (minimum mean-square error) 수신기가 갖는 성능을 제공한다.
-
서브 홀로그램 디스플레이는 디지털 홀로그래피 디스플레이의 제한된 시역을 관찰자의 동공 크기로 맞게 구현하여 사용자가 더 넓은 범위에서 더 큰 영상을 느끼도록 만드는 홀로그래픽 디스플레이이다. 본 논문에서는 서브홀로그램 방식에서 시야 창 문제를 해결하기 위해, Depth 카메라와 스테레오 카메라의 하이브리드 구성을 이용하여 정밀한 사용자 동공 추적 기법에 대해서 제안한다. 저해상도의 깊이 카메라의 얼굴 인식 정보를 바탕으로 고해상도 스테레오 카메라에서의 얼굴 및 눈의 후보영역을 찾고, 고해상도 스테레오 카메라에서 후보 영역 내의 동공 위치를 잦아서 빠르면서도 정밀한 동공 추적이 가능하도록 하였다.
-
The blur amount of an image changes proportional to scene depth. Depth from Defocus (DFD) is an approach in which a depth map can be obtained using blur amount calculation. In this paper, a novel DFD method is proposed in which depth is measured using an infocused and a defocused image. Subbaro's algorithm is used as a preliminary depth estimation method and edge blur estimation is provided to overcome drawbacks in edge.
-
본 논문에서는 결합형 양방향 필터를 이용하여 실시간으로 깊이 영상을 구하는 방법을 제안한다. 제안한 방법에서는 Kinect 깊이 카메라로부터 얻은 깊이 영상의 화질을 실시간으로 향상시키기 위해 GPU 내의 상수 메모리와 2차원 영상 처리에 적합한 텍스쳐 메모리를 사용했다. 또한, 단일 화소에 대한 결합형 양방향 필터 연산을 각 GPU 쓰레드(thread)에 할당한 다음 병렬로 처리하여 계산량을 현저히 감소시킨다. 실험 결과를 통해, 제안한 실시간 깊이 영상 보정 방법이 깊이 영상의 화질을 향상시켰고, 초당 260화면의 속도로 동작하는 것을 확인했다.
-
Jang, Su-Jin;Kim, Yoon-Hwan;Kim, Hye-Eun;Lee, Woo-In;Kim, Dong-Hwan;Yoon, Sun-Ah;Yu, Hee-Yong;Kim, Woo-Youl;Seo, Young-Ho;Kim, Dong-Wook 120
본 논문에서는 키넥트 센서의 RGB영상을 이용하여 얼굴을 검출하고 검출된 영역의 깊이정보를 템플릿으로 사용하여 다수개의 얼굴을 추적하는 방법을 제안한다. 이 논문은 [1]의 단일 얼굴 추적방법을 다수의 얼굴을 추적하도록 확장한 것이다. 다수의 얼굴추적을 실시간으로 처리하기 위하여 영상을 down sampling 하여 사용한다. 얼굴 검출은 기본적으로 기존의 Adaboost 방법을 사용하나, 피부색만을 이용, 탐색영역을 최대한 축소하여 수행 시간 및 오검출율을 줄인다. 얼굴추적은 깊이정보를 템플릿으로 하며, 깊이값에 따라 크기, 탐색영역을 조정하고, 또한 일정 프레임마다 얼굴을 검출하며 겹침, 새로 나타남, 영상 밖으로 사라짐 등의 얼굴추적 시 발생하는 문제를 해결한다. -
2009년 출시된 영화 "AVATAR"가 stereoscopic방식 3D영화로 대단한 성공을 거둔 이후로 가전시장과 필름 시장에는 많은 3D 영상들이 stereoscopic방식으로 제작되어 유통되게 되었다. 하지만 기존에 제시되어온 two lens stereoscopic camera system은 두 대의 카메라를 사용하기 때문에 광학적 정렬과 기하학적 조절이 매우 어렵기 때문에 stereoscopic 영상을 촬영하고 보급 하는데 많은 문제점을 가지고 있었다. 따라서 하나의 광축을 가진 single lens stereoscopic camera system들이 기존에 제시되어 왔으나 여전히 single lens stereoscopic system에도 문제점이 존재한다. 이에 본 논문에서는 기존에 제시된 stereoscopic camera system을 two lens / single lens로 나누어 조사 분석하고, 분석한 문제점을 해결하기 위한 새로운 single lens stereoscopic camera system을 제안할 것이다.
-
양안식 3DTV 비디오의 효율적인 압축을 위해 다양한 기술들이 연구되었으며, 그 중 좌우영상으로 상이한 해상도의 영상을 사용하는 비대칭 양안식 영상은 인간의 시각시스템이 상이한 해상도의 양안식 양상을 높은 쪽 영상의 품질에 가깝게 인지하는 특성을 이용한 대표적인 비트레이트를 절감 방식이다. 이에 다양한 연구에서 좌우해상도 차이에 따른 화질 저하 정도를 측정하려는 시도가 이루어졌으나, 기존 연구에서는 적정 시청거리를 고려하지 않고 좌우 영상의 크기만을 고려하여 실험하였으며 따라서 각 연구별로 상이한 실험 결과가 도출되었다. 본 연구에서는 인간의 시각 시스템을 고려하여 적정 시청거리를 계산하고, 이에 따라 좌우영상 비율 별 화질평가를 수행하였다. 특히 본 연구에서는 좌영상을 IID급 방송콘텐츠로 가정하고, 우영상을 모바일 방송콘텐츠로 가정함으로써, 실험 결과의 방송 서비스 활용가능성을 높였다.
-
디지털 홀로그램 기록 방식에 있어서 기록하고자 하는 영상을 디지털화하는 작업과 더불어 영상을 필름에 투영시키기 위한 공간 광 변조기, 기록 광원을 생성하기 위한 광학 시스템 및 필름 이송을 담당하는 스테이지의 정밀한 제어가 필요하다. 본 논문에서는 디지털 홀로그래픽 기록 시스템을 개발함에 있어서 전체 운용 기능에 해당하는 제어 구조를 제안하고 제안된 구조의 기능과 구현된 결과를 통해 향후 개선 사항을 소개하고자 한다.
-
본 논문은 포인터 레이저를 이용한 3D 스캔방식을 제안한다. 3D 스캔이란 물체의 3차원 정보(x, y, z)를 추정하는 기술이다. 3D 스캔 기술은 과거에서부터 많은 연구가 진행 되었으며 스테레오 카메라, 패턴 인식 등 다양한 방식으로 3파원 정보를 추정 한다. 기존의 방식들은 물체의 표면 정보를 정확하게 스캔하는 장점을 가졌지만, 스캐너의 비용이 비싸고, 그 부피가 크다는 단점 때문에 상용화에 어려움이 많다. 본 논문은 기존 방법보다 부피가 작고 가벼우며 시스템 비용이 적은 포인터 레이저를 이용하여 3차원 정보를 추정하는 방법에 대하여 설명한다. 물체의 깊이 정보(z)에 따른 포인터 레이저의 영상에서의 위치 변화를 통하는 방식으로 3차원 정보 추정을 구현 하였다. 실험을 통하여 포인터 레이저만으로 3차원 정보가 추정 되는 것을 확인한다. 위 방법은 3D 스캐너의 부피가 최소화 되므로 다양한 제품에 부착되어 3D 스캐너의 상용화를 기대한다.
-
본 논문에서는 단일시점의 텍스처 영상과 깊이영상을 수신 측에 전송하여 수신 측에서 원하는 시점을 생성하여 시청하는 2D 또는 3D 시스템을 가정하고, 이에 대한 영상 콘텐츠의 소유권을 주장할 수 있는 디지털 워터마킹 방법을 제안한다. 따라서 이 방법에서는 기존의 영상에 대한 공격 뿐 아니라 시점이동도 공격으로 간주한다. 시점이동 공격에 대해 본 논문에서는 송신된 시점으로 시점을 재변환하여 워터마크 데이터를 추출하는 방법을 사용하며, 여기에는 미리 학습된 자료(NCC(normalized cross-correlation) 값)를 사용한다. 워터마크 데이터를 삽입하는 방법은 기존에 가장 흔히 사용되는 방법, 즉 원 영상의 특정영역을 DCT하여 특정 부대역에 데이터를 삽입하는 방법을 사용한다. 실험을 통하여 시점이동된 영상에서의 워터마크 데이터 추출의 어려움을 보이며, 원시점으로 이동한 경우와 그렇지 않은 경우 추출한 워커마크 데이터의 차이도 보인다.
-
홀로그램을 생성하기 위해서는 방대한 양의 연산이 필요하다. 또한 고속의 홀로그램 생성 하드웨어는 많은 량의 데이터를 처리하기 때문에 많은 량의 메모리 접근이 필요하다. AP(Application Processor) 칩과 같이 여러 기능을 수행하는 칩 내에서 같이 구동할 경우 메모리 접근 때문에 칩 전체적인 영향을 준다. 따라서 본 논문은 이전 연구에서의 고속 홀로그램 생성을 위한 하드웨어에서 메모리 접근에 대하여 고찰하고 본 연구팀에서 구현한 시스템 모델을 이용하여 접근 방법을 통하여 홀로그램 생성기의 메모리 접근속도에 대하여 분석하였다.
-
멀티미디어 시대에 있어 이미지 신호처리(Image Signal Processing, ISP) 기술의 중요성이 거듭 강조되고 있는 가운데, 디지털 신호의 해상도를 변경하기 위해 여러 가지 커널을 사용하여 영상을 scaling 하는 방법들이 제안되고 있다. 본 논문에서 는 cubic convolution scaler를 이용하여 영상을 확대 및 축소할 때 하드웨어 관점에서의 메모리 최적화를 주제로 다룬다. SoC 상에서는 라인 메모리 개념을 가지기 때문에 영상의 해상도를 변환할 때 많은 메모리를 사용하게 된다. 또한 scaling을 할 때 곱하기 연산이 들어가게 되면 그에 비례하여 복잡도와 그에 따른 비용이 증가하게 된다. 이에 메모리와 process단계를 최적화하는 방법을 제안한다.
-
UHDTV 시스템의 개발로 오디오에서도 보다 몰입감 있는 멀티채널 오디오 시스템에 대한 관심이 높아지고 있다. 이에, 과거 ITU-R에서 표준이 제정되어 극장 및 HDTV 등에 폭넓게 활용되어 온 5.1채널 대비 elevation 채널을 포함한 더 많은 채널 수를 사용하여 청취자에게 궁극의 몰입감을 줄 수 있는 멀티채널 오디오 시스템이 여러 표준화 단체를 통해 논의되고 있다. 이에 본 논문에서는 ITU-R에서 이루어지는 Advanced Multichannel Stereophonic Sound System 표준화 논의를 중점적으로 살펴보기 위하여, ITU-R의 구성과 현재까지 논의된 이슈 및 앞으로의 전망 등에 대해서 논하고자 한다.
-
다수의 음원이 특정한 공간에 산재하고 있을 때, 그 중 특정 음원에 주목하면 다른 음원과 분리되어 특정 음원만 들리는 현상을 칵테일파티 현상이라고 한다. 심리적인 이 현상에 영감을 받아 음원을 분리하는 알고리즘이 만들어졌다. 이런 음원 분리방법을 Blind Source Separation(BSS) 이라고 하는데, 여러 신호가 섞이는 과정을 모르는 상태에서 음원을 분리한다는 뜻에서 Blind Source Separation 이라고 한다. BSS에 사용되는 알고리즘으로 주로 PCA, ICA이 있다. PCA는 2차원의 경우를, ICA는 그 이상의 고차원의 통계적 특성을 이용한다. 이에 본 논문은 PCA를 이용하여 두 음원을 분리하는 알고리즘을 구현하는데 역점을 두었다. PCA는 주로 음원보다는 이미지 신호 처리에 초점이 맞추어져 있지만, 음원 분리에 있어서도 충분한 성능을 보여주므로, ICA를 이용한 음원 분리 알고리즘과의 비교를 통하여 장, 단점을 알아보고 추후 PCA의 응용 가능성을 알아보았다.
-
최근 뇌파에 관련된 연구가 IT 분야와 결합하여 많이 진행되고 있다. 우리의 연구에서는 음악의 선호/비선호를 구분 문제를 뇌파를 이용해서 접근하려 한다. 이를 위해서 데이터를 모으고 분석하는 과저에서 나온 실험결과를 이 논문에서 발표한다. 최대한 편안한 상태에서 음악을 들으면서 뇌파를 취득하였을 때, 선호하는 음악과 비선호하는 음악을 구분해서 들었을 때의 뇌파취득 결과와, 그렇지 않았을 때의 뇌파 취득 결과를 간단한 분류방법을 통해서 비교한다.
-
현재 MPEG에서 무료(Royalty-Free) 비디오 코덱으로 표준화 중인 IVC(Internet Video Coding)에서는 인트라 부호화를 위하여 DC 모드의 한 가지 예측 모드만 사용하고 있다. 이러한 기존의 인트라 부호화 기법은 부호화 모드를 시그널링할 필요가 없고 부호화 시간이 빠른 장점이 있지만 인트라 예측의 정확도가 많이 떨어짐에 따라 부호화 효율이 저하된다. 본 논문에서는 IVC의 인트라 부호화 성능 향상을 위하여 4 가지 예측 모드를 지원한다. 즉, 공간적 상관성을 고려하여 평활화된 참조화소 값을 사용하는 평활화된 다중모드 인트라 부호화 기법을 제안한다. 실험결과 제안된 기법은 All-Intra 부호화 구조에서 기존의 ITM 6.0 대비 7.4% 정도의 비트율 감소를 얻음을 확인하였다.
-
동영상 압축 표준 기술인 HEVC(High Efficiency Video Coding) 는 ITU-T와 ISO/IEC 의 VCEG과 MPEG 의 공동으로 표준화를 진행중이다. 최근 표준의 확장기술에 해당하는 방법으로 Range Extension을 표준화 중에 있으며, 기존에 존재하는 RDPCM에서 재차 잔차신호를 줄이는 방법으로 CRDPCM 방법을 제안한다. 제안하는 방법은 손실 압축에 해당하며 실험 결과에 따르면 약 0.7%의 성능 향상을 가진다.
-
본 논문에서는 다양한 멀티미디어 코덱을 고속으로 처리하기 위하여 전용하드웨어가 아닌 병렬 어레이 프로세서 기반의 U-Chip(Universal-Chip) 구조를 제안하고 TSMC 80nm 공정을 사용하여 11,865,090개의 게이트 수를 가지는 칩으로 개발하였다. U-Chip은 역양자화(IQ), 역변환(IT), 움직임 보상(MC) 연산을 위한
$4{\times}16$ 개의 프로세싱 유닛으로 구성된 병렬 어레이 프로세서와 문맥적응적 가변길이디코딩(CAVLC)을 위한 비트스트림 프로세서와 인트라 예측(IP), 디블록킹필터(DF) 연산을 위한 순차 프로세서와 DMAC의 데이터 전송 및 각 프로세서를 제어하여 병렬 파이프라인 스케쥴링을 처리하는 시퀀서 프로세서 등으로 구성된다. 1개의 프로세싱 유닛에 1개의 매크로블록 데이터를 맵핑하여 총 64개의 매크로블록을 병렬처리 하였다. 64개 매크로블록의 대용량 데이터 전송 시간과 각 프로세서들의 연산을 동시에 병렬 파이프라인 함으로서 전체 연산 성능을 높일 수 있는 이점이 있다. 병렬 파이프라인 구조의 H.264 디코더 프로그램을 개발하였고 제작된 U-Chip을 통해$720{\times}480$ 크기의 베이스라인 프로파일 영상에 대하여 코어 192MHz 동작, DDR 메모리 96MHz 동작에서 30fps의 처리율을 가짐을 확인하였다. -
Image distortions, such as quantization errors, can have a severe negative impact on the performance of computer vision algorithms, and, more specifically, on object detection algorithms. State-of-the-art implementations of the JPEG-2000 image coder commonly allocate the available bits to minimize the Mean-Squared-Error (MSE) distortion between the original image and the resulting compressed image. However, considering that some state-of-the-art object detection methods use the gradient information as the main image feature, an improved object detection performance is expected for JPEG-2000 image coders that allocate the available bits to minimize the distortions on the gradient content. Accordingly, in this work, the Gradient Mean-Squared-Error (GMSE) based JPEG-2000 coder presents an improved object detection performance over the MSE based JPEG-2000 image coder when the object of interest is located at the same spatial location of the image regions with the strongest gradients and also for high bit-rates. For low bit-rates (e.g. 0.07bpp), the GMSE based JPEG-2000 image coder becomes overly selective in choosing the gradients to preserve, and, as a result, there is a greater chance of mismatch between the spatial locations of the gradients that the coder is trying to preserve and the spatial locations of the objects of interest.
-
최근 Full-HD TV, UHDTV의 보급에 따라 고화질 영상에 대한 수요가 증가하고 있으며 N-Screen 서비스의 확장으로 고화질 영상을 빠르게 전송하는 문제의 중요성은 더욱 커지고 있다. 고화질 영상을 빠르게 전송하기 위해서는 압축 효율의 향상이 필요한데, 일반적으로 영상에 잡음이 많을 때에는 압축 효율이 떨어진다. 본 논문에서는 다양한 원인의 잡음들 중에 film grain noise에 초점을 맞추어 이를 조절하여 영상압축의 효율을 높이는 방법을 연구한다. film grain은 영화촬영 방법 및 환경 등에 따라 강도가 달라지기도 하지만 필름으로 촬영한 모든 영화에서 쉽게 관찰할 수 있으며 앞으로도 계속 포함이 될 것으로 예상되고, 디지털 영화의 경우에도 저조도에서는 이와 비슷한 특성의 잡음이 발생한다. 재안하는 방법에서는 film grain이 포함된 영상에서 grain을 추출/제거한 영상을 압축하며 추출한 film grain에서 작은 영역을 선택하여 sample grain을 만든 후 별도로 압축한다. 디코더에서 grain을 없앤 영상만을 보여줄 수 있지만, 경우에 따라 grain이 없으면 심미적으로 오히려 좋지 않은 결과가 보이기도 한다. 따라서 압축을 푼 후에는 sample grain에서 원본 영상 크기의 grain을 합성한 후 grain을 제거한 영상과 더하여 grain이 포함된 영상을 재 생성한다. 실험한 결과 원본과 유사한 grain이 생성되면서 압축효율이 향상됨을 확인할 수 있다.
-
최근 표준화가 완료된 HEVO(High Efficiency Video Coding)에서는 계층적 구조를 갖는 가변블록의 크기를 사용하고 재귀적으로 부호화를 수행사여, 최적의 부호화단위(CU: Coding Unit) 분할 구조와 예측단위(PU: Prediction Unit)를 결정함으로써 높은 부호화 효율을 얻을 수 있는 반면 부호화 복잡도가 증가하는 문제가 있다. 본 논문에서는 부호화기의 복잡도를 감소시키기 위한 고속 부호화 알고리즘으로 고속 모드 결정 기법을 제안한다. 제안기법은 상위 깊이(CU: Coding Unit)의 최적 모드와 부호화 율-왜곡 비용을 이용해서 현재 깊이 CU에서의 특정 모드의 율-왜곡 비용 계산을 생략함으로써 PU 탐색을 조기 종료한다. 즉, 상위 깊이 CU의 조건에 따라 화면간 예측 모드의 일부 또는 화면내 예측을 수행하지 않는다. 실험결과 제안기법은 HM 12.0대비 0.2%의 비트 증가에 22.9%의 계산시간 감소 효과를 얻을 수 있음을 확인하였다.
-
HEVC의 화면내 예측 부호화는 예측 모드를 최대 35개까지 확장함으로써 기존H.264/AVC에 비해서 향상된 부호화 효율을 갖는다. 반면 화면내 부호화의 복잡도 또한 크게 증가하여 복잡도 감소를 위한 고속 부호화 기법이 요구된다. HEVC의 차조모델인 HM에서는 화면내 부호화 고속화를 위해 RMD(Rough Mode Decision) 과정을 통하여 후보 모드를 결정하고 선택된 후보 모드에서 초종 예측 모드를 결정한다. 본 논문에서는 화면내 부호화의 복잡도 감소를 위하여 고속 화면내 예측 모드 결정 기법을 제시한다. 본 기법은 후보 모드를 결정하기 위한 RMD 과정에서의 탐색 모드 수와후보 모드로부터 최종 모드를 결정하기 위한 탐색 모드 수를 제한하는 방법을 결합하여 모드 결정을 위한 복잡도를 감소한다. 본 제안 기법은 실험결과 HM 12.0대비 1.0%의 비트 증가로 13.19%의 복잡도를 감소시킬 수 있었다.
-
최신 비디오 부호화 표준인 HEVC는 종래의 H.264/AVC에 비해 높은 부호화 효율을 달성하는 반면, 연산 복잡도 또한 크게 증가하여, 제한된 자원을 가진 휴대 단말에서 고화질 및 고해상도 영상의 실시간 복원이 어려운 문제점이 있다. 이러한 문제를 해결하기 위해, 본 논문에서는 HEVC 복호화기의 연산 복잡도를 감소시키기 위한 저 복잡도의 움직임 보상 기술을 제안한다. 제안 방법은 참조 픽셀 간의 유사성을 측정하여, 유사성이 높은 예측 단위에 대해 간략한 보간 필터를 적용함으로써 HEVC 복화기의 연산 복잡도를 감소시킨다. 실험 결과를 통해 제안 방법은 HEVC 복호화기의 연산 복잡도를 최대 13.5%를 감소시킬 수 있으며, 그에 따른 화질 열화는 약 0.48 dB로 크지 않는 것을 확인하였다. 뿐만 아니라, 제안 방법은 임계값의 조절을 통해 연산 복잡도 조절 복호화기의 실현 가능성을 확인할 수 있었다.
-
본 논문에서는 SVC와 MVC의 부호화 구조를 결합하여 구현된 스케일러블 다시점 비디오 부호화의 움직임 추정 기법과 DPB를 위한 GPB 기반의 RPL (reference picture list) 설계를 제안한다. 제안된 움직임 추정 기법에서는 부호화 과정에서 필요한 예측 부호화의 성능 향상을 위해서 서로 다른 시점 (view)의 픽처 정보를 참조픽처의 후보로서 사용한다. 또한, B픽처 예측의 경우 HEVC에서 사용하는 HEVC GPB 기술을 통해 참조화면에서 두 개의 움직임 벡터를 활용한다. 제안된 움직임 예측 구조에 의해서 압축된 비디오 데이터의 크기를 감소시켜 압축 효율을 증대시킬 수 있다. 다양한 실험을 통해서 제안된 예측 구조를 적용함으로써 스케일러블 다시점 비디오 부호화에서의 압축 효율의 향상을 얻어낼 수 있음을 확인하였다.
-
본 논문에서는 효과적인 홀로그래픽 비디오 서비스를 다양한 재생환경에서 제공하기 위한 스케일러블 코딩 방법을 제안한다. 이 방법은 홀로그램과 광원의 차영상을 사용하여 압축을 하는 방식으로 구성된다. 즉, 기존의 스케일러블 코딩방식인 홀로그램 해상도 스케일러블 코딩과 광원의 화질 스케일러블 코딩 방식을 조합하여 새로운 알고리즘을 제안한다.
$1,024{\times}1,024$ 크기의 홀로그램의 차영상에 대해서는 손실압축, 광원의 차영상은 무손실 압축을 이용하여 스케일러블 코딩을 수행함으로써 적응적인 서비스가 가능하도록 한다. -
최근 다양한 3D 콘텐츠들에 대한 사용자의 요구에 따라 HD(High Definition)화질 및 이를 넘어서는 고해상도(FHD(full high definition), UHD(ultra high definition))의 고품질 3D 방송 서비스에 대한 연구가 진행되고 있으며, 차세대 영상 기술로 주목되고 있는 3차원 비디오 기술은 사용자에게 실감 있는 영상을 제공할 수 있다, 하지만 많은 시점을 전부 촬영하는 것은 한계가 있으므로, 카메라의 깊이 정보를 이용하여, 전송하는 시점을 줄이고, 시점영상을 합성함으로써 사용하는 카메라의 수보다 더 많은 시점을 생성하는 방법이 필요하다. 현재 국제 표준화 기구인 MPEG(Moving Picture Experts Group)의 3차원 비디오 부호화(3D Video Coding, 3DVC)에서는 깊이영상을 가지는 3차원 비디오영상에 대한 효과적인 부호화 기술들에 대해 표준화가 진행되고 있다. 이에 본 논문은 HEVC 기반의 3D-HEVC에서 사용하는 표준 기술들에 대하여 소개하고, 현재 사용되고 있는 기술들에 대한 성능 평가를 분석 하였다.
-
최근 HD(High Definition)화질 및 UHD(Ultra High Definition)화질과 같은 고품질 방송 서비스가 등장하고, 무선 네트워크 기술의 발달로 스마트폰, 태블릿PC 등과 같은 다양한 휴대용 멀티미디어 기기들이 존재함에 따라, 소비자들은 다양한 환경에서 고해상도 영상을 고품질로 사용하기를 원하고 있다. 따라서 스케일러빌러티의 현실적 필요성이 점점 대두되고 있으며, 이에 따라 ISO/IEC의 MPEG(Moving Picture Experts Group)와 ITU-T의 VCEG(Video Coding Experts Group)이 공동으로 결성한 Joint Collaborative Team on Video Coding(JCT-VC)에 의해 시간, 공간, 화질 등이 확장성을 제공하는 Scalable Video Coding(SVC)의 표준화가 진행되고 있다. 이에 본 논문은 공간적, 시간적, 화질적 스케일러빌러티(Scalability)를 제공하기 위한 SHVC의 표준 기술들에 대해 설명하고, 기존 단일 계층 부호화 방식(Single Video Coding)으로 서로 다른 해상도의영상을 Simulcast부호화한 결과와 비교하여 SHVC의 부호화한 결과와 비교하여 SHVC의 보호화 효율에 대한 성능을 분석 하였다.
-
N-스크린 환경에서 방송사들을 포함한 사업자들은 온라인을 통해TV 프로그램을 시청자들에게 제공하고 있다. 사업자들은 N-스크린 서비스를 운영하면서 광고를 통해 수익을 창출하고 있는데, 모바일 이용이 활성화 되면서 N-스크린 광고 시장 규모도 증가하고 있다. 모바일 환경에서는 화면 크기의 제약으로 인해 기존의 이미지, 베너 형태의 광고 보다 동영상 광고방식이 유리하여 이에 대한 수요가 높은데, N-스크린 환경에서 다양한 화면 사이즈를 가진 기기에 동영상 광고를 제공하기 위해서는 광고 소재 관리가 필수적이다. 또한 온라인 광고 제공에 관여하는 광고주, 광고 대행사, 플랫폼 사, 매체 사 간에 협업이 가능한 시스템 개발이 요구된다. 본 논문에서는 N-스크린 환경에서 동영상 광고를 효율적으로 제공하고 운영하기 위한 시스템을 제안한다.
-
제한수신시스템(Conditional Access System, CAS)은 사용자의 조건에 따라 방송에 대한 접근을 제어하는 시스템으로 유료 방송 시스템에서 인가된 사용자만이 해당 프로그램에 접근할 수 있도록 하는 콘텐츠 보안 기술이다. 최근에는 기존의 하드 웨어 기반 CAS가 가지는 이기종 기기간 호환성과 다른 서비스와의 연동 등의 문제를 해결하고자 CAS 모듈을 소프트웨어로 구현하여 네트워크를 통해 설치하는 교환 가능형 제한수신시스템(eXchangeable CAS, 이하 XCAS) 방식을 도입하여 활발하게 서비스를 제공하고 있다. XCAS는 기존 CableCard방식이 가지는 CAS의 보안성과 분리교환 원칙을 유지하면서도 다양한 단말에 쉽게 설치하여 서비스가 가능하다는 점에서 큰 장점을 가지고 있지만, 방송수신만을 목적으로 하는 DTV(Digtal Television)에 대해 적용하기가 어렵다는 문제점이 존재하였다. 본 논문에서는 케이블방송환경에서 DTV를 통한 유료방송서 비스 제공을 위한 DTV 인증 및 XCAS 서비스에 필요한 SM(Secure Module) 모듈을 다운로드하기 위한 기법을 제안한다.
-
MPEG Media Transport (MMT)는 방송 서비스에서 방송망 및 IP망을 활용하여 미디어 데이터를 보다 효율적으로 전송하고 이를 저장 및 소비 할 수 있게 하기 위해 MPEG에서 개발 중인 표준이다. MMT에서는 방송프로그램을 하나의 Package로 정의하고, 해당 Package에서는 비디오, 오디오 및 데이터를 포함한 다양한 구성요소를 각각의 Asset으로 정의하고 있으며, 각 Asset은 전송 및 재생/저장의 최소단위인 MPU (Media Processing Unit) 파일들의 집합으로 구성되어져 있다. 이와 같이, MMT에서는 비디오 콘텐츠를 하나의 파일로 취급하는 기존의 방법과 달리 여러개의 MPU파일로 구성하게 함으로서, 가변적 네트워크 상황에 따라 효율적 전송 및 부분 저장을 가능하게 하였다. 본 논문에서는 여러개의 MPU파일로 구성된 MMT 콘텐츠를 각각의 MPU 파일별로 저장 및 접근을 가능하게 하고, 또한 여러개의 MPU파일들을 끊김없이 하나의 콘텐츠로 재생할 수 있는 재생기의 설계 및 구현방법을 제안하였다.
-
Go, Kyung-Hee;Cho, Suk-Hee;Choi, Jin-Soo;Chang, Il-Sick;Jang, Ho-Eun;Kim, A-Ra;Park, Goo-Man 204
본 논문은 클라우드 컴퓨팅환경에서 향후 TLS 기반 제작 및 편집의 중요성에 주목하여 UHD 콘텐츠 편집을 지원하는 MXF 구조에 관하여 논하였다. 기술의 발전으로 인해 화면의 해상도가 최소 4K UHD로 높아짐으로써 초고해상도 콘텐츠를 편집하기 위한 기술들이 필요하다. 이를 위해 대용량의 비디오 데이터를 높은 압축률로 부호화할 수 있는 기술이 지원되어야 한다. 본 논문에선 초고해상도로 인한 대용량의 UHD 비디오 제작을 위한 비트스트림을 지원하는 MXF의 에센스 콘테이너를 제안한다. -
국내 케이블TV는 이날로그방송 뿐만 아니라 디지털방송, 주문형 비디오, 초고속 인터넷, 양방향 서비스, 인터넷 전화 등의 다양한 서비스를 제공하고 있다. 하지만 종편, 보도, 홈쇼핑 등의 신규 채널 증가와 방송 통신 융합에 따른 다양한 양방향 서비스 도입, 시속적인 HD채널 확대 등으로 헌재 사용 가능한 주파수가 매우 부족한 상황으로 3DTV, UHDTV, 인터넷 기반방송 등의 차세대 방송 서비스 제공을 위한 주파수 확보 방안 마련 이 매우 시급하게 필요한 상황이다. 본 논문에서는 국내 케이블TV의 주파수 이용 현황 및 신규 주파수 수요 전망을 예측하고 다양한 효율적인 주파수 해결 방법을 모색하고 단계적으로 해결 방법을 적용하여 주파수를 확보하는 효율적인 주파수 이용방안에 대해서 기술하였다.
-
본 논문에서 적응적 탐색 영역(Adaptive Search Range)을 이용하여 개선한 제한된 1비트 변환 알고리즘을 제안하였다. 이 변환은 전역 검색 알고리즘 (Full Search Algorithm)을 사용한다. 그러나 이것은 매우 많은 연산량과 복잡도를 가진다. 제안된 알고리즘에서는 각 블록의 탐색범위를 결정하기 위한 움직임 벡터 (Motion Vector)와 함께 제한된 1비트 변환 알고리즘의 제한된 마스크 (Constrained Mask)를 사용한다. 실험결과를 통해 제안된 알고리즘은 움직임 예측의 정확도에 대한 성능을 비슷하게 유지하면서 평균적으로 Search Point의 수를 84% 줄일 수 있음을 보여준다.
-
본 논문에서는 객체 위주의 컬러 영상 검색을 위하여 영상의 saliency map을 이용해 객체 중심의 영상을 생성하고, 객체와 그 주변 영역에서의 대표 색상이 가지는 통계적 특성과 공간적 분포 정보를 이용하는 방법을 제안한다. 먼저, 영상의 saliency map을 이진화하여 영상을 객체/배경으로 분할하고 객체를 중심으로 객체/배경의 비율이 일정한 일정 크기의 영상을 생성한다. 생성된 영상에서 대표 색상을 추출하고, 각 색상이 영상에서 어떻게 분포하는가를 나타내는 이진 공간분포 지도를 형성한다. 그 후 영상 간의 대표 색상마다 이진 공간분포의 차이를 비교함으로써, 색상의 통계적 특성과 공간적 분포가 동시에 반영된 특징으로 영상을 검색한다. 본 논문에서 제안한 saliency map을 이용한 대표 색상 기반의 영상 검색 기법은 기존의 대표 색상 기반의 영상 검색보다 우수한 성능을 보여준다.
-
본 논문은 다양한 값의 가중치간 적용한 두 포인트 보간 필터를 제안한다. 기존 방법은 선행 보간 필터에 변형 함수와 가중치를 적용한 일반선행 보간 공식을 이용해 영상의 화질을 향상시켰지만 제안된 보간법은 일반 선형 보간 공식에 가중치 값을 다양하게 적용하여 2 점 보간법에서 실질적인 가중치 결정을 제공한다. 실험 결과에서는 제안된 방법이 기존 보간법보다 더 우수한 성능을 보여주는 것을 알 수 있다.
-
본 논문에서는 짝수 홀수 분해법 (even-odd decomposition; EOD) 에 기초한 CCI (cubic convolution interpolation) 변형된 방법을 제안한다. CCI는 선형보간법과 더불어 영상 보간에서 가장 많이 사용되는 보간법이다. 선형보간법과 비교하여 우수한 화질을 제공하지만, 복잡도 상당히 증가하는 문제점을 갖고 있다. 따라서, 본 논문은 최근 제안된 짝수 홀수 분해법을 활용하여 CCI에 대한 새로운 보간 방법을 제시한다. 제안된 방법의 성능을 검증하기 위해서 실험이 수행되었고 실험결과는 변형된 CCI 보간 방법이 복잡도를 줄임과 동시에 영상 화질을 개선할 수 있음을 보여 주었다.
-
정확한 움직임 추정 기술은 원본과 가장 유사한 영상의 복원에 효과적이고 압축률에도 중요한 영향을 미친다. 하지만 기존의 전역 탐색 (Full Search) 알고리듬과 Sum of Absolute Difference (SAD)라는 정합 오차 기준은 연산량이 높고 하드웨어 구현시 비효율적이다. 이를 보완하기 위한 1비트 변환 알고리듬은 움직임 벡터의 변화량을 0과 1의 연산으로 나타내는데, 이 알고리듬은 움직임이 많아 픽셀 값의 변화가 심한 블록의 변화량도 0과 1로만 표현한다. 그렇기 때문에 정확한 움직임이 반영되지 않고 그로 인해 낮은 Peak Siganl to Noise Ratio (PSNR)을 가져온다. 이 점을 개선하고자 본 논문에서는 참조블록들의 움직임 벡터를 파악하고 분류하여 선택적으로 움직임의 변화량이 큰 영역은 전역 탐색 알고리듬을, 움직임이 작거나 없는 영역은 1비트 연산을 수행하도록 하여 기존의 알고리듬과 비교하여 Peak Siganl to Noise Ratio (PSNR)측면에서 우수한 성능을 확인할 수 있었다.
-
본 논문은 최근 연구가 지속적으로 진행되고 있는 움직임 추정 기술 중 하나인 1비트 변환(One-bit Transform, IBT) 알고리듬의 정확도를 개선시킨 알고리듬을 제안하였다. 1비트 변환 알고리듬은 정합오차 기준을 기존의 Sum of Absolute Differences (SAI)에서 이진연산이 가능한 정합오차로 바꿔서 하드웨어 설계에 보다 적합하도록 제안된 알고리듬이지만 정합 과정에서 많은 오차를 야기하는 단점을 가지고 있다. 본 논문에서는 1비트 변환 알고리듬 과정 중 계산 되는 필터 값의 보정을 통해 움직임 추정의 정확도를 향상 시켰다. 실험 결과에서 제안된 알고리듬이 객관적인 화질 측면에서 기존의 1비트 변환 알고리듬보다 더 우수한 성능을 보이는 것을 확인할 수 있었다.
-
본 논문은 에지맵 기반의 삼차 스플라인 보간 방법을 이용한 컬러 디모자이킹 방법을 제안한다. 삼차 스플라인 보간 방법은 데이터 집합에 부드러운 곡선을 만드는 방법으로, 부드러운 영상을 만들기에 적합하다. 상, 하, 좌, 우 총 4가지 방향에 대하여 각각의 예측치를 얻어내고, 각 컬러 채널의 에지맵을 이용하여 최종적인 값을 보간한다. 실험결과에서는 기존의 보간 방법보다 주관적 화질과 Peek Signal to Noise Ratio(PSNR) 측면에서 더 나은 성능을 보였다.
-
지상파 방송이 아날로그 방송에서 디지털 방송으로 완전 전환되고 HDTV 방송이 표준으로 완전히 자리를 잡은 현재, 국내 방송의 대부분은 비월주사 방식(interlace)으로 송출이 되고 있으며, 이에 따라 비월주사 방식의 영상을 TV에서 사용하는 순차 주사 방식의 영상으로 바꿔주는 디인터레이싱은 여전히 TV방송을 위한 중요한 기법으로 남아있다. 이 논문에서는 영상에 나타난 물체의 에지 방향의 연속성을 고려한 효과적인 공간적 디인터레이싱 기법을 소개한다. 에지방향에 따라 보간하는 것은 디인터레이싱 결과물의 화질을 결정하는 데에 주요한 요소이다. 따라서 이 논문에서는 기존의 알고리듬에서 에지 방향을 결정하는 과정을 확장하여 좀 더 정확한 에지 방향 결정이 가능하도록 했다. 제안된 방법의 실험 결과는 기존의 주요한 공간적 디인터레이싱 기법들에 비하여 주관적, 객관적인 비교에서 우수함을 보여준다.
-
The quality of document image captured from electronic display might be worse when it is compared with document image captured from paper. The problem appears because of Moir? noise. This problem can lead to achieve inaccurate intermediate result for further image processing. This paper proposes a method to remove Moir? noise of document images captured from electronic display. The proposed algorithm is separated in two parts. In the first step, it corrects the text area region (foreground) with small area of smoothing. Then, it corrects the background area with large area of smoothing.
-
The quality of document images captured by digital camera might be degraded because of non-uniform illumination condition. The high illumination (glare distortion) affects on the contrast condition of the document images. This condition leads to the poor contrast condition of the text in document image. So, optical character recognition (OCR) system might hardly recognize text in the high illuminated area. The method to increase the contrast condition between text (foreground) and background in high illuminated area is proposed in this paper.
-
영상을 포함하여 다양한 방법으로 실내에서 위치를 확인하는 방법에 대한 연구가 진행되고 있다. 영상 기반의 측위 또한 여러 가지 방법이 있는데, 우리는 시스템 구축 비용이 많이 들지 않으면서도 많은 서비스에 활용 할 수 있는 영상 기반의 실용적 측위 시스템에 대한 연구를 하였다. 이 시스템은 실내에 미리 설치 된 간판이나 광고 등을 식별하고 이를 이용하여 실내에서 사용자의 위치를 구할 수 있다. 그러나, 영상 기반의 시스템이기 때문에 같은 영상이 서로 다른 참조 대상으로 등록 될 경우, 이것을 서로 구별 할 수 없다는 단점이 있다. 실내에서는 GPS 와 같은 위성 항법 신호 수신이 잘 되지 않기 때문에 GPS 를 위치를 확인하기 위한 목적으로 사용 할 수는 없다. 그러나, 특정 지점에서 수신되는 GPS 신호가 유사한 점을 이용하면, 서로 다른 위치에 설치 된 동일한 이미지의 참조 대상을 구별 할 수 있다. 이 방법은 추가적인 비용이 들지 않기 때문에, 영상 기반의 실용적 측위 시스템의 장점을 그대로 유지 하면서 측위 성능을 더 높 힐 수 있는 방법이다.
-
본 논문에서는 회귀도 기반의 중요도 검출 기법을 제안한다. 제안하는 기법은 각 군집의 분포 정보를 이용하여 중요도를 검출한다. 우선, 이를 입력 영상에 군집 기법을 수행한다. 그리고 각 군집의 분포를 분석하여 각 군집에 대한 회귀도, 응집도, 그리고 중심밀집도를 추출한다. 마지막으로 회귀도, 응집도, 그리고 중심밀집도를 곱함으로써 중요도를 검출한다. 실험 결과 제안하는 알고리즘이 기존의 기법들 보다 중요도를 정확하게 검출하는 것을 확인할 수 있다.
-
인간행동의 자동인식 기술은 영상보안 및 인간-사물 상호작용 분야에 핵심적 기술이다. 그러나 실제 비디오 환경에서는 인간 행동의 다양성 및 잡음 등 많은 제한점들로 인해 효과적인 행동인식에 어려움이 있다. 최근 이러한 문제점을 해결하기 위하여 많은 영상 처리 및 인식 분야에서 연구되고 있는 sparse representation 기반의 방법들이 제시되고 있다. 이에 본 논문에서는 효과적으로 sparse representation을 행동인식에 적용하고, sparse representation 기반 인간행동인식을 위해 사용되는 지역특징 및 전역특징에 대하여 비교했다.
-
정간보는 우리나라 전통 음악의 대표적인 기보방법 중 하나로서, 세종대왕 때에 창안이 되어 오늘날까지 사용되고 있다. 정간보의 경우, 우리가 흔히 접하는 서양의 오선보와 표기 방법에 많은 차이가 있어, 전통 음악을 전공하지 않은 사람들이 보고 이해하는 데에 어려움이 있다. 이러한 이유로, 정간보 악보를 오선보로 변환하여 사용하는 경우가 있는데, 정간보는 음의 높이와 길이 등을 기술하는 방법이 오선보와는 다른 형태를 가지고 있어, 정간보를 오선보로 변환하는 작업은 주로 사람에 의해 수기로 이루어지고 있다. 본 논문에서는 정간보를 자동적으로 오선보로 변환하는 방법을 제안한다. 이를 위해서는 정간보를 구조적인 디지털 파일 형태로 저장하는 기술과 디지털 파일 형태로 저장된 정간보를 오선보 악보로 변환하고, 이를 오선보를 저장하는 파일 형태로 저장하는 기술에 대한 연구가 필요하다. 선행 연구를 통해 정간보를 구조적인 디지털 파일 형태로 저장하는 방법이 제안되었는데, 본 논문에서는 디지털 파일 형태로 저장된 정간보 악보를 기반으로 이를 오선보로 변환하고, 파일 형태로 저장하는 방법을 제안한다. 제안한 정간보의 자동 오선보 변환 방법의 검증을 위해, 정간보 악보를 수기로 변환한 오선보 악보와 제안한 방법에 따라 자동 변환된 오선보 악보를 비교 분석하여 그 결과를 제시하였다.