통합 검색 | Korea Science

MDCT 도메인에서 오디오 신호 특징을 고려한 초광대역 코덱 개선 (Enhancement of Super-wideband Coder by Considering Audio Feature in MDCT Domain)

홍기봉;정규혁;이인성
- 대한전자공학회논문지SP
- /
- 제48권5호
- /
- pp.129-136
- /
- 2011
본 논문에서는 입력신호에 따라 효율적인 부호화를 위해 다중모드를 가지는 초광대역 부호화기를 제안하였다. 최근에 개발된 G.718기반의 초광대역 확장 코덱은 초광대역에 존재하는 오디오 신호를 부호화하기 위하여 Generic모드와 Sinusoidal모드로 신호를 분류하여 부호화 하지만, 현악기, 관현악기와 같은 오디오 신호에 존재하는 멀티플 피치 및 하모닉 성분과 타악기와 같은 오디오 신호에 존재하는 Individual-Line 성분을 효율적으로 부호화하지 못하였다. 제안하는 방법은 오디오 신호에 존재하는 하모닉과 Individual-Line성분의 특징을 고려하여 모드를 세분화하였다. 성능평가를 위하여 객관적인 평가로 MDCT 도메인에서 SNR을 이용하였으며 MUSHRA 테스트를 통해 주관적인 평가를 하였다. 실험 결과 제안한 방법은 기존의 G.718 초광대역 부호화기보다 Individual-Line신호 경우 약 3dB, 하모닉 신호의 경우 약 0.8dB 높은 SNR을 보였으며 MUSHRA 테스트 역시 평균 5점 음질 향상을 확인하였다.
PDF KSCI

Spectral Band Replication 대역폭에 따른 MPEG USAC 부호화 성능 평가 (Performance Evaluation of the MPEG USAC According to the Spectral Band Replication Bandwidth)

안경준;정유선;백승권;강경옥;김인철
- 방송공학회논문지
- /
- 제16권5호
- /
- pp.705-713
- /
- 2011
본 논문에서는 SBR의 대역폭이 MPEG USAC의 전체 성능에 끼치는 영향을 다룬다. 여기서 SBR 대역폭은 SBR 코덱이 적용되는 주파수 영역을 말하고 SBR 비트열 성분 중 하나인 bs_stop_freq에 의해 규정된다. 다섯 개의 서로 다른 SBR 대역폭을 가질 때 USAC의 성능을 MUSHRA 테스트라는 주관적인 방법으로 비교하였다. 이 비교에서 전송률은 14~24Kbps로 한정하였고, 주부호화기로는 LPD만을 사용하였다. 실험결과 SBR 대역폭이 18KHz 이상일 때가 다른 대역폭에 비해 좋은 성능을 보이는 것으로 관측되었다.
https://doi.org/10.5909/JEB.2011.16.5.705 인용 PDF KSCI

해금 사운드 콘텐츠의 저작권 보호를 위한 워터마킹 알고리듬 (Watermarking Algorithm for Copyright Protection of Haegeum Sound Contents)

홍연우;강명수;조상진;정의필
- 융합신호처리학회논문지
- /
- 제10권4호
- /
- pp.214-219
- /
- 2009
본 논문에서는 해금 사운드 콘텐츠의 저작권 보호를 위해 해금의 주파수 특성을 고려한 워터마킹 알고리듬을 제안한다. 해금 음은 1500Hz~2000Hz 대역과 2800Hz~3500Hz 대역에서 배음 성분의 크기가 공통적으로 크게 나타나는데 이 대역을 워터마크 삽입대역으로 결정하였다. 제안한 방법은 원 신호에 푸리에 변환을 하여 주파수 영역으로 변환하고 삽입대역에 속한 배음 성분에 PN 시퀀스를 통해 생성한 워터마크 비트를 삽입하였다. 또한 저역통과 필터, 대역통과 필터, 잘라내기, 노이즈 추가, MP3 압축과 같은 공격에서 최대 1.41%의 BER을 보였고, 클래식, 팝, 가야금 등의 연주곡과 비교 실험 결과 해금에서 가장 뛰어난 성능을 보였다. 주관 청취 테스트인 MUSHRA 테스트 결과 해금 음에 대해서는 평균 98점 이상을 보였고 국악연주곡에서는 96.67점을 보여 모두 Excellent의 평가 결과를 보였다.
PDF

수정된 잡음 채움 기법을 적용한 3D 오디오 부호기 (A 3D Audio Codec Employing a Revised Noise Filling Method)

김인철
- 방송공학회논문지
- /
- 제26권3호
- /
- pp.327-330
- /
- 2021
본 논문에서는 3D 오디오 부호기의 성능 향상을 위해 새로운 잡음 채움 기법을 제안한다. 제안한 잡음 채움 기법에서는 핵심 대역을 IGF 시작 주파수까지가 아니라 MAX_SFB로 설정되는 영역까지로 제한한다. 그리고, IGF 입력 패치의 모든 주파수 영역에 잡음 채움이 수행되도록 한다. 본 논문에서 수정된 잡음 채움 기법의 성능은 MUSHRA 테스트를 통해 평가되었고, 그 결과 기존의 방법보다 우수한 성능을 보임을 입증한다.
https://doi.org/10.5909/JBE.2021.26.3.327 인용 PDF KSCI KPUBS

가변 핵심 대역 하향 표본화 비를 가진 MPEG USAC 성능 평가 (A Performance Evaluation of the MPEG USAC with Variable Core-Band Down-Sampling Ratio)

이재화;김인철
- 방송공학회논문지
- /
- 제18권1호
- /
- pp.106-114
- /
- 2013
본 논문에서는 내부 표본화 주파수와 핵심 대역 하향 표본화 비의 조정이 MPEG USAC의 전체 성능에 끼치는 영향을 다룬다. 여기서 내부 표본화 주파수는 실제 부호화될 때의 내부적인 표본화 주파수를 말한다. 핵심 대역 하향 표본화 비는 전체 부호화 대역폭에 대한 핵심 대역폭의 비를 나타낸다. 성능은 6개의 실험 음원에 대해 10명이 참가한 MUSHRA 검사를 통해 평가되었다. 실험에서는 기존의 1/2에 비해 1/3 혹은 1/4의 핵심 대역 하향 표본화 비를 사용하면 저전송률에서 부호화 성능을 향상시킬 수 있음을 보였다.
https://doi.org/10.5909/JBE.2013.18.1.106 인용 PDF KSCI

채널 간 위상차 파라미터 생략 기법을 이용한 오디오 부호화 (An Audio Coding Technique Employing the Inter-channel Phase Difference Skip)

김현휘;김인철
- 방송공학회논문지
- /
- 제21권3호
- /
- pp.369-379
- /
- 2016
본 논문에서는 음성/음악 통합 압축 기술(USAC)에 적용된 공간 오디오 부호화 기법인 MPEG 서라운드에서 채널 간 위상차(IPD) 파라미터를 효과적으로 생략하는 기법에 대해 다룬다. 기존의 방법에서는 파라미터 밴드의 IPD 파라미터가 모두 작은 경우에도 전체를 처리하여 전송한다. 이러한 경우 생략을 통해 비트 효율을 향상시킬 수 있다. IPD 파라미터의 심리음향적 민감도를 고려하여 청취 환경에서 인지하지 못하는 문턱 값을 추정하고, 문턱 값 아래의 위상차를 발생시키는 IPD 파라미터는 0으로 설정하고 전송하지 않는다. 제안하는 채널 간 위상차 파라미터 생략 기법을 적용하면 기존에 비해 38% 정도의 위상 파라미터 절감 효과를 얻을 수 있고, MUSHRA 청취 실험을 통해 복호화된 오디오의 음질 하락이 없음을 보인다.
https://doi.org/10.5909/JBE.2016.21.3.369 인용 PDF KSCI KPUBS HTML

향상된 버퍼 제어 방법을 사용한 3D 오디오 핵심 부호화기 (A 3D Audio Core-Codec Employing an Improved Buffer Control Method)

김인철
- 방송공학회논문지
- /
- 제25권2호
- /
- pp.233-241
- /
- 2020
본 논문에서는 3DA 핵심 부호화기의 FD 처리부의 성능 향상을 위해 새로운 버퍼 제어 기법을 제안하였다. 제안한 버퍼 제어 기법은 3GPP의 심리음향 모델과 스펙트럼 공백 회피 기법을 포함한 율-왜곡 제어부를 채택하였다. 그런 다음, 활동성이 높은 프레임에 충실한 비트 할당이 이루어질 수 있도록 3GPP 버퍼 제어 방법을 수정하였다. 본 논문에서 제안한 버퍼 제어 방법의 성능은 MUSHRA 테스트를 통해 평가되었고, 그 결과 3DA RM9 및 3GPP AAC의 버퍼 제어 방법보다 우수한 성능을 보임을 입증한다.
https://doi.org/10.5909/JBE.2020.25.2.233 인용 PDF KSCI KPUBS

Multi-band Approach to Deep Learning-Based Artificial Stereo Extension

Jeon, Kwang Myung;Park, Su Yeon;Chun, Chan Jun;Park, Nam In;Kim, Hong Kook
- ETRI Journal
- /
- 제39권3호
- /
- pp.398-405
- /
- 2017
In this paper, an artificial stereo extension method that creates stereophonic sound from a mono sound source is proposed. The proposed method first trains deep neural networks (DNNs) that model the nonlinear relationship between the dominant and residual signals of the stereo channel. In the training stage, the band-wise log spectral magnitude and unwrapped phase of both the dominant and residual signals are utilized to model the nonlinearities of each sub-band through deep architecture. From that point, stereo extension is conducted by estimating the residual signal that corresponds to the input mono channel signal with the trained DNN model in a sub-band domain. The performance of the proposed method was evaluated using a log spectral distortion (LSD) measure and multiple stimuli with a hidden reference and anchor (MUSHRA) test. The results showed that the proposed method provided a lower LSD and higher MUSHRA score than conventional methods that use hidden Markov models and DNN with full-band processing.
https://doi.org/10.4218/etrij.17.0116.0773 인용 PDF KSCI

Spatial Audio Coding 기술의 멀티채널 부호화 성능 비교 (Evaluation of Spatial Audio Coding Tools for Multichannel Audio)

장인선;서정일;문한길;강경옥
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
- /
- pp.153-156
- /
- 2004
Spatial Audio Coding (SAC)은 낮은 대역폭에서 다채널/다객체 오디오 신호를 전송하기 위해 제안된 기술이다. 본 논문에서는 MPEG 에서 SAC 기술의 평가 방법으로 채택된 Multi-Stimulus test with Hidden Reference and Anchor (MUSHRA) 실험 절차에 대해서 설명한다. 또한 제 69 차 MPEG 회의에서 제안된 4 개 기관의 SAC 기술에 대한 청취실험을 수행하고 그 결과를 분석한다.
PDF

다시점 방송 서비스를 위한 사용자 위치추적 기반 다채널 오디오 패닝 시스템 구현 (Implementation of a Person Tracking Based Multi-channel Audio Panning System for Multi-view Broadcasting Services)

김용국;양종열;이영한;김홍국
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2009년도 학술대회
- /
- pp.150-157
- /
- 2009
본 논문에서는 다시점 방송 서비스(multi-view broadcasting service)를 위한 사용자 위치추적 기반 다채널 오디오 패닝 시스템을 제안한다. 다시점 방송이란 각기 다른 시점에 해당하는 카메라들을 이용하여 촬영한 영상을 렌더링 해주는 방송 서비스이며 다채널 오디오 패닝 기법은 이러한 다시점 방송의 실감효과를 증대시키기 위한 오디오 렌더링에 필요한 기술이다. 이런 실감 오디오 기술을 다시점 방송 서비스에 적용하기 위해서 사용자의 시점정보를 얻을 수 있는 사용자 추적 기술 역시 필요하다. 이를 위해서 본 논문에서 제안한 기술은 크게 두 가지로 나눌 수 있다. 첫째로, 초음파 위성 및 수신기를 이용하는 사용자 추적 기술을 제안한다. 제안한 사용자 추적 기술을 이용해 약 10 mm 근방의 높은 해상도와 약 0.15초의 빠른 간격으로 사용자의 위치정보를 얻을 수 있었다. 둘째로, 공간 파라메터 기반 다채널 오디오 패닝 기술을 제안한다. 제안한 오디오 패닝 기법은 MPEG Surround로 압축된 오디오에 대해 MPEG Surround의 공간 파라메터를 이용하여 복호화 시 패닝된 오디오를 얻는 방법이다. 제안된 방법의 성능을 평가하기위해 음질 측면과 음상 정위 측면에서 성능을 평가하였다. 음질 측정은 MUSHRA 방법으로 이루어졌으며, 제안된 방식은 약 90점에 해당하는 MUSHRA점수로 평가되었다. 또한, 음상 정위 성능은 더미헤드를 이용하여 각 패닝 오디오에 대한 각도별 주파수응답을 측정하여 방사패턴을 분석하였다. 그 결과 본 논문에서 제안된 방식은 기존 파라메터 기반 오디오 패닝 방식에 비해 향상된 음질을 보임과 동시에 음상이 올바른 위치에 정위됨을 보일 수 있었다. 마지막으로 제안된 사용자 추적 기법 및 오디오 패닝 기법을 다시점 영상 재생 시스템과 결합시킴으로써, 사용자 추적 기반 다시점 방송 시스템의 프로토타입을 구현하였다.
PDF

검색결과 13건 처리시간 0.024초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)