• 제목/요약/키워드: band-limited audio

검색결과 9건 처리시간 0.024초

딥러닝 기반 음향 신호 대역 확장 시스템 (Deep Learning based Raw Audio Signal Bandwidth Extension System)

  • 김윤수;석종원
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1122-1128
    • /
    • 2020
  • 대역 확장(Bandwidth Extension)이란 채널 용량 부족 혹은 이동통신 기기에 탑재된 코덱의 특성으로 인해 부호화 및 복호화 과정에서 대역 제한(band limited)되거나 손상된 협대역 신호(NB, Narrow Band)를 복원, 확장하여 광대역 신호(WB, Wide Band)로 전환 시켜주는 것을 의미한다. 대역 확장 연구는 주로 음성 신호 위주로 대역 복제(SBR, Spectral Band Replication), IGF(Intelligent Gap Filling)과 같이 고대역을 주파수 영역으로 변환하여 복잡한 특징 추출 과정을 거쳐 이를 바탕으로 사라지거나 손상된 고대역을 복원한다. 본 논문에서는 딥러닝 모델 중 오토인코더(Autoencoder)를 바탕으로 1차원 합성곱 신경망(CNN, Convolutional Neural Network)들의 잔차 연결을 활용하여 복잡한 사전 전처리 과정 없이 일정한 길이의 시간 영역 신호를 입력시켜 대역 확장 시킨 음향 신호를 출력하는 모델을 제안한다. 또한 음성 영역에 제한되지 않는 음악을 포함한 여러 종류의 음원을 포함하는 데이터셋에 훈련시켜도 손상된 고대역을 복원할 수 있음을 확인하였다.

수정된 잡음 채움 기법을 적용한 3D 오디오 부호기 (A 3D Audio Codec Employing a Revised Noise Filling Method)

  • 김인철
    • 방송공학회논문지
    • /
    • 제26권3호
    • /
    • pp.327-330
    • /
    • 2021
  • 본 논문에서는 3D 오디오 부호기의 성능 향상을 위해 새로운 잡음 채움 기법을 제안한다. 제안한 잡음 채움 기법에서는 핵심 대역을 IGF 시작 주파수까지가 아니라 MAX_SFB로 설정되는 영역까지로 제한한다. 그리고, IGF 입력 패치의 모든 주파수 영역에 잡음 채움이 수행되도록 한다. 본 논문에서 수정된 잡음 채움 기법의 성능은 MUSHRA 테스트를 통해 평가되었고, 그 결과 기존의 방법보다 우수한 성능을 보임을 입증한다.

음질향상 알고리즘을 내장한 MPEG-1 오디오 디코더의 Embedded OS 플랫폼에의 구현 (An Implementation of Sound Enhanced MPEG-1 Audio Decoder on Embedded OS Platform)

  • 홍성민;박규식
    • 한국멀티미디어학회논문지
    • /
    • 제10권8호
    • /
    • pp.958-966
    • /
    • 2007
  • 본 논문에서는 음질향상 알고리즘을 내장한 MPEG-1 오디오 디코더를 Embedded OS(Linux)기반 플랫폼에 구현하였다. 네트워크 대역폭과 저장 공간의 제한점을 고려한 MP3, AAC, OGG 등과 같은 손실 오디오 압축 코덱들은 공통적으로 고주파 대역의 정보가 손실되는데, 이러한 고주파 신호성분 손실은 결국 표준 CD음질을 가지는 오디오 신호보다 제한된 저주파 대역만을 재생할 수 있게 된다. 본 논문은 손실된 고주파 대역의 신호성분과 하모닉 성분을 효과적으로 추정 및 복원할 수 있는 음질 향상 알고리즘을 MPEG-1 오디오 디코더 내부에 각 계층 I, II, III 특성별로 최적화하여 Embedded Linux 플랫폼으로 구현하였다. 기존의 MPEG-1 오디오 디코더와의 비교 청취 실험을 통해 본 논문에서 구현된 시스템이 신호 스펙트럼 및 음질 면에서 향상되었음을 확인할 수 있었다.

  • PDF

ARM 플랫폼 기반의 MP3 오디오 음질 향상 시스템 구현 (An Implementation of an ARM Platform based MP3 Sound Enhancement System)

  • 오상헌;박규식
    • 대한전자공학회논문지SP
    • /
    • 제44권1호
    • /
    • pp.70-75
    • /
    • 2007
  • 44.1kHz 샘플링 레이트의 표준 CD 음질의 오디오 신호를 인터넷 상에서 전송 및 분배하기 위해서는 네트워크 대역폭과 저장 공간의 제한 점을 고려해야 한다. 이러한 제한은 MP3, AAC, OGG 등과 같은 오디오 신호 압축 코덱을 이용하여 해결할 수 있지만, 이러한 코덱들은 공통적으로 고 주파수(High frequency) 대역의 정보가 손실 된다는 문제가 발생한다. 이러한 고주파수 손실은 결국 표준 CD음질을 가지는 오디오 신호보다 제한된 저 주파수 대역만을 재생 할 수 있게 된다. 일반적으로 오디오 신호의 고 주파수 성분은 위치정보 와 명료도, 재생 환경 등에 대한 음의 풍부한 정보를 제공한다. 본 연구에서는 MP3 오디오 코덱으로 디코드(decode) 된 오디오 신호에서 손실된 고 주파수 대역의 정보를 효과적으로 추정 및 복원하는 ARM 플랫폼 기반의 MP3 오디오 음질향상 시스템을 구축하였다. 제안된 시스템과 기존의 대표적인 알고리즘인 Liu의 HFR 과의 비교실험을 통해 제안된 알고리즘이 신호 스펙트럼상에서 고주파 신호 추정 및 복원 능력이 우수함을 볼 수 있고, 알고리즘 연산량도 약 2배 정도 절약할 수 있었다.

저비트율로 압축된 오디오의 음질 개선 방법 (Audio Quality Enhancement at a Low-bit Rate Perceptual Audio Coding)

  • 서정일;서진수;홍진우;강경옥
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.566-575
    • /
    • 2002
  • 이동통신망과 같이 제한된 대역폭에서 실시간 멀티미디어 스트리밍 서비스를 제공하기 위해서는 보다 낮은 비트율로 비디오와 오디오 데이터를 압축하여야 한다. 또한 대부분의 대역이 비디오 데이터를 위해 할당되어 있으므로 제한된 대역폭만이 오디오에 할당되게 된다. 오디오 데이터를 낮은 비트율로 압축하기 위해서는 압축율이 높은 알고리즘을 사용하거나, 표본화 주파수 (sampling frequency)를 낮춤으로써 데이터 양을 줄여 낮은 비트율로 부호화하여야 한다. 본 논문에서는 이러한 문제점을 극복하기 위해서 낮은 표본화 주파수로 오디오 신호를 압축하고, 낮은 표본화주파수를 사용함으로서 발생하는 대역폭의 손실은 소량의 부가정보를 이용하여 복원해 줌으로써 음질을 향상시키는 알고리즘을 제안한다. 높은 주파수의 스펙트럼을 복원하기 위하여 부호화단에서 낮은 주파수 대역과 다운 샘플링 과정 중에 손실되는 높은 주파수 대역간의 에너지비를 바크밴드에 구한 후 이를 부호화하여 복호화 단으로 전달하고 이를 이용하여 높은 주파수 성분을 복원하는 방법을 제안하였다. 제안된 방법을 이용하면 10%∼20% 정도의 추가적인 비트를 사용하면서 기존의 방식보다 세그멘탈 신호대 잡음비는 1㏈∼3㏈의 성능 개선을 보였으며, 주관적인 MOS 듣기 평가를 수행한 결과 기존의 방식보다 음질이 향상됨을 확인하였다. 또한 본 논문에서 제안한 방법은 주파수 영역에서 압축을 수행하는 모든 오디오 부호화 방식에도 적용이 가능하다.

다중 레벨 양자화 기법을 적용한 오디오 핑거프린트 추출 방법 (Audio Fingerprint Extraction Method Using Multi-Level Quantization Scheme)

  • 송원식;박만수;김회린
    • 한국음향학회지
    • /
    • 제25권4호
    • /
    • pp.151-158
    • /
    • 2006
  • 본 논문은 필립스의 음악 검색 기법을 기반으로 필터 뱅크 에너지 변화량과 음악의 통계적인 특성을 이용한 오디오 핑거프린트 추출 방법을 제안하였다. 기존의 필립스 방식은 제한된 주파수 영역을 너무 많은 필터 뱅크로 분할하여 분석함으로써 밴드들 사이에 연계성 및 왜곡에 대한 민감도가 증가하는 특징을 보일 수 있다. 제안된 방법은 필터 뱅크의 밴드 수를 줄여 왜곡에 대한 강인성을 증진시키고, 필터 뱅크 에너지의 변화량의 부호와 크기 정보를 통계적 특성을 고려한 양자화 기법을 이용해 2비트로 할당함으로써 오디오 핑거프린트의 고유성을 확보하였다. 추출된 2비트는 4개의 레벨로 정보를 표현함으로 각 레벨 사이에 연계성이 존재하게 된다. 이 같은 레벨 사이의 연계성은 유사도 측정 시 이용될 뿐만 아니라 오디오 핑거프린트를 기준으로 검색 영역을 확장하는 제안된 방식에서는 효율적인 검색 영역을 선택할 수 있는 정보로 활용 되었다. 제안된 방식은 다양한 주변 잡음환경 (거리, 백화점, 자동차, 사무실, 식당)에서의 실험을 통하여 주변 잡음에 강인한 특성을 보일 뿐만 아니라 검색 속도 또한 향상되는 특징을 보였다.

악성종양환자와 정상인이 발성한 모음의 좁은대역 스펙트럼값의 상관계수와 절대차이합 비교 (A Comparative Study of Vowels Produced by Normal Subjects and Patients with Malignant Vocal Folds by Correlation Coefficient and Difference Sum of Narrow-band Spectra)

  • 양병곤;왕수건;조철우;김형순;김은지;권순복
    • 음성과학
    • /
    • 제10권4호
    • /
    • pp.189-200
    • /
    • 2003
  • The objective of this study was to examine two new parameters by which we could screen people with malignant vocal folds. The new parameters were the difference sums and Pearson correlation coefficients between adjacent pairs of intensity level matrices of narrow-band spectra. Audio files from the Korean Disordered Speech Database were analyzed by Praat, a speech analysis software, to obtain matrices of 400 intensity levels at 16 time points of each sustained vowel spectra. We limited our study to 12 normal subjects and 20 patients with malignant vocal folds who recorded at least three Korean vowels at a sound-proofed booth in Busan National University Hospital. Results indicated that the average coefficients of the abnormal subjects were much lower than those of the normal subjects while the average difference sums of the patients were much higher than those of the normal ones. Also, we found that the degree of the malignancy of the vocal folds was related to the coefficients and sums. However, some subjects at the initial stages of cancerous vocal folds yielded almost comparable coefficients and difference sums to those of the normal speakers. Further studies on larger databases will be desirable to set certain criteria or threshold levels for screening people with vocal fold diseases.

  • PDF

대역 확장을 통한 MP3 오디오의 음질 향상 (A Quality Improvement of MP3-Coded Audios Using Bandwidth Extension)

  • 허소영;김인철
    • 방송공학회논문지
    • /
    • 제13권5호
    • /
    • pp.744-751
    • /
    • 2008
  • 본 논문에서는 대역 확장 기법을 이용한 MP3 오디오 신호의 음질 향상 방법에 대해 살펴본다. Liu가 제안한 고주파 복원 기법을 근간으로 하여, 제안한 음질 향상 기법에서는 복원 시작 지점을 결정하는 방법과 개선된 선형 예측 방법을 제시하였다. 또한 고주파 대역 성분 생성에 저주파 성분을 복사해 이용하는 방법과 함께 AWGN을 이용하는 방법을 제시한다. 제안한 방법은 주관적 음질 평가를 통하여 MP3 오디오의 품질을 개선시킬 수 있음을 확인할 수 있었다.

텍스트 마이닝을 이용한 현대 자동차 중국시장 소비자의 만족 및 불만족 요인 분석 연구: 다른 브랜드와의 비교 (Text Mining-Based Analysis of Hyundai Automobile Consumer Satisfaction and Dissatisfaction Factors in the Chinese Market: A Comparison with Other Brands)

  • 최염;남인용
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.539-549
    • /
    • 2024
  • 본 연구는 텍스트 마이닝 기법 중 빈도분석, 워드 클라우드와 LDA 토픽 모델링 등을 사용하여, 중국 시장에서 현대자동차를 중심으로 토요타, 폭스바겐, 뷰익, 지리 등의 자동차 브랜드와 비교하며 소비자 만족와 불만족의 키워드 및 토픽을 분석하였다. 연구 대상은 2021년식-2023년식의 다섯 브랜드의 준중형 차량으로, 이 차량들에 대한 소비자 만족과 불만족 리뷰를 수집하여 분석하였다. 분석 결과, 현대자동차 아반떼는 긴 축거를 포함한 다양한 만족 요인을 보여주었다. 그러나 아반떼에 대한 불만족 요인으로는 조종, 엔진 성능, 트렁크 공간, 샤시 및 서스펜션, 안전 구성, 음향 스피커의 수량 및 브랜드, 음악 회원, 격리대, 스크린반사, CarLife 및 지도 등이 지적되었다. 이러한 문제점들을 개선하면 현대자동차의 중국 시장에서의 경쟁력이 크게 향상될 것으로 보인다. 한편, 기존 연구들은 주로 문헌 연구와 설문조사에 초점을 맞추었으나, 이 방법들은 연구자가 설정한 변수에 한정된 소비자 인식만을 밝혀내는 데 그쳤다. 본 연구는 텍스트 마이닝을 통한 다양한 자동차 브랜드 간의 비교를 통해 시장 동향과 소비자 선호에 대한 더 깊은 이해를 도모할 수 있다. 또한, 현대자동차를 포함한 다른 브랜드들이 중국 시장에서의 마케팅 전략을 개선하는 데 유용한 정보를 제공한다.