• 제목/요약/키워드: speech signal processing

검색결과 331건 처리시간 0.025초

V/S/TSIUVC 스위칭을 이용한 음성부호화 방식에 관한 연구 (A study on Speech Coding Method using V/S/TSIUVC Switching)

  • 이시우
    • 한국산학기술학회논문지
    • /
    • 제7권6호
    • /
    • pp.1180-1184
    • /
    • 2006
  • 유성음원과 무성음원을 사용하는 음성부호화 방식에 있어서 모음과 무성자음이 있는 프레임에서 음질저하 현상이 나타난다. 본 논문에서는 음질을 개선하기 위해 V/S/TSIUVC 스위칭과 TSIUVC 근사합성 방법을 사용한 새로운 멀티펄스 음성부호화 방식을 제시한다. TSIUVC는 영교차율과 개별피치 펄스에 의하여 추출되며, TSIUVC의 추출율은 여자와 남자음성에서 각각 91%와 96.2%를 얻었다. 여기에서 중요한 사실은 양질의 TSIUVC 합성 파형을 얻기 위해서는 0.547kHz 이하와 2.813kHz 이상의 주파수 정보를 사용하여야 한다. V/UV를 이용한 MPC와 V/S/TSIUVC를 이용한 FBD-MPC의 비교평가를 하였다. 실험결과, FBD-MPC의 음질이 MPC의 음질에 비하여 상당히 개선되었음을 알 수 있었다.

  • PDF

8kbps에 있어서 ACFBD-MPC에 관한 연구 (A Study on ACFBD-MPC in 8kbps)

  • 이시우
    • 한국산학기술학회논문지
    • /
    • 제17권7호
    • /
    • pp.49-53
    • /
    • 2016
  • 최근 무선네트워크의 효율을 높이기 위하여 신호압축 방식의 사용이 증가되고 있다. 특히, MPC 시스템은 비트율을 줄이기 위하여 피치추출 방법과 유성음과 무성음의 음원을 사용하였다. 일반적으로, 유성음원과 무성음원을 사용하는 MPC 시스템에 있어서, 같은 프레임 안에 모음과 무성자음이 있는 경우에 재생 음성파형에 일그러짐이 나타난다. 이것은 대표구간의 멀티펄스를 피치구간마다 복원하는 과정에서 재생 음성파형이 정규화 되는 것이 원인으로 작용한다. 본 논문에서는 재생 음성파형의 일그러짐을 제어하기 위하여 피치구간 마다 멀티펄스의 진폭을 보정하고, 특정 주파수를 이용하는 ACFBD-MPC(Amplitude Compensation Frequency Band Division-Multi Pulse Coding)를 제안하였다. 실험은 남자와 여자음성에서 각각 16개의 문장을 사용하였으며, 음성신호는 10kHz 12bit로 A/D 변환하였다. 또한 8kbps의 부호화 조건에서 ACFBD-MPC 시스템을 구현하고, ACFBD-MPC의 SNR를 평가하였다. 그 결과 ACFBD-MPC의 남자 음성에서 14.2dB, 여자 음성에서 13.6dB 임을 확인할 수 있었으며, ACFBD-MPC가 기존의 MPC에 비하여 남자음성에서 1dB, 여자음성에서 0.9dB 개선되는 것을 알 수 있었다. 이 방법은 셀룰러폰이나 스마트폰과 같이 낮은 비트율의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다.

PDA 환경에서 자동화자 확인의 계산량 개선을 위한 연구 (A Study for Complexity Improvement of Automatic Speaker Verification in PDA Environment)

  • 서창우;임영환;전성채;장남영
    • 융합신호처리학회논문지
    • /
    • 제10권3호
    • /
    • pp.170-175
    • /
    • 2009
  • 본 논문은 PDA 디바이스에서 개인정보를 보호하기 위한 자동화자확인 시스템을 제안한다. 최근 M-커머스와 같은 모바일 환경을 위한 PDA의 용량이 확장되고 사용이 증가되고 있다. 그러나 너무 많은 계산량 때문에 PDA 디바이스에서 자동화자확인의 실질적인 응용은 여전히 많은 어려움이 존재한다. 본 논문에서는 이러한 문제점을 해결하기 위해서 음성발성 동안 스펙트럼 차감법과 음성 검출과 같은 전처리를 수행함으로써 계산량을 줄일 수 있는 방법을 적용하였다. 또한 빠른 처리 결과를 얻기 위한 은닉마코프모델의 최적 상태 정합과 시퀀스 확률비 테스트를 적용하였다. 전체적인 시스템은 PDA디바이스의 제한된 메모리와 낮은 CPU 속도에 적합하도록 간결하게 구현하였다.

  • PDF

Polyphase Representation of the Relationships Among Fullband, Subband, and Block Adaptive Filters

  • Tsai, Chimin
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.1435-1438
    • /
    • 2005
  • In hands-free telephone systems, the received speech signal is fed back to the microphone and constitutes the so-called echo. To cancel the effect of this time-varying echo path, it is necessary to device an adaptive filter between the receiving and the transmitting ends. For a typical FIR realization, the length of the fullband adaptive filter results in high computational complexity and low convergence rate. Consequently, subband adaptive filtering schemes have been proposed to improve the performance. In this work, we use deterministic approach to analyze the relationship between fullband and subband adaptive filtering structures. With block adaptive filtering structure as an intermediate stage, the analysis is divided into two parts. First, to avoid aliasing, it is found that the matrix of block adaptive filters is in the form of pseudocirculant, and the elements of this matrix are the polyphase components of the fullband adaptive filter. Second, to transmit the near-end voice signal faithfully, the analysis and the synthesis filter banks in the subband adaptive filtering structure must form a perfect reconstruction pair. Using polyphase representation, the relationship between the block and the subband adaptive filters is derived.

  • PDF

DSP 칩을 이용한 에뮬레이터 설계 (Design of Emulator using DSP Chip)

  • 이대영;이재학;김진민;김현호;배현덕
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1993년도 하계학술대회 논문집 A
    • /
    • pp.453-455
    • /
    • 1993
  • In this research, the digital signal processing PC board which employs TI's TMS320C25 is implemented. The board can perform following functions. spectrum analysis of speech and repetitive signal, digital filters emulation by convolution, signal generation of sinusoidal wave, rectangular wave etc.. In this system, communications between PC and DSP board. program down-loading to DSP board and recording and graphic of acquired and processed data in DSP board are executed by PC. Parallel interface and buffer memory are used in communications. Data acquisition and operation are carried out in DSP board. Resultant data are transmitted to PC and output through DAC.

  • PDF

음성·영상 신호 처리 알고리즘 사례를 통해 본 젠더혁신의 필요성 (Gendered innovation for algorithm through case studies)

  • 이지연;이혜숙
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.459-466
    • /
    • 2018
  • 젠더혁신은 연구개발의 전 과정에서 남녀의 생물학적, 인지적, 사회적 특성 및 행동방식의 차이에 의한 성 젠더 요소를 고려하여 남녀 모두를 위한 보다 나은 연구개발과 지식을 창출하는 과정을 의미한다. 본 논문의 연구목적은 ICT산업, 자동차 산업, 빅데이터, 로봇 산업 등에 활용할 수 있는 영상 음성신호처리에서 문헌연구 및 기존 자료를 분석하고 사례 조사를 통하여 젠더혁신의 중요성을 고찰하는 것이다. 본 연구에서는 젠더 연구를 기반으로 영상 음성신호처리의 관련된 최신 국내외 문헌을 검색하고 총 8편의 논문을 선정한다. 그리고 젠더분석 측면에서, 연구대상, 연구 환경, 연구 설계로 구분하여 살펴본다. 연구결과로써, 노인음성 신호처리, 기계학습과 젠더, 기계번역 기술, 안면 젠더인식 기술의 음성 영상신호 처리 알고리즘 논문 사례 분석을 통하여 기존의 알고리즘에 젠더편향성이 있음을 밝히고 이들 알고리즘 개발에서 상황에 맞는 성 젠더 분석이 필요함을 보인다. 또한 알고리즘 개발에 다양한 성 젠더 요소를 반영하는 젠더혁신 방법과 정책을 제안한다. 추후 ICT에서의 젠더혁신은 남녀 모두의 요구를 반영한 제품과 서비스를 개발로 새로운 시장 창출에 기여할 수 있다.

창함수 설계 기법을 이용한 FIR 디지털 필터의 성능 향상에 관한 연구 (A Study on an Performance Improvement of FIR Digital Filter using Window Function Design Method)

  • 이경효;배상범;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.351-354
    • /
    • 2007
  • 현대 사회에서 디지털 처리 기술은 다양한 분야에서 응용되고 있다. 대표적으로 음성 및 영상 처리에 관한 신호 처리 기술을 들 수 있으며, 이러한 신호 처리를 위한 필터는 크게 FIR 필터와 IIR 필터로 나눌 수 있다. FIR 필터는 IIR 필터에 비해 높은 차수로써 구현이 되어지는 단점이 있으나, 안정적이며 구현하기에 용이하다는 장점을 가진다. 또한 선형 위상 응답 특성을 가지고 있어, 파형 정보 특성이 중요시되는 곳에 사용되어지고 있다. FIR 필터 구현에 있어 주요한 문제점은 깁스현상을 최소화시키는 것이다. 따라서 본 논문에서는 변형된 창함수를 이용한 FIR 디지털 필터를 사용하여 기존에 제시된 방법과 비교하였다.

  • PDF

국가기록원 음성 기록물의 복원과 분석 (Restoration for Speech Records Managed by the National Archives of Korea)

  • 오세진;강홍구
    • 한국음향학회지
    • /
    • 제32권3호
    • /
    • pp.269-278
    • /
    • 2013
  • 국가기록원의 음성 기록물은 우리나라의 근현대사를 담은 중요한 기록물이다. 하지만 아날로그로 녹음된 방식은 시간이 지남에 따라 손실을 피할 수 없어 디지털로 변환하여 관리 및 서비스할 필요성이 있다. 그에 따라 왜곡이 발생한 부분에 대해 본래의 정보를 복원하는 작업은 매우 중요하며, 본 논문은 음성 기록물의 훼손 종류에 따라 4가지의 카테고리로 분류하고 음량, 정상 잡음, 돌발 잡음에 맞는 복원 알고리즘을 적용하였다. 그 결과 음량은 음성 존재구간에 대해서 -26 dBov로 조정했고 SNR은 10 dB이상 상승하였다. 특히 기존에는 음성이 훼손된 부분을 순차적으로 청취하여 개별적으로 문제를 해결해야 했기 때문에 방대한 자료를 복원하기는 불가능 했지만 자동 복원 알고리즘을 도입하여 보다 효율적인 방식으로 복원할 수 있게 되었다.

특정 대역 에너지를 이용한 한국어 기본 수자 음성의 백동 인식에 관한 연구 (A Study on the Automatic Recognition of Korean Basic Spoken Digit Using Energy of Special Bandwidth)

  • 한희;김순협;박규태
    • 대한전자공학회논문지
    • /
    • 제19권3호
    • /
    • pp.5-12
    • /
    • 1982
  • 기본 모음의 분석을 위한 특징 파라미터로 특정 대역의 에너지의 비를 이용하는 방법을 사용하여 이 파라미터와 영통과률(zero crossing rate;ZCR) 그리고 에너지 파라미터의 논리 조합으로 한국어 기본산자 음성의 인식을 시도하였다. 본 실험을 위해서 음성 신호는 차단 주파수 10KHz의 저역 여파기로 여파되었고 20KHz의 표본화율로 표본화 되어 IBM 370으로 시뮬레이션 되었다. 본 시뮬레이션에서는 리메쯔 교환 알고리즘[l3].[14]에 의해 61차, 120차, 25차, 25차 등 4개의 FIR 디지탈 여파기를 설계하여 사용하였다. 실험 결과 3인의 화자에 대해서 92%의 인식률을 얻었다.

  • PDF

Harmonic 분산값 최소화 알고리즘에 의한 주파수 영역 평탄화 기법 (The Technique of Spectrum Flattening by Algorithm for Minimized Harmonics Variance Value)

  • 민소연;김영규
    • 한국산학기술학회논문지
    • /
    • 제11권9호
    • /
    • pp.3558-3562
    • /
    • 2010
  • 음성신호처리 분야에 있어서 정확한 기본주파수(피치)를 검출하는 것은 매우 중요하다. 그러나 포만트의 영향과 천이 진폭의 영향으로 인하여 음성신호로부터 정확한 피치를 검출하는 것은 매우 어렵다. 따라서 본 논문에서는 음소의 천이나 변동의 영향이 적은 주파수 영역에서의 하모닉스 분산값 최소화 알고리즘을 통해 스펙트럼을 평탄화 하여 피치를 검출하는 방법에 대하여 연구하였다. 실험결과에서는 제안한 방법이 기존의 방법인 LPC법, 켑스트럼법과 비교하여 평탄화 특성이 어느 정도의 우수성을 보이는지를 평가하였다. 또한 각각의 방법을 적용하여 기본주파수를 검출한 결과를 비교함으로써 제안한 방법이 우수함을 입증하였다.