• 제목/요약/키워드: Acoustical excitation

검색결과 105건 처리시간 0.024초

2.4 kbps 하모닉-CELP 코더를 위한 웨이블렛 피치 검출기 (Wavelet-based Pitch Detector for 2.4 kbps Harmonic-CELP Coder)

  • 방상운;이인성;권오주
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.717-726
    • /
    • 2003
  • 본 논문은 2.4 kbps 하모닉-CELP 부호화기를 위한 피치 검출기의 설계 방법과 전이 시점을 검출하고 그 값을 기준으로 유/무성음 변환 구간에 대한 합성 윈도우를 달리하여 효과적인 파형 보간이 이루어지도록 하기 위한 방법을 제안하였다. 하모닉-CELP 부호화기에서 유성음 구간은 과거와 현재 프레임의 표준 파형을 보간하여 이루어지므로 전이 구간에서 피치 주기가 반으로 줄거나 두 배로 예측되어질 경우, 피치주기의 심한 변화량에 의해 파형 왜곡 및 프레임 경계에서의 불연속을 발생시킨다. 또한 하모닉 합성을 할 때 삼각 윈도우에 의한 중첩-합산 (overlap-add) 방법을 사용하기 때문에 전이 구간에서 유성음 구간의 신호가 순간적인 증가 (감소)를 할 경우 삼각 윈도우의 영향으로 합성 여기 신호가 선형 증가 (감소) 하는 단점이 있다. 우선 피치 검출기의 설계는 정확한 피치의 검출을 하되 피치 더블링에 의한 프레임 불연속성을 막기 위해 1차 혼성 검색법을 사용하였으며, ACF에 의한 2차 검색으로 피치의 정확도를 높였다. 그리고 삼각 윈도우에 의해 합성 파형이 선형 증가하던 문제는 웨이블렛에 의해 검출된 GCI를 이용하여 전이 시점을 검출한 후, 그 값을 기준으로 사다리꼴 윈도우 설정을 하여 해결하였다. 실험 결과 파형 보간 코더에서 가장 문제가 되었던 피치 더블링이 사라졌으며, 피치 검색 오차율은 ACF 검출법에 비해 5.4% 개선되었고 웨이블렛에 의한 검출법에 비해 2.66% 개선되었다. 전이 구간에서의 MOS값은 0.13 향상되었다.

가변 임계값을 이용한 지각 필터의 적응적인 음질 개선 알고리즘 (Adaptive Enhancement Algorithm of Perceptual Filter Using Variable Threshold)

  • 차형태
    • 한국음향학회지
    • /
    • 제23권6호
    • /
    • pp.446-453
    • /
    • 2004
  • 본 논문에서는 잡음에 의해 열화된 오디오 신호를 가변 임계값을 이용한 적응 지각 필터를 사용하여 음질을 개선하는 알고리즘을 제안한다. 제안된 적응 지각 필터는 신호 구간마다 달라지는 신호의 세기와 잡음의 영향 정도를 고려하여 임계값을 가변적으로 조정함으로써 잔여 잡음을 효과적으로 제어하는 방식으로 지각적으로 개선된 음질의 신호를 얻을 수 있다 제안한 방식은 잡음에 의해 열화된 오디오 신호를 주파수 영역으로 변환한 후 임계 대역 기반의 임계 대역 에너지 (Critical intensity energy)와 마스킹 영향이 고려된 청각 자극 에너지 (Excitation energy)를 계산한 다음, 지각 필터를 기반으로 한 적응 지각 필터 알고리즘으로 각 단계별 지각 필터 응답을 임계값으로 이용하여 가변 임계값이 재조정되는 단계를 결정하게 된다. 신호의 구간별 에너지 크기에 의한 잡음에 의해 열화된 정도의 차이를 가변 임계값을 이용하여 고려함으로써 잔여 잡음의 효과적인 제어가 가능하게 된다. 제안한 방법은 다양한 신호대 잡음비에서 열화된 오디오 신호를 입력으로 사용하였다. 입력 신호대 잡음비가 15dB, 20dB, 25dB와 30dB의 각각의 경우에 대하여 잡음대 마스킹비 (Noise-to-mask ratio, NMR)와 청감 테스트 (Mean opinion score, MOS Test)를 시행하였다. 그 결과, 잡음대 마스킹비의 개선 측면에서 각각의 경우에 대해 17.4dB, 15.3dB, 12.8dB, 9.8dB의 개선을 확인할 수 있었고, 청감 테스트의 개선 측면에서는 각각 2.9, 2.5, 2.3, 1.7의 개선된 음질을 확인할 수 있었다.

CELP Type Vocoder에서 RTP 확장 헤더 데이터를 이용한 연속적인 프레임 손실에 대한 PLC 성능개선 (The Performance Improvement of PLC by Using RTP Extension Header Data for Consecutive Frame Loss Condition in CELP Type Vocoder)

  • 홍성훈;배명진
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.48-55
    • /
    • 2010
  • 패킷네트워크에서 사용하는 음성부호화기는 자체적으로 PLC (Packet Loss Concealment) 알고리즘을 사용하고 있지만 서비스에 적합할 만큼 좋지 않다. 더욱이 연속적인 패킷 손실에 대해서는 많이 취약하다. PLC 알고리즘은 크게 송신단 기반의 알고리즘과 수신단 기반의 알고리즘으로 나뉜다. 송신단 기반의 알고리즘은 추가정보를 전송하기 때문에 음질개선에 큰 성능을 갖는 반면 데이터 전송율이 높아지고 추가 지연이 발생하며 상호간의 호환이 불가능하다. 수신단 기반의 알고리즘은 수신된 데이터에 기반하기 때문에 추가지연이나 정보가 필요 없으나 음질개선에 한계가 있다. 본 논문에서는 RTP 헤더 정보 중 사용하지 않는 확장 헤더 데이터 (Extension Header Data: 32 bit)부분에 PLC를 위한 추가정보를 전송하는 방법을 제안한다. 이렇게 함으로써 송신단 기반의 알고리즘이 갖는 호환성 문제를 해결하고 음질 개선 성능을 향상 시킬 수 있다. 추가적으로 발생하는 지연 (delay)는 이미 수신단에서 네트워크상의 지연을 조정하기 위해 지터 버퍼 (jitter buffer)를 갖고 있기 때문에 제안하는 알고리즘으로 인해 발생하는 추가 지연은 없다. G.729 PLC를 위한 추가 정보는 LP 파라미터 합성용 MA필터 인덱스, 여기신호, 여기신호 이득 및 잔여신호 이득 파라미터로 프레임당 16 bit를 할당한다. 이는 RTP payload 전송 시 음성 데이터를 두 프레임인 20 ms 단위로 전송하기 때문이다. 성능 평가 결과 기존 대비 13.5%의 성능 향상을 보였다.

고음질 합성용 스펙트럼 보상된 시간축조절 피치 변경법 (On a Pitch Alteration Method by Time-axis Scaling Compensated with the Spectrum for High Quality Speech Synthesis)

  • 배명진;이원철;임성빈
    • 한국음향학회지
    • /
    • 제14권4호
    • /
    • pp.89-95
    • /
    • 1995
  • 파형부호화법은 음성신호에서 잉여성분 제거과정을 통해 유용한 파형의 꼴을 단순히 보존하는 방법이다. 음성합성분야에서 고음질의 파형부호화법은 분석에 의한 합성방식으로 주로 적용된다. 그렇지만 이러한 부호화법에서 파라미터들은 여기용과 성도 여파기용으로 분리되지 않기 때문에 이 파형부호화법을 규칙에 의한 합성 방식으로 사용하기는 어렵다. 파형부호화합을 규칙합성에 적용하려면 운율조절을 위해 피치변경법이 필요하다. 본 논문에서는 시간축 스케일링과 주파수상에서의 스펙트럼 보정을 통해 파형부호화법에서 피치를 변경할 수 있는 새로운 피치변경법을 제안하였다. 이 방식은 파형의 위상성분을 보존하는 시간-주파수 혼성법이고, 50%의 피치변경을 수행하였을 때 2.5%정도의 스펙트럼 왜곡을 나타내었다.

  • PDF

초음파 의료 영상에서 비집속 송신을 이용한 고속 음향 복사력 임펄스 영상법 (Fast Acoustic Radiation Force Impulse Imaging Using Non-focused Transmission in Medical Ultrasound Imaging)

  • 최승민;박정만;권성재;정목근
    • 한국음향학회지
    • /
    • 제31권3호
    • /
    • pp.151-160
    • /
    • 2012
  • 초음파 의료 영상에서 탄성영상은 암과 같은 종양의 진단에 도움을 준다. 본 논문은 초음파 음향 복사력을 이용하여 관찰하고자 하는 연조직에 힘을 인가하여 탄성 영상을 구현하였다. 데이터 획득 시간을 줄이기 위하여 송신 집속을 하지 않고 버스트 (burst) 형태의 평면파를 송신하여 모든 영상 영역에 동시에 음향 복사력이 인가되도록 하였다. 균일 탄성팬텀을 이용한 실험에서 송신 집속을 하지 않고도, 송신 시간을 길게 함으로써 탄성 영상을 얻기에 충분한 음향 복사력을 얻을 수 있음을 확인하였다. 그러나 기존의 집속형 음향 복사력을 이용한 영상과는 다른 시간 대 변위 특성이 관찰되었다. 제안한 탄성 영상 기법으로 초음파 병변 탄성 팬텀과 소의 간 실험에서 병변을 구별할 수 있음을 확인하였다.

음소단위를 이용한 소규모 문자-음성 변환 시스템의 설계 및 구현 (Design and Implementation of Simple Text-to-Speech System using Phoneme Units)

  • 박애희;양진우;김순협
    • 한국음향학회지
    • /
    • 제14권3호
    • /
    • pp.49-60
    • /
    • 1995
  • 본 논문은 소규모 시스템에 적용 가능한 한국어 문자-음성 변환 시스템의 설계 및 구현에 대한 연구를 목적으로 한다. 본 논문에서 채택한 음성합성 방법은 파라메터 합성법으로서 LPC(linear Predictive Coding)계열의 PARCOR(PARtial autoCORrelation) 계수를 음향 파라메터로 사용하였으며, 음성합성 단위로는 가장 기본적인 단위인 음소를 채택하였다. 합성 파라메터로는 유성음의 경우 PARCOR계수, 피치, 진폭을 무성음의 경우 잔차신호와 PARCOR계수를 사용하였다. 특히 무성음의 경우 LPC합성시 음질이 떨어진다는 단점이 있었으나, 본 논문에서는 LPC분석시 얻어지는 잔차신호를 무성음의 여기신호로 사용하여 단어 단위의 합성에서 60%의 이해도를 얻을 수 있었다. 합성결과 단어 단위의 합성에 적용 가능하였고, 문장단위의 합성을 위해서는 음소 지속시간 조절에 대한 연구가 진행되어야 할것이다. 본 논문의 구현환경으로는 486 PC상에서 음성의 입,출력을 위해 70[Hz]-4.5[KHz] 대역통과 필터와 증폭기, 그리고 TMS320C30 디지털 신호처리 프로세서를 장착한 DSP 보드를 사용하였다.

  • PDF

수중 SAW Device의 최적 설계법 (Optimal Design of Underwater SAW Devices)

  • 노용래
    • 한국음향학회지
    • /
    • 제9권4호
    • /
    • pp.18-32
    • /
    • 1990
  • 최근 신호 처리 기기와 센서로서 각광을 받고 있는 SAW Device 는 때론 목적에 따라 수중에서 사용해야 할 때가 있다. 그러나 유체내의 고체 표면을 전파하는 표면파의 경우, 유체내로의 에너지 손실로 인해 설계상에 많은 어려움을 주고 있다. 따라서 본 연구에서는 이러한 어려움을 극복할 수 있는 최적 설계법으로서, 컴퓨터 모형해석을 통해 수중에서 압전물질에 의한 표면파의 최대 발진 효율, 최소 전파 감쇄율, 그리고 pure mode 전파를 이룰 수 있는 SAW Device 의 최적 geometry, 즉 초적 압전 결정 평면, 표면과 전파 방향, 그리고 무차원 전파 계수 들을 구하였다. 본 논문에서는 표면파가 전파하는 고체 재료로서 PZT와 PVDF 적층, 그리고 쇠 하부층을 사용하였으나, 이 설계법은 임의의 유체층과 고체층의 조합에도 적용할 수 있다. 동일한 기술은 수중음향 계측기, antifouling, 그리고 산업 및 의료 분야 등에 쓰이는 센서와 발진기의 설계에도 바로 응용할 수 있다.

  • PDF

공기 전도형 출력을 갖는 정원창 자극형 인공중이의 출력방식 제안 (A Proposal of Output Method of Round Window Stimulation Type Middle Ear Implants using Acoustic Transmission)

  • 성기웅;이규엽;김명남;조진호
    • 한국멀티미디어학회논문지
    • /
    • 제21권6호
    • /
    • pp.678-684
    • /
    • 2018
  • In order to broaden the indication of middle ear implant, research has been actively conducted on the reverse output method that stimulates the round window. However, it is very difficult to transmit the vibration output effectively because the indivisual anatomical difference of the round window niche is very large and also the visual field is not secured even by a skilled otolaryngologic surgeon. In this paper, we propose a new reverse stimulation method of middle ear implants that transmits energy to the inner ear by using air as a medium. This can compensate for the disadvantages of the conventional method of transmitting vibration energy and minimizes the energy transfer efficiency interference due to the combination of the excitation point and the output device. It was shown that forward and backward transfer characteristics were obtained by cadaveric experiments, and it was shown that it can overcome the acoustical impedance of high round window and transmit energy to inner ear. The receiver, which is the output device of the conventional hearing aids, can generate a constant volume velocity, so it can have a high output at a limited volume, such as a round window niche. So, suggested method can overcome the high acoustical impedance of the round window and deliver acoustic energy to the inner ear.

적응형 다중 비트율 음성 부호화기를 위한 효율적인 대수코드북 검색법 (An Efficient Algebraic Codebook Search Method for ham Speech Coder)

  • 변경진;정희범;한민수
    • 한국음향학회지
    • /
    • 제22권2호
    • /
    • pp.129-134
    • /
    • 2003
  • 본 논문에서는 적응형 다중 비트율 (AMR: Adaptive Multi-Rate) 음성 부호화기의 구현 시 계산량을 가장 많이 차지하는 대수 코드북 검색과정의 계산량을 줄임으로써 효율적인 AMR 음성 부호화기를 구현하였다. 대수 코드북 검색의 계산량을 줄이기 위하여 기존의 AMR 음성 부호화기에서 사용하고 있는 깊이우선 가지 검색법 (depth first tree) 검색 방법을 개선한 고속 코드북 검색 알고리즘을 제안하였다. 제안된 방법은 검색과정에서 최적의 여기신호로 선택될 가능성이 적은 트리를 제거하여 검색의 복잡도를 줄이는 방법으로 트리 선택을 위한 추가의 계산량이 필요없으며 검색에 필요한 계산량은 기존의 깊이우선 가지 검색법에 비해 현저한 감소를 이루었으나 약간의 음질 저하가 있었다. 제안한 방법을 적용하여 AMR 음성 부호화기의 12.2 kbps 모드를 TeakLite DSP를 사용하여 구현한 결과 기존의 방법에 비해 약 40%의 계산량을 감소할 수 있었다.

잡음 에너지 제어를 통한 지각 필터 성능 개선 (Performance Improvement of Perceptual Filter Using Noise Energy Control)

  • 서정국;차형태
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.43-51
    • /
    • 2005
  • 본 논문에서는 잡음 에너지 제어를 통한 지각 필터의 성능을 향상시킴으로써 잡음에 의해 열화 된 오디오 신호의 음질을 개선하는 알고리즘을 제안한다. 기존의 방식에서는 묵음 구간에서 획득한 잡음 에너지를 사용하여 필터를 구성하여 사용하지만, 신호 구간마다 달라지는 신호의 세기 및 잡음의 환경 정도에 많은 영향을 받아 잡음의 에너지가 급격하게 변화한다면 음질의 개선률이 감소함을 알 수 있다. 그러나 제안하는 방식에서는 묵음 구간에서 추정한 잡음의 에너지 제어를 통해 초기 추정 잡음보다 가까운 추정 잡음을 얻음으로써 잡음 에너지가 급격하게 변화하여도 음질 개선률에는 변화가 적음을 알 수 있었다. 또한 저 대역에 영향을 미치는 잡음의 경우에도 다른 방법들과는 달리 음질의 개선이 뚜렷하였다. 기존 방식과의 비교를 위해 다양한 신호 대 잡음 비 (signal-to-noise ratio, SNR)에서 열화 된 오디오 신호를 입력으로 사용하였다. 입력 SNR이 5dB, l0dE, 15dB와 20dB의 각각의 경우에 대하여 SSNR (Segmental SNR)과 잡음 대 마스킹 비 (Noise-to-mask ratio, NMR), 음질 테스트를 수행한 결과, 청감 테스트 (Mean Opinion Score, MOS Test)결과의 향상과 음질의 개선을 확인할 수 있었다.