• 제목/요약/키워드: 무성아

검색결과 753건 처리시간 0.027초

G.723.1 MP-MLQ 부호화기의 성능개선에 관한 연구 (The Research of Improving The Performance of the G.723.1 MP-MLQ Vocoder)

  • 민소연;나덕수;김정진;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.49-52
    • /
    • 1999
  • 4.8kbps 내외의 전송률에서 양호한 음질을 제공하는 CELP 계열 음성 부호화기 중에서 인터넷 폰 및 화상회의를 목적으로 개발된 G.723.1은 5.3kbps ACELP(Algebraic CELP)와 6.3kbps MP-MLQ(Multi-Pulse Maximum Likelihood Quantization) 두 개의 부호화기를 포함하고 있다[1]. 이 중 MP-MLQ는 고정 코드북 검색 시 많은 계산량으로 인해 실시간 구현에 어려움이 따르고 있다. 이러한 문제점을 개선하기 위해 본 논문에서는 유/무성음을 분리한 후 grid bit를 먼저 결정하여 코드북을 검색하는 방법 제안한다. LSP 파라미터의 분포특성을 이용하여 유/무성음을 분리한 후 무성음에 대해서는 스펙트럼 정보만 전송하고 유성음에 대해서만 코드북 검색을 수행한다. 그리고 코드북 검색 시 Grid bit를 먼저 결정하여 수행하였다. Grid bit는 짝/홀수번째 전체 펄스를 이용하여 합성한 합성음과 DC 성분이 제거된 원음과의 비교를 통하여 결정하였다. 실험 결과 전체 처리시간은 평균적으로 약 $20.55\%$ 감소하였으며 주관적 음질평가 결과 음질 열하는 거의 발생하지 않았다.

  • PDF

가변율 half rate 음성 부호화기의 설계 (Design of a Variable half rate speech codec)

  • 성호상
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.293-296
    • /
    • 1998
  • 본 논문에서는 다양한 멀티미디어 서비스를 위해 가변율 half rate 음성 부호화기를 설계하였다. 유, 무성음과 묵음의 구분을 위해 본 논문에서는 프레임 에너지와 음성 파라메터들을 이용한 효과적인 voicing 결정 알고리즘을 사용하였다. 유성음을 위한 half rate 음성 부호화기는 저속에서 좋은 특성을 보이는 generalized AbS구조를 이용하였다. LPC 계수는 LSP 계수로 변환한 후 predictive 2-stage VQ를 통해서 양자화하며, 여기 신호는 음질저하를 최소화하며 복잡도를 감소시킨 shift 방식의 대수적 고정 코드북 구조를 사용하고, 적응코드북과 여기코드북의 이득은 VQ로 양자화 하였다. 무성음을 위한 부호화기는 대부분이 유성음을 위한 부호화기와 동일하지만, 무성음에서는 피치간 상관도가 매우 낮으므로 피치 보간 방법을 사용하지 않고 개루프로 피치 lag를 찾은 후 전체 프레임에 사용한다. 1 kb/s 부호화기는 묵음 구간과 주변소음 구간에 사용되며 이 구간의 신호를 피치 성분이 미약한 주변소음들로 제한하고 이에 최적인 부음성 부호화기를 설계하였다. 최종적으로 완성된 가변율 half rate 부호화기는 voice activity factor(VAF)가 0.47인 시험음성에서 약 2.6 kb/s의 평균 전송률을 보였다. 주관적 음질 평가의 일환으로 IS-96 표준 코덱인 가변율 8 kb/s QCELP와 A-B preference 시험을 실시하였다. 시험 결과 평균전송률이 약 2배인 가변율 8 kb/s QCELP 보다 우수한 음질 성능을 보였다.

  • PDF

음성신호에서 천이구간의 근사합성에 관한 연구 (A Study on Approximation-Synthesis of Transition Segment in Speech Signal)

  • 이시우
    • 한국콘텐츠학회논문지
    • /
    • 제5권3호
    • /
    • pp.167-173
    • /
    • 2005
  • 유성음원과 무성음원을 사용하는 음성부호화 방식에 있어서, 같은 프레임 안에 모음과 무성자음이 있는 경우에 음질저하현상이 나타난다. 본 논문에서는 같은 프레임 안에 유성음과 무정자음이 같이 존재하지 않도록 Zero Crossing Rate과 개별피치 펄스를 사용하여 무성자음을 포함한 천이구간을 추출하는 방법과 주파수대역을 분할하여 TSIUVC를 근사합성하는 방법을 제안한다. 실험결과, 0.547kHz 이하 2.813kHz 이상의 주파수 정보를 사용하여 TSIUVC 음성파형을 양호하게 근사합성 할 수 있었으며, TSIUVC의 추출율은 여자와 남자음성에서 각각 $91\%$$96.2\%$를 얻었다. 이 방법은 음성합성, 음성분석, 새로운 Voiced/Silence/TSIUVC의 음성부호화 방식에 활용할 수 있을 것으로 기대된다.

  • PDF

Level Crossing과 DPCM을 사용한 유성음/무성음/묵음의 분류 (Voiced/Unvoiced/Silence Classification of Speech Signal by Level Crossing and DPCM)

  • 김진영;성굉모
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1615-1618
    • /
    • 1987
  • 시간 영역에서 만들어진 음성신호의 파라미터을 이용하여 주어진 음성신호의 구간이 유성음, 무성음, 혹은 묵음인지를 분류하는 새로운 알고리듬을 제시하였다. 이에 사용한 파라미터은 구간내에서 샘플링된 값의 절대치 합과 일정한 level 이상의 peak의 합(T-peak), T-peak와 절대치 합의 비 그리고, DPCM의 절대치 합들이다. 이를 파라미터를 이용하여 간단히 유성음/무성음/묵음 구간을 분류 할였다. This paper proposes new algorithm for classifying speech signal frame into voiced, unvoiced, silence frame, using the parameters extracted from time domain behavior of speech signal The parameters used in this paper are absolute magnitude, the sum of peaks lager than reference level (T-peak), the ratio of T-peak to absolute magnitude and the magnitude of signal outputs of DPCM. Using this parameters, speech signal is more easily classified into voiced/unvoiced/silence frame.

  • PDF

퍼셉트론 신경회로망을 사용한 유성음, 무성음, 묵음 구간의 검출 알고리즘 (Voiced-Unvoiced-Silence Detection Algorithm using Perceptron Neural Network)

  • 최재승
    • 한국전자통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.237-242
    • /
    • 2011
  • 본 논문에서는 다층 퍼셉트론 신경회로망을 사용하여 각 프레임에서의 유성음, 무성음, 그리고 묵음 구간을 검출하는 구간검출 알고리즘을 제안한다. 다층 퍼셉트론 신경회로망의 입력으로는 고속 푸리에변환에 의한 전력스펙트럼 및 고속 푸리에변환 계수가 사용되어 네트워크가 학습된다. 본 실험에서는 원 음성에 백색잡음이 중첩된 음성을 신경회로망에 입력함으로서 각 프레임에서의 유성음, 무성음, 묵음 구간의 검출성능 결과를 나타낸다. 본 실험에서는 신경회로망의 학습 데이터 및 평가 데이터가 다를 경우에도 이러한 음성 및 백색잡음에 대하여 92% 이상의 검출율을 구할 수 있었다.

동축형 전극구조 변화시의 오존생성 특성 (Ozone Generation Characteristics by according to the Coaxial Electrode Geometry)

  • 조국희;이홍식;이형호
    • 조명전기설비학회논문지
    • /
    • 제14권2호
    • /
    • pp.68-74
    • /
    • 2000
  • 본 논문에샤는 동축형 전극구조 변화시의 중첨방전에 의해 발생되는 오존의 농도 효율 및 발생량 특생에 대해서 논했다. 오존생정올 향상시키기 위해 오존방전환의 새로운 형태를 제안하였으며 연면방전과 무성방전이 동시에 분리된 방전공간내에서 발생하도록 하였다. 전극구조에 대한 오존발생 의존성을 조사하지 워해 구조가 다른 형태(2전극-1캡,3전극-2캡 및 3전극-3캡형)인 방전관올 설계.제작하였고 실험은 오존발생특성을 살펴보지 위하여 60[Hz] 전원을 사용하여 무성방전과 연면반전을 같은 갭내에 중첩시켜 측정한 결과 무성방전을 이용한 전극구조보다 중첩방전올 이용한 전극에서 오존의 농도, 효율 및 발생량이 향상됨율 확인할 수 있었다.

  • PDF

Aspergillus nidulans 무성분화 촉진 조건의 단백체 및 해당 유전자 기능분석 (Functional Analysis of Aspergillus nidulans Genes Selected by Proteomic Analysis under Conditions Inducing Asexual Development)

  • 임주연;강은혜;정보리;박희문
    • 한국균학회지
    • /
    • 제45권3호
    • /
    • pp.196-211
    • /
    • 2017
  • Aspergillus nidulans의 포자형성 및 무성분화에 관여하는 새로운 인자를 찾고자, 포자형성 촉진 조건인 0.6 M KCl이 첨가된 배지와 첨가되지 않은 배지에서 자란 균사체의 단백질체 분석을 시도하였다. 2DE 분석을 통해 2,400여개의 spot을 확인하였고, 무성분화 유도 9시간 및18시간 별로 생성양의 변화양상을 기준으로 총 5개의 그룹으로 나눌 수 있었다. 기능 분석이 아직까지 이루어지지 않은 단백질을 암호화하고 있는 유전자들 가운데 DU 그룹에 속하는 AN1342와 DD 그룹에 속하는 AN9419 두 개의 유전자의 기능을 알아보고자 유전자결손 돌연변이주를 제작하고 표현형을 관찰하였다. Alanine-glyoxylate aminotransferase의 기능을 할 것으로 예측되는 AN1342을 결손 시키면 무성분화 기관인 stalk의 길이가 짧아졌고, 액체 배양 시 야생형과 달리 배지로 분홍색 색소가 분비되어 sspA라 명명하였다. AN9419 결손균주는 균사생장이 심각하게 저해되고 알라닌이 첨가되어야 균사생장이 가능하였으나 무성포자 형성은 거의 이루어지지 않았으며 GO분석을 통하여 alanyl-tRNA synthetase의 기능을 할 것으로 유추된 점에 근거하여 alaA라 명명하였다.

모어청자에 의한 일본어 어두 폐쇄음의 지각 (Perception of Japanese word-initial stops by native listeners)

  • 변희경
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.53-64
    • /
    • 2021
  • 일본어의 어두 폐쇄음은 일차적으로 VOT로 구별되며 유성음은 음 값의 VOT, 무성음은 양 값의 VOT를 갖는 것으로 알려져 있다. 최근의 연구에 의하면 유성음이 양 값의 VOT를 갖는 어두 유성 폐쇄음의 무성화 현상이 전국적으로 젊은 층을 중심으로 진행되고 있는 것이 확인되었다. 또한 지역마다 정도의 차이는 있으나 어두 폐쇄음 구별에 VOT 이외에 후속 모음의 F0 차이가 유효한 것이 밝혀졌다. 본고는 산출에 쓰이는 음향 변수 VOT와 F0가 지각 변수로도 유효한지를 검토한 것이다. 4개 지역의 대학생 55명을 대상으로 자연음과 합성음을 이용한 세 가지 지각 실험을 실시한 결과는 어느 지역에서나 어두 폐쇄음의 일차적 지각 변수로 기능하는 것은 VOT이며 예상했던 F0의 사용은 극히 한정적인 것으로 나타났다. F0는 VOT가 기능하지 않을 때에 높은 F0를 무성음으로 지각하는 경우는 있으나 반대로 낮은 F0를 유성음으로 지각하는 경우는 거의 보이지 않았다. 이러한 결과는 유성/무성의 구별에 관여하는 산출의 음향 변수와 지각 변수가 일치하지 않는 것을 뜻하며, 나아가 일차적 변수인 VOT의 구별이 어려운 상황에서도 F0의 적극적인 사용 없이 일상생활에서 유성/무성의 구별에 혼란이 없는 것은 VOT와 F0 이외의 다른 요인이 관여하고 있음을 시사한다. 본고에서는 산출에서 어느 정도 관여가 인정된 모음의 음질(H1-H2)이나 음향 변수가 아닌 문맥이 관여하고 있을 가능성에 대해 논하였으나 이에 대한 검증은 앞으로의 과제로 남아 있다.

후행하는 자음의 여러 특성에 따른 영어 모음 길이에 관한 연구 (A study on English vowel duration with respect to the various characteristics of the following consonant)

  • 유현빈;이석재
    • 말소리와 음성과학
    • /
    • 제14권1호
    • /
    • pp.1-11
    • /
    • 2022
  • 본 연구는 영어에서 어말 자음의 유무성성에 따라 선행하는 모음의 길이에 차이가 나타나는 현상이 어말 자음, (부분) 무성음화 정도, 폐쇄음의 파열 여부와 가지는 상관관계에 대해서 살펴보고자 한다. 또한, 선행 모음의 길이 차이에 대한 여러 설명 중 무성 자음 앞 모음보다 유성 자음 앞 모음을 더 길게 발화하여 어말 자음의 유무성성을 구별한다는 기능적인 관점을 중심으로 연구 결과를 보고자 한다. 본 연구는 영어 원어민 화자들을 대상으로 발화 실험을 진행하고 선행하는 모음의 길이, 어말 유성 자음의 (부분) 무성음화 정도, 어말 폐쇄음의 파열 유무를 측정하였다. 발화 실험 결과, 어말 자음의 유무성성에 따른 선행 모음 길이 차이의 비율은 어말 자음이 폐쇄음인지, 마찰음인지에 따라 달라지지 않았다. 또한, 어말 유성 자음의 (부분) 무성음화 정도가 크게 나타날수록 어말 유성 자음 앞 모음의 길이가 길게 나타나며 기능적 관점에서 예측한 바와 일치하는 결과가 나타났다. 마지막으로, 기능적 관점에 따른 예측과는 다르게 선행 모음 길이 차이의 비율은 어말 폐쇄음이 파열 없이 발화되었을 때보다 파열하여 발화되었을 때 더 크게 나타났다. 이러한 결과는 어말 자음의 유무성성에 따른 선행 모음 발화 길이의 차이를 기능적 관점으로만 설명하기에는 한계가 있다는 것을 시사한다.