• 제목/요약/키워드: Consonant

검색결과 417건 처리시간 0.028초

Effects of syllable structure and prominence on the alignment and the scaling of the phrase-initial rising tone in Seoul Korean: A preliminary study

  • Kim, Sahyang
    • 말소리와 음성과학
    • /
    • 제7권4호
    • /
    • pp.139-145
    • /
    • 2015
  • The present study investigates the effects of syllable structure and prosodic prominence on the patterns of tonal alignment and scaling of the phrase-initial rise in Seoul Korean. Two syllable structures (Onset (/#CVC.../ as in minsa) vs. No-onset (/#VC.../ as in insa)) and two prominence conditions (Focus vs. Neutral) were considered. Results showed that the alignment of the L and the H tones in the phrase-initial rise was affected by syllable structure but not by prominence. The time of L was before the vowel onset of the first syllable in the Onset condition (i.e., within the onset consonant) and it was after the vowel onset in the No-onset condition. The difference was attributable to the fact that the initial L was anchored at a fixed distance from the phrase boundary, which was about 30ms after the onset of the syllable in both cases. The time of H was also consistently observed about 20ms after the second vowel onset (i.e., /a/ in minsa/insa). Moreover, the rise time (the duration from the L to the H tones) was longer as the local syllable duration became longer due to different syllable structure and prominence conditions. Taken together, the results provide a support for the segmental anchoring hypothesis, which claims that both the beginning and the end of F0 movement are consistently aligned with segmental 'anchor' points with relatively high stability (Ladd et al., 1999). Results also showed that the scaling of the early rise was slightly influenced by syllable structure but not by prominence. The differences between the results of the current study and a previous study (Cho, 2011) are further discussed.

천이구간 추출 및 근사합성에 의한 음성신호 압축과 복원 (Speech Signal Compression and Recovery Using Transition Detection and Approximate-Synthesis)

  • 이광석;이병로
    • 한국정보통신학회논문지
    • /
    • 제13권2호
    • /
    • pp.413-418
    • /
    • 2009
  • 유 무성음의 음원을 이용한 음성부호화 시스템에서는 프레임 내에 유성자음과 무성자음이 공존하는 경우에 음질왜곡을 일으킬 수 있다. 따라서 프레임 내에 유성자음과 무성자음이 공존하지 않도록 하기 방법으로써 무성자음을 탐색하고 검출을 포함하는 천이 구간을 제안하였다. 본 연구는 최소 자승법과 주파수 대 역 분할법을 사용함으로써 TS 근사합성의 새로운 방식을 제시하였으며 결과적으로 이는 0.547KHz이하와 2.813kHz 이상에서의 주파수 정보를 이용함으로써 TS내에서 고품질의 근사합성 파형을 얻을 수 있었다. 보다 중요한 것은 최대 오류신호는 TS 내에 저 왜곡 근사 합성파형이 생길 수 있다는 것이다. 이 방식은 유성음/묵음/TS의 새로운 음성부호화, 음성해석 및 음성 합성에 적용할 수 있으리라 생각한다.

신경망 학습 코드에 따른 오프라인 필기체 한글 인식률 비교 (Comparisons of Recognition Rates for the Off-line Handwritten Hangul using Learning Codes based on Neural Network)

  • 김미영;조용범
    • 전기전자학회논문지
    • /
    • 제2권1호
    • /
    • pp.150-159
    • /
    • 1998
  • 본 논문은 필기체 한글의 특징을 추출한 후 이를 신경망을 이용하여 인식하였다. 한글의 특징 추출을 위해 $5{\times}5$ 윈도우 방법을 사용하였는데, 이는 $3{\times}3$ 윈도우 방법을 수정한 것이다. 추출된 특징을 이진화 코드로 변환하여 신경망의 입력으로 사용하며, 백프로퍼게이션 알고리즘으로 학습시켰다. 수직 모음, 수평모음, 자음 인식을 위한 3개의 신경망을 각각 구성하였고, 결과를 비교하기 위하여 3가지 학습 방법을 사용하였다. 3가지 학습 방법은 고정 코드 방법, 학습 코드 방법 I, 학습 코드 방법 II이고 학습 코드 방법 II가 가장 좋은 결과를 보였다. 이 경우 수직 모음과 수평 모음은 100%의 인식률을, 자음은 93.75%의 인식 결과를 보였다.

  • PDF

경계선 기울기 방법을 이용한 다양한 인쇄체 한글의 인식 (Recognition of Various Printed Hangul Images by using the Boundary Tracing Technique)

  • 백승복;강순대;손영선
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.1-5
    • /
    • 2003
  • 본 논문에서는 CCD 흑백 카메라를 이용하여 입력되는 인쇄체 한글 이미지의 문자를 인식하여 편집 가능한 텍스트 문서로 변환하는 시스템을 구현하였다 문자 인식에 있어서 잡음에 강한 경계선 기울기 방법을 이용함으로써 문자의 구조적 특성에 근거한 윤곽선 정보를 추출할 수 있었다. 이를 이용하여 각 문자 이미지의 수평 및 수직 모음을 인지하고 6가지 유형으로 분류한 후, 자소 단위로 분리하고 최대 길이 투영을 사용하여 모음을 인식하였다. 분리된 자음은 경계선이 변화되는 위상의 형태를 미리 저장된 표준 패턴과 비교하여 인식하였다. 인식된 문자는 KS 한글 완성형 코드로 문서 편집기에 출력되어 사용자에게 제공되는 시스템을 구현하였다.

설소대 절제술이 설운동과 발음에 미치는 영향 (THE EFFECT OF LINGUAL FRENECTOMY ON THE TONGUE MOTION AND SPEECH)

  • 김용덕;박성희;정인교;손우성;김욱규;신상훈
    • Journal of the Korean Association of Oral and Maxillofacial Surgeons
    • /
    • 제28권4호
    • /
    • pp.310-317
    • /
    • 2002
  • We have examined 20 tongue-tie patients who had been operated the lingual frenectomy in Dept. of Oral & Maxillofacial surgery, Pusan National University for the effect of the lingual frenectomy on the tongue motion and speech, and divided patients into groups by age. Each group was separated as follows ; the age of 5-6, 7-9, 10-12, 13-15, and 16-18. We measured the frenal lengh, the range of tongue motion and evaluated the speech pre- and postoperatively. The preoperative patient groups have larger tongue tips and smaller lingual frenums than normal ones. In the preoperative patient group, there was significant obstacle of the protrusive and superior movement of the tongue. The exception was the laterotrusive movement on both sides. There was the lower value of the Picture Consonant Articulation Test(PCAT) in the preoperative 5 to 6 year-old group compared with normal group. In other age groups, there was no significant difference. The range of postoperative PCAT in all age groups has become as similiar as that of normal group. The 5 to 6 year-old group which had significant difference in PCAT was improved in PCAT. In conclusion, we propose that the PCAT as well as anatomical tongue size and functional tongue movement is the basis of the indication of lingual frenectomy and the 5-6 year-old is the optimal time of the lingual frenectomy for improvement of the tongue movement and the speech.

SOM과 LVQ에 의한 자음의 분류 (Classification of Consonants by SOM and LVQ)

  • 이채봉;이창영
    • 한국전자통신학회논문지
    • /
    • 제6권1호
    • /
    • pp.34-42
    • /
    • 2011
  • 음성타자기의 구현에 접근하려는 노력의 일환으로서, 우리는 본 논문에서 자음의 분류에 대해 연구한다. 많은 자음들은 시간에 따른 주기적 거동을 보이지 않고 따라서 그들에 대한 푸리에 해석의 타당성에 확신을 갖기 어렵다. 그러므로, 우선 음성 신호로부터 추출되는 MFCC와 LPCC 특징벡터들이 자음에 대해 어느 정도의 의미가 있는지를 파악하기 위하여 LBG 클러스터링을 통한 벡터양자화를 수행한다. VQ의 실험적 결과는 자음에 대한 푸리에 해석의 타당성에 관해 분명한 결론을 내리는 것이 쉽지 않음을 보여주었다. 자음의 분류를 위해 SOM과 LVQ의 두 가지 신경망이 사용되었다. SOM의 결과는 몇 쌍의 자음들이 나뉘어 분류되지 않음을 보여주었다. LVQ에서는 본질적으로 이 문제가 사라지지만 자음의 분류 정확도는 낮은 수준이었다. 이로부터, LVQ에 의한 자음 분류에 있어서는 MFCC 및 다른 특징 벡터들이 함께 사용되어야 함이 사료된다. 하지만 본 연구에서 도입한 MFCC/LVQ의 결합은 기존의 언어모델을 기반으로 하는 음소 분류에 비해 그 결과가 나쁘지 않은 것으로 나타났다. 모든 경우에 LPCC 특징벡터는 MFCC에 비해 그 결과가 좋지 않았다.

Sentence design for speech recognition database

  • Zu Yiqing
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.472-472
    • /
    • 1996
  • The material of database for speech recognition should include phonetic phenomena as much as possible. At the same time, such material should be phonetically compact with low redundancy[1, 2]. The phonetic phenomena in continuous speech is the key problem in speech recognition. This paper describes the processing of a set of sentences collected from the database of 1993 and 1994 "People's Daily"(Chinese newspaper) which consist of news, politics, economics, arts, sports etc.. In those sentences, both phonetic phenometla and sentence patterns are included. In continuous speech, phonemes always appear in the form of allophones which result in the co-articulary effects. The task of designing a speech database should be concerned with both intra-syllabic and inter-syllabic allophone structures. In our experiments, there are 404 syllables, 415 inter-syllabic diphones, 3050 merged inter-syllabic triphones and 2161 merged final-initial structures in read speech. Statistics on the database from "People's Daily" gives and evaluation to all of the possible phonetic structures. In this sentence set, we first consider the phonetic balances among syllables, inter-syllabic diphones, inter-syllabic triphones and semi-syllables with their junctures. The syllabic balances ensure the intra-syllabic phenomena such as phonemes, initial/final and consonant/vowel. the rest describes the inter-syllabic jucture. The 1560 sentences consist of 96% syllables without tones(the absent syllables are only used in spoken language), 100% inter-syllabic diphones, 67% inter-syllabic triphones(87% of which appears in Peoples' Daily). There are rougWy 17 kinds of sentence patterns which appear in our sentence set. By taking the transitions between syllables into account, the Chinese speech recognition systems have gotten significantly high recognition rates[3, 4]. The following figure shows the process of collecting sentences. [people's Daily Database] -> [segmentation of sentences] -> [segmentation of word group] -> [translate the text in to Pin Yin] -> [statistic phonetic phenomena & select useful paragraph] -> [modify the selected sentences by hand] -> [phonetic compact sentence set]

  • PDF

한국어 파열음의 발성 유형에 따른 공기역학 측정치 비교 (The Comparison of Aerodynamic Measures in Korean Stop Consonants based on Phonation Types)

  • 최성희;최철희
    • 말소리와 음성과학
    • /
    • 제6권4호
    • /
    • pp.195-203
    • /
    • 2014
  • The aim of this study was to investigate the effects of phonation types ([+/- aspirated], [+/- fortis]) on aerodynamic measures with Korean bilabial stops. Sixty-three healthy young adults (30 males, 33 females) participated to evaluate the VOEF (Voicing Efficiency) tasks with bilabial stop consonants /$p^h$/, /p/, /p'/ using Phonatory Aerodynamic System (PAS) Model 6600 (Kay PENTAX Corp, Lincoln Park, NJ). All VOEF measures were significantly influenced by phonation types except RANP(pitch range)(p <.01). For sound pressure, maximum SPL, mean SPL, and Mean SPL during Voicing have been shown to be significantly greatest in fortis stop /p'/ than aspirated /$p^h$/ and lenis stop /p/ (p<.001). On the other hand, mean pitch after lenis stop was significantly lower than after aspirated and fortis stops (p<.001). Peak expiratory airflow, Target airflow, and FVC (Expiratory volume) were significantly lowest in fortis stop /p'/ which might be associated with higher aerodynamic resistance while peak air pressure and mean peak air pressure during closure were significantly lower in lenis stop /p/. Additionally, AEFF (Aerodynamic efficiency) was significantly higher in fortis stop /p'/ than lenis stop /p/ as well as aspirated stop /$p^h$/ (p<.001). Thus, sound pressure, airflow parameters, and aerodynamic resistance made crucial roles in distinguishing fortis /p'/ from lenis stop /p/ and aspirated. Additionally, pitch and subglottal air pressure parameters were important aerodynamic characteristics in distinguishing lenis /p/ from fortis /p'/ and aspirated /$p^h$/. Therefore, accurate aspirated /p/ stop consonant should be elicited when collecting the airflow, intraoral pressure related data with patients with voice disorders in order to enhance the reliability and relevance or validity of aerodynamic measures using PAS.

강건한 한국어 상품평의 감정 분류를 위한 패턴 기반 자질 추출 방법 (A Robust Pattern-based Feature Extraction Method for Sentiment Categorization of Korean Customer Reviews)

  • 신준수;김학수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권12호
    • /
    • pp.946-950
    • /
    • 2010
  • 기계 학습 기반의 많은 감정 분류 시스템들은 문장으로부터 언어적 자질을 추출하기 위하여 형태소 분석기를 사용한다. 그러나 온라인 상품평에는 많은 띄어쓰기 오류 및 철자 오류가 포함되어 있어서 일반적으로 형태소 분석기가 좋은 성능을 내기 어려우며, 기반 시스템의 낮은 성능은 감정 분류 시스템의 성능하락을 초래한다. 이러한 문제를 해결하기 위하여 본 논문에서는 어절 패턴과 음운 패턴의 최장 일치 매칭(matching)에 기반한 자질 추출 방법을 제안한다. 두 종류의 패턴은 대용량의 품사 부착 말뭉치로부터 자동으로 구축된다. 어절 패턴은 영사, 동사와 같은 내용어를 포함하는 어절들로 구성되며, 음운 패턴은 동사나 형용사와 같은 용언의 초성과 중성의 쌍으로 구성된다. 음운 패턴에 초성과 중성만을 사용한 이유는 철자 오류에 영향을 덜 받기 때문이다. 제안 방법을 평가하기 위하여 SVM(Support Vector Machine)을 기계 학습기로 사용하는 감정 분류 시스템을 구현하였다. 한국어 상품평에 대한 실험에서 제안 방법을 자질 추출 모듈로 사용하는 감정 분류 시스템이 형태소 분석기를 사용하는 것보다 우수한 성능을 보였다.

이웃 각도 히스토그램 및 변형된 하우스도르프 거리를 이용한 'ㅁ', 'ㅇ' 자소 인식 (The Recognition of Grapheme 'ㅁ', 'ㅇ' Using Neighbor Angle Histogram and Modified Hausdorff Distance)

  • 장원두;김하영;차의영;김도현
    • 한국멀티미디어학회논문지
    • /
    • 제8권2호
    • /
    • pp.181-191
    • /
    • 2005
  • 한글 문자 인식에 있어서 ' ㅁ '과 ' ㅇ '의 오인식은 전반적인 인석성능의 저하를 가져오는 요소가 되고 있으나 이에 대한 연구가 미흡한 실정이다. 따라서, 본 논문에서는 'ㅁ'과 'ㅇ'을 효과적으로 인식하기 위한 새로운 특징 추출 방법을 제안하였다. 제안하는 방법은 변형된 하우스도르프 거리를 이용한 최적의 이웃 반경을 설정하고, 이 반경에 의해 이웃 픽셀과의 각도를 추출하여 두 자소를 구분하는 특징으로 사용하였다 실험을 통하여 분석한 결과 제안하는 특징 추출 방법은 기존의 방법들보다 적은 특징 개수를 사용하여 효율적으로 패턴을 인식할 수 있었으며 우수한 일반성 및 안정성을 나타내었다.

  • PDF