• 제목/요약/키워드: sentence

검색결과 1,656건 처리시간 0.025초

음향 측정과 지각 판단에 의한 한국인 영어의 운율 연구 (A Study Using Acoustic Measurement and Perceptual Judgment to identify Prosodic Characteristics of English as Spoken by Koreans)

  • 구희산
    • 음성과학
    • /
    • 제2권
    • /
    • pp.95-108
    • /
    • 1997
  • The purpose of this experimental study was to investigate prosodic characteristics of English as spoken by Koreans. Test materials were four English words, a sentence, and a paragraph. Six female Korean speakers and five native English speakers participated in acoustic and perceptual experiments. Pitch and duration of word syllables were measured from signals and spectrograms made by the Signalize 3.04 software program for Power Mac 7200. In the perceptual experiment, accent position, intonation patterns, rhythm patterns and phrasing were evaluated by the five native English speakers. Preliminary results from this limited study show that prosodic characteristics of Koreans include (1) pitch on the first part of a word and sentence is lower than that of English speakers, but the pitch on the last part is the opposite; (2) word prosody is quite similar to that of an English speaker, but sentence prosody is quite different; (3) the weakest point of sentence prosody spoken by Koreans is in the rhythmic pattern.

  • PDF

SPEECH SYNTHESIS USING LARGE SPEECH DATA-BASE

  • Lee, Kyu-Keon;Mochida, Takemi;Sakurai, Naohiro;Shirai, Katasuhiko
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.949-956
    • /
    • 1994
  • In this paper, we introduce a new speech synthesis method for Japanese and Korean arbitrary sentences using the natural speech data-base. Also, application of this method to a CAI system is discussed. In our synthesis method, a basic sentence and basic accent-phrases are selected from the data-base against a target sentence. Factors for those selections are phrase dependency structure (separation degree), number of morae, type of accent and phonemic labels. The target pitch pattern and phonemic parameter series are generated using those selected basic units. As the pitch pattern is generated using patterns which are directly extracted form real speech, it is expected to be more natural than any other pattern which is estimated by any model. Until now, we have examined this method on Japanese sentence speech and affirmed that the synthetic sound preserves human-like features fairly well. Now we extend this method to Korean sentence speech synthesis. Further more, we are trying to apply this synthesis unit to a CAI system.

  • PDF

경직형 마비성 구어장애자의 장애 정도별 음성 특성 (Voice Characteristics of Spastic Dysarthria)

  • 박희정;신혜정;정옥란;석동일
    • 음성과학
    • /
    • 제11권4호
    • /
    • pp.185-195
    • /
    • 2004
  • Spastic dysarthria is a motor speech disorder produced by a damage to the direct (pyramidal) and indirect (extrapyramidal) pathways of the central nervous system. This study attempted to determine the influences of the severity of spastic dysarthria on the stability of voice. A sustained /a/, /a/ produced at the beginning of a sentence and at the end of the sentence were analyzed. The Praat 4.0.51 was used for analysis. The results showed a significant difference between the severe spastic dysarthric group and normal group matched by age and sex at the beginning and the end of the sentence. In addition, the severe group showed a significant difference between the first /a/ and the second /a/ at the end of sentence.

  • PDF

Sentence BERT 임베딩을 이용한 과편향 뉴스 판별 (Hypernews Detection using Sentence BERT Embedding)

  • 임정우;황태선;오동석;양기수;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.388-391
    • /
    • 2019
  • 과편향 뉴스 판별(hyperpartisan news detection)은 뉴스 기사가 특정 인물 또는 정당에 편향되었는지 판단하는 task이다. 이를 위해 feature-based ELMo + CNN 모델이 제안되었으나, 이는 문서 임베딩이 아닌 단어 임베딩의 평균을 사용한다는 한계가 존재한다. 따라서 본 논문에서는 feature-based 접근법을 따르며 Sentence-BERT(SentBERT)의 문서 임베딩을 이용한 feature-based SentBERT 기반의 과편향 뉴스 판별 모델을 제안한다. 제안 모델의 효과를 입증하기 위해 ELMO, BERT, SBERT와 CNN, BiLSTM을 적용한 비교 실험을 진행하였고, 기존 state-of-the-art 모델보다 f1-score 기준 1.3%p 높은 성능을 보였다.

  • PDF

Sentence-BERT를 활용한 YouTube 가짜뉴스 탐지 시스템 연구 (A Study On YouTube Fake News Detection System Using Sentence-BERT)

  • 김범중;허지혜;이협건;김영운
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.667-668
    • /
    • 2023
  • IT 기술의 발달로 인해 뉴스를 제공하는 플랫폼들이 다양해 졌고 최근 해외 인터뷰 영상, 해외 뉴스를 Youtube Shorts형태로 제작하여 화자의 의도와는 다른 자막을 달며 가짜 뉴스가 생성되는 문제가 대두되고 있다. 이에 본 논문에서는 Sentence-BERT를 활용한 YouTube 가짜 뉴스 탐지 시스템을 제안한다. 제안하는 시스템은 Python 라이브러리를 사용해 유튜브 영상에서 음성과 영상 데이터를 분류하고 분류된 영상 데이터는 EasyOCR을 사용해 자막 데이터를 텍스트로 추출 후 Sentence-BERT를 활용해 문자 유사도를 분석한다. 분석결과 음성 데이터와 영상 자막 데이터가 일치한 경우 일치하지 않은 경우보다 약 62% 더 높은 문장 유사도를 보였다.

Sentence design for speech recognition database

  • Zu Yiqing
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.472-472
    • /
    • 1996
  • The material of database for speech recognition should include phonetic phenomena as much as possible. At the same time, such material should be phonetically compact with low redundancy[1, 2]. The phonetic phenomena in continuous speech is the key problem in speech recognition. This paper describes the processing of a set of sentences collected from the database of 1993 and 1994 "People's Daily"(Chinese newspaper) which consist of news, politics, economics, arts, sports etc.. In those sentences, both phonetic phenometla and sentence patterns are included. In continuous speech, phonemes always appear in the form of allophones which result in the co-articulary effects. The task of designing a speech database should be concerned with both intra-syllabic and inter-syllabic allophone structures. In our experiments, there are 404 syllables, 415 inter-syllabic diphones, 3050 merged inter-syllabic triphones and 2161 merged final-initial structures in read speech. Statistics on the database from "People's Daily" gives and evaluation to all of the possible phonetic structures. In this sentence set, we first consider the phonetic balances among syllables, inter-syllabic diphones, inter-syllabic triphones and semi-syllables with their junctures. The syllabic balances ensure the intra-syllabic phenomena such as phonemes, initial/final and consonant/vowel. the rest describes the inter-syllabic jucture. The 1560 sentences consist of 96% syllables without tones(the absent syllables are only used in spoken language), 100% inter-syllabic diphones, 67% inter-syllabic triphones(87% of which appears in Peoples' Daily). There are rougWy 17 kinds of sentence patterns which appear in our sentence set. By taking the transitions between syllables into account, the Chinese speech recognition systems have gotten significantly high recognition rates[3, 4]. The following figure shows the process of collecting sentences. [people's Daily Database] -> [segmentation of sentences] -> [segmentation of word group] -> [translate the text in to Pin Yin] -> [statistic phonetic phenomena & select useful paragraph] -> [modify the selected sentences by hand] -> [phonetic compact sentence set]

  • PDF

효율적인 영어 구문 분석을 위한 최대 엔트로피 모델에 의한 문장 분할 (Intra-Sentence Segmentation using Maximum Entropy Model for Efficient Parsing of English Sentences)

  • 김성동
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.385-395
    • /
    • 2005
  • 긴 문장 분석은 높은 분석 복잡도로 인해 기계 번역에서 매우 어려운 문제이다. 구문 분석의 복잡도를 줄이기 위하여 문장 분할 방법이 제안되었으며 본 논문에서는 문장 분할의 적용률과 정확도를 높이기 위한 최대 엔트로피 확률 모델 기반의 문장 분할 방법을 제시한다. 분할 위치의 어휘 문맥적 특징을 추출하여 후보 분할 위치를 선정하는 규칙을 학습을 통해 자동적으로 획득하고 각 후보 분할 위치에 분할 확률 값을 제공하는 확률 모델을 생성한다. 어휘 문맥은 문장 분할 위치가 표시된 말뭉치로부터 추출되며 최대 엔트로피 원리에 기반하여 확률 모델에 결합된다. Wall Street Journal의 문장을 추출하여 학습 데이타를 생성하는 말뭉치를 구축하고 네 개의 서로 다른 영역으로부터 문장을 추출하여 문장 분할 실험을 하였다. 실험을 통해 약 $88\%$의 문장 분할의 정확도와 약 $98\%$의 적용률을 보였다. 또한 문장 분할이 효율적인 파싱에 기여하는 정도를 측정하여 분석 시간 면에서 약 4.8배, 공간 면에서 약 3.6배의 분석 효율이 향상되었음을 확인하였다.

백과사전 영역에서 중심어주도패턴에 기반한 문장주제 할당 기법 (A Sentence Theme Allocation Scheme based on Head Driven Patterns in Encyclopedia Domain)

  • 강보영;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.396-405
    • /
    • 2005
  • 기존의 주제 관련 연구들은 문서에 자주 등장하는 용어를 주제로 간주하는 등 문서에서 다루는 주제에 대한 정의가 모호하다. 또한 문서를 구성하는 기본 단위인 문장의 주제가 문서 요약 및 정보 추출 등의 연구 분야에 중요하게 활용될 수 있음에도 불구하고, 이에 대한 고려 없이 문서 전체의 주제를 추출하고 할당하는 연구가 대부분이다. 따라서 본 논문에서는 문장 단위의 주제 처리에 대한 기본 연구로서, 백과사전 영역에서 효과적인 중심어주도패턴에 기반한 문장주제 할당 기법을 제안하였다. 두산동아 백과사전 인물분야 2,381문서를 대상으로 성능을 분석해본 결과, 제안된 기법이 비교기준보다 향상된 성능을 보였으며, 특히 제안된 네 가지 중심어주도 패턴 중 술어를 기반으로 구성된 중심어주도패턴 유형 4가 학습집합에 대하여 평균 $98.96\%$, 실험집합에 대하여 $88.57\%$의 성능(F-score)으로 주제할당에 가장 효과적임을 알 수 있었다.

어휘정보를 이용한 문장작성에 관한 연구 (A Study on the Sentence Generation using Lexical Information)

  • 황인정;민홍기
    • 융합신호처리학회논문지
    • /
    • 제5권3호
    • /
    • pp.198-204
    • /
    • 2004
  • 본 연구는 언어 장애를 가진 사용자의 언어생활을 돕기 위한 문장작성 방식을 제안한 것이다. 제안한 문장작성 방법은 통신보조기기에 적용할 수 있도록 시스템으로 구현해 보았다. 통신보조기기는 개인 휴대장치로서 필요한 문장을 작성하여 출력하는 기기이다. 언어장애인들의 대표적인 의사표현 수단인 수화는 일반인들과의 의사소통에는 불편하기 때문에 다른 표현 방법이 필요하다. 자모를 모두 입력하여 문장을 작성하는 방식은 키의 수가 많기 때문에 대화할 때 시간이 많이 소용되는 불편한 방식이다. 그러므로 언어장애인을 위한 문장 작성의 가장 중요한 목적은 적절한 장소와 상황에 맞는 단어가 배열된 통신보조기기를 이용하여 적은 키의 수로 문장을 작성하는 것이다. 본 연구의 문장 작성을 구현하기 위한 어휘정보는 사용자 영역을 정하고, 그 영역에 맞는 단어와 문장을 수집하고, 수집된 어휘의 특징을 추출하여 구축되었다. 그리고 제안한 문장 작성 방식의 효용을 측정하기 위해 시스템을 이용하여 문장 작성을 위한 키의 수와 키보드 입력에 의한 자모수를 비교하였다.

  • PDF

전기성문파형검사를 이용한 모음과 공명 자음의 발성특성 (Phonatory Caracteristics of Vwels and Resonant Consonants using the Electroglottography)

  • 최성희;남도현;임재열;임성은;최홍식
    • 대한후두음성언어의학회지
    • /
    • 제15권2호
    • /
    • pp.133-140
    • /
    • 2004
  • Background and Objectives : Vowels and resonant including nasals and liquid are produced with vocal folds vibration have been used for voice therapy of hyperadduction patients. This study was conducted to investigate phonatory characteristics of vowels and resonant consonants through the EGG measures from Lx. Speech studio (Laryngograph Ltd, UK). Materials and Method : 7 male adults produced sustained vowel /a/, /i/, /u/, nasals /m/, /n/, /${\eta}$/and liquid /I/ and read the sentences (1nasals-liquid sentence, 1 non-nasals-liquid sentence) and tongue-tip trill and humming. Fx(Hz), Ox(%) were obtained of vowels, nasals, liquid and each of the posterior vowel /a/ of /ma/, /na/, /la/, /ha/ with same F0(around F#165Hz) and amplitude (75${\pm}$5db). And also DFx(Hz), DQx(%), CFx(%) and CAx(%) were obtained from reading two kinds of sentences. Results : Qx(%) was the highest in /u/ of vowels, and nasal/n/ of the resonant consonants and nasals-liquid sentence was higher Qx than non-nasals-liquid sentence but significant differences were not found. Qx(%) of the posterior vowel /a/ of nasal consonants/n/ was higher than in the isolated vowel/a/ and other posterior vowel of resonant consonants and fricatives /h/. Regularity or periodicity and higher Qx were observed in the nasals-liquid sentence than non-nasals-liquid sentence in graphs of QxFx & CFx produced by Quantiative analysis. In the nasalance score, /u/vowel was significant higher among the vowels and /I/ liquid was significant lower among the resonant consonants and nasals-liquid sentence is higher than non-nasals -liquid sentence. CQ(%) was not significantly correlated with nasalance(%). Conclusion : These findings might signify resonant phonation was not correlated with nasalance.

  • PDF