• Title/Summary/Keyword: 음절 수

Search Result 318, Processing Time 0.023 seconds

IP generating factors and rules of read speech and dialogue in Korean (대화체와 낭독체의 억양구 형성에 관한 연구)

  • Park Jihye
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.285-288
    • /
    • 2002
  • 본 논문에서는 발화 유형을 대화체와 낭독체의 두 가지로 구분하여 각 발화 유형에서 억양구를 형성하는 특징을 살펴보았다. 실험 결과, 한 문장 내에 두 개 이상의 억양구가 생성되는 경우와 접속문의 경우에는 낭독체에서 더 많은 억양구가 형성되었다. 대화체에서 더 많은 억양구가 형성되는 경우는 주로 주어 다음에 억양구가 형성되는 경우이며, 대화체 발화에서는 한 문장내에 두 개 이상의 억양구가 형성된 경우는 존재하지 않았다. 이러한 실험 결과를 바탕으로 억양구의 형성이 음절수뿐만 아니라 문장의 구조에 영향을 받으며, 이 두 가지 요인이 발화 유형에 따라 다르게 적용된다는 운율적 특징을 파악할 수 있다.

  • PDF

A fast POS tagging method for speech synthesis (음성합성을 위한 품사태깅시스템의 속도 개선)

  • Kim Jeong-se;Park Jun
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.159-162
    • /
    • 2002
  • 본 논문에서는 음성합성을 위한 의사형태소 품사 태깅 시스템의 속도를 개선하는 방법으로 정확률을 다소 희생하더라도 속도개선이 될 수 있는 방법을 제안하고자 한다. 형태소 해석 시에는 종성으로 올 수 있는 자모를 제외한 나머지에 대해서는 음절단위로 구성하는 변형된 Tabular 파싱법으로 해석하는데, 여기에다 일반적으로 적용 가능한 몇 가지의 규칙을 추가함으로써 해석 가능한 노드들을 줄였다. 태깅 시에는 한국어의 특성상 어절 하나씩을 품사 태깅하였을 경우에도 상당히 정확하다는 점을 이용하여 어절 내부에서는 full search 를 하고 그 다음 어절은 이전 어절의 제일 높은 값을 가지는 품사열 정보를 활용하는 방법을 제안한다. 제안한 시스템은 32 개 품사 태그셋에 2 만 형태소 사전을 이용해 실험한 결과, 기존의 시스템보다 약 $60\%$이상의 속도 개선을 보였으며, 정확률은 약 $1\%$ 정도 떨어졌다.

  • PDF

The Factors In Reading Hangul Text : font width-to-height ratio of a letter, line length (글자꼴, 글줄길이, 글줄모양과 한글의 가독성)

  • Lee, Soo-Jeong;Jung, Woo-Hyun;Chung, Chan-Sup
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.193-205
    • /
    • 1993
  • 한글의 글자꼴과 장평율 그리고 글줄 길이와 글줄꼴 처리 방식이 가독성에 미치는 효과를 측정하였다. 글자꼴은 명조체, 고딕체, 샘물체를 사용하였고, 장평율은 글자의 가로 대 세로 비율을 1 대 1, 1 대 2 그리고 2 대 1로 변형시킨 세 가지를 사용하였다. 글줄 길이는 60mm와 120mm의 두 가지로 하였고 글줄 끝에서 음절 단위로 끊어 쓴 문장과 어절 단위로 끊어 쓰되 띄어쓰기 여백을 조절한 문장과 조절하지 않은 문장을 사용하였다. 연구결과, 글자꼴에서는 명조체와 고딕체의 가독성이 샘물체보다 좋았고, 가로 대 세로의 비율이 1 대 1이거나 1 대 2인 글자의 가독성이 2 대 1인 글자의 가독성보다 우수하였다. 이러한 연구 결과는 한글 정보 처리 과정에서 자모보다 글자가 중요한 시각 정보로 사용되고 한번 응시하는 동안에 표집되는 글자수가 가독성에 영향을 미칠 수 있다는 사실을 시사한다. 글줄 길이는 120mm일 때의 가독성이 더 좋았고 글줄 끝처리 방식은 가독성에 영향을 미치지 않는 것으로 나타났다.

  • PDF

Design of Brain-computer Korean typewriter using N-gram model (N-gram 모델을 이용한 뇌-컴퓨터 한국어 입력기 설계)

  • Lee, Saebyeok;Lim, Heui-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.143-146
    • /
    • 2010
  • 뇌-컴퓨터 인터페이스는 뇌에서 발생하는 생체신호를 통하여 컴퓨터나 외부기기를 직접 제어할 수 있는 기술이다. 자발적으로 언어를 생성하지 못하는 환자들을 위하여 뇌-컴퓨터 인터페이스를 이용하여 한국어를 자유롭게 입력할 수 있는 인터페이스에 대한 연구가 필요하다. 본 연구는 의사소통을 위한 뇌-컴퓨터 인터페이스에서 낮은 정보전달률을 개선하기 위해서 음절 n-gram과 어절 n-gram 모델을 이용하여 언어 예측 모델을 구현하였다. 또한 실제 이를 이용한 뇌 컴퓨터 한국어 입력기를 설계하였다, 이는 기존의 뇌-컴퓨터 인터페이스 연구에서 특징 추출이나 기계학습 방법의 성능향상을 위한 연구와는 차별적인 방법이다.

  • PDF

A Consideration of the Shape Similarity between Hangeul Typeface Design and Latin Alphabet Typeface Design - focused on YoonDesign Fonts (한글디자인과 라틴 알파벳디자인의 형태유사성 고찰 1 - 윤디자인 폰트를 중심으로 -)

  • Park, Jae-Hong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.123-124
    • /
    • 2021
  • 본 논문은 기존 폰트 디자인을 고찰하여 한글과 라틴 알파벳 디자인의 형태 유사성을 향상시키기 위한 기초 자료를 제공한다. 고찰을 위해 윤디자인 대표 폰트 20종을 선정하였다. 형태적 관점에서 글자 디자인적 유사성을 찾기 위해 낱자, 낱글자, 낱말, 문장을 기준으로 고찰하였다. 윤디자인 대표 폰트 20종의 한글과 라틴 알파벳 글자 디자인의 결과는 다음과 같다. 첫째, 낱자(자소) 디자인은 동일한 형태이지만, 크기와 비례가 변화할 수 있다. 둘째, 낱글자(음절) 디자인은 낱글자 전체의 디자인을 위해 부분적으로 다른 형태를 디자인할 수 있다. 셋째, 낱말(단어) 디자인은 낱말의 우월효과를 고려하여야 한다. 넷째, 문장의 디자인은 글줄의 흐름을 고려하여 글자의 크기, 비례와 기준선을 디자인하여야 한다.

  • PDF

Error Word Detection in Korean Corpus (한국어 대용량 코퍼스의 오류 어휘 탐지 방안)

  • Choi, Min-Joo;Park, Ji-Hoon;Son, Sung-Hwan;Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.500-502
    • /
    • 2019
  • 대용량의 언어 코퍼스를 이용할 때, 오류 어휘가 코퍼스에 포함되어 있는 경우 해당 코퍼스를 이용한 실험의 성능이 저하될 수 있다. 이 때문에 정확한 문장들로 이루어진 코퍼스를 구축하기 위해 다량의 문장 중에서 정확하게 오류 어휘를 탐지할 필요가 있다. 본 논문에서는 대용량 데이터에서 빈도수가 낮은 음절을 이용해 오류 어휘를 탐지하는 방법을 제안하고, 제안 방법을 이용하여 오류 어휘 탐지 시 고려하여야 할 점에 대해 서술한다.

  • PDF

Comparative Study of Sentiment Analysis Model based on Korean Linguistic Characteristics (한국어 언어학적 특성 기반 감성분석 모델 비교 분석)

  • Kim, Gyeong-Min;Park, Chanjun;Jo, Jaechoon;Lim, Heui-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.149-152
    • /
    • 2019
  • 감성분석이란 입력된 텍스트의 감성을 분류하는 자연어처리의 한 분야로, 최근 CNN, RNN, Transformer등의 딥러닝 기법을 적용한 다양한 연구가 있다. 한국어 감성분석을 진행하기 위해서는 형태소, 음절 등의 추가 자질을 활용하는 것이 효과적이며 성능 향상을 기대할 수 있는 방법이다. 모델 생성에 있어서 아키텍쳐 구성도 중요하지만 문맥에 따른 언어를 컴퓨터가 표현할 수 있는 지식 표현 체계 구성도 상당히 중요하다. 이러한 맥락에서 BERT모델은 문맥을 완전한 양방향으로 이해할 수있는 Language Representation 기반 모델이다. 본 논문에서는 최근 CNN, RNN이 융합된 모델과 Transformer 기반의 한국어 KoBERT 모델에 대해 감성분석 task에서 다양한 성능비교를 진행했다. 성능분석 결과 어절단위 한국어 KoBERT모델에서 90.50%의 성능을 보여주었다.

  • PDF

A Study on Hangeul Mobile Handwriting Practice and Analyzing Application Development Based on Deep Learning (딥러닝 기반 한글 전자 필기 연습 및 분석 앱 개발에 대한 연구)

  • Ko, Ju-Eun;Oh, Jee-Eun;Min, Kyoung-Won
    • Annual Conference of KIPS
    • /
    • 2022.05a
    • /
    • pp.322-325
    • /
    • 2022
  • 전 세계적으로 코로나바이러스가 유행함에 따라 비대면 활동을 비롯하여 전자 필기 이용 및 상품 소비가 증가하였다. 전자 필기에 대한 수요가 늘어남에 따라 전자 필기 글씨체 교정에 대한 관심 또한 증가하는 추세이다. 본 논문에서는 전자 필기 이미지에서 음절과 음소 영역을 추출하여 글씨를 분석하고, 이를 사용하여 사용자의 손글씨에서 개선점을 찾아낼 수 있는 딥러닝 알고리즘을 제안한다. 제안한 알고리즘을 통해 사용자가 원하는 전자 필기 글씨체를 효과적으로 습득할 수 있도록 사용자 글씨에 대해 구체적인 피드백을 제공하는 딥러닝 기반 태블릿 PC 용 한글 전자 필기 연습 및 분석 앱에 대한 연구를 소개하였다.

Sentence Boundary Detection Using Machine Learning Techniques (기계학습 기법을 이용한 문장경계인식)

  • Park, Su-Hyuk;Rim, Hae-Chang
    • Annual Conference of KIPS
    • /
    • 2008.05a
    • /
    • pp.69-72
    • /
    • 2008
  • 본 논문은 언어의 통계적 특징을 이용하여 범용의 문장경계 인식기를 제안한다. 제안하는 방법은 대량의 코퍼스 내에서 사용되고 있는 문장 경계를 기준으로 음절 및 어절 등의 자질을 이용하여 통계적 특징을 추출하고 다양한 기계학습 기법을 사용하여 문장경계를 인식하고자 하였다. 또한 특정 언어나 도메인에 제한적이지 않고 범용적인 자질만을 사용하려고 노력하였다. 언어의 특성상 문장의 구분이 애매한 경우 또는 잘못 사용 된 구두점 등의 경우에도 적용 가능하도록 다양한 자질을 사용하여 실험하였으며, 한국어와 영문 코퍼스에 대해서 동일한 자질을 적용하여 실험하여 본 논문에서 제시한 자질들이 한국어 및 다른 언어권의 언어에도 적용될 수 있는 범용적인 자질임을 확인할 수 있었다. 한국어 문장경계 인식을 위한 기계학습 및 실험을 위해서 세종계획 코퍼스를 사용하였으며, 성능척도로는 정확률과 재현율을 사용하였으며, 실험결과 제안한 방법으로 99%의 정확률과 99.2%의 재현율을 보였다. 영문의 경우는 Wall Street Journal 코퍼스를 사용하였으며, 동일한 자질을 적용하여 실험한 결과 98.9%의 정확률과 94.6%의 재현율을 보였다.

Study on the realization of pause groups and breath groups (휴지 단위와 호흡 단위의 실현 양상 연구)

  • Yoo, Doyoung;Shin, Jiyoung
    • Phonetics and Speech Sciences
    • /
    • v.12 no.1
    • /
    • pp.19-31
    • /
    • 2020
  • The purpose of this study is to observe the realization of pause and breath groups from adult speakers and to examine how gender, generation, and tasks can affect this realization. For this purpose, we analyzed forty-eight male or female speakers. Their generation was divided into two groups: young, old. Task and gender affected both the realization of pause and breath groups. The length of the pause groups was longer in the read speech than in the spontaneous speech and female speech. On the other hand, the length of the breath group was longer in the spontaneous speech and the male speech. In the spontaneous speech, which requires planning, the speaker produced shorter length of pause group. The short sentence length of the reading material influenced the reason for which the length of the breath group was shorter in the reading speech. Gender difference resulted from difference in pause patterns between genders. In the case of the breath groups, the male speaker produced longer duration of pause than the female speaker did, which may be due to difference in lung capacity between genders. On the other hand, generation did not affect either the pause groups or the breath groups. The generation factor only influenced the number of syllables and the eojeols, which can be interpreted as the result of the difference in speech rate between generations.