• Title/Summary/Keyword: 한글 입력방식

Search Result 119, Processing Time 0.025 seconds

Text Transliteration System and Number Transliteration Disambiguation for TTS (음성합성을 위한 텍스트 음역 시스템과 숫자 음역 모호성 처리)

  • Park, Jeong Yeon;Shin, Hyeong Jin;Yuk, Dae Bum;Lee, Jae Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.449-452
    • /
    • 2018
  • TTS(Text-to-Speech)는 문자열을 입력받아 그 문자열을 음성으로 변환하는 음성합성 기술이다. 그러나 실제 입력되는 문장에는 한글뿐만 아니라 영단어 및 숫자 등이 혼합되어 있다. 영단어는 대소문자에 따라 다르게 읽을 수 있으며, 단위로 사용될 때는 약어로 사용되는 것이므로, 알파벳 단위로 읽어서는 안 된다. 숫자 또한 함께 사용되는 단어에 따라 읽는 방식이 달라진다. 본 논문에서는 한글과 숫자 및 단위, 영단어가 혼합된 문장을 분류하고 이를 음역하는 시스템을 구성하며 word vector를 이용한 숫자 및 단위의 모호성 해소방법을 소개한다.

  • PDF

A Character-Converting System Implementation by Keypad Mapping of DTMF Telephone Set (복합주파수 전화기의 번호판 매핑에 의한 문자 변환 시스템 구현)

  • 김용환;장우현;신유식;서광석;김종교;정항근
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.1
    • /
    • pp.60-65
    • /
    • 1998
  • 전화기의 선택 및 제어 신호는 직류 임펄스의 수에 의한 방법을 사용하였으나 현재 는 복합 주파수 방식을 널리 사용하고 있으며, 음성을 이용한 서비스들도 복합 주파수 방식 에 의해 제공되고 있다. 본 논문에서는 전화기의 복합 주파수 신호를 한글 자소로 변환하는 번호판 매핑 방법을 제시하였으며, 이 방식을 이용하여 상용되는 음성 정보 서비스의 검색 코드 입력 방식을 재구성해 보았다. 즉, 여러 가지 서비스에서도 한글 문장을 사용할 수 있 음을 보였다. 또한, 전화 통화시 사용되는 문장을 번호판 매핑 방식을 적용하여 구성함으로 써 전화기에서의 문장 편집 및 문장 정보 교환의 가능성을 보였다.

  • PDF

The Corpus-probability Based Generation of Korean Standard Pronunciation (코퍼스 확률에 기반한 한국어 표준발음 생성)

  • Kim, Dong-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.210-215
    • /
    • 2007
  • 본 연구에서는 코퍼스 확률에 기반하여 한국어 표준 발음 생성에 대한 연구를 한다. 기존의 이은영 외 (2005)에서 연구된 규칙기반의 한국어 IPA 발음 변환방식과는 달리 본 연구에서는 음운변환 코퍼스를 바탕으로 표준발음을 변환한다. 이 방식을 위해서 Brill(1995)에서 제안한 변형기반 학습방식이 활용되었으며, 단계적인 처리방식이 아닌 입-출력 대응 방식의 확률적 처리 방식이 제안되었다. 음운변환 방식은 음운규칙에 근거한 처리가 아닌 언어자원인 코퍼스를 활용해서 처리하였다는 점에서 기존의 연구방식과 차이가 있다. 또한, 기존 연구에서는 음운규칙을 단계적으로 적용하여서 입력형이 출력형으로 도출되기 위해서 여러 단계를 거쳤지만, 본 연구에서는 입력형과 출력형의 일대일 대응이라는 점에서 차이점을 보인다.

  • PDF

Text Preprocessor for Generating Korean Automatic Pronunciation Variants Using Morpheme-trg Information (한국어 발음열 자동 생성을 위한 형태소 태그 정보 기반의 텍스트 전처리기)

  • 이경님;정민화
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.199-201
    • /
    • 2001
  • 일반적으로 발음열 자동 생성기는 음성 인식 및 음성 합성에 사용되며, 그 주된 역할은 입력된 한글 철자에 대해 발음 나는 데로 표기된 음소열로 출력하는 것이다. 그러나 실제 입력되는 문장에는 특수 기호 및 알파벳. 아라비아 숫자, 영어 단어, 알파벳과 숫자가 혼용된 약어, 기호 단위 명사 등이 포함되어 있다. 게다가 아라비아 숫자의 경우 단위 명사의 종류에 따라서 뿐만 아니라, 문맥에 따라 숫자를 읽는 방식이 달라지게 된다. 이러한 모든 현상들을 발음열 생성기 내부에서 처리하게 되면 선행작업이 상대적으로 크게 되어 과부하 문제 가 발생된다. 또한 어절 내의 문맥 정보만으로 정확한 변환 결과를 얻기 힘들기 때문에 형태소 분석 수행 결과 및 예외처리를 위 한 루틴을 포함하여 한글 자소 단위의 입력형식으로 변환하는 전처리 시스템을 구성하였다.

  • PDF

BART with Random Sentence Insertion Noise for Korean Abstractive Summarization (무작위 문장 삽입 노이징을 적용한 BART 기반의 한국어 문서 추상 요약)

  • Park, Juhong;Kwon, Hongseok;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.455-458
    • /
    • 2020
  • 문서 요약은 입력 문서의 핵심 내용을 파악하여 짧고 간결한 문장으로 나타내는 과정이다. 최근에는 문서 요약을 위해 사전 학습된 언어 모델을 이용하는 방식이 여럿 제안되고 있지만, 이러한 언어 모델들은 문서 요약의 특성을 고려하지 않고 설계된 입력 노이즈 방식을 사용하는 한계점이 있다. 본 논문에서는 한국어 문서 추상 요약에 사전 학습 언어 모델인 BART를 도입하고, 입력 문서에 무작위 문장을 삽입하는 노이징 방식을 추가하여 문서 추상 요약 모델의 언어 이해 능력을 향상시키는 방법론을 제안한다. 실험 결과, BART를 도입한 문서 요약 모델의 결과는 다른 요약 모델들의 결과에 비해 전반적으로 품질 향상을 보였으며, BART와 함께 무작위 문장을 삽입하는 노이징 방법은 적은 비율로 삽입하는 경우 추가적인 성능 향상을 보였다.

  • PDF

An Android App Development for JAMOHAN with Learning and Game Facilities (학습 및 게임 기능을 갖는 자소모아한글단어맞추기(자모한) 안드로이드 앱 개발)

  • Kim, Ga-Young;Lee, Hyo-Eun;Kim, Hae-Su;Yang, Chang-Gun;Kang, Hyun-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.191-194
    • /
    • 2012
  • 본 논문은 뜻풀이를 통해 한글단어를 맞추는 앱 어플리케이션인 자모한(자소 모아 한글단어 맞추기)의 구현에 대하여 논한다. 학습 형태의 게임방식을 통하여 누구나 쉽게 사용하고 한글 단어를 학습할 수 있는 안드로이드 앱 어플리케이션이다. 자모한은 3가지 특징을 가진다. 첫 번째는 '한글'로, 평소 뜻을 제대로 알고 쓰지 못했던 단어나 잊혀져 가는 순수 우리말과 같은 한글단어의 뜻을 학습 할 수 있다. 두 번째는 '자소'로 한글에서 하나하나의 자소가 모여 단어가 됨을 보여주며 각 단어의 자소 구성을 명확히 인식할 수 있도록 도와준다. 세 번째는 '획수'이다. 게임에서 간접적으로 자소의 획수를 알려주고 있다. 이러한 특징들은 교육적 측면으로서 좋은 특징을 가지고 있다. 그 외에도 자모한은 데이터베이스 파일을 중심으로 작동하기 때문에 파일의 구조와 입력 정보를 변경하여 여러 버전(햇갈리기 쉬운 단어, 순수우리말, 사자성어 등)으로 응용이 가능하다는 산업 및 기술적 측면의 모습도 볼 수 있다.

  • PDF

A Design and Implementation of Hangul Spelling and Word-spacing Checker using Connectivity Information (접속정보를 이용한 한글 철자 및 띄어쓰기 검사기의 설계 및 구현)

  • Kang, J.W.;Song, C.H.;Kim, Y.B.;Choi, K.S.;Kwon, Y.R.;Kim, G.C.
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.3-9
    • /
    • 1989
  • 본 논문은 $UNIX^{TM}$ 환경에서의 한글 텍스트에 대해 일괄 처리 방식으로 한글 철자 및 띄어쓰기를 검사하는 시스템을 설계 및 구현하였다. 본 시스템은 접속 정보를 이용한 최단일치법을 사용하여 한 어절에 대해 형태론적인 분석을 하여 입력된 화일 내의 철자 및 띄어쓰기 오류를 찾아낸다.

  • PDF

Implementation of Industrial Information Display System (산업용 정보표시 시스템 구현)

  • Kim, Whi-Young;Hong, Jung-Hwan;Gang, Uk;Park, Seong-Jun;Kim, Hee-Je
    • Proceedings of the KIEE Conference
    • /
    • 2001.07d
    • /
    • pp.2048-2050
    • /
    • 2001
  • 기존의 생산관리 현황반, 각종 산업용 판넬의 Faul Indicator, 각종 기계의 상태표시, 엘리베이터 정보출력장치, 주차타워 안내표시, 버스 행선지 안내표시, 병원, 은행 등 각종 광고용에서 사용되는 정보표시장치를 휘도와 안정성이 우수한 40mm 3 Color LED Dot Matrix Module을 이용한 Message 표시장치로서, 각종 Panel 및 기계 장치에 부착되거나 단독 설치되어 Parallel 또는 Serial Port로 입력을 받아 그 입력에 해당되는 Message를 출력 하며 User에 의해 제작되는 Graphic과 Text 형태가 있으며 외부입력에 의해 선택되는 Text Message와 출력 형태는 User에 의해 제작되는 Program에 의해 출력되는 방식으로 구현하여 영문, 숫자는 물론 한글 및 한자 표현도 가능 하도록 하여, 문자의 크기가 5${\times}$7 LED Dot Matrix에 비해 상대적으로 크고 미려하여 현장에서 상황의 인지도를 높이고 ASC-II 및 KS-5601의 Hex Code 입력방식보다 일반사용자가 Programming 하기 쉬우며 Message를 Graphic Symbol형태 및 문자로 작성하여 Message출력 형태를 선택할 수 있는 Mode Programming방식을 적용해 사용자의 용이이성이 배가 되도륵 하여 비교 검토한 결과 사용에 있어 편리성을 입증할 수 있었다.

  • PDF

The Design and Implementation of Multilingual Chatting System Using Exapansion of Sentence Patterns By User (사용자에 의한 문형 확장 방식을 이용한 다국어 채팅 시스템의 설계 및 구현)

  • Park, Hong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.215-220
    • /
    • 1999
  • 본 연구에서는 정해진 주제내에서 높은 번역율과 빠른 처리 시간을 동시에 수용할 수 있는 효과적인 다국어 채팅 시스템을 구현하기 위해 사용자가 어절 단위로 단어를 입력하거나 선택하여 이미 구축되어 있는 문형에 접근하도록 유도하는 사용자 문형확장 방식을 제안하였다. 사용자 문형확장 방식을 사용하여 다국어 채팅 시스템을 구현할 경우 사용자 입력과 동시에 구문분석, 변환, 생성등 일련의 번역과정을 최소한의 처리시간으로 처리할 수 있으므로 매우 용이하게 실시간 번역 시스템을 구현할 수 있다는 장점이 있다. 사용자 문형확장 방식과 더불어 이와 함께 사용될 수 있는 통합 문형코드와 통합 품사체계도 제안하였다. 이는 번역의 대상이 되는 한국어, 영어, 일본어 각각에 대해 문형코드와 품사코드를 따로 설정하지 않고 통일된 하나의 코드체계를 적용함으로써 기계번역에서의 변환과정을 최소화하기 위해 고안하였다.

  • PDF

A Study on Improvement of Retrieval Algorithm for Audio Response Service (음성정보 서비스의 검색 알고리즘 개선 연구)

  • Jeong, Yoo-Hyeon;Kim, Soon-Hyop
    • The Journal of the Acoustical Society of Korea
    • /
    • v.16 no.5
    • /
    • pp.92-95
    • /
    • 1997
  • Thlephone pushbuttons simply consist of 0~9 digits, #, and ${\ast}$). So it is difficulty for user to input the various query command for information retrieval of audio response sevice. We suggest the new retrieval algorithm for audio response service using Korean initial sounds sequences. User those who do not know the retrieval code can retrieve the audio response service by pushing the telephone digit buttons which correspond to initial sounds of its name.

  • PDF