• Title/Summary/Keyword: 표기 방법

Search Result 387, Processing Time 0.029 seconds

Phonetic Similarity Meausre for the Korean Transliterations of Foreign Words (외국어 음차 표기의 음성적 유사도 비교 알고리즘)

  • Gang, Byeong-Ju;Lee, Jae-Seong;Choe, Gi-Seon
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.10
    • /
    • pp.1237-1246
    • /
    • 1999
  • 최근 모든 분야에서 외국과의 교류가 증대됨에 따라서 한국어 문서에는 점점 더 많은 외국어 음차 표기가 사용되는 경향이 있다. 하지만 같은 외국어에 대한 음차 표기에 개인차가 심하여 이들 음차 표기를 포함한 문서들에 대한 검색을 어렵게 만드는 원인이 되고 있다. 한 가지 해결 방법은 색인 시에 같은 외국어에서 온 음차 표기들을 등가부류로 묶어서 색인해 놓았다가 질의 시에 확장하는 방법이다. 본 논문에서는 외국어 음차 표기들의 등가부류를 만드는데 필요한 음차 표기의 음성적 유사도 비교 알고리즘인 Kodex를 제안한다. Kodex 방법은 기존의 스트링 비교 방법인 비음성적 방법에 비해 음차 표기들을 등가부류로 클러스터링하는데 있어 더 나은 성능을 보이면서도, 계산이 간단하여 훨씬 효율적으로 구현될 수 있는 장점이 있다.Abstract With the advent of digital communication technologies, as Koreans communicate with foreigners more frequently, more foreign word transliterations are being used in Korean documents more than ever before. The transliterations of foreign words are very various among individuals. This makes text retrieval tasks about these documents very difficult. In this paper we propose a new method, called Kodex, of measuring the phonetic similarity among foreign word transliterations. Kodex can be used to generate the equivalence classes of the transliterations while indexing and conflate the equivalent transliterations at the querying stage. We show that Kodex gives higher precision at the similar recall level and is more efficient in computation than non-phonetic methods based on string similarity measure.

Automatic Foreign Word Transliteration Model for Information Retrieval (정보검색을 위한 외래어 자동표기 모델)

  • 이재성;최기선
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1997.08a
    • /
    • pp.17-24
    • /
    • 1997
  • 조사에 따르면 한글 문서에서 사용되는 단어 중 외래어 또는 영어가 포함된 단어가 약 26%정도를 차지하고 있으며, 이는 정보검색의 중요 색인어로 사용된다(권윤형 1996). 그러나 이들 단어들은 서로 같은 단어인데도 영어로 표기되기도 하고 이형의 외래어들로 표기되기도 하여, 정보검색의 효율을 떨어뜨리고 있다. 본 논문에서는 영어 단어와 그에 대응되어 표기되는 외래어들을 찾기 위한 한 단계로서, 영어를 한글로 음차(transliteration)하여 자동표기하는 통계적 모델을 제안하고 실험한다. 제안된 모델은 통계적 기계번역 방식과 그의 한 방법인 문서 정렬(text alignment) 방식에 근거하고 있다. 특히 이 모델에서는 효과적으로 발음의 단위를 분리한 다음 정렬을 하여. 전체적인 계산량을 줄이고 성능도 향상시켰다. 음차표기는 피봇방식과 직접방식의 두가지로 구현하였다. 피봇방식은 영어에서 발음을 생성한 후, 그 발음을 다시 한글로 표기하는 방식이고, 직접방식은 직접 영어 단어에서 한글 표기로 포기하는 방식이다. 두 방식을 제안된 모델을 이용하여 비교 테스트한 결과 직접방식이 보다 정확하게 표준 외래어로 표기하였다.

  • PDF

A Web Application Design based-on UML with Note and Stereotype (노트와 스테레오타입을 이용한 UML 기반 웹 어플리케이션 설계 사례)

  • 엄태훈;최윤석;정기원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.658-660
    • /
    • 2001
  • 본 논문에서는 사건흐름을 기능 별로 묶어 패턴화하는 방법을 통해 사건흐름 명세서를 표기하고, UML의 노트표기를 이용해 패턴 번호를 순차도에 적용하는 방법을 제시한다. 이와 더불어 설계 산출물 상에 표시되는 웹 페이지의 표현을 스테레오타입을 이용해 표기함으로써 시스템에 대한 이해도를 높이도록 하였고, 요구사항 명세서에 요구사항에 따른 사용사례와 사용자와의 관계를 표시하여 요구사항이 어떻게 반영되었는지를 쉽게 추적할 수 있게 하였다. 제안한 방법은 실제 영화 예매 시스템의 분석 및 설계 사례를 통해 그 사용 예를 보였다.

  • PDF

A Proposal for Roman Representation of Hangul Characters (한글 문자의 로마문자 표기에 대한 제안)

  • Kang, Joo-Sang
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.10-14
    • /
    • 1989
  • 한글문자를 기계화하기 위하여 로마문자로 표기하는 방법에 대한 새로운 제안을 한다. 현재 남한안이나 북한안은 서로 이견을 보이고 있어서 국제적 합의에 이르지 못하고 있다. 본 제안에서는 남, 북한 안과는 달리 영문자의 대문자와 소문자를 모두 활용하며 다양한 모음의 구성에서 음성학적으로 표기한다. 이 표기법은 자체의 합리성, 국제표준과의 호환성 판독의 편리성, 음성인식에의 이용성등에서 기존 표기체계보다 유리하다.

  • PDF

A Study on Effectiveness of Hang-Tag Type and Preferred Method of Functional Information for Outdoor Jackets (아웃도어 재킷의 기능성표기 행택 유형에 대한 소비자의 이해도 및 선호도 연구)

  • Bang, Giseong;Yoo, Shinjung
    • Science of Emotion and Sensibility
    • /
    • v.19 no.4
    • /
    • pp.83-94
    • /
    • 2016
  • The aim of this study was to investigate effective expression method of performance information of functional clothing and preferred alternatives for the categorized consumer groups according to the perception about the functional outdoor jacket. 472 males and females in their 20s-60s' were surveyed and their answers were analysed and categorized by using SPSS 21.0 statistical program. For the study, four different expression methods for waterproof & breathable fabric, 'illustration only', 'illustration+Korean text', 'illustration+foreign text', and 'chart with Korean text', were presented and asked for finding correct answers. The analysis was done for three categorized consumer groups from the former study, 'unconversant/brand & design pursuing group', 'conversant/function pursuing group' and 'high price/high function preferring group'. The results showed that regardless of groups, 'picture only' was the most preferred method and 'graph' was the least. However, the percentage of correct answers for the 'graph' was the biggest, especially for 'conversant/function pursuing group'. It implied that the effective expression method should be differentiated depending on the target consumer groups. 'Conversant/function pursuing group' more agreed on the need for additional information, such as 'after-washed performance', than other two groups.

Transliteration Correction Method using Korean Alphabet Viable Prefix (한국어 자모 Viable Prefix를 이용한 외래어 표기 교정 기법)

  • Kwon, Soon-Ho;Kwon, Hyuk-Chul
    • The KIPS Transactions:PartB
    • /
    • v.18B no.2
    • /
    • pp.87-92
    • /
    • 2011
  • In Korean documents, there are diverse spellings of transliterated foreign loanwords. This fact diminishes the performance of information retrieval systems in that a foreign word can be recognized differently, which is to say, as two or several different words. Thus, information retrieval systems require preprocessing to correct nonstandard loanword spellings prior to searching and recognizing corresponding equivalent words. This paper proposes a method that improves precision and processing efficiency using the Korean alphabet's viable prefix, which prunes a virtual tree from which candidate loanwords are created.

Retrieving English Words with a Spoken Work Transliteration (입말 표기를 이용한 영어 단어 검색)

  • Kim Ji-Seoung;Kim Kwang-Hyun;Lee Joon-Ho
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.39 no.3
    • /
    • pp.93-103
    • /
    • 2005
  • Users of searching Internet English dictionary sometimes do not know the correct spelling of the word in mind, but remember only its pronunciation. In order to help these users, we propose a method to retrieve English words effectively with a spoken word transliteration that is a Korean transliteration of English word pronunciation. We develop KONIX codes and transform a spoken word transliteration and English words into them. We then calculate the phonetic similarity between KONIX codes using edit distance and 2-gram methods. Experimental results show that the proposed method is very effective for retrieving English words with a spoken word transliteration.

An English-to-Korean Transliteration Model based on Character and Pronunciation (글자 및 발음 기반 영-한 음차표기 모델)

  • 오종훈;배선미;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.925-927
    • /
    • 2004
  • 음차표기란 외국어의 발음을 자국어로 표기하는 것으로 정의된다. 영-한 자동 음차표기 방법에는 직접방식, 피봇방식, 혼합방식이 있다. 기존의 영-한 음차표기 연구들은 직접방식에 기반한 연구들이 대부분이었다. 하지만, 음차표기는 직접방식에서 사용하는 단순한 자소 대 자소변환 작업이라기보다는 자소의 음성적 변환 작업이라고 할 수 있다. 따라서 자소뿐만 아니라 음소 등 음성적 정보가 매우 중요하다. 본 논문에서는 이러한 특성을 이용하여 자소 정보뿐만 아니라 음소 정보를 이용한 음차표기 기법을 제안한다. 주어진 자소와 음소 및 자소와 음소의 문맥정보를 이용하여 한국어 음차표기를 생성하는 본 논문의 기법은 약 60%의 단어정확도를 나타내었다.

  • PDF

A Study on the Utilization of Romanization (로마자 표기표준의 활용에 관한 연구)

  • 심효정
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2000.08a
    • /
    • pp.23-26
    • /
    • 2000
  • 많은 양의 정보가 실시간으로 생산되는 현재 다양한 정보검색방법이 더욱 필요하게 되었으며 이에 따라 다양한 언어로 된 정보를 신속하고 정확하게 검색해내기 위해서 로마자 표기도 더욱 중요하게 되었다. 이에 본 연구에서는 정보검색 분야에서의 로마자 표기표준의 활용을 중심으로 논하고자 한다.

  • PDF

A Study of Interpretation Effect of Passwords to Password Generation (패스워드 표기 방식이 패스워드 생성에 미치는 영향)

  • Kim, Seung-Yeon;Kwon, Taekyoung
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.25 no.5
    • /
    • pp.1235-1243
    • /
    • 2015
  • The purpose of this study was to find if the password composition of domestic users is affected by the different form of the word 'Password' in the interface of login or password change. In particular, 'Password', foreign notation, and 'Secret Number', notation translated by Korean, have a semantic difference. According to the survey of 200 students in S university, passwords made under the word 'Secret Number' are heavy on numbers than alphabet. Because these passwords make much smaller composition space than another case, they have bad security impact. We expect to make use of this paper as a base line data for study to find how improve domestic user's password security.