• Title/Summary/Keyword: 표기 방법

Search Result 387, Processing Time 0.09 seconds

Automatic Detection and Extraction of Transliterated Foreign Words Using Hidden Markov Model (은닉 마르코프 모델을 이용한 음차표기된 외래어의 자동인식 및 추출 기법)

  • 오종훈;최기선
    • Korean Journal of Cognitive Science
    • /
    • v.12 no.3
    • /
    • pp.19-28
    • /
    • 2001
  • In this paper, we describe an algorithm for transliterated foreign word extraction in Korean language. In the proposed method we reformulate the transliterated foreign word extraction problem as a syllable-tagging problem such that each syllable is tagged with a transliterated foreign syllable tag or a pure Korean syllable tag. Syllable sequences of Korean strings ale modeled by Hidden Markov Model whose state represents a character with binary marking to indicate whether the character forms a Korean word or not. The proposed method extracts a transliterated foreign word with high recall rate and precision rate. Moreover, our method shows good performance even with small-sized training corpora.

  • PDF

Establishment of the ′Standard Hangul Phoneme into Character Conversion Rule′ (한국어 음가/ 한글 표기 변환을 위한 표준 규칙 제정)

  • 이계영;임재걸
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05c
    • /
    • pp.128-132
    • /
    • 2002
  • 한글 표기를 음가로 변환하는 규칙을 역으로 적용하여 음가를 한글 표기로 전환시키는 표준 규칙을 고안하는 것이 본 연구의 목표다. 이러한 표준 규칙은 음성인식에 반드시 필요한 귀중한 자료가 된다. 음성 인식은 표준으로 기록된 음성의 패턴과 입력을 비교하여 가장 유사한 패턴을 찾는 방법을 사용한다. 이때 표준 음성 패턴이 띄어쓰기 단위라면 수백만 개의 표준 패턴이 수록되어야 한다. 이렇게 하면 표준 패턴을 위한 데이터베이스도 너무 커지고 비교회수도 너무 많아져서 실용화가 불가능하다. 그래서, 음절단위로 인식하는 것이 바람직하다. 음절단위로 인식하면 인식된 음가가 한글 표기 문법에 맞지 않으므로, 인식 결과를 출력할 때에는 음가를 그대로 출력하는 것이 아니라 한글표기로 변환하여 표기해야 한다 이때, 본 연구의 연구 결과인 표준규칙을 사용한다.

  • PDF

The reasons why it is good to write Chinese loanwords in Korean instead of Chinese characters and Hànyǔ pīnyīn (중국의 외래어 표기를 한자와 병음 대신 한글로 쓰면 좋은 이유 증명)

  • TaeChoong Chung
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.639-643
    • /
    • 2022
  • 한글이 우수한 글자라는 의견에 세계 대부분의 학자들이 동의하고 있다. 한글 자모의 단순성과 직교성(규칙성)으로 인해 표현할 수 있는 발음의 수도 제일 많고 읽고 쓰고 배우기도 쉽다는 점을 누구나 인정하기 때문이다. 구한말과 1950년대에 중국도 한글표기를 사용할 뻔 했다는 이야기도 있다. 그러나 그들은 한자를 사용하되 단순화 하는 방법과 병음을 사용하는 것으로 결론이 났고 현재 그렇게 사용하고 있다. 그런데 중국인들이 외래어를 다루는 것을 보면 많이 고생한다는 생각이 든다. 외래어 표기를 한글로 사용한다면 외래어를 위한 한자 단어를 만들 필요가 없고 외래어를 표현하고 배우고 읽고 쓰는데 훨씬 더 효과적으로 할 수 있고, 원음 재현율이 매우 개선된다. 또한' 글자의 길이가 짧아지고 더 멀리서도 인식되는 장점도 있다. 본 논문은 그것을 보여준다. 본 논문에서는 영어 원단어, 한국어 표기, 중국어 표기, 병음 표기, 중국어 발음 한글 표기 등을 비교해서 한글이 유리함을 보여주고자 한다. 결론적으로 외국단어를 한자나 한자의 병음으로 표현하는 것보다 한글로 표현하는 것이 중국어를 사용하는 모든 사람들에게 큰 도움이 될 것이다. 물론 그들이 한글을 읽고 쓰는 것을 배우는 부담은 있지만 몇일만 배우면 평생의 문제를 해결하게 되는 문제이므로 큰 부담은 아니라고 본다.

  • PDF

A Study on the mathematical notation of expression in terms of skipping the parenthesis (괄호 생략 관점에서 식의 표기에 관한 고찰)

  • Kim, Chang Su;Kang, Jeong Gi
    • Journal of the Korean School Mathematics Society
    • /
    • v.19 no.1
    • /
    • pp.1-19
    • /
    • 2016
  • This study investigated the mathematical notation used today in terms of skip ping the parenthesis. At first we have studied the elementary and secondary curriculum content related to omitted rules. As a result, it is difficult to find explicit evidence to answer that question 'What is the calculation of the $48{\div}2(9+3)$?'. In order to inquire the notation fundamentally, we checked the characteristics on prefix, infix and postfix, and looked into the advantages and disadvantages on infix. At the same time we illuminated the development of mathematical notation from the point of view of skipping the parenthesis. From this investigation, we could check that this interpretation was smooth in the point of view that skipping the parentheses are the image of the function. Through this we proposed some teaching methods including 'teaching mathematical notation based on historic genetic principle', 'reproduction of efforts to overcome the disadvantages of infix and understand the context to choose infix', 'finding the omitted parentheses to identify the fundamental formula' and 'specifying the viewpoint that skipping the multiplication notation can be considered as an image of the function'.

Indexing and Ranking Mathematical Equations Using Postfix Notation (후위 표기법을 사용한 수학식 색인 및 랭킹)

  • Lee, Sehee;Shin, Junsoo;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.160-164
    • /
    • 2009
  • 최근 인터넷 및 컴퓨터의 사용이 활발해짐에 따라 문서의 디지털화가 빠르게 진행되고 있다. 이런 변화에 따라 수학식이 많이 사용되는 과학, 공학, 수학 등의 분야와 관련된 문서들을 검색해야할 필요성이 늘어가고 있다. 그러나 현재 일반 검색엔진은 텍스트 검색만을 제공하며 별도의 수학식 검색은 제공하지 않는다. 따라서 본 논문에서는 수학식 검색이 가능하도록 수학식의 색인 방법 및 랭킹 방법을 제안한다. 제안하는 색인 방법은 MathML로 입력되는 수학식을 후위 표기법과 일반 색인 방법의 두 가지로 색인하며, 언어모델을 사용하여 질의에 적합한 수학식을 랭킹한다. 일반 검색 엔진의 성능과 비교하기 위하여 2-포아송 모델과 제안 모델을 비교하였으며, 그 결과 제안 모델의 성능이 더 우수함을 보였다.

  • PDF

Suggestion of syllable representation methods for foreign languages in Hangul (한글에 의한 외국어 표기법에서 음절표현 방법 제안)

  • Chung, TaeChoong
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.65-69
    • /
    • 2015
  • 우리 모두 소리의 표현력이 뛰어난 한글의 우수성은 너무나 잘 알고 있으며, 한글의 세계화를 외치고 있다. 그러나 그런 일을 해야할 국립국어원 등 국가기관은 외국어 표기법을 만들지 않고 있다. 외래어표기법으로 충분하다고 생각하고 있는 것이다. 외래어표기법은 현재의 한글을 유지하면서 외국어를 한글 단어로 만들 때 어떻게 만드느냐를 규정한 것이다. 한글세계화에 필요한 외국어 표기법은 한글로 외국어를 잘 표현함으로써 한글을 외국에 퍼트리는 것이 목표이다. 따라서 외국인이 쓰기에 편리해야하고 외국어 발음 왜곡을 최소화 하면서 잘 표현해 내기엔 현재 한글로는 부족한 면이 있음으로 표현력이 확장된 한글을 만들어야한다. 물론 확장된 한글이 현재의 한글과 동떨어지면 안될 것이다. 많은 분들이 여러 아이디어로 제안을 해 왔지만 대부분 자음을 추가하는 데에 집중되어 있다. 확장한글에서 다루어야할 것은 1) 추가되는 자음과 모음 2) 한글에 없는 성조나 강약 및 장단 등에 관한 규정 추가 등이면 된다고 생각하고 있다. 그러나 한글의 큰 특성인 음절이 외국어 표현 때에 왜곡되는 현상이 있는데, 어떻게 외국어와 한글의 음절개념을 일치시킬 수 있을지에 대해 관심을 가지고 방안을 제안하고자 한다. 그 방안으로는 1) 합용병서와 2) 풀어쓰기 활용법이 가능하나, 필자는 중간선으로 3) 촉진자 표기법을 제안한다. 또한, 크기조절법에 대응해 음절인 글자 위에 점을 표기하는 음절점표기법도 제안한다.

  • PDF

A Study on the Education System for People Who Don't Have Their Own Letters, SOUL (문자 없는 나라를 위한 문자 교육 시스템(소울)에 관한 연구)

  • Ham, Hye-Ryeong;Noh, Yong-Deok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.377-380
    • /
    • 2010
  • 지식기반 사회에서 교육은 장기적인 발전을 위한 필수 요소이다. 교육을 위해서는 말하기, 듣기, 쓰기, 읽기 능력이 필요하다. 이 중 하나라도 충족하지 못한다면 제대로 된 교육을 받을 수 없다. 하지만 전 세계에 존재하는 약 6900여종의 언어 중 6600여종의 언어는 표기할 수 있는 고유 문자가 없다. 읽기 능력과 쓰기 능력을 기르기 위한 최소 조건조차 마련되어 있지 않은 것이다. 그래서 말은 있지만 문자는 없는 국가에 말을 표기할 수 있는 문자를 보급하여 지식기반 발전의 기반을 마련해 주는 소울(SOUL) 시스템을 제안한다. 소울(SOUL)은 두 가지 기능을 가지고 있다. 문자 교육 기능과, 지식 공유 공간 기능이다. 문자 교육 기능에서는 각 문자가 내는 소리와 조합방법, 그리고 각 문자의 표기법, 표기 순서 등을 익힘으로써 문자를 쉽게 익힐 수 있도록 하였다. SOUL은 말을 표기할 문자로 비교적 익히기 쉬운 언문인 한글을 채택하였다. 그리고 지식 공유 공간 기능에서는 문자를 익힌 사용자가 마치 위키피디아처럼 지식을 기록하고 공유할 수 있어 지식을 축적하도록 도와주도록 설계하였다. 여기서는 소울(SOUL) 시스템의 구조 및 구현을 보인다.

Consumers' understanding and preference for shelf life and ingredient listings in food label (유통기한 및 원재료명 표시에 대한 소비자의 이해도 및 선호도)

  • 이경애;김향숙
    • Korean journal of food and cookery science
    • /
    • v.17 no.4
    • /
    • pp.405-411
    • /
    • 2001
  • This research was conducted to evaluate consumers' understanding and preference for shelf life and ingredient listings in food label by survey using a questionnaire. The questionnaires were collected from female adult consumers residing in Seoul, Kyonggi, Choongnam and Chungbuk areas. Most of the consumers showed good understanding for shelf life and ingredient listings in food label. They had no particular preference for the types of shelf life labelling. They preferred listing all ingredients completely with amounts, but differentiated from food additives. They wanted to get more information about shelf life and ingredient listings in food label that is mainly associated with food safety They showed more preference for labelling the shelf life in the information panel with a storage condition. Most of them chose the ingredient list format in which each ingredient was written in one row in bold characters with percentage labelling.

  • PDF

Automatic Korean-English Back-Transliteration (한-영 자동 음차 복원)

  • Kang, Byung-Ju;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.63-69
    • /
    • 1999
  • 최근 다국어 정보검색, 기계번역 등과 관련하여 자동 음차 표기 및 복원에 대한 필요성이 증대되고 있다. 특히 영어와 한국어 같이 그 음운구조의 차이가 큰 언어 쌍인 경우에는 간단한 문제가 아니다. 더구나 외래어를 영어로 복원하는 것은 표기의 경우보다 훨씬 어렵다. 본 논문에서는 결정트리 학습을 통한 한/영 자동 음차 복원 방법을 제안하고 기존의 방법 및 로마자 표기법에 기반한 방법에 비교하여 매우 정확하게 복원이 가능함을 보인다.

  • PDF

CODARTS Methodology by the STS (STS 표기법에 의한 CODARTS 방법론)

  • Eom, Jin-A;Kim, Gyu-Nyeon
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.2
    • /
    • pp.241-250
    • /
    • 1999
  • Gomaa에 의해 제안된 CODARTS(Concurrent Design Approach for Real-Time System)방법론은 COBRA(Concurrent Object-based Real-Time Analysis)을 사용하여 실시간 시스템의 행동 모델을 개발하고 행동 모델에서 병렬 태스크 구조로 변환하는 데 도움을 주는 태스크 구성 지침을 제공한다. CODARTS에서는 태스크 구성 지침을 RTSA(Real-Time System Analysis)표기법으로 표현된 행동 모델에 적용하여 태스크를 구성한다. 그러나 RTSA 표기법에는 태스크를 구성하는데 필요한 실행 성질 및 주기, 이벤트의 병렬성 및 순서와 같은 정보들을 기술하지 않기 때문에 직접 태스크 구성 지침을 적용하는 것은 어렵다. 본 논문에서는 CODARTS 방법론의 분석단게에서 태스크 구성에 필요한 정보를 통합적으로 나타낼 수 있는 STS (Specification for Task Structuring)를 제안한고 이를 이용하여 태스크를 자동적으로 구성할 수 있는 알고리즘과 적용 예제를 보인다.