• Title/Summary/Keyword: 원시 언어

Search Result 99, Processing Time 0.021 seconds

Translation Disambiguation Based on 'Word-to-Sense and Sense-to-Word' Relationship (`단어-의미 의미-단어` 관계에 기반한 번역어 선택)

  • Lee Hyun-Ah
    • The KIPS Transactions:PartB
    • /
    • v.13B no.1 s.104
    • /
    • pp.71-76
    • /
    • 2006
  • To obtain a correctly translated sentence in a machine translation system, we must select target words that not only reflect an appropriate meaning in a source sentence but also make a fluent sentence in a target language. This paper points out that a source language word has various senses and each sense can be mapped into multiple target words, and proposes a new translation disambiguation method based on this 'word-to-sense and sense-to-word' relationship. In my method target words are chosen through disambiguation of a source word sense and selection of a target word. Most of translation disambiguation methods are based on a 'word-to-word' relationship that means they translate a source word directly into a target wort so they require complicate knowledge sources that directly link a source words to target words, which are hard to obtain like bilingual aligned corpora. By combining two sub-problems for each language, knowledge for translation disambiguation can be automatically extracted from knowledge sources for each language that are easy to obtain. In addition, disambiguation results satisfy both fidelity and intelligibility because selected target words have correct meaning and generate naturally composed target sentences.

Phrase-Pattern-based Korean-to-English Machine Translation System using Two Level Word Selection (두단계 대역어선택 방식을 이용한 구단위 패턴기반 한영 기계번역 시스템)

  • Kim, Jung-Jae;Park, Jun-Sik;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.209-214
    • /
    • 1999
  • 패턴기반기계번역방식은 원시언어패턴과 그에 대한 대역언어패턴들의 쌍을 이용하여 구문분석과 변환을 수행하는 기계번역방식이다. 패턴기반 기계번역방식은 번역할 때 발생하는 애매성을 해소하기 위해 패턴의 길이를 문장단위까지 늘이기 때문에, 패턴의 수가 급증하는 문제점을 가진다. 본 논문에서는 패턴의 단위를 구단위로 한정시킬 때 발생하는 애매성을 해소하는 방법으로 시소러스를 기반으로 한 두단계 대역어 선택 방식을 제안함으로써 효과적으로 애매성을 감소시키면서 패턴의 길이를 줄이는 모델을 제시한다. 두단계 대역어 선택 방식은 원시언어의 한 패턴에 대해 여러 가능한 목적언어의 대역패턴들이 있을 때, 첫 번째 단계에서는 원시언어 내에서의 제약조건에 맞는 몇가지 대역패턴들을 선택하고, 두번째 단계에서는 목적언어 내에서의 제약조건에 가장 적합한 하나의 대역패턴을 선택하는 방식이다. 또한 본 논문에서는 이와 같은 모델에서 패턴의 수가 코퍼스의 증가에 따른 수렴가능성을 논한다.

  • PDF

Design of Verb-Phrase Patterns for Korean-to-English MT (한영 자동 번역을 위한 동사구 번역패턴의 활용)

  • 양성일;김영길;서영애;김창현;홍문표;최승권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.178-180
    • /
    • 2001
  • 원시언어 문장의 구조 분석을 기반으로 하는 기계번역 시스템에서 원시언어의 최소 의미 단위는 동사를 중심으로 한 단문으로 생각할 수 있다. 단문 단위 대역어를 지정하기 위해서는 동사구 번역패턴의 사용이 요구된다. 본 논문에서는 한국어 단문 내 격 정보와 번역을 위한 의미 제약조건을 기술하여 한영 기계번역 시스템에서 사용하는 동사구 번역패턴을 정의하고, 문장 정규화를 통한 동사구 번역패턴의 활용방법을 제안한다. 동사구 번역패턴은 단문 구조 파악을 위한 제약 조건부와 대역어 선정부로 나뉜다. 제약 조건부는 단문 구조 번역을 위한 최소한의 의미 제약만으로 기술되며, 격조사로 구분되는 격 정보를 갖는다. 이러한 격 정보는 원시언어인 한국어의 단문 분석을 위해 사용되며 분석결과에 대해 단문 단위 대역어를 지정한다. 동사구 번역 패턴은 실제 말뭉치에서의 사용을 반영하기 위해 병렬 말뭉치로부터 구축되며 실험을 통해 예측되는 패턴의 규모를 알아볼 수 있다.

  • PDF

Unicode and Code Conversion for Sejong 21 Raw Corpus (21세기 세종계획 원시 말뭉치의 유니코드와 코드 변환)

  • Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.262-265
    • /
    • 2009
  • 21세기 세종계획은 국어정보화를 위한 범국가적 사업으로서 국어 기초 자원을 구축하는데 매우 큰 기여를 하였으며, 그 주요 결과물로 배포된 세종 말뭉치는 많은 연구자들에게 꼭 필요한 가치있는 결과물이다. 이처럼 소중한 국어 자원을 실제 연구자들이 활용하고자 할 때 불편함을 느끼는 경우가 있는데 그 이유는 균형 말뭉치의 구축이라는 말뭉치의 특성 및 원문 자료의 내용을 최대한 보존하기 위한 노력의 일환으로 사용자 정의 영역에 정의된 문자들이 다수 포함되어 있기 때문이다. 본 논문에서는 자연언어 처리, 정보검색 분야 연구자들이 세종계획 최종 결과물 중에서 원시 말뭉치를 활용하는데 있어서 말뭉치에 사용된 문자코드의 유형을 중심으로 코드 변환 문제점과 그 해결 방안을 모색하고자 한다.

  • PDF

The Design of a Functional Language which has an Annotation Syntax and Implmentation of the Front-end of the Translator for the Language (Annotation을 가지는 함수언어의 설계 및 번역기 전반부 구현)

  • 최관덕
    • Journal of the Korea Society of Computer and Information
    • /
    • v.3 no.1
    • /
    • pp.25-34
    • /
    • 1998
  • There are two major method for expressing parallelim in functional languages. The one is the strictness analysis and the other the annotation. The strictness analysis is a method that a compiler detects parallelism and expresses the detected information in the object program. The annotation is a method that a programmer detects parallelism and expresses in the source program. This study is on the annotation and is aimed at construction of a translator for a functional language which has an annotation syntax. The translator translates a source program to enriched lambda-calculus graphs. The translator is implemented in C using compiler development tools such as YACC and Lex, under UNIX environments. In this paper we present the design and implementation techniques for developing the front-end of the translator.

  • PDF

ASN.1 Source Code Auto-Generator (ASN.1 원시 코드 자동 생성기)

  • 정진영;김영철
    • Journal of the Korea Society of Computer and Information
    • /
    • v.8 no.4
    • /
    • pp.28-34
    • /
    • 2003
  • ASN.1 is the most fundamental technology in network management. The develoment of ASN.1 environment requires three steps : compiler work to parse ASN.1 languages, updating database with the parsing results, and pretty-printing work for data in the database. This paper presents the design and implementation of the translator which automatically translates the specification of ASN.1 to the object-oriented language C++. This system provides a total environment including for various graphic user interface, DB interface, browser to develop ASN.1 for development environment of ASN.1 For the implementation, Objectivity DB is used for database, flex and yacc for compiling, and Tcl/Tk for user interface.

  • PDF

Re-examining the Concept of 'Seeking Out the Original Root (原始返本)' as an Example of Religious Language (종교언어로서의 '원시반본(原始返本)' 개념 재검토)

  • Cha, Seon-keun
    • Journal of the Daesoon Academy of Sciences
    • /
    • v.29
    • /
    • pp.171-207
    • /
    • 2017
  • The research regarding religious concepts used in Daesoon Jinrihoe are still incomplete. This study is a suggestion to critically review the existing research on 'seeking out the original root (原始返本)', one of the religious terms of Daesoon Jinrihoe. In addition, this concept will be seen from a new perspective. 'Seeking out the original root' plays a major role in Daesoon theology due to the cosmology established by Daesoon Jinrihoe. However, the existing research on this topic are prone to the perspective of 'returning' and assuming a 'cyclical view on the order of history'. Therefore, the cosmology that has been built by the religious language misleads readers to assume a retrospective process or that the process itself is realized on its own in accordance with the cosmic order. These kinds of studies do not specifically manifest the world view of Daesoon Jinrihoe. They fail to do so because Sangje's reordering works and its fruit, the earthly paradise of the Later World, have never existed before. The concept of 'seeking out the original root' should break away from the frame of a cyclical view of history and exert the uniqueness of Daesoon Jinrihoe. In this regard, this study can be summarized as follows: 'Seeking out the original root', one of the principles needed to achieve the re-creation of the Later World, endeavors to find a way to account for the origin of all things such as civilizations, cultures, and dharmas. If such a way is found, the facts between the root and the beginning should be acknowledged, as the root itself is what has been sustained, succeeded, used, resolved, revised, and rectified. The origin is usually dealt with from the position of rewarding. This was all achieved in Sangje's decisions and his reordering works. Its outcome will be utilized as a basis to establish an earthly paradise in the Later World. This concept, as defined above, excludes a cyclical view of history and implies that the concept of 'seeking out the original root' is a flexible frame within the context of dynamic structuralism. Given the style of this approach, this study provides a view which can be easily differentiated from existing research.

Design of a Multilingual Translation System Based on Interlingual Approach (중간언어에 기반한 기계 번역시스템의 설계)

  • Kim, Sang-Kuk;Park, Chang-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.521-526
    • /
    • 1993
  • 다언어간 번역을 지향하는 기계번역시스템의 개발을 위해서는, 의미 이해기반의 해석기술과 언어에 독립적인 생성기술의 설계가 기본이므로 원시언어와 목표언어가 어느 한쪽의 언어지식에 의존하지 않고 언어형식화가 가능한 중간언어 구조를 설정하는 것이 중요하다. 따라서, 한국어를 중심으로 하는 다언어 번역의 설계에서는 비교적 문구조의 정형화가 이루어진 영어와는 달리 어순 배열의 자유도가 높고 조사의 격표시로 문장구조가 결정되는 한국어의 특성을 고려한 해석 및 생성 메카니즘이 필요하다. 본 논문에서는 문장에 내포된 심층의미의 중간 표현으로써, 단어의 의미를 개념화시킨 개념소(Conceptual Primitive)간의 의미적 결합관계를 나타내는 개념 그래프(Conceptual Graph)를 채택하고 설계한 다언어 번역지향의 중간언어기반 번역시스템에 대하여 기술한다.

  • PDF