• Title/Summary/Keyword: 영-한 번역

Search Result 53, Processing Time 0.027 seconds

Cliche Analysis for English-Korean Interpretation and Translation Training : Mainly on Shakespeare's Works Texts (영·한 통번역 교육을 위한 클리셰(cliche) 분석 : 셰익스피어 극 텍스트를 중심으로)

  • You, Seon-Young
    • The Journal of the Korea Contents Association
    • /
    • v.15 no.11
    • /
    • pp.626-634
    • /
    • 2015
  • The purpose of this study was to analyze the cliche for English-Korean interpretation and translation training with special reference to the cliche based on Shakespeare's works texts. The term of 'idioms' are generally used as figurative expressions instead of the term of 'cliche'. Thus, cliches must be reinterpreted in the lexicon that are used in useful expressions. Cliches are often idioms. Idioms are figurative phrases with an implied meaning; the phrase is not to be taken literally. This causes difficulty when translating to another language because the meaning may not be understood by people within that culture. Cliches are figurative or literal expressions and are overused expressions. Consequently, the cliches are distinguished from the idioms by the transparent meanings. This study was examined based on the cliches shown in Shakespeare's works texts. After all, anyone who wants to become an efficient English learners, interpretor and translator should be familiar with cliches. They had better use the cliche in English learning site. I hope this study will be helpful even a bit to his attempt.

Design and Implementation of an XML-based Translator for Metadata Interchange in RDBs (RDB 대상 메타데이터 교환을 위한 XML기반 번역기 설계 및 구현)

  • Lee, Wol-Yeong;Lee, Gi-Ho
    • Journal of KIISE:Databases
    • /
    • v.28 no.1
    • /
    • pp.48-56
    • /
    • 2001
  • XML은 여러 분야에서 다양한 타입의 데이터를 효과적으로 관리하기 위한 표준으로 사용되고 있다. 이러한 XML의 한 응용으로서 데이터베이스 시스템, 파일 시스템, OLTP시스템, OLAP시스템, 데이터웨어하우징을 위한 ETL 시스템, 데이터마이닝 시스템 등을 포함하는 다양한 타입의 데이터 처리 시스템 사이에서 메타데이터를 교환하기 위하여 XML을 이용하여 메타데이터를 표준화하는 것이다. 본 연구는 MDC(MetaData Coalition)에 제안한 일반적인 데이터 처리 시스템을 위한 메타데이터 교환 스펙인 MDIS(Metadata Interchange Specification)를 따르도록 설계한 관계형 데이터베이스 시스템의 메타데이터 교환을 위한 사양으로서 R-MDIS(MetaData Interchange Specification for RDBs) 모델을 제안하고 이에 따라 표현된 자료를 상호 데이터베이스 시스템 사이에서 교환할 수 있는 Export 함수와 Import 함수를 포함하는 번역기를 개발한다. 이 번역기는 메타데이터의 일관성을 유지하면서도 메타데이터의 양방향 흐름을 지원할 수 있도록 하는 정보를 포함하고 있다. 본 연구는 구체적인 관계형 데이터베이스 시스템에서의 메타데이터 교환을 위한 실제적인 번역기를 구현함으로써 다양한 종류의 데이터 처리 시스템들 사이에서 메타데이터 불일치 문제를 해결할 수 있는 근거를 제시하였다. 둘째, XML을 이용하여 메타데이터 교환 사양을 설정함으로서 구도화된 데이터나 구조화되지 않은 데이터 모두에 대하여 일관된 방법으로 데이터 교환이 가능하도록 하여 효율적인 정보 교환을 할 수 있다는 것을 보여 주었다. 셋째, 본 연구에서 개발한 번역기는 메타데이터 교환에 의해 데이터들을 공유하게 함으로서 효율적으로 관리하지 못하던 데이터들을 효율적으로 사용할 수 있게 함으로서 데이터 관리 문제에 해결책이 될 것이다.

  • PDF

Mining the Web for Korean-English Parallel Corpora and Sentence Alignment (웹 문서로부터 한-영 병렬 말뭉치 자동 구축과 문장 단위 정렬)

  • Yang, Zoo-Il;Kim, Seon-Ho;Song, Man-Suk
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.150-155
    • /
    • 1999
  • 다국어를 이용한 통계적 자연어 처리의 연구가 진행됨에 따라 병렬 말뭉치의 중요성이 대두되고 있다. 그러나 여러 가지 제약점으로 인하여 현재 이용 가능한 한국어 병렬 말뭉치가 드문 상황이다. 월드 와이드 웹 상에는 다양한 언어로 번역된 문서들이 있으며 이를 병렬 말뭉치로 구축, 활용한다면 말뭉치의 희소성으로 인한 문제를 해결할 수 있다. 본 논문에서는 웹 상에서 번역문서 후보를 추출한 다음 HTML 문서 구조를 비교하여 번역문서인지를 판별하고 문장 단위 정렬을 이용하여 병렬 말뭉치로 구축하는 방법을 제시한다.

  • PDF

Zero Pronoun Resolution for Korean-English Spoken Language MT (한국어-영어 대화체 번역시스템을 위한 영형 대명사 해소)

  • Park, Arum;Ji, Eun-Byul;Hong, Munpyo
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.98-101
    • /
    • 2011
  • 이 논문은 한-영 대화체 번역 시스템에서 영형 대명사 해소를 위한 새로운 방법론을 제시하였다. 영형 대명사는 문맥, 상황, 세상 지식으로부터 추론될 수 있는 문장에서 생략된 요소이다. 이 논문은 특히 주어-대명사 생략 현상에 대해 다루고 있는데, 그 이유는 드라마 대본이나 인스턴트 메신저 채팅과 같은 한국어 대화체에서는 매우 일반적인 현상이기 때문이다. 이 논문에서 우리는 많은 양의 지식을 요구하지 않는 간단한 방법론을 제시하였다. 평가결과 우리의 방법은 0.79의 F-measure 스코어를 달성하였고, 전체번역률의 측면에서는 약 4.1% 정도의 향상효과가 있었다.

  • PDF

A Study on the Korean Parts-of-Speech for Korean-English Machine Translation (기계번역용 한국어 품사에 관한 연구)

  • 송재관;박찬곤
    • Journal of the Korea Society of Computer and Information
    • /
    • v.5 no.4
    • /
    • pp.48-54
    • /
    • 2000
  • This Paper classified korean Parts-of-speech for korean-english machine translation and investigated morphological characters of each parts-of-speech. Korean standard grammar classified parts-of-speech by semantic, functional and formal character. Many rules make a difficulties the understanding of grammar structure and parts-of-speech classification and it is necessary to preprocess at machine translation. This paper classified korean parts-of-speech by one rule. The parts-of-speech suggested in this paper have a same syntactic role and same parts-of-speech with english dictionary, and express the structure of korean sentence. And also it can make target language by pattern matching in korean-english translation.

  • PDF

Validity and Reliability of Korean Version of Home Falls and Accidents Screening Tool (HOME FAST) (한글판 낙상 위험 주거환경 평가 (Home Falls and Accidents Screening Tool; HOME FAST)의 내용이해도 및 신뢰도 연구)

  • Ju, Yumi;Cho, Sun-Young
    • Therapeutic Science for Rehabilitation
    • /
    • v.8 no.4
    • /
    • pp.77-92
    • /
    • 2019
  • Objective : This study aims to obtain the validation of Korean version of HOME FAST using the translation-back translation process and to evaluate the reliability. Methods : Total three stages were conducted which includes forward translation to Korean, test for degree of understanding of translated version, back translation to English, and then review and proof reading process. 21 occupational therapists were participated in the evaluation of understanding of Korean-translated HOME FAST, then some of expressions were modified for better understanding. Korean version was went through back-translation to English. Similarity between the original version and re-translated version were evaluated. Total 75 data from community dwelling elderly group were collected to assess internal consistency. Two occupational therapists simultaneously evaluated for the inter-rater reliability. Results : 11 items of Korean-translated scale were responded as having confused meaning by occupational therapists. There was some modification on expression. In the evaluation of similarity between original version and re-translated version, 3 items were selected as dissimilar items in terms of syntax and 6 items were selected in terms of semantic similarity. After the repetitive modification process, items were obtained conceptual equivalence between two different languages. Internal consistency was .62(KR20) (p<.01) and inter-rater reliability was .97(ICC) (p<.01). Conclusion : Korean version of HOME FAST was finalized through translation-retranslation process. The conceptual equivalence was established and Korean version showed highly reliable. In further study, The modification of items reflecting Korean house and life style should be conducted.

Automatic Korean-English Back-Transliteration (한-영 자동 음차 복원)

  • Kang, Byung-Ju;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.63-69
    • /
    • 1999
  • 최근 다국어 정보검색, 기계번역 등과 관련하여 자동 음차 표기 및 복원에 대한 필요성이 증대되고 있다. 특히 영어와 한국어 같이 그 음운구조의 차이가 큰 언어 쌍인 경우에는 간단한 문제가 아니다. 더구나 외래어를 영어로 복원하는 것은 표기의 경우보다 훨씬 어렵다. 본 논문에서는 결정트리 학습을 통한 한/영 자동 음차 복원 방법을 제안하고 기존의 방법 및 로마자 표기법에 기반한 방법에 비교하여 매우 정확하게 복원이 가능함을 보인다.

  • PDF

Target Word Selection for English-Korean Machine Translation System using Multiple Knowledge (다양한 지식을 사용한 영한 기계번역에서의 대역어 선택)

  • Lee, Ki-Young;Kim, Han-Woo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.5 s.43
    • /
    • pp.75-86
    • /
    • 2006
  • Target word selection is one of the most important and difficult tasks in English-Korean Machine Translation. It effects on the translation accuracy of machine translation systems. In this paper, we present a new approach to select Korean target word for an English noun with translation ambiguities using multiple knowledge such as verb frame patterns, sense vectors based on collocations, statistical Korean local context information and co-occurring POS information. Verb frame patterns constructed with dictionary and corpus play an important role in resolving the sparseness problem of collocation data. Sense vectors are a set of collocation data when an English word having target selection ambiguities is to be translated to specific Korean target word. Statistical Korean local context Information is an N-gram information generated using Korean corpus. The co-occurring POS information is a statistically significant POS clue which appears with ambiguous word. The experiment showed promising results for diverse sentences from web documents.

  • PDF

High-Quality Multimodal Dataset Construction Methodology for ChatGPT-Based Korean Vision-Language Pre-training (ChatGPT 기반 한국어 Vision-Language Pre-training을 위한 고품질 멀티모달 데이터셋 구축 방법론)

  • Jin Seong;Seung-heon Han;Jong-hun Shin;Soo-jong Lim;Oh-woog Kwon
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.603-608
    • /
    • 2023
  • 본 연구는 한국어 Vision-Language Pre-training 모델 학습을 위한 대규모 시각-언어 멀티모달 데이터셋 구축에 대한 필요성을 연구한다. 현재, 한국어 시각-언어 멀티모달 데이터셋은 부족하며, 양질의 데이터 획득이 어려운 상황이다. 따라서, 본 연구에서는 기계 번역을 활용하여 외국어(영문) 시각-언어 데이터를 한국어로 번역하고 이를 기반으로 생성형 AI를 활용한 데이터셋 구축 방법론을 제안한다. 우리는 다양한 캡션 생성 방법 중, ChatGPT를 활용하여 자연스럽고 고품질의 한국어 캡션을 자동으로 생성하기 위한 새로운 방법을 제안한다. 이를 통해 기존의 기계 번역 방법보다 더 나은 캡션 품질을 보장할 수 있으며, 여러가지 번역 결과를 앙상블하여 멀티모달 데이터셋을 효과적으로 구축하는데 활용한다. 뿐만 아니라, 본 연구에서는 의미론적 유사도 기반 평가 방식인 캡션 투영 일치도(Caption Projection Consistency) 소개하고, 다양한 번역 시스템 간의 영-한 캡션 투영 성능을 비교하며 이를 평가하는 기준을 제시한다. 최종적으로, 본 연구는 ChatGPT를 이용한 한국어 멀티모달 이미지-텍스트 멀티모달 데이터셋 구축을 위한 새로운 방법론을 제시하며, 대표적인 기계 번역기들보다 우수한 영한 캡션 투영 성능을 증명한다. 이를 통해, 우리의 연구는 부족한 High-Quality 한국어 데이터 셋을 자동으로 대량 구축할 수 있는 방향을 보여주며, 이 방법을 통해 딥러닝 기반 한국어 Vision-Language Pre-training 모델의 성능 향상에 기여할 것으로 기대한다.

  • PDF

Head-based Pharse Structure Transfer Dictionary for Korean_English Machine Translation (한.영 기계번역을 위한 중심어 기반 구 구조 변환 사전)

  • Lee, San-Jo;Park, Sang-Kyu;Kim, Yung-Taek
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.157-162
    • /
    • 1994
  • 한국어로부터 자연스러운 영어 역어문장을 생성하기 위한 정보를 사전에 일관성있게 수록하는 방법을 제시하였다. 기계번역의 각 과정에서 필요한 정보는 가장 적당한 형태로 사전으로부터 제공되어야 하는 것이 일반적인 방법이다. 그러나 한국어는 어순의 부분적 자유성, 어미의 복잡한 활용규칙, 조사의 다양한 쓰임새로 인해 이러한 규칙들의 정보를 일관되게 사전에 수록하기가 어려운 실정이다. 본 논문에서는 한국어 문장과 역어 문장을 단어나 구 혹은 절등의 구성요소들의 다대다 매핑규칙을 찾고 이들 규칙을 적당한 형태로 사전에 수록하여야하는 어려움에서 벗어나 문장대 문장구조를 직접대응시켜 구구조단위로 분석된 형태의 부분 파서트리 형태의 트리구조를 역어와 함께 사전에 수록하므로써 사전정보를 손쉽게 구축, 유지하고자 하였다. 또 이들 정보를 추출해내는 알고리즘을 사용함으로써 주어진 한국어 문장에 대해 사전에 수록된 가장 자연스러운 형태의 역어문장을 생성할 수 있도록 하였다.

  • PDF