• 제목/요약/키워드: Korean-to-Japanese Machine Translation

검색결과 21건 처리시간 0.026초

어휘기능문법(Lexical-Functional Grammar)에 근거한 한-영 양방향 기계 번역기의 언어학적 구성 (Linguistic design of a bidirectional Korean-English machine translation system based on Lexical-Functional Grammar)

  • 김정렬
    • 한국언어정보학회지:언어와정보
    • /
    • 제3권1호
    • /
    • pp.65-82
    • /
    • 1999
  • The interests in Machine Translation(MT) have gotten revitalized lately with the rapid expansion of internet users. MT technology has gone through several different stages of development, but the longest surviving methods usually maintains the following characteristics: the expand ability and flexibility based on proved linguistic formalism, the transfer method of translation, the continued efforts of systematic updates being made into the system. This paper introduces one such system, L&H Korean-English bidirectional MT system. This system uses Lexical-Functional Grammar as its linguistic framework. It also adopts the transfer method of MT and has been around on the market for over 10 years for other language pairs. Currently, the system covers over 10 different languages including Chinese, Japanese and Arabic, in addition to European languages. This paper will review the system in its core and discuss related tools and resources be ing used to enhance the quality of translation.

  • PDF

문장구조 유사도와 단어 유사도를 이용한 클러스터링 기반의 통계기계번역 (Clustering-based Statistical Machine Translation Using Syntactic Structure and Word Similarity)

  • 김한경;나휘동;이금희;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권4호
    • /
    • pp.297-304
    • /
    • 2010
  • 통계기계번역에서 번역성능의 향상을 위해서 문장의 유형이나 장르에 따라 클러스터링을 수행하여 도메인에 특화된 번역을 시도하는 방법이 있다. 그러나 기존의 연구 중 문장의 유형 정보와 장르에 따른 정보를 동시에 사용한 경우는 없었다. 본 논문에서는 각 문장의 문법적 구조 유사도에 따른 유형별분류 기법과, 단어 유사도 정보를 사용한 장르 구분법을 적용하여 기존의 두 기법을 통합하였다. 이렇게 분류된 말뭉치에서 추출한 도메인 특화 모델과 전체 말뭉치에서 추출된 모델에서 보간법(interpolation)을 사용하여 통계기계번역의 성능을 향상하였다. 문장구조 유사도와 단어 유사도의 계산 방법으로는 각각 커널과 코사인 유사도를 적용하였으며, 두 유사도를 적용하여 말뭉치를 분류하는 과정에서는 K-Means 알고리즘과 유사한 기계학습 기법을 사용하였다. 이를 일본어-영어의 특허문서에서 실험한 결과 최선의 경우 약 2.5%의 상대적인 성능 향상을 얻었다.

호텔예약을 위한 음성번역시스템 (A Speech Translation System for Hotel Reservation)

  • 구명완;김재인;박상규;김우성;장두성;홍영국;장경애;김응인;강용범
    • 한국음향학회지
    • /
    • 제15권4호
    • /
    • pp.24-31
    • /
    • 1996
  • 이 논문에서는 호텔예약을 위한 음성번역시스템(KT-STS:Korea Telecom Speech Translation System)에 대해 기술한다. KT-STS는 한국손님이 일본의 호텔을 예약하고자 할 때 사용할 수 있는 시스템으로 한국어 음성을 인식하여 일본어로 번역을 해주는 시스템이다. 이 시스템은 한국어 음성인식부, 한일 기계번역부, 그리고 한국어 음성합성부로 구성되어 있다. 한국어 음성인식부는 HMM(Hidden Markov Model)에 근거한 화자독립, 300 단어급 연속음성인식시스템이다. 언어모델은 바이그램(bigram)을 전향 언어모델로, 의존문법을 후향 언어모델로 사용한다. 기계번역부에서는 의존문법과 직적 번역 방식을 사용하였다. 음성합성부에서 합성단위로 반음소를 사용하며 합성방식은 주기파형분해 및 재배치 방식을 이용한다. KT-STS는 TMS320C30 DSP 보드를 장착한 SPARC20 위크스테이션 상에서 거의 실시간으로 동작한다. 음성인식 실험결과 94.68%의 단어인식률과 82.42%의 문장인식률을 얻었으며, 한일 번역기만의 번역 성공률은 100%였다. 우리는 이 시스템과 일본 KDD에서 개발한 시스템을 전용선으로 연결하여 한일간 자동통역 국제시연을 가진 바 있다.

  • PDF

Korean-Chinese Person Name Translation for Cross Language Information Retrieval

  • Wang, Yu-Chun;Lee, Yi-Hsun;Lin, Chu-Cheng;Tsai, Richard Tzong-Han;Hsu, Wen-Lian
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.489-497
    • /
    • 2007
  • Named entity translation plays an important role in many applications, such as information retrieval and machine translation. In this paper, we focus on translating person names, the most common type of name entity in Korean-Chinese cross language information retrieval (KCIR). Unlike other languages, Chinese uses characters (ideographs), which makes person name translation difficult because one syllable may map to several Chinese characters. We propose an effective hybrid person name translation method to improve the performance of KCIR. First, we use Wikipedia as a translation tool based on the inter-language links between the Korean edition and the Chinese or English editions. Second, we adopt the Naver people search engine to find the query name's Chinese or English translation. Third, we extract Korean-English transliteration pairs from Google snippets, and then search for the English-Chinese transliteration in the database of Taiwan's Central News Agency or in Google. The performance of KCIR using our method is over five times better than that of a dictionary-based system. The mean average precision is 0.3490 and the average recall is 0.7534. The method can deal with Chinese, Japanese, Korean, as well as non-CJK person name translation from Korean to Chinese. Hence, it substantially improves the performance of KCIR.

  • PDF

일한 기계번역 시스템 COBALT-J/K의 성능 평가 (Evaluation of COBALT-J/K, Japanese to Korean Machine Translation System)

  • 정중락;김정인;문경희;이종혁;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.338-345
    • /
    • 1996
  • 일본어 특허 문서를 번역하기 위해 개발이 시작된 COBALT-J/K(COllocation - BAsed Language Translator from Japanese to Korea)는 현재 그 번역 대상을 모든 일본어 문서로 확장해 곧, 상용 시스템으로 전환을 바라보고 있다. 이런 시점에서 일반 문서를 대상으로 하는 범용 기계 번역 시스템의 관점에서 시스템을 평가하여 문제점을 찾고, COBALT-J/K가 우선적으로 해결하고자 한 문제들이 올바르게 해결되었는지를 살피고자 한다. 이를 위한 평가 방법으로 문형별로 분류된 다수의 일본어 문장에 대하여 실제 번역을 하여 한국어 번역문과 일본어 원문을 비교하는 방식으로 분석하였으며, 현재 시판되고 있는 J-Seoul에 대해서도 같은 방법으로 실험한 결과를 얻은 후, 이 결과는 평가의 보조 자료로 삼았다.

  • PDF

PC를 이용한 일$\cdot$한 번역 시스템 ATOM의 개발에 관한 연구 ( I ) - 구문해석과 생성과 사전 구성과 형태소 해석을 중심으로 - (Development of Japanese to Korean Machine Translation System ATOM Using Personal Computer I - Dictionary Construction and Morphological Analysis -)

  • 김영섬;김한우;최병욱
    • 대한전자공학회논문지
    • /
    • 제25권10호
    • /
    • pp.1183-1192
    • /
    • 1988
  • 정확한 형태소 해석과정의 구현을 위해 heuristic 정보를 부가한 형태소 사전과 접속정보 테이블을 구성하고 문절수최소법을 근간으로 하여 자동 띄어쓰기 과정을 구현한다. 또한 독립적인 활용어 테이블을 구성하고, 접속정보 테이블과 상호 연계시켜 적용합으로 해서 접속정보와 활용어 정보의 구성을 간단하게 하였으며, 시스템의 검증과 확장 효율을 제고하였다. 번역 사전은 해석 사전과 생성 사전으로 구성하며, 해석과정의 효율과 보다 자연스런 역어의 생성을 위해 통계적으로 추출한 고빈도의 종결구를 관용어로 기술하고, 사전상에 직접 프로시쥬어를 기술하여 시스템의 적응성을 증대시켰다.

  • PDF

PC를 이용한 일$\cdot$한 번역 시스템 ATOM의 개발에 관한 연구 ( II ) - 구문해석과 생성과 정을 중심으로 - (Development of Japanese to Korean Machine Translation System ATOM Using Personal Computer II - Syntactic/Semantic Analysis and Generation Process -)

  • 김영섬;김한우;최병욱
    • 대한전자공학회논문지
    • /
    • 제25권10호
    • /
    • pp.1193-1201
    • /
    • 1988
  • 구문 해석과정에서 동사가 갖는 필수격을 기준으로 격 프레임을 구성하여 격 구조를 생성하며, 형태소 해석 결과에 단문을 기준으로 한 부분 문법을 재귀적으로 적용함으로 해서 구문 의미 해석을 수행한다. 또한 역어 생성과정에서 일본어 조사처리의 중요성을 고려하여 중요 조사의 애매성 해소와 역어 분류를 위한 독립적인 프로시쥬어를 기술하여 효율을 제고한다. 그리고 일본어 종결구의 처리를 위해서 동사와 조동사의 복합 가능성을 고려한 생성 테이블을 작성하여 형태소와 구문 해석정보에 의해 일의적(一義的)인 결정을 행하여 보다 자연스런 역어의 생성과 생성과정의 간략화를 도모하였다.

  • PDF