• Title/Summary/Keyword: 영어용어

Search Result 89, Processing Time 0.025 seconds

English/korean Terminology Translation System Using Word Formation (조어법 정보를 이용한 전문용어의 영/한 번역 시스템 개발)

  • 서충원;배선미;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.937-939
    • /
    • 2004
  • 전문용어 조어법 분석은 기존의 전문용어들의 어휘의 구성과 구조를 파악하여 전문용어 생성의 원리를 밝혀 여러 응용시스템에 이용하기 위한 기초 작업에다. 조어법 정보를 이용한 전문용어 번역 시스템은 조어법 분석 결과의 조어단위 정렬과 색인을 통하여, 새로운 영어 용어에 대한 한국어 대역이 후보 집합을 생성한다. 생성된 후보들은 언어 모델의 정보량의 차이를 이용한 가중치에 의하여 순서화된다. 본 논문에서 제안하는 가중치 방법을 이용하여 조어법 분석 결과에 포함되지 않은 용어들을 대상으로 성능을 평가했을 때, 영-한 조어단위 번역의 n-best 정확률에서 1순위 정확률은 약 61%, 10순위 정확률은 97%의 성능을 보였다.

  • PDF

Establishing Facet for Classifying Theological Terms (신학 용어 분류를 위한 패싯 설계에 관한 연구)

  • Yoo, Yeong-Jun
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.42 no.3
    • /
    • pp.259-279
    • /
    • 2008
  • The purpose of this study is to classify theological terms using facets and form foundation to build a theological thesaurus The terms was chosen in a English theological dictionary and the number of them are 1,031 but eventually, 984 terms were classified. The facets which classify the terms are 7 fundamentals and 14 sub-facets. Analysing the result of classification, abstract terms are much more than physical terms. They are 70% of the whole. Decimal classification to classify documents comes to dead end. therefore I think the research to classify terms of a specific subject as theology must be active. Furthermore, It is necessary to have knowledge about a specific subject to organize information in a specific subject.

Automatic Korean to English Cross Language Keyword Assignment Using MeSH Thesaurus (MeSH 시소러스를 이용한 한영 교차언어 키워드 자동 부여)

  • Lee Jae-Sung;Kim Mi-Suk;Oh Yong-Soon;Lee Young-Sung
    • The KIPS Transactions:PartB
    • /
    • v.13B no.2 s.105
    • /
    • pp.155-162
    • /
    • 2006
  • The medical thesaurus, MeSH (Medical Subject Heading), has been used as a controlled vocabulary thesaurus for English medical paper indexing for a long time. In this paper, we propose an automatic cross language keyword assignment method, which assigns English MeSH index terms to the abstract of a Korean medical paper. We compare the performance with the indexing performance of human indexers and the authors. The procedure of index term assignment is that first extracting Korean MeSH terms from text, changing these terms into the corresponding English MeSH terms, and calculating the importance of the terms to find the highest rank terms as the keywords. For the process, an effective method to solve spacing variants problem is proposed. Experiment showed that the method solved the spacing variant problem and reduced the thesaurus space by about 42%. And the experiment also showed that the performance of automatic keyword assignment is much less than that of human indexers but is as good as that of authors.

한국형 해사영어 커리큘럼 개발

  • Jeong, Hui-Su;Seol, Jin-Gi;Choe, Seung-Hui
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2018.11a
    • /
    • pp.289-291
    • /
    • 2018
  • 본 발표는 대한민국 선원의 의사소통 역량 및 글로벌 역량 강화를 위해 해수부에서 실시한 "선상 의사소통능력 강화방안" 사업을 통해 개발된 한국형 해사영어 커리큘럼의 수립 과정과 그에 따른 컨텐츠 제작 과정을 공유하고, 향후 개발 방향을 모색하기 위함이다. 따라서 본 발표를 통해 커리큘럼을 수립을 위한 선행 연구 과정(국제해사기구, 국제민간항공기구 및 국제항로표지협회 등의 국제 가이드라인 검토 및 분석, 특수목적영어 교육훈련기법 외), 교육 커리큘럼 수립(IMO 해사영어모델코스 및 표준해사통신용어 분석 및 재편성), 교육 컨텐츠 구성(실제 선사 유관 자료의 수집 및 데이터베이스 구축), 교육 훈련 교재 개발(교재, 학생용 워크북, 교사용 워크북, 음원) 등의 과정을 순차적으로 소개하고, 이에 대한 결과물을 공유하며, 향후 발전 방향을 제안하고자 한다.

  • PDF

Evaluation of English Term Extraction based on Inner/Outer Term Statistics

  • Kang, In-Su
    • Journal of the Korea Society of Computer and Information
    • /
    • v.25 no.4
    • /
    • pp.141-148
    • /
    • 2020
  • Automatic term extraction is to recognize domain-specific terms given a collection of domain-specific text. Previous term extraction methods operate effectively in unsupervised manners which include extracting candidate terms, and assigning importance scores to candidate terms. Regarding the calculation of term importance scores, the study focuses on utilizing sets of inner and outer terms of a candidate term. For a candidate term, its inner terms are shorter terms which belong to the candidate term as components, and its outer terms are longer terms which include the candidate term as their component. This work presents various functions that compute, for a candidate term, term strength from either set of its inner or outer terms. In addition, a scoring method of a term importance is devised based on C-value score and the term strength values obtained from the sets of inner and outer terms. Experimental evaluations using GENIA and ACL RD-TEC 2.0 datasets compare and analyze the effectiveness of the proposed term extraction methods for English. The proposed method performed better than the baseline method by up to 1% and 3% respectively for GENIA and ACL datasets.

A Generation System of English Pronunciation for the medical domain (의료분야를 위한 영어 발음열 생성 시스템)

  • Kim, A-Lum;Jeong, Kyung Seok;Park, Hyuk Ro
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.793-796
    • /
    • 2004
  • 본 논문은 의료분야의 음성 인식 시스템의 발음모델의 성능 향상에 필요한 올바른 영어 단어 발음열을 얻고자 한다. 본 시스템의 텍스트는 의료 전문 용어인 영어와 한글의 조합으로 되어있어, 한국어 G2P 성능뿐만 아니라 영어 G2P의 성능도 중요한 문제가 되고 있다. 또한 본 시스템의 의료 음성 데이터가 한국 화자로써, 표기열이 영어식 발음 폰셋으로 변환되면 효율적이지 못하다. 이를 위해, 영어 G2P의 결과를 한국 화자에 적합하게 변환해주는 방법론이 필요하게 된다. 따라서 본 논문에서 제안하는 방법은 음성 텍스트에서 영어만 추출한 후, 영어 G2P 프로그램(addttp, NIST)을 이용해 발음열을 구한다. 그리고 한국 화자의 실제 음성을 통해 얻은 정답 발음열을 구하여 서로 비교한다. 비교를 위해 각 발음열의 한 폰씩 정렬을 수행한 후, 삽입, 삭제, 대치 에러가 이러나는 쌍과 좌우 바이그램 정보를 추출한다. 마지막으로, 좌우 바이그램 정보에서 best1의 에러 패턴을 통해 모든 단어에 적용한다. 이 때, 최종적으로 실보다 득이 되는 에러패턴만을 추출, 적용한다. 실험에서는 26여개의 에러 패턴을 찾을 수 있어, 8%의 올바른 발음열을 추가적으로 얻는데 성공하였다.

  • PDF

An Information Retrieval System for IT Terminologies Using a Main Memory DBMS (메인 메모리 DBMS를 이용한 정보기술 전문용어 검색 시스템)

  • 강옥선;경원현;조완섭
    • Proceedings of the Korea Database Society Conference
    • /
    • 2001.06a
    • /
    • pp.311-322
    • /
    • 2001
  • 대부분의 일반 정보 검색 시스템은 색인어를 통해 이루어지는데 이런 경우 사용자는 원하는 정보를 얻기 위해 데이터베이스에 저장된 색인어를 정확하게 입력해야 한다. 그러나 일반 사용자가 필요한 색인어를 정확하게 입력하기는 어렵고 특히 원하는 정보가 전문분야의 것일 때는 더욱 그러하다. 따라서 특정 분야의 용어들을 중심으로 전문용어를 관리할 수 있는 시스템의 개발이 요구되고 있다. 정보기술 분야도 빠르게 성장하고 있는 전문분야의 하나로 사용되는 대부분의 단어가 영어이고 한글 표기 또한 다양하여 많은 사용자들이 원하는 정보를 정확하게 찾지 못하고 있다. 이렇듯 단어간의 형태적인 불일치로 인해 생기는 정보 검색의 문제를 해결하고 검색어의 범위를 확장하기 위해 만든 것이 전문용어 검색 시스템이다. 정보 검색시 사용자가 입력한 검색어뿐만 아니라 동의어나 상위어, 하위어까지 검색하여 질의를 확장함으로써 검색 효율을 높일 수 있다. 또한 객체-관계형 데이터베이스로 설계하여 검색이 용이하고, 새로운 단어의 확장이 용이하도록 그 구조를 설계하였다. 제안한 시스템은 메인 메모리 DBMS 를 이용하여 전자상거래와 같이 많은 사용자들이 동시에 접근하는 환경에서도 빠른 검색 성능을 유지할 수 있도록 하였다.

  • PDF

An Alignment method for Extracting English-Korean translations of term constituents (정렬기법을 이용한 전문분야 조어단위 대역쌍 추출)

  • 오종훈;황금하;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.529-531
    • /
    • 2003
  • 전문용어는 전문분야의 개념을 표현하는 언어적 표현이다. 전문용어의 조어단위는 전문용어를 구성하는 최소의 형태적 단위이다. 이러한 조어단위는 전문용어의 의미를 파악하는데 중요할 뿐만 아니라 전문분야 문서에 대한 기계번역과 같은 작업에 중요한 언어자원으로 사용될 수 있다. 하지만‘조어단위와 개념단위의 불일치 문제’, 조어 단위의‘동형이의어’,‘동의이형어’문제 등으로 인하여, 하나의 전문분야 개념을 나타내는 조어단위들의 덩어리를 파악할 필요가 있다. 본 논문에서는 이러한 문제점을 조어분석 된 한영 대역 전문용어사전에 대한 한국어-영어 조어단위 정렬문제로 해결하고자 한다. 본 논문의 기법은 97%의 정확률로 조어단위 간의 정렬을 수행하였다.

  • PDF

Automatic Extraction of Technical Terminologies from Scientific Text based on Hidden Markov Model (은닉마르코프 모델(HMM)을 이용한 과학기술문서에서의 외래어 추출 모델)

  • Oh, Jong-Hoon;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.137-141
    • /
    • 1999
  • 기술의 발달로 인해 수많은 용어들이 생성되고 있다. 이들은 대부분 전문용어이며 이는 비영어권 국가인 우리나라에 도입될 때, 외래어나 원어형태로 도입된다. 그런데 외래어나 원어형태의 전문용어는 형태소 분석기, 색인기 등의 시스템에서 오류의 원인이 되어, 이를 전처리기로 사용하는 자연언어처리 시스템의 성능을 저하 시킨다. 따라서 본 논문에서는 외래어나 원어로 된 전문용어를 처리하기 위한 전단계로서 문서에서 자동적으로 외래어를 인식하고 추출하는 방법을 제시한다. 본 논문에서 제시하는 방법은 외래어 추출 문제를 태깅문제로 변환하여, 태깅 문제를 해결하는 기법 중의 하나인 은닉마르코프 모델 (Hidden Markov Model)을 이용하여 외래어 추출을 하였다. 그 결과 94.90%의 재현률과 95.41%의 정확도를 나타내었다.

  • PDF

Design and Implementation of technical term dictionary system written in nML (nML을 이용한 기술용어 사전 시스템 구축)

  • 강현구;이광근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.70-72
    • /
    • 2001
  • ML은 엄밀한 수학적 모델에 기반 하여 구현된 프로그래밍 언어로서 고차함수, 복합형 함수와 엄격한 타입시스템을 지원하는 언어이다. nML은 한국과학기술원 프로그램 분석 시스템 연구단에서 연구중인 프로그램 분석 기술을 최대한 반영하여 구현하고 있는 ML의 한국형 사투리이다. 본 논문에서는 nML을 이용하여 일반적이고 자주 사용되는 프로그래밍 국면을 다양하게 반영한 응용프로그램을 구축하여 보았다. 구현하고자 하는 시스템은 중앙 집중형 데이터 서버를 가지는 기술용어 사전 시스템으로서 KDIC이라 명하였다. 본 시스템의 목적은 특정 분야에서 영어 용어들에 대한 전문인의 한글 용어로의 번역 사례를 모은 데이터 베이스를 구축하고, 이러한 번역 사례가 자연스럽게 이용되고자 함에 있다.