• 제목/요약/키워드: 영-한 번역

검색결과 53건 처리시간 0.024초

한/영 기계번역 시스템을 위한 시제 도우미의 설계와 구현 (Design and Implementation of a Tense Helper for a Korean-to-English Machine Translation System)

  • 이병희
    • 인터넷정보학회논문지
    • /
    • 제2권4호
    • /
    • pp.55-67
    • /
    • 2001
  • 최근 여러 상용 기계번역 시스템들이 발표되고 있다. 하지만 아직은 많은 시스템들이 오역된 결과를 출력하는 문제점을 안고 있다. 본 논문은 이러한 오역 중에서 시제처리 때문에 발생하는 오류에 중점을 둔다. 본 논문에서는 한국어의 시제를 영어의 현재, 과거, 미래, 현재완료 과거완료 미래완료 현재진행 과거진행, 미래진행, 현재완료진행, 과거완료진행, 미래완료진행 등 12시제와 비교한다. 이와 함께 한국어 시제의 의미를 분석하고, 시제의 구조를 개념그래프에 기반 하여 기술한다. 실험에서는 시제가 포함된 문장을 입력받아 개념그래프로 변환하는 프로그램을 구현하고 그 결과를 기술한다.

  • PDF

원자 및 분자 개념을 표상한 시각자료에 대한 중학생들의 이해 및 해석 과정 (Students' Comprehension and Interpretation Process of InscriptionsRepresenting the Concept of Atom and Molecule)

  • 노태희;윤미숙;한재영
    • 대한화학회지
    • /
    • 제53권3호
    • /
    • pp.355-367
    • /
    • 2009
  • 이 연구에서는 중학교 3학년 학생들의 면담을 통해 원자 및 분자 개념을 표상한 시각자료에 대 한 이해와 해석 과정을 조사하였다. 학생들과의 면담 및 결과 분석에 기호학적 모델을 사용하였다. 연구 결과, 시각자료의 이해와 관련된 구조화 과정은 잘 수행하는 편이며, 목표 개념에 도달하는 번역 과정 및 시각자료간의 대응에 해당하는 번역 과정은 대체로 어려워하였다. 시각자료와 글을 연결하는 번역 과정은 학생에 따라 성공 여부가 달랐다. 한편, 면담에 참여한 모든 학생들이 시각자료를 해석하는 과정은 유사하게 나타났다. 이에 대한 교육적 함의를 논의하였다.

Patent Tokenizer: 형태소와 SentencePiece를 활용한 특허문장 토크나이즈 최적화 연구 (Patent Tokenizer: a research on the optimization of tokenize for the Patent sentence using the Morphemes and SentencePiece)

  • 박진우;민재옥;심우철;노한성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.441-445
    • /
    • 2020
  • 토큰화(Tokenization)는 사람이 작성한 자연어 문장을 기계가 잘 이해할 수 있도록 최소 단위인 토큰으로 분리하는 작업을 말하여, 이러한 토큰화는 자연어처리 전반적인 태스크들의 전처리에 필수적으로 사용되고 있다. 최근 자연어처리 분야에서 높은 성능을 보이며, 다양한 딥러닝 모델에 많이 활용되고 있는 SentencePiece 토큰화는 여러 단어에서 공통적으로 출현하는 부분단어들을 기준으로, BPE 알고리즘을 이용하여 문장을 압축 표현하는 토큰화 방법이다. 본 논문에서는 한국어 기반 특허 문헌의 초록 자연어 데이터를 기반으로 SentencePiece를 비롯한 여러 토큰화 방법에 대하여 소개하며, 해당 방법을 응용한 기계번역 (Neural Machine Translation) 태스크를 수행하고, 토큰화 방법별 비교 평가를 통해 특허 분야 자연어 데이터에 최적화된 토큰화 방법을 제안한다. 그리고 본 논문에서 제안한 방법을 사용하여 특허 초록 한-영 기계번역 태스크에서 성능이 향상됨을 보였다.

  • PDF

한국과학교육학회지 논문의 글쓰기 사례 연구 (Case Study on the Writing of the Papers of Journal of the Korean Association for Science Education)

  • 한재영
    • 한국과학교육학회지
    • /
    • 제35권4호
    • /
    • pp.649-663
    • /
    • 2015
  • 과학교육 논문의 글쓰기 실태를 한국어 기초 문법과 번역투의 측면에서 조사하고 그 개선점을 찾아보았다. 과학교육 연구는 사회과학과 자연과학의 특성을 모두 나타내며 양적 연구를 더 많이 하는 특징이 있어 논문 글쓰기 방식에 영향을 미칠 수 있다. 이 연구에서 번역투는 순수한 한국어가 아닌 외국어에서 유래한 상투적 표현을 말한다. 한국어 기초 문법은 호응의 문제, 맞춤법 띄어쓰기 문장 부호의 문제, 사동표현의 문제, 무분별한 영어 사용의 문제로 정리하였고, 번역투는 영어번역의 문제, 일본어 번역의 문제, 영어와 일본어 번역의 문제로 구분하였다. 이에 따라 한국과학교육학회지 한 호에 실린 논문 9편의 글쓰기 중에서 한국어 기초 문법에 어긋나는 사례와 번역투에 해당하는 사례를 찾아 문제를 논의하고 대안을 제시하였다. 빈도가 높은 문제사례는 '~적', '영어 사용', '복수 표현', '하다류 피동', '~고 있는', '~을 통하여', '~에 대하여', '가지다', '관형격조사 ~의', '사물주어 수동태', '사동(시키다)' 등이었다. 연구 결과에 기초하여 과학교육 소논문의 글쓰기 특징을 '양적 연구의 글쓰기', '학술 연구의 객관적 글쓰기', '외국에서 유래한 연구의 글쓰기' 세 가지로 정리하였다. 과학교육 논문 글쓰기에 나타나는 문제를 개선하기 위해 과학교육 연구자는 한국어 기초 문법과 번역투에 관심을 기울이고, 구체적인 사례와 내용을 숙지할 필요가 있다. 이 연구의 결과는 한국어 글쓰기 교육과 문법 교육에 활용할 수 있다.

자소 및 음소 정보를 이용한 영어-한국어 음차표기 모델 (An English-to-Korean Transliteration Model based on Grapheme and Phoneme)

  • 오종훈;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권4호
    • /
    • pp.312-326
    • /
    • 2005
  • 최근 정보검색과 기계번역과 같은 자연언어응용에서 영-한 자동 음차표기에 대한 관심이 높아지고 있다. 지금까지의 영-한 자동 음차표기 연구에는 $<영어자소{\rightarrow}$한글자소>의 직접방식, <영어자소${\rightarrow$음소$\rightarrow$한글자소>의 피봇방식이 있다 기존의 영-한 음차표기 연구들은 주로 직접방식에 대한 연구가 활발히 진행되어 찼다. 하지만, 음차표기는 직접방식에서 사용하는 단순한 자소 대 자소변환 작업이라기보다는 자소의 음성적 변환 작업이라고 할 수 있다. 따라서 자소 뿐만 아니라 음소 등 음성적 정보가 매우 중요하다. 본 논문에서는 이러한 특성을 이용하여 자소 정보뿐만 아니라 음소 정보를 이용한 음차표기 기법을 제안한다. 주어진 자소와 음소 및 자소와 음소의 문맥정보를 이용하여 한국어 음차표기를 생성하는 본 논문의 기법은 약 $60\%$의 단어 정확도를 나타내었다.

영.한 대역 시소러스의 문제점에 관한 연구 (The Problem of word-for-word Translating English Thesaurus Terms into Korean)

  • 오재익
    • 정보관리연구
    • /
    • 제28권3호
    • /
    • pp.46-73
    • /
    • 1997
  • 정보검색 시스템의 검색효율성을 높이기 위해 많은 나라에서 시소러스를 구축하여 이용하고 있다. 그러나 시소러스 구축에는 많은 시간과 비용은 물론 전문성이 요구된다. 그러므로 외국의 시소러스를 번역하여 자국어 시소러스를 구축하는 사례를 빈번하게 찾아 볼 수 있다. 이 방법을 채택하는 경우 짧은 시간에 시소러스를 구축할 수 있다는 장점은 있으나 언어적, 문화적 차이 때문에 의미상의 등가성과 의미관계를 나타내는 계층관계와 연관관계가 상호 일치하지 않는 부분이 있을 것으로 여겨진다. 그러므로 본 연구에서는 1977년에 발행된 "Thesaurus of ERIC descriptors(7th ed. 1977)" 제 7판과 이것을 대역하여 한국 교육개발원에서 발행한 "KEDI 교육시소러스(1981)"의 디스크립터들을 비교 연구하여 번역 시소러스의 구축방법에 대한 문제점을 규명하고자 하였다.

  • PDF

영-한 기계번역 성능 평가 연구 (Towards a Methodology for Evaluating English-to-Korean Machine Translation Systems)

  • 시정곤;김원경;고창수
    • 한국언어정보학회지:언어와정보
    • /
    • 제4권2호
    • /
    • pp.1-26
    • /
    • 2000
  • The purpose of this paper is to establish the standard method of evaluation English-to-Korean MT systems We focus on test suites, evaluation procedure and evaluation results. Four computer programs on the market are tested on a test suite consisting of 1,501 sentence, The quality of translation and the capacity of MT system are the key points for evaluation . The sentences in the suite are classified according to the grammatical properties they reveal. The classificatory scheme has the structure of a directory: each sentence belongs to a subclass, which belongs to a major class,. We place the sentences in the test suite on a scale of difficulty (hard ordinary easy) and each output sentence is graded on a scale of four accuracy levels. We also test the programs with respect to their speed.

  • PDF

어휘기능문법(Lexical-Functional Grammar)에 근거한 한-영 양방향 기계 번역기의 언어학적 구성 (Linguistic design of a bidirectional Korean-English machine translation system based on Lexical-Functional Grammar)

  • 김정렬
    • 한국언어정보학회지:언어와정보
    • /
    • 제3권1호
    • /
    • pp.65-82
    • /
    • 1999
  • The interests in Machine Translation(MT) have gotten revitalized lately with the rapid expansion of internet users. MT technology has gone through several different stages of development, but the longest surviving methods usually maintains the following characteristics: the expand ability and flexibility based on proved linguistic formalism, the transfer method of translation, the continued efforts of systematic updates being made into the system. This paper introduces one such system, L&H Korean-English bidirectional MT system. This system uses Lexical-Functional Grammar as its linguistic framework. It also adopts the transfer method of MT and has been around on the market for over 10 years for other language pairs. Currently, the system covers over 10 different languages including Chinese, Japanese and Arabic, in addition to European languages. This paper will review the system in its core and discuss related tools and resources be ing used to enhance the quality of translation.

  • PDF

서울시 유치원의 현황 분석과 비교 (Analysis of the Current Status of Kindergartens in Seoul)

  • 고은서;김태균;이재영;박시현;문유진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.331-332
    • /
    • 2023
  • 유치원은 학령이 안 된 어린이의 심신 발달을 위한 교육 시설이다. 그러므로 본 연구는 학부모들이 첫 교육을 중요하게 생각하는 만큼 수많은 유치원의 다각적인 정보를 원아 학부모들이 한 눈에 파악 및 비교할 수 있게끔 하기 위해 수행되었다. 본 연구의 목적은 유치원을 선정하려고 하는 학부모들의 불편을 최소화하고 정보를 투명하게 공개하여 선택의 폭을 넓혀 확실한 선택을 할 수 있도록 하는 것이다. 이를 달성하기 위해 본 팀은 데이터베이스 시스템을 활용하여 보다 편리한 서비스 및 유용한 정보를 제공하였다.

  • PDF

문장 내 영 조응어 해석을 위한 영대명사의 조응성 결정 (Anaphoricity Determination of Zero Pronouns for Intra-sentential Zero Anaphora Resolution)

  • 김계성;박성배;박세영;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권12호
    • /
    • pp.928-935
    • /
    • 2010
  • 문서에서 생략된 요소가 지시하는 대상을 식별해 내는 작업은 기계 번역, 정보추출 등과 같은 자연언어처리 분야의 다양한 응용들을 위해 필요하다. 문장에서 생략된 요소들은 영조응사, 영대명사 등으로 불리며, 지시(reference)의 한 유형으로 간주되고 있지만, 모든 영형이 문서에서 명확하게 언급된 지시 대상을 지시하지는 않는다. 이에 영형의 조응성을 결정하려는 연구가 최근 진행되고 있으며, 본 논문에서는 한국어에서 가장 빈번하게 나타나는 영형 주어(subject zero pronouns)의 문장 내 조응성 결정에 초점을 맞춘다. 주어진 영형과 선행사 후보들 간의 쌍대 비교(pairwise comparison)에 기반한 기존 연구와 달리, 본 논문은 비조응적 혹은 문장 간에서 해결 가능한 영형이 나타난 절의 구조를 직접 학습함으로써 영형의 문장 내 조응성을 결정한다. 실험에서 제안한 방법은 베이스라인보다 나은 성능을 보였으며, 영형의 조응성 결정은 향후 영형 조응어 해석에 긍정적인 영향을 줄 수 있을 것으로 기대된다.