• 제목/요약/키워드: 문맥정보

검색결과 661건 처리시간 0.026초

벡터를 사용한 2단계 영한 대역어 선택 (2-Level English-Korean Target Word Selection Using Vectors)

  • 이기영;박상규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.473-476
    • /
    • 2003
  • 영한 자동번역 시스템에서 대역어 선택 모듈은 어휘 변환을 수행한다. 일반적으로 영어 단어는 다양한 한국어 단어로 번역될 수 있는 의미적 모호성을 지니고 있으며, 고품질의 영한 자동번역 결과를 제공하기 위해서는, 해당 문맥에 가장 적합한 한국어 단어가 선택되어야 한다. 본 논문에서는 영어의 명사 어휘에 대하여, 벡터를 사용하는 2 단계 영한 대역어 선택 기법을 제안한다. 벡터를 사용하는 2 단계 대역어 선택 방식은 첫 번째 단계에서, 원문에서 사용된 영어 명사의 의미를 결정하고, 두 번째 단계에서, 해당 의미를 지니는 유사 한국어 대역어 가운데, 생성될 한국어 문맥에 맞는 적합한 한국어 대역어를 선택한다. 또한 제안하는 방법의 타당성을 검증하기 위해 현재 우리가 개발중인 Tellus-EK 영한 자동번역 시스템에 적용한 결과를 논한다.

  • PDF

Let-다형성 타입 유추 알고리즘 M의 병목을 해소하기 위한 혼성 알고리즘 H (A Hybrid Algorithm that Eliminates the Bottleneck of the Let-Polymorphic Type-Inference Algorithm M)

  • 주상현;이욱세;이광근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권12호
    • /
    • pp.1227-1237
    • /
    • 2000
  • Hindley/Milner let-다형성 타입체계(let-polymorphic type system)에는 두 가지 타입 유추(type-inference) 알고리즘이 있다. 하나는 표준으로 알려진 W 알고리즘으로 프로그램의 문맥에 상관없이 상향식으로 유추하는 알고리즘이고, 다른 하나는 프로그램의 문맥에 따라 하양식으로 유추하는 M 알고리즘이다. 본 연구에서는 함수 적용(application)이 중첩되는 경우, M 알고리즘에 병목현상이 발생함을 보이고, 이러한 병목현상이 발생하지 않는 혼성 알고리즘 H를 제시한다. H 알고리즘은 M 알고리즘을 함수 적용 부분만 W 알고리즘으로 변형한 알고리즘으로, W보다 일찍 M보다는 늦게 오류를 감지함을 보인다.

  • PDF

M3K에서 IPC 컴포넌트 설계 및 구현 (Design and Implementation of IPC Component in M3K)

  • 김영호;고영웅;유혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.35-37
    • /
    • 2000
  • M3K(MutiMedia MicroKernel)는 멀티미디어에서 요구하는 실시간 특성을 지원할 수 있는 것을 목표로 하고 있으며, 이를 위해서 마이크로 커널 구조로서 설계되었다. 마이크로 커널은 내부에서 발생하는 지연시간이 작고 예측 가능하므로 실시간 시스템을 지원하기에 적합하다. 그러나 서버간의 빈번한 메시지 교환에 따른 IPC 병목현상은 전체 시스템의 성능을 저하시키고, 외부 이벤트에 대한 실시간 처리를 어렵게 한다. 본 연구에서는 M3K 에서 실시간 특성을 지원할 수 있도록 IPC를 설계 및 구현하는 것을 목표로 하고 있다. 이에 대한 접근방법으로는 IPC 중에 발생되는 쓰레드 간의 문맥 전환을 소프트웨어적으로 구현하고, IPC를 우선 순위가 부여된 시그널 객체를 이용하여 처리하고 있다. 따라서 빈번하게 발생되는 문맥 전환의 비용을 최소화함으로써 캐쉬 미스 및 TLB 미스를 줄이고, 우선 순위가 높은 이벤트나 IPC부터 처리될 수 있게 한다.

  • PDF

이국어 병렬말뭉치와 중간언어를 활용한 이국어 사전 자동구축 (Automatic bilingual lexicon construction via bilingual parallel corpus and pivot language)

  • 서형원;권홍석;김재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.307-310
    • /
    • 2013
  • 본 논문은 한국어-스페인어와 한국어-불어 간의 양방향 이국어 사전(Bi-directional bilingual lexicon)을 자동으로 구축하기 위한 새로운 방법을 제안한다. 일반적으로 한국어와 스페인어/불어 간의 병렬 말뭉치를 직접적으로 구축하기에는 어려움에 따르기 때문에, 영어를 중심언어로 하는 영어(EN)-한국어(KR)/스페인어(ES)/불어(FR) 병렬 말뭉치를 이용하여 문맥 벡터를 만들고 그들 간의 유사도를 계산하는 변형된 문맥 벡터 방법을 제안한다. 영어는 다른 언어와의 이국어 병렬 말뭉치가 비교적 많이 공개되어 있기 때문에 이 방법을 이용하면 비교적 쉽게 KR-ES와 KR-FR 양방향 이국어 사전을 구축할 수 있다. 본 논문에서 제안한 방법으로 실험해본 결과 최고 85%(ES${\rightarrow}$KR)의 정확도를 얻을 수 있었다.

규칙 기반 영한 기계번역에서의 구문 규칙 컴파일러 (Syntactic Rule Compiler in Rule-based English-Korean Machine Translation)

  • 김성동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1315-1317
    • /
    • 2013
  • 규칙 기반의 영한 기계번역 시스템의 구문 분석 시스템은 영어의 구문 구조를 기술하는 규칙 부분과 규칙을 적용하여 차트 파싱을 수행하는 실행 부분으로 구성된다. 구문 규칙은 문맥 자유 문법의 형식으로 기술되는데, 기술된 구문 규칙을 적용하여 파싱을 실행하는 실행 부분은 C 언어 함수로 표현되므로, 구문 규칙을 C 언어 함수로 변환해야 한다. 본 논문에서는 문맥 자유 문법 형식으로 기술된 구문 규칙을 C 언어 함수로 변환하는 도구인 구문 규칙 컴파일러를 개발하였다. 구문 규칙 컴파일러는 자동적으로 구문 규칙을 C 언어 함수로 변환함으로써 영한 기계번역 시스템의 성능 개선 과정에서 빈번하게 발생하는 구문 규칙의 생성과 수정을 용이하게 하여 번역 성능을 개선하는 작업을 지원한다.

리눅스 기반 임베디드 시스템의 성능 분석을 위한 소프트웨어 계층별 문맥 분석 기법 (Hierarchical Software Context Analysis Technique for Performance Analysis of Linux Based Embedded System)

  • 곽상헌;이호림;이남승;임성수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.57-58
    • /
    • 2009
  • 임베디드 시스템이 복잡해질수록, 성능 병목을 파악할 수 있는 성능 분석도구가 요구되고 있다. 현존하는 리눅스 기반의 소프트웨어 성능 분석 도구는 전체 시스템 관점에서 소프트웨어 계층에 따라 응용 소프트웨어의 실행 흐름을 파악하기에는 한계가 있다. 본 논문에서는 모든 소프트웨어 계층에서의 실행 흐름을 일관적으로 파악할 수 있는 문맥 분석 기법을 제안한다. 이 도구를 통해서 사용자 영역의 사용자 정의 함수와 라이브러리 함수, 커널 영역에서의 시스템 호출과 커널 이벤트에 대한 호출자와 피호출자에 대한 관계를 모두 파악할 수 있다.

클러스터링 기법을 활용한 관광지 대표문장 추출 (Extracting Representative Sentences about Tourist Sites Using a Clustering Method)

  • 김다희;이강우;임지원;홍순구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.677-680
    • /
    • 2021
  • '파리의 더러운 지하철', '런던의 비싼 물가' 등 관광지에 대한 몇 마디 말은 관광지를 직관적으로 이해하는데 도움을 준다. 관광지에 대한 직관적 평가를 파악하기 위해서 클러스터링 기법을 사용하였다. '주차', '경치', '시설'과 같은 다양한 라벨을 부여하여 클러스터링을 비교한 결과 '주차', '경치' 등 비슷한 문맥의 리뷰가 같은 클러스터로 묶인 것을 확인할 수 있었고, 각 분야의 문맥을 파악하기 위해 대표문장을 추출하였다. 각 분야의 대표문장은 해당 분야의 평가를 잘 파악할 수 있었고, 해당분야의 만족도뿐만 아니라 불편사항 등을 이해하는데 도움을 준다.

한국어 상대시간관계 추출을 위한 LSTM 기반 모델 설계 (Design of LSTM-based Model for Extracting Relative Temporal Relations for Korean Texts)

  • 임채균;정영섭;이영준;오교중;최호진
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.301-304
    • /
    • 2017
  • 시간정보추출 연구는 자연어 문장으로부터 대화의 문맥과 상황을 파악하고 사용자의 의도에 적합한 서비스를 제공하는데 중요한 역할을 하지만, 한국어의 고유한 언어적 특성으로 인해 한국어 텍스트에서는 개체간의 시간관계를 정확하게 인식하기 어려운 경향이 있다. 특히, 시간표현이나 사건에 대한 상대적인 시간관계는 시간 문맥을 체계적으로 파악하기 위해 중요한 개념이다. 본 논문에서는 한국어 자연어 문장에서 상대적인 시간표현과 사건 간의 관계를 추출하기 위한 LSTM(long short-term memory) 기반의 상대시간관계 추출 모델을 제안한다. 시간정보추출 연구에는 TIMEX3, EVENT, TLINK 추출의 세 가지 과정이 포함되지만, 본 논문에서는 특정 문장에 대해서 이미 추출된 TIMEX3 및 EVENT 개체를 제공하고 상대시간관계 TLINK를 추출하는 것만을 목표로 한다. 또한, 사람이 직접 태깅한 한국어 시간정보 주석 말뭉치를 대상으로 LSTM 기반 제안모델들의 상대적 시간관계 추출 성능을 비교한다.

  • PDF

도메인 상태를 이용한 다중 도메인 대화 상태 추적 (Multi Domain Dialog State Tracking using Domain State)

  • 전현민;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.421-426
    • /
    • 2020
  • 다중 도메인 목적 지향 대화에서 기존 딥 러닝을 이용한 대화 상태 추적(Dialog state tracking)은 여러 턴 동안 누적된 사용자와 시스템 간 대화를 입력 받아 슬롯 밸류(Slot value)를 추출하는 모델들이 연구되었다. 하지만 이 모델들은 대화가 길어질수록 연산량이 증가한다. 이에 본 논문에서는 다중 도메인 대화에서 누적된 대화의 history 없이 슬롯 밸류를 추출하는 방법을 제안한다. 하지만, 단순하게 history를 제거하고 현재 턴의 발화만 입력 받는 방법은 문맥 정보의 손실로 이어진다. 따라서 본 논문에서는 도메인 상태(Domain state)를 도입하여 매 턴 마다 대화 상태와 함께 추적하는 모델을 제안한다. 도메인 상태를 같이 추적함으로써 현재 어떠한 도메인에 대하여 대화가 진행되고 있는지를 파악한다. 또한, 함축된 문맥 정보를 담고 있는 이전 턴의 대화 상태와 도메인 상태를 현재 턴의 발화와 같이 입력 받아 정보의 손실을 줄였다. 대표적인 데이터 셋인 MultiWOZ 2.0과 MultiWOZ 2.1에서 실험한 결과, 대화의 history를 사용하지 않고도 대화 상태 추적에 있어 좋은 성능을 보이는 것을 확인하였다. 또한, 시스템 응답과 과거 발화에 대한 의존성을 제거하여 end-to-end 대화 시스템으로의 확장이 좀 더 용이할 것으로 기대된다.

  • PDF

문장의 화행을 반영한 한-영 대화체 기계번역 (A Korean to English Dialogue Machine Translation System Using Speech Acts)

  • 이현정;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.271-276
    • /
    • 1997
  • 대화체는 문어체와는 달리 화자와 청자 사이의 질의/응답으로 이루어진 형태의 문장들을 가지며, 생략과 대용어가 빈번히 발생하는 특징을 갖는다. 이러한 대화 형태에서 어떠한 한 문장에는 화자가 전달하고자 하는 의도를 포함하고 있다. 이러한 대화체 문장들을 번역하는 것은 단순한 언어적 분석에 의한 번역으로서는 많은 번역상의 오류가 발생하게 된다. 따라서 대화체 문장들의 올바른 번역을 위해서는 대화의 상황을 반영하는 문맥 정보가 부가적으로 요구된다. 본 연구에서는 이러한 문맥 정보로서 화행을 사용하여 대화체 기계번역을 수행하고자 한다. 화행(Speech Act)이란 화자에 의해 의도되어 발화 속에 포함된 언어적 행위를 나타내며, 이러한 화행을 분석함으로써 화자의 의도를 파악하고 이를 통해 올바른 번역을 수행할 수 있게 된다. 본 기계번역 시스템에 포함된 화행 분석 과정에서는 대화를 화행으로 모델링한 담화 문법과 유사한 형태의 재귀적 대화 전이망(Recursive Dialog Transition Network)을 사용하게 된다. 본 논문에서는 호텔 예약 영역에서의 기계번역 시스템에 대한 간단한 소개와 화행의 종류 및 분석 방법과 이를 통한 기계번역 방식에 대해 살펴보도록 하겠다.

  • PDF