• 제목/요약/키워드: Korean Parser

검색결과 168건 처리시간 0.027초

한국어 문장분석과 어휘정보의 연결에 관한 연구 (A Study of the Interface between Korean Sentence Parsing and Lexical Information)

  • 최병진
    • 한국언어정보학회지:언어와정보
    • /
    • 제4권2호
    • /
    • pp.55-68
    • /
    • 2000
  • The efficiency and stability of an NLP system depends crucially on how is lexicon is orga- nized . Then lexicon ought to encode linguistic generalizations and exceptions thereof. Nowadays many computational linguists tend to construct such lexical information in an inheritance hierarchy DATR is good for this purpose In this research I will construct a DATR-lexicon in order to parse sentences in Korean using QPATR is implemented on the basis of a unification based grammar developed in Dusseldorf. In this paper I want to show the interface between a syntactic parser(QPATR) and DTAR-formalism representing lexical information. The QPATR parse can extract the lexical information from the DATR lexicon which is organised hierarchically.

  • PDF

한국어 구문 분석기를 이용한 예문기반 유사 영문 선택에 관한 연구 (A Study of the selection of similar English sentence based on example using the Korean parser)

  • 권영훈;윤영호;한광록
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.360-362
    • /
    • 2000
  • 본 연구는 예문을 이용하여 한국어 문장과 가장 유사한 영어 문장을 선택하기 위한 기존 연구보다 예문 지시의 정확도를 향상하고 기존의 문제점이었던 문장성분 선택의 불일치성을 제거하기 위해 한국어 구문 분석 시스템을 추가한 형태를 갖추고 있다. 한국어 구문 분석 시스템을 사용하는 이유는 한문장을 하나의 프레임으로 구조화시킬 때 서술부가 문장의 의미를 나타내는 가장 중요한 역할을 하므로 서술부를 헤더로 선택하고 단순히 조사 정보를 사용하여 각 문장성분을 추출하는 방법의 문제점을 제거하고 서술부 연결 관계를 기초로 프레임의 슬롯을 확보할 수 있기 때문이다. 유사 영문이 필요한 한국어 문장이 입력되면 입력 문장에 대한 형태소 분석과 한국어 구문 분석을 통하여 한국어 문장에서 서술부와 연결되는 주요 성분을 분리하여 프레임 구조를 생성하고 생성된 프레임과 이미 구축된 예문 데이터베이스 사이의 가중치와 유사도를 계산함으로써 한국어 문장과 유사한 영어 문장의 예를 제시하여 영작에 이용할 수 있는 시스템을 구현한다.

  • PDF

영한 번역 시스템에 관한 연구 (A Study on English-Korean Translation System)

  • 김영섬;김한우;최병욱
    • 대한전자공학회논문지
    • /
    • 제23권6호
    • /
    • pp.908-915
    • /
    • 1986
  • In this paper, an English-Korean machine translation system which consists of a syntax analyzer, a semartic analyzer and a sentence generatodr is proposed. The intermediate language in the syntax analysis is described by a lambda categorial grammar that is based on Montague Grammar, and the augmented context free grammar is introduced in the description of object language. Much difficulty in constructing general rules and semantic representations of an object language in the parser can be avoided by using the knowledge from the user interface utility that can modify the contents of dictionary and grammar rules.

  • PDF

연상 메모리의 자동설계에 관한 연구 (A Study on the Automatic Design of Content Addressable Memory)

  • 김종선;백인천;박노경;차균현
    • 한국통신학회논문지
    • /
    • 제15권10호
    • /
    • pp.857-867
    • /
    • 1990
  • CAM은 RAM이나 PLA 처럼 규칙적인 구조를 갖고 있으므로 CAM 자동설계 프로그램을 제작하기 용이하다. 본 프로그램은 CIF 형태로 그 결과가 출력되고 수정 작업이나 결과를 화면에 보기 위해 IBM/PC 상에서 디스플레이 프로그램을 개발하였다. CIF 파저는 YACC와 LEX로 제작하였고, 플롯팅을 위해서는 ROLAND XY 플롯터를 사용하였다. 위의 과정을 하나의 메뉴안에서 선택에 따라 수행하도록 Full-Down 메뉴를 사용하여 종합하였다.

  • PDF

Syntax directed Compiler for Subset of PASCAL

  • 이태경
    • 정보과학회지
    • /
    • 제4권2호
    • /
    • pp.65-73
    • /
    • 1986
  • Compiler 교육용 Compiler의 필요성은 강조할 필요가 있다. 이 교육용 Compiler가 가져야 할 성질은 다음과 같다. 첫째, Modular programming Technique사용하여 이해하기 쉬운 작은 program 형태로 만들어야 한다. 그렇게 함으로써 학생들이 상호결합(interface)변수와 형태를 알고 Compiler의 한 부분을 자신의 program으로 대치한 후 실험하여 볼 수 있다. 둘째; 내부에서 사용되는 Table은 간단한 형태로 구성한다. 세째; 다른 언어의 Compiler를 쓸때 사용하는 program(예를들면 parser generator)이 있어야 한다. 이것을 이용하여 학생들은 자신이 만든 언어의 Compiler를 학기중에 만들 수 있다. 넷째; REAL TIME clock을 이용하여 각 program module이 사용한 시간을 찍어낼 수 있어야 한다. 이렇게 함으로써 어떤 module이 가장 많은 시간을 소모하며, 이것을 개선하는 방 법을 찾아낼 수 있다. 다섯째; Compile된 결과를 Assembler 언어로도 출시시킬 수 있어야 한다. 위와 같은 교육용 Compiler의 제작 방법과 그 문제점에 대하여 서술하려고 한다.

대화정보를 이용한 계획인식 기반형 자연언어 대화이해 시스템의 설계 및 구현 (A Design and Implementation of Natural Language Dialogue Understanding System Based on Discourse Information and Plan Recognition)

  • 김영길;최병욱
    • 전자공학회논문지B
    • /
    • 제33B권3호
    • /
    • pp.159-168
    • /
    • 1996
  • In this paper, the natural language dialogue understanding sytem, based on discourse information and plan recognition, is designed and implemented. The system needs to analyze the user's input utterance and acquire the discoruse information to perform plan recognition and facilitate cooperative response. This paper proposes the mehtod of controlling a dialogue, based on the algorithm for extracting the discourse information. When the discourse information for dialogue understanding is extracted, the information-based value in feature structure that is obtained form korean parser is used. And the system makes use of the structure. Thus it can offer the response that the user wants to take, and let the dialogue to study in utterance level and enhance the efficiency of dialogue understanding. In this paper, we apply the system to the hotel reservation domain and show the mehtod of using the discoruse information to control the dialogue.

  • PDF

관계형 데이타베이스 시스템을 위한 지능적인 질의처리시스템 (An Intellingnet Query Processing System for Relational Database System)

  • 김대수;김창석
    • 한국지능시스템학회논문지
    • /
    • 제7권4호
    • /
    • pp.1-8
    • /
    • 1997
  • 본 논문에서는 관계형 데이타베이스 시스템을 위한 새로운 지능적인 질의 처리 시스템을 제안하였다. 애매한 질의와 관련된 기존의 연구결과를 분석하여 그 문제점들을 해결할 수 있는 새로운 질의 처리 시스템이 개발되었는데, 지능적 질의 처리기를 비롯한 각 모듈의 역할을 정의하였으며, 구문분석기, 질의변환 모듈, 추진 엔진, 의미 데이타베이스 모듈, 결과합성기 등의 알고리즘을 제시하였다. 또한 제안된 질의처리 시스템의 기반한 실제 작동의 과정을 한 예를 들어 검증한 결과 타당성 있는 결과가 입증되었으며, 사용자의 일반적인 질의뿐만 아니라 애미한 질의에도 지능적으로 대처하여 순서화된 겨로가를 보여주고 있다.

  • PDF

Xerces를 이용한 GML 파서의 개발 (Development of GML Parser using Xerces)

  • 김영창;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.18-21
    • /
    • 2006
  • 최근, 지리 정보 사용에 대한 관심과 응용 분야에 대한 개발이 증가함에따라서, 지리 정보의 공유 및 상호운용성에 대한 필요성이 증가하고 있다. 이에 따라 OGC(Open GIS Consortium)에서는 지리 정보의 교환 표준으로 GML 언어를 제시하였다. GML은 지리 정보를 전송 및 저장하기 위해 XML로 인코딩한 언어이다. 따라서, 지리 정보를 위한 공간 데이터베이스에 GML 문서를 저장하기 위해서는 효과적인 GML 문서의 파싱이 필수적이다. 본 논문에서는 대표적인 XML 파서인 Xerces를 확장하여 GML 문서를 효과적으로 파싱할 수 있는 GML 파서를 개발한다. 이를 위해 GML 스키마에서 제공하는 지리 정보 데이터 타입을 Xerces 파서의 내부 데이터 타입으로 제공하여, GML 응용 문서의 스캔(scan) 및 Validation을 위해 소요되는 GML 스키마 문서의 파싱 비용을 효과적으로 줄일 수 있다.

  • PDF

Stack LSTM 기반 한국어 의존 파싱을 위한 음절과 형태소의 결합 단어 표상 방법 (Improving Stack LSTMs by Combining Syllables and Morphemes for Korean Dependency Parsing)

  • 나승훈;신종훈;김강일
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.9-13
    • /
    • 2016
  • Stack LSTM기반 의존 파싱은 전이 기반 파싱에서 스택과 버퍼의 내용을 Stack LSTM으로 인코딩하여 이들을 조합하여 파서 상태 벡터(parser state representation)를 유도해 낸후 다음 전이 액션을 결정하는 방식이다. Stack LSTM기반 의존 파싱에서는 버퍼 초기화를 위해 단어 표상 (word representation) 방식이 중요한데, 한국어와 같이 형태적으로 복잡한 언어 (morphologically rich language)의 경우에는 무수히 많은 단어가 파생될 수 있어 이들 언어에 대해 단어 임베딩 벡터를 직접적으로 얻는 방식에는 한계가 있다. 본 논문에서는 Stack LSTM 을 한국어 의존 파싱에 적용하기 위해 음절-태그과 형태소의 표상들을 결합 (hybrid)하여 단어 표상을 얻어내는 합성 방법을 제안한다. Sejong 테스트셋에서 실험 결과, 제안 단어표상 방법은 음절-태그 및 형태소를 이용한 방법을 더욱 개선시켜 UAS 93.65% (Rigid평가셋에서는 90.44%)의 우수한 성능을 보여주었다.

  • PDF

동적 구문처리기 소프트웨어 적용을 통한 대화력전 수행체계 연동의 유연성 향상 방안 (Improving Flexibility of External Data Exchange in Count-fire Operation System by Adapting Dynamic Parser Software)

  • 홍원의
    • 한국군사과학기술학회지
    • /
    • 제11권1호
    • /
    • pp.51-56
    • /
    • 2008
  • The counter-fire operation system performs its mission exchanging information with other related systems such as command & control systems and military information systems. In the process of exchanging information, the counter-fire operation system uses a type of data message which contains exchange data information in the format of KMTF. The requirement of data exchange of count-fire operation will continue to evolve. But the EDX(External Data eXchange) configuration item of the current counter-fire operation system can not effectively cope with the variation of data exchange requirements due to its fixed software structure. In the paper, a solution for improving flexibility of external data exchange in counter-fire operation system is proposed.