• 제목/요약/키워드: 구문해석

검색결과 109건 처리시간 0.021초

한국어 구문 해석을 위한 동사 '가다'의 명사 결합 관계 연구 (Noun Link Relation Research Of Verb '-Kata (가다)' for Korean Syntactic Analysis)

  • 박건숙
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.207-216
    • /
    • 1998
  • 본 논문에서는 한국어 구문 해석을 위해 동사 중심의 구문 틀 정보를 구축하고, 나아가 결합 빈도가 높은 명사와의 결합 관계를 하나의 네트워크로 구성하는 구문 해석의 방법을 제안한다. 동사 중심의 구문 틀과 명사의 의미 자질은 구문 해결에서 아주 중요한 역할을 하는 것으로, 구문의 비문 여부를 가리는 데 도움을 준다. 그러나 명사의 의미 자질은 경계가 모호하여 구문의 적격성(wellformedness)을 가리기에는 부족한 점이 많다. 따라서 동사와 명사의 결합 관계를 이용하면 구문의 의미적 적격성을 좀 더 명시적으로 가릴 수 있다. 한국어에서 기본 동사이고, 초등학교 교과서에서 사용된 빈도가 아주 높은 동사 '가다'를 가지고 구체적으로 구문 틀 정보와 결합 명사의 의미 자질 및 결합 관계를 정리하였다.

  • PDF

파싱을 위한 선택 : 구문 형태소의 이용 (Another Choice for Parsing : Using Syntactic Morpheme)

  • 황이규;송연정;이현영;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.249-254
    • /
    • 1999
  • 자연어 분석에서 발생하는 가장 큰 문제점은 분석의 각 단계에서 필요 이상의 모호성이 발생하는 것이다. 이러한 모호성은 각각의 분석 단계에서는 반드시 필요한 결과일 수 있지만 다음 단계의 관점에서는 불필요하게 과생성된 자료로 볼 수 있다. 특히 한국어 형태소 분석 단계는 주어진 문장에 대해 최소의 의미를 가지는 형태소로 분석하기 때문에 과생성된 결과를 많이 만들어 내는데, 이들 대부분이 보조용언이나 의존 명사를 포함하는 형태소열에서 발생한다. 품사 태깅된 코퍼스에서 높은 빈도를 나타내는 형태소들을 분석해 보면 주위의 형태소와 강한 결합 관계를 가지는 것을 발견할 수 있다. 이러한 형태소는 대부분 자립성이 없는 기능형태소로서, 개개의 형태소가 가지는 의미의 합으로 표현되기보다는 문장내에서 하나의 구문 단위로 표현될 수 있다. 본 논문에서는 이 형태소 열을 구문 형태소로 정의하고, 필요한 경우 일반 형태소 해석의 결과를 구문 형태소 단위로 결합하고 이를 바탕으로 구문 해석을 하는 방법을 제안한다. 구문 형태소 단위를 이용하여 구문해석을 수행함으로써, 형태소 해석 결과의 축소를 통해 불필요한 구문 해석 곁과를 배제할 수 있다.

  • PDF

영어 부정 스트리핑 구문의 중의성 해소에 관한 연구: 직접 해석 접근법을 중심으로 (Resolving the Ambiguities of Negative Stripping Construction in English : A Direct Interpretation Approach)

  • 김소지;조세연
    • 비교문화연구
    • /
    • 제52권
    • /
    • pp.393-416
    • /
    • 2018
  • 영어의 부정 스트리핑 구문은 접속사 but, 부사 not, 그리고 하나의 구성성분 NP로 구성되어있다. 해당 구문은 통사적으로는 불완전한 문장처럼 보이지만 의미적으로는 완전한 해석을 전달하며 특히, 이 구문은 중의적인 해석을 가질 수도 있기 때문에 적절한 접근방법으로 의미부를 분석하는 것이 필수적이다. 본 논문에서는 부정 스트리핑 구문의 통사적 구문생성과 중의성 해소를 위해 직접 해석 접근법(Direct Interpretation Approach)을 기반으로 한 구문 규칙을 제안하고자 한다. 이 규칙은 이전의 연구들이 해결하지 못하는 문제점을 설명할 수 있으며, 통사, 의미, 화용론 등 다양한 특성을 설명해준다.

구문형태소를 이용한 색인어 추출 (Index Extraction Using Syntactic Morpheme)

  • 황이규;이근용;김남수;이용석
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.26-30
    • /
    • 2000
  • 문서를 대표하는 단어를 추출하는 색인어 추출은 정보검색 시스템의 질을 좌우한다. 대부분의 색인어 추출 시스템은 명사를 추출하고 있으며, 가능한 모든 명사를 추출하고 있다. 이러한 방법은 불필요한 단어가 그 문장을 대표하는 색인어로 추출될 가능성이 높으며, 이는 정보 검색 시스템의 효율을 저하시킨다. 이를 해결하기 위해 품사 태깅이나 구문 해석 단계 등을 통해 불필요한 후보를 제거할 수 있지만, 태거를 구축하거나 구문 해석을 위해서는 많은 비용과 시간이 필요하다. 본 논문에서는 구문 형태소 단위의 형태소 해석에 기반한 색인어 추출 방법을 제안한다. 구문 형태소는 통사적/의미적으로 강한 공기 관계를 가지면서 문장에서 하나의 통사적 단위나 자질의 단위로 표현되기 때문에 구문 형태소내에 포함된 단어열들은 대부분 색인어가 될 수 없다. 이러한 방법을 이용하여, 형태소 해석 결과를 이용한 색인어 추출에서 발생하는 색인 오류를 제거함으로써 색인기의 성능을 높이는 방법을 제안한다.

  • PDF

구문형태소를 이용한 색인어 추출 (Index Extraction Using Syntactic Morpheme)

  • 황이규;이근용;김남수;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.26-30
    • /
    • 2000
  • 문서를 대표하는 단어를 추출하는 색인어 추출은 정보검색 시스템의 질을 좌우한다. 대부분의 색인어 추출 시스템은 명사를 추출하고 있으며, 가능한 모든 명사를 추출하고 있다. 이러한 방법은 불필요한 단어가 그 문장을 대표하는 색인어로 추출될 가능성이 높으며, 이는 정보 검색 시스템의 효율을 저하시킨다. 이를 해결하기 위해 품사 태깅이나 구문 해석 단계 등을 통해 불필요한 후보를 제거할 수 있지만, 태거를 구축하거나 구문 해석을 위해서는 많은 비용과 시간이 필요하다. 본 논문에서는 구문 형태소 단위의 형태소 해석에 기반한 색인어 추출 방법을 제안한다. 구문 형태소는 통사적/의미적으로 강한 공기 관계를 가지면서 문장에서 하나의 통사적 단위나 자질의 단위로 표현되기 때문에 구문 형태소내에 포함된 단어열들은 대부분 색인어가 될 수 없다. 이러한 방법을 이용하여, 형태소 해석 결과를 이용한 색인어 추출에서 발생하는 색인 오류를 제거함으로써 색인기의 성능을 높이는 방법을 제안한다.

  • PDF

LR 구문분석 기법을 이용한 음성 계산기 (Voice Calculator using LR Parsing Technique)

  • 유형근;이형준;이강성;김순협
    • 한국음향학회지
    • /
    • 제12권6호
    • /
    • pp.70-76
    • /
    • 1993
  • 본 논문은 음성만을 이용하여 계산할 수 있도록 하는 dam성 계산기 구현을 위한 기술에 관한 연구이다. 일정한 형식을 갖는 언어에 의하여 발생할 수 있는 다양한 형태의 구문을 언어 문법적 규칙을 기초로 해석하는 기능은 단독어 인식에서 문장인식으로 넘어가는 과정에서 필수적인 요소이다. 음성 계산기에 HMM과 LR 구문분석 기법을 적용하여 입력된 문장을 분석하고 잘못 인식된 단어를 문장에 맞도록 하였다. 구문분석하는 중에 수식의 의미도 해석하여 계산 결과를 출력해 내도록 하였다. 구문 분석을 사용하지 않은 방법에 비해서 잘못 인식할 가능성을 크게 줄였다.

  • PDF

형태소 및 구문 모호성 축소를 위한 구문단위 형태소의 이용 (Using Syntactic Unit of Morpheme for Reducing Morphological and Syntactic Ambiguity)

  • 황이규;이현영;이용석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권7호
    • /
    • pp.784-793
    • /
    • 2000
  • 기존의 한국어 형태소 해석은 한국어의 교착어 특성상 다양한 형태론적 모호성을 가진다. 이러한 형태론적 모호성은 많은 구문 모호성을 만들어 내어 올바른 의미를 가지는 파스트리의 선택을 어렵게 한다. 한국어에서 이런 형태론적 모호성의 대부분이 보조용언이나 의존 명사와 관련이 있다. 보조용언이나 의존명사는 주위의 형태소들과 강한 결합 관계를 가지고 있으며, 대부분 자립성이 없는 기능형태소이다. 결합된 형태소들은 문장 내에서 하나의 기능적 역할이나 구문적 역할을 수행한다. 우리는 품사 태깅된 20 만 어절 크기의 말뭉치로부터 이 형태소열을 찾아 이를 3가지 유형으로 분류하였다. 그리고, 이를 구문 형태소로 정의하고 구문 형태소를 구문 분석의 기본 입력 단위로 간주하였다. 본 논문에서는 구문 형태소가 아래와 같은 문제의 해결에 있어서 효율적인 방법임을 제안한다: 1) 형태소 해석의 축소, 2) 구문 해석 도중 불필요한 부분 파스트리의 배제, 3) 구문 모호성의 축소. 마지막으로, 실험 결과를 통해 구문단위 형태소가 형태소 및 구문 모호성을 축소하기 위해 반드시 필요함을 보인다.

  • PDF

영한 기계번역에서 전치사구를 해석하는 시스템 (An Analysis System of Prepositional Phrases in English-to-Korean Machine Translation)

  • 강원석
    • 한국정보처리학회논문지
    • /
    • 제3권7호
    • /
    • pp.1792-1802
    • /
    • 1996
  • 영한 기계번역에서 전치사구의 해석 부착의 문제(Attachment Problem)와 의미 해석의 문제, 그리고 해석에 필요한 정보 획득의 문제가 있다. 이 세 가지 문제를 해결하기 위하여 본 논문은 전치사구 해석 시스템을 제시한다. 이 시스템은 규칙 제어기와 신경망의 하이브리드 구문해석 시스템, 격의미 해석 시스템, 그리고 신경망 의 입력 정보를 자동으로 생성하는 의미속성 생성기로 구성한다. 의미속성 생성기는 시스템의 입력이 되는 의미속성을 자동으로 생성하는 방법으로 인위적인 방법의 단점 을보완하여 객관성 있는 전치사구 해석을 하게 한다. 격의미 해석 시스템은 영한 기계 번역에 맞는 격의미를 찾아내어 자연스런 한국어 생성을 하게 하고 구문해석 시스템은 규칙 방법의 장점과 신경망 방법의 장점을 취한 하이브리드 방식의 시스템으로 전치사 구 부착의 문제를 해결한다.

  • PDF

PC를 이용한 일$\cdot$한 번역 시스템 ATOM의 개발에 관한 연구 ( II ) - 구문해석과 생성과 정을 중심으로 - (Development of Japanese to Korean Machine Translation System ATOM Using Personal Computer II - Syntactic/Semantic Analysis and Generation Process -)

  • 김영섬;김한우;최병욱
    • 대한전자공학회논문지
    • /
    • 제25권10호
    • /
    • pp.1193-1201
    • /
    • 1988
  • 구문 해석과정에서 동사가 갖는 필수격을 기준으로 격 프레임을 구성하여 격 구조를 생성하며, 형태소 해석 결과에 단문을 기준으로 한 부분 문법을 재귀적으로 적용함으로 해서 구문 의미 해석을 수행한다. 또한 역어 생성과정에서 일본어 조사처리의 중요성을 고려하여 중요 조사의 애매성 해소와 역어 분류를 위한 독립적인 프로시쥬어를 기술하여 효율을 제고한다. 그리고 일본어 종결구의 처리를 위해서 동사와 조동사의 복합 가능성을 고려한 생성 테이블을 작성하여 형태소와 구문 해석정보에 의해 일의적(一義的)인 결정을 행하여 보다 자연스런 역어의 생성과 생성과정의 간략화를 도모하였다.

  • PDF