• 제목/요약/키워드: 부분 의미 분석

검색결과 903건 처리시간 0.024초

부분 구문 분석 결과에 기반한 두 단계 부분 의미 분석 시스템 (Two-Phase Shallow Semantic Parsing based on Partial Syntactic Parsing)

  • 박경미;문영성
    • 정보처리학회논문지B
    • /
    • 제17B권1호
    • /
    • pp.85-92
    • /
    • 2010
  • 부분 의미 분석 시스템은 문장의 구성 요소들이 술어와 갖는 관계를 분석하는 것으로 문장에서 술어의 주체, 객체, 도구 등을 나타내는 의미 논항을 확인하게 된다. 본 논문에서 개발한 부분 의미 분석 시스템은 두 단계로 구성되어 있는데, 먼저 부분 구문 분석 결과로부터 의미 논항의 경계를 찾는 의미 논항 확인 단계를 수행하고 다음으로 확인된 의미 논항에 적절한 의미역을 부착하는 의미역 할당 단계를 수행한다. 순차적인 두 단계 방법을 적용하는 것에 의해서, 학습 성능 저하의 주요한 원인인 클래스 분포의 불균형 문제를 완화할 수 있고, 각 단계에 적합한 자질을 선별하여 사용할 수 있다. 본 논문에서는 PropBank 말뭉치에 기반한 CoNLL-2004 shared task의 데이터 집합 및 평가 프로그램을 사용하여 각 단계가 시스템의 전체 성능에 기여하는 정도를 보인다.

절 경계와 트리 거리를 사용한 2단계 부분 의미 분석 시스템 (A Two-Phase Shallow Semantic Parsing System Using Clause Boundary Information and Tree Distance)

  • 박경미;황규백
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.531-540
    • /
    • 2010
  • 본 논문은 최대 엔트로피 모형에 기반한 두 단계 부분 의미 분석 방법을 제안한다. 먼저, 의미 논항의 경계를 인식하고, 그 다음 단계에서 확인된 논항에 적절한 의미역을 할당한다. 두 단계 부분 의미 분석에서는 두 번째 단계인 논항 분류가 논항 확인 단계의 결과에 기반하여 수행되기 때문에 논항 확인의 성능이 매우 중요하다. 본 논문은 논항 확인의 성능을 향상시키기 위하여 논항 확인의 전처리 단계에 구문 지식을 통합한다. 구체적으로, 절 인식 결과로부터 술어의 인접절 및 상위절들을 확인하고, 구문 분석 결과로부터 술어의 부모 노드로부터 구문 구성 요소의 부모 노드까지의 트리 거리를 추출하여 전처리 단계에서 활용한다. 실험을 통해, 구문 지식을 활용하는 것이 부분 의미 분석 성능에 기여함과 제안하는 두 단계 방법이 한 단계 방법보다 우수한 성능을 낼 수 있음을 보인다.

다차원선호분석의 최적척도화 및 부분수량화 (Optimal Scaling and Partial Quantification in Multidimensional Preference Analysis)

  • 황선영;정수진;김영원
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.305-320
    • /
    • 2001
  • 다차원선호분석(mutidimensional preference analysis)은 여러 상품들에 대한 개인(또는 그룹)의 선호도를 알아보기 위한 분석방법으로 결과는 보통 2차원 그림으로 제공된다. 본 연구에서는 의미있는 두 가지 최적척도 기준을 제안하고 이와 연관된 행 및 열표시자를 유도하고 있으며, 아울러 사전지식을 반영하기 위해 부분수량화를 다차원선호분석에 도입하는 방법을 제시한다. 또한 본 연구에서 제시한 다차원분석기법들을 실제 인터넷 검색엔진에 대한 선호도 자료에 적용한다.

  • PDF

나이브 베이즈 분류기를 이용한 의미제약이 강화된 한국어 복합명사 의미 분석 (A Semantic Analysis of Korean Compound Nouns with Enforced Semantic Constraints using a Na${\ddot{i}}$ve Bayes Classifier)

  • 이용훈;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.102-106
    • /
    • 2011
  • 본 논문에서는 사전 원어정보를 이용한 기존 방법에 나이브 베이즈 분류기를 추가로 이용하는 의미제약 기술에 대하여 소개한다. 의미제약은 의미 분석의 전처리 단계로서 부분적으로 중의성을 해소하여 입력된 복합명사의 분석 정확도 뿐만 아니라 전체적인 분석시간의 단축에도 큰 도움을 준다. 나이브 베이즈 분류기를 이용하는 방법은 사전의 의존성으로 인해 제약할 수 없는 2-gram을 대상으로 제약을 시도한다. 분류기를 위한 학습데이터는 의미 태깅된 기분석 2-gram사전을 이용하여 U-WIN의 관계정보와 사전 그리고 패턴들에 의해 생성된다. 원어정보로 해결하지 못하는 34.63%의 2-gram중 2.83%에 대해 추가로 제약에 성공 하였다.

  • PDF

동적 의미 분석에 의한 점진 해석기 구축 (The Building of Incremental Interpreter Using Analyzing of Dynamic Semantics)

  • 한정란;최성
    • 인터넷정보학회논문지
    • /
    • 제5권6호
    • /
    • pp.111-120
    • /
    • 2004
  • 소프트웨어의 생산성을 향상시키기 위해 소프트웨어 개발 단계에서 소요되는 비용을 최소화하려는 연구가 다양하게 진행되고 있다. 프로그램 개발 단계에서는 프로그램을 부분적으로 수정하게 되고 프로그램의 부분 수정인 경우에도 프로그램을 편집하여 다시 실행하는데 많은 시간이 소요된다. 프로그램을 수정할 경우 수정한 부분과 이에 영향 받는 부분만을 재실행하기 위한 점진 해석기가 필요하다. 본 논문에서는 프로그램 실행 시 동적 의미 분석 방법에 의해 점진 해석기를 구현하고자 한다. IMPLO(IMPerative Language with Object) 언어를 EBNF(Extended Backus Naur Form) 표기법으로 정의하고 동적 의미 구조를 표현하기 위해 작용식(action equation)을 사용하여 IMPLO 언어에 대한 점진 해석기(incremental interpreter)를 설계하여 구현하고자 한다.

  • PDF

단어빈도가 명사정의하기에 미치는 효과 (The Effect of Word Frequency on Noun Definitions)

  • 이찬종
    • 한국음향학회지
    • /
    • 제27권6호
    • /
    • pp.303-308
    • /
    • 2008
  • 본 연구는 한국어에서 단어빈도가 명사 정의하기에 미치는 효과를 살펴보는 것이다. 초등학생, 중학생, 고등학생, 대학생 80명을 대상으로 명사의 친숙도와 명사의 정의하기를 분석하였다. 의미범주를 "사용/목적," "묘사," "관련/관계," "부분설명," "설명," "오류," "부분설명-속성," "부분설명-특정 분류." "부분설명-비특정 분류," "설명-특정 분류," "설명-비특정 분류"로 분류하여 분석하였다. 그 결과 저빈도 명사보다 고빈도 명사의 경우 더 친숙도를 보였고 분류명사나 속성의 의미범주를 사용하는 "설명"의 경우 저빈도 명사보다 고빈도 명사의 경우 더 높은 빈도를 보였다. 그리고 분류명사와 속성의 의미범주가 연령에 따라 증가하였고 오류반응이 연령이 증가하면서 적게 나타났다. 따라서 명사 정의하기에서 명사의 출현빈도가 중요한 영향력을 미치는 것을 알 수 있었다.

어휘적 중의성 제거 규칙과 부분 문장 분석을 이용한 한국어 문법 검사기 성능 향상 (Improvement of Korean Grammar Checker Using Partial Parsing based on Dependency Grammar and Disambiguation Rules)

  • 소길자;남현숙;김수남;원상연;권혁철;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.253-260
    • /
    • 1998
  • 한국어 문서에는 여러 어절을 검증해야만 처리할 수 있는 의미 오류와 문체 오류가 있다. 다수 어절 사이에 있는 오류는 부분 문장 분석을 한다. 논문에서는 의미 오류와 문체 오류를 처리할 때 어휘적 중의성 때문에 생기는 문제점을 제시하고 해결방법을 제안한다. 어휘적 중의성이란 한 단어가 두 가지 이상의 형태소 정보를 가짐을 뜻한다. 철자검사기와는 달리 문법 검사기에서는 어휘적 중의성을 제거하지 않으면 여러 가지 검사 오류가 발생한다. 이 논문에서는 의미, 문체 시스템에서 어휘적 중의성 때문에 검사 오류가 발생할 수 있는 과정을 크게 세 단계로 분류하였다. 연어 오류가 발생할 수 있는 검사단어가 어휘적 중의성을 가지면 표제어가 다른 규칙이 여러 개 존재한다. 이 때 규칙 선택 문제가 생긴다. 중의성 문제는 부분 문장분석 과정에서도 지배소와 의존소 사이의 의존관계를 정확하게 설정하기 어렵게 한다. 본 논문에서는 각 단계에서 발생한 문제를 최소화하여 문법 검사기의 성능을 향상시킨다.

  • PDF

점진적 메쉬의 엄밀한 선택 세분화 기법 (Truely Selective Refinement of Progressive Meshes)

  • 김준호;이승용
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제6권3호
    • /
    • pp.25-34
    • /
    • 2000
  • 본 논문에서는 점진적 메쉬의 보다 엄밀한 의미에서의 선택적 세분화 방법을 제안한다. 기존의 선택적 세분화 방법은 정점분할 및 에지붕괴 연산이 수행되기 위해서는 현재의 1-고리 이웃 상황이 점진적 메쉬 분석 단계에 기억해 놓은 1-고리 이웃과 같을 때만 올바로 동작하도록 되어 있는 증가적 방법이다. 이러한 증가적 방법은 메쉬의 부분적 해상도 변경을 하게 되면 인접한 부분의 해상도가 그 부분의 해상도를 좇아가게 되는 단점을 가지고 있다. 본 논문에서 제안하는 방법은 점진적 메쉬 표현이 가지는 정점의 계층적 구획화 성질에 기반한 것으로, 원하는 메쉬의 부분에 대해 해상도를 변경할 때, 인접 부분의 정점분할 및 에지붕괴 연산을 초래하지 않아 보다 엄밀한 의미에서의 점진적 메쉬의 선택적 세분화를 수행할 수 있다.

  • PDF

단백질 상호작용 네트워크을 위한 개념 기반 추상화 (A Concept-Based Approach for Abstracting Protein Interaction Networks)

  • 최재훈;박종민;김기헌;박선희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.232-234
    • /
    • 2005
  • 본 논문은 세포 내에 존재하는 방대한 단백질들 사이의 상호작용 관계 네트워크에서 생물학적인 의미 연관성을 가지는 부분 네트워크를 콤포지트로 추상화할 수 있는 방법을 제안한다. 이 추상화를 위해 네트워크에서 구조적으로 완전한 부분 네트워크, 개념적으로 인접한 부분 네트워크 그리고 두 조건을 모두 만족하는 부분네트워크를 탐색한다. 따라서, 사용자는 방대한 네트워크을 개념적인 관점에서 분석할 수 있으며, 특정한 의미을 가지는 부분 네트워크를 쉽게 검색할 수 있다.

  • PDF

한국어의 주격 중출 구문 (The Construction of Multiful Nominatives in Korean)

  • 이운영;이정민
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.319-324
    • /
    • 1995
  • 한국어에는 주격 표지를 가진 명사가 두 번 이상 나타나는 구문이 자주 나타난다. 이러한 구문을 주격 중출 구문이라고 한다. 주격 중출 구문은 크게 부분-전체 구문, 양화사 유동 구문, 그리고 심리 술어 구문으로 나누어진다. 본고에서는 부분-전체 구문과 양화사 유동 구문은 함수-논항 관계를 이용하여 분석하고, 심리 술어 구문은 의미역할과 자리 이동으로 설명한다. 이러한 것은 의미적 측면과 통사적 측면을 함께 고려한 것으로 좀 더 일관성 있는 설명을 위한 접근이라 하겠다.

  • PDF