• 제목/요약/키워드: Linguistic Resource Construction

검색결과 4건 처리시간 0.019초

언어자원 자동 구축을 위한 위키피디아 콘텐츠 활용 방안 연구 (A Study on Utilization of Wikipedia Contents for Automatic Construction of Linguistic Resources)

  • 류철중;김용;윤보현
    • 디지털융복합연구
    • /
    • 제13권5호
    • /
    • pp.187-194
    • /
    • 2015
  • 급변하는 자연언어를 기계가 이해할 수 있도록 하기 위해서는 다양한 언어지식자원(linguistic knowledge resources)의 구축이 필수적으로 수반된다. 본 논문에서는 온라인 콘텐츠의 특성을 활용해 언어지식자원을 자동으로 구축함으로써 지속적으로 확장 가능한 방법을 고안하고자 한다. 특히 언어분석 과정에서 가장 활용도가 높은 개체명(NE: Named Entity) 사전을 자동으로 구축, 확장하는데 주안점을 둔다. 이를 위해 본 논문에서는 개체명 사전 구축대상문서로 위키피디아(Wikipedia)를 선정, 그 특성을 파악하기 위해 다양한 통계 분석을 수행하였다. 이에 기반하여 위키피디아 콘텐츠가 갖는 구문적 특성과 구조 정보 등의 메타데이터를 활용하여 개체명 사전을 구축, 확장하는 방법을 제안한다.

어휘정보구축을 위한 사전텍스트의 구조분석 및 변환 (A Structural Analysis of Dictionary Text for the Construction of Lexical Data Base)

  • 최병진
    • 한국언어정보학회지:언어와정보
    • /
    • 제6권2호
    • /
    • pp.33-55
    • /
    • 2002
  • This research aims at transforming the definition tort of an English-English-Korean Dictionary (EEKD) which is encoded in EST files for the purpose of publishing into a structured format for Lexical Data Base (LDB). The construction of LDB is very time-consuming and expensive work. In order to save time and efforts in building new lexical information, the present study tries to extract useful linguistic information from an existing printed dictionary. In this paper, the process of extraction and structuring of lexical information from a printed dictionary (EEKD) as a lexical resource is described. The extracted information is represented in XML format, which can be transformed into another representation for different application requirements.

  • PDF

오피니언 질의문의 초점 분석을 위한 언어자원 구축 (Linguistic Resource Construction for Focus Analysis of Online Queries about Human Opinion)

  • 심승혜;백혜연;남지순;박세영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.252-254
    • /
    • 2011
  • 본 연구에서는 온라인 사용자 후기글 혹은 상품평관련 사이트에서 나타나는 '질의(Ouery)'가 무엇에 대한 것인지를 분석하고, 그 초점을 제시하는 시스템의 구현을 위하여 요구되는 언어자원을 구축하는 것을 목적으로 한다. 이를 위해 개상의 상태 혹은 성질을 나타내는 의문사 '어떠하' 질의문 유형을 추출하여 여기에서 실현되는 질의초점 명사구에 대한 어휘 사전 및 통사 패턴 LGG문법을 구축하여 질의문의 초점 분석을 위한 체계적인 언어자원 구축의 필요성을 강조하였다. 이와 같이 구축된 LGG문법과 초점어휘 사전의 성능평가를 위해 실험을 수행하였고, 재현률 59%와 정확률 98%의 실험결과를 얻었다.

체언표현 개념분류체계와 OWL 온톨로지의 상관관계 연구 (A Study on the Relation between Taxonomy of Nominal Expressions and OWL Ontologies)

  • 송도규
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.93-99
    • /
    • 2006
  • 컴퓨터에 의한 지능형 의미기반 지식/정보의 자동처리를 위해서는 사람이 보유하고 활용하는 상식을 포함한 지식을 정형화하고 체계적으로 표상하여 컴퓨터에게 이해시키고 활용할 수 있도록 하여야 한다. 이의 필요성은 각 분야에서 널리 공감되고 있고 온톨로지라는 지식/정보 표현 포맷으로 그 표상 형식이 수렴되고 있다. 그러나 사람이 가지고 있는 지식과 정보는 매우 비정형적이고 때로는 모호한 개념에 기반하고 있어, 이를 정형화하기가 어렵다. 본고에서는 비질료적인 개념에서 직접 온톨로지를 구축하지 않고 개념을 그대로 사상한다고 여겨지는 언어기호 간의 관계로부터 온톨로지를 구축하는 방법론을 논의한다. 기존의 개념분류체계에서 고찰된 개념간의 관계와 언어학적으로 규명된 어휘 간의 관계가 밀접히 일치함을 보이고 바로 활용할 수 있는 자료가 풍부한 어휘 간의 관계로부터 온톨로지를 구축하는 구체적인 알고리듬을 제시한다. 여기에서 온톨로지 표현 포맷은 월드와이드웹 컨소시엄(W3C)의 OWL을 채택했다.

  • PDF