• 제목/요약/키워드: question-answering system

검색결과 153건 처리시간 0.017초

Structural SVM을 이용한 백과사전 문서 내 생략 문장성분 복원 (Restoring Omitted Sentence Constituents in Encyclopedia Documents Using Structural SVM)

  • 황민국;김영태;나동열;임수종;김현기
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.131-150
    • /
    • 2015
  • 영어와 달리 한국어나 일본어 문장의 경우 용언의 필수격을 채우는 명사구가 생략되는 무형대용어 현상이 빈번하다. 특히 백과사전이나 위키피디아의 문서에서 표제어로 채울 수 있는 격의 경우 그 격이 문장에서 더 쉽게 생략된다. 정보검색, 질의응답 시스템 등 주요 지능형 응용시스템들은 백과사전류의 문서에서 주요한 정보를 추출하여 수집하여야 한다. 그러나 이러한 명사구 생략 현상으로 인해 양질의 정보추출이 어렵다. 본 논문에서는 백과사전 종류 문서에서 생략된 명사구 즉 무형대용어를 복원하는 시스템의 개발을 다루었다. 우리 시스템이 다루는 문제는 자연어처리의 무형대용어 해결 문제와 거의 유사하나, 우리 문제의 경우 문서의 일부가 아닌 표제어도 복원에 이용할 수 있다는 점이 다르다. 무형대용어 복원을 위해서는 먼저 무형대용어의 탐지 즉 문서 내에서 명사구 생략이 일어난 곳을 찾는 작업을 수행한다. 그 다음 무형대용어의 선행어 탐색 즉 무형대용어의 복원에 사용될 명사구를 문서 내에서 찾는 작업을 수행한다. 문서 내에서 선행어를 발견하지 못하면 표제어를 이용한 복원을 시도해 본다. 우리 방법의 특징은 복원에 사용된 문장성분을 찾기 위해 Structural SVM을 사용하는 것이다. 문서 내에서 생략이 일어난 위치보다 앞에 나온 명사구들에 대해 Structural SVM에 의한 시퀀스 레이블링(sequence labeling) 작업을 시행하여 복원에 이용 가능한 명사구인 선행어를 찾아내어 이를 이용하여 복원 작업을 수행한다. 우리 시스템의 성능은 F1 = 68.58로 측정되었으며 이는 의미정보의 이용 없이 달성한 점을 감안하면 높은 수준으로 평가된다.

지식베이스 구축을 위한 한국어 위키피디아의 학습 기반 지식추출 방법론 및 플랫폼 연구 (Knowledge Extraction Methodology and Framework from Wikipedia Articles for Construction of Knowledge-Base)

  • 김재헌;이명진
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.43-61
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 인공지능 기술에 대한 연구가 활발히 진행되고 있으며, 이전의 그 어느 때보다도 기술의 발전이 빠르게 진행되고 있는 추세이다. 이러한 인공지능 환경에서 양질의 지식베이스는 인공지능 기술의 향상 및 사용자 경험을 높이기 위한 기반 기술로써 중요한 역할을 하고 있다. 특히 최근에는 인공지능 스피커를 통한 질의응답과 같은 서비스의 기반 지식으로 활용되고 있다. 하지만 지식베이스를 구축하는 것은 사람의 많은 노력을 요하며, 이로 인해 지식을 구축하는데 많은 시간과 비용이 소모된다. 이러한 문제를 해결하기 위해 본 연구에서는 기계학습을 이용하여 지식베이스의 구조에 따라 학습을 수행하고, 이를 통해 자연어 문서로부터 지식을 추출하여 지식화하는 방법에 대해 제안하고자 한다. 이러한 방법의 적절성을 보이기 위해 DBpedia 온톨로지의 구조를 기반으로 학습을 수행하여 지식을 구축할 것이다. 즉, DBpedia의 온톨로지 구조에 따라 위키피디아 문서에 기술되어 있는 인포박스를 이용하여 학습을 수행하고 이를 바탕으로 자연어 텍스트로부터 지식을 추출하여 온톨로지화하기 위한 방법론을 제안하고자 한다. 학습을 바탕으로 지식을 추출하기 위한 과정은 문서 분류, 적합 문장 분류, 그리고 지식 추출 및 지식베이스 변환의 과정으로 이루어진다. 이와 같은 방법론에 따라 실제 지식 추출을 위한 플랫폼을 구축하였으며, 실험을 통해 본 연구에서 제안하고자 하는 방법론이 지식을 확장하는데 있어 유용하게 활용될 수 있음을 증명하였다. 이러한 방법을 통해 구축된 지식은 향후 지식베이스를 기반으로 한 인공지능을 위해 활용될 수 있을 것으로 판단된다.

정보기술 산업에서의 인수 유형별 인수 의도 분석 (Intents of Acquisitions in Information Technology Industrie)

  • 조우제;장영봉;권영옥
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.123-138
    • /
    • 2016
  • 전 세계적으로 기업의 중요한 전략적 수단으로 인수합병이 활발히 이루어지고 있고, 지능형 서비스 산업을 포함한 정보기술 산업에서의 인수합병 활동은 꾸준히 활발하게 진행되고 있다. 본 논문에서는 정보기술 산업 내에서 일어나는 인수합병 건에 대해 인수 기업 입장에서의 인수 의도에 초점을 두고 분석하였다. 특히, 두 하드웨어 기업 간, 하드웨어 기업 소프트웨어 기업 간, 두 소프트웨어 기업 간 인수합병 유형에 따라 인수 의도가 어떻게 다른지 비교하고자 하였고, 이를 위해 미국 정보기술 산업 내에서 1995년과 2010년 사이에 일어났던 1003개의 인수합병 건의 자료를 분석하였다. 인수 의도를 파악하는데 있어, 인수 기업의 입장에서 생산비용 절감 의도, 제품 개발 및 개선 의도, 고객층 확장 의도, 고객채널 확장 의도의 네 가지로 구분하여 측정하였다. 분석 결과 생산비용 절감 의도와 고객층 확장 의도는 하드웨어 기업이 피인수 기업일 때 더 많이 나타났고, 제품개발 의도는 하드웨어 기업이 인수 기업일 때 더 많이 나타났다. 그리고, 고객채널 확장 의도는 소프트웨어 기업이 피인수 기업일 때 더 많이 나타났다. 또한, 생산비용 절감 의도, 제품 개발 및 개선 의도를 제품생산 관련활동 의도로, 고객층 확장 의도와 고객채널 확장을 고객관련 활동 의도로 구분하여 비교하였을 때에는, 하드웨어 기업 간 인수합병에 비해, 두 소프트웨어 기업 간 인수합병에서 상대적으로 고객관련 활동 의도가 높은 비중을 나타내고 있음을 알 수 있었다. 활발하게 인수합병이 이루어지고 있는 세계적 추세와는 달리 국내 인수합병거래 규모는 선진국에 비해 매우 적은 수준이다. 본 연구는 인수합병이 보다 활발하게 이루어지고 있는 미국기술정보 산업에서의 인수 의도를 분석하여, 국내에서 인수합병 활동을 활성화하는 방안을 분석 및 개발하는데 기여하고자 한다.