• 제목/요약/키워드: 지식추출엔진

검색결과 32건 처리시간 0.022초

지식추출엔진 및 특허출원엔진의 개발을 위한 모형 연구 (A Study on the Development Model for Knowledge Portal Site and Automated Patent Application Engine)

  • 노동조
    • 한국비블리아학회지
    • /
    • 제13권1호
    • /
    • pp.157-165
    • /
    • 2002
  • 기술정보와 지적재산권정보의 효과적인 입수와 이용은 연구자들의 연구개발 과정에서 발생하는 시행착오나 중복연구를 방지할 뿐만 아니라 산업재산권의 침해를 사전에 예방할 수 있기 때문에 보다 효율적인 연구를 추구하는 사람들에게 있어서는 필수적인 요소이다. 하지만 정보가 폭증하는 지식정보사회에서 연구자들이 정보활동에 쏟는 시간의 과다는 연구시간의 단축을 의미하며 이는 연구의 생산성을 저하시키는 결과를 초래한다. 본 연구는 연구자들의 연구생산성 향상을 위한 하나의 도구로써 연구자들을 대신하여 전자문서의 내용을 자동적으로 분석하여 핵심적인 내용들을 추려서 문제와 해결방안의 형태로 된 지식 데이터베이스를 구축하고 이와 연계된 자동화된 특허출원엔진의 개발에 초점을 맞추었다. 전술한 두 시스템의 개발 가능성과 타당성에 대하여 논의하고 시스템 구축에 필요한 요소와 기술적인 문제들을 모형 개발을 통하여 제시하였다.

  • PDF

지식기반 의미 메타 검색엔진 (Knowledge-based Semantic Meta-Search Engine)

  • 이인근;손세호;권순학
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.737-744
    • /
    • 2004
  • 웹으로부터 사용자가 원하는 정보에 잘 부응하는 정보를 추출하는 것은 검색엔진이 갖추어야 할 기본적 요소라 할 수 있다. 그러나 질의어와의 패턴 매칭 방식에 의존하는 기존의 대부분의 검색엔진은 질의어가 갖는 애매성으로 인하여 사용자의 요구에 부합하는 검색결과를 제공하기가 쉽지 않다는 단점을 지니고 있다. 이를 극복하기 위하여 본 논문에서는 다음과 같은 5가지 과정, 즉, (i) 질의어 형성, (ii) 질의어 확장, (iii) 검색, (iv) 순위 재생성 및 (v) 지식베이스로 구성되는 지식기반 의미 메타 검색엔진의 기본 구조를 제안한다 영어로 구현된 웹 문서에 대한 모의실험을 통하여 본 논문에서 제안된 지식기반 의미 메타 검색엔진이 기존의 검색엔진(구글)을 사용하여 얻은 결과보다 좋은 결과를 보임을 확인할 수 있었다.

좌우접속정보를 이용한 명사추출기 (A Noun Extractor using Connectivity Information)

  • 안동언
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.173-178
    • /
    • 1999
  • 본 논문의 명사추출기는 정보검색시스템을 위한 색인어 추출기로 좌우접속정보를 이용한 형태소해석을 통하여 얻어진 형태소들 중에서 명사를 추출한다. 본 형태소해석기는 형태소해석을 위한 언어지식과 어절 분리 엔진을 분리하여 수정과 확장이 용이하게 하였다. 사용한 언어지식은 좌우접속정보로서 한 어절을 이루는 형태소들의 품사간의 접속여부를 행렬로 표현한 것이다. 어절 분리 엔진은 사전을 참조하여 한 어절에서 최장일치법에 의해 형태소를 분리하고 좌우접속정보를 참조하여 형태소 분리가 올바른지를 판단한다. 형태소들의 품사분류는 표준 태그셋을 기반으로 음절 정보를 추가하여 확장하였다. 형태소를 해석한 결과 미등록어가 발생하였을 때 미등록어에서 명사를 추정하는 모듈이 없기 때문에 재현율은 좋지 않았다.

  • PDF

정확도 높은 검색 엔진을 위한 문서 수집 방법 (A Document Collection Method for More Accurate Search Engine)

  • 하은용;최선완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.471-473
    • /
    • 1999
  • 인터넷상의 정보 검색 엔진들은 웹 로봇을 실행해서 인터넷에 연결되어 있는 수많은 웹 서버들을 방문해서 웹 문서를 획득하고, 인덱싱 기법을 써서 자료를 추출하고 분류해서 검색 엔진의 기초가 되는 데이터 베이스를 구축한다. 정보 추출을 위해 웹 로봇을 운영할 때 웹 서버에 대한 사전 지식 없이 진행된다면 수많은 불필요한 요구가 전송돼서 인터넷 트래픽을 증가시키는 요인이 된다. 하지만 웹 서버가 사전에 자신이 공개할 문서에 대한 요약 정보를 웹 로봇에게 통보하고, 웹 로봇은 이 정보를 이용해서 웹 서버의 해당 문서에 대한 정보 수집 작업을 처리한다면 불필요한 인터넷 트래픽을 줄일 수 있을 뿐만 아니라 검색 엔진의 정보의 정확도를 높이고, 웹 서버상의 웹 문서 파일의 변동 사항을 자동으로 검사하고 변동된 사항들을 종합 정리해서 등록된 각 웹 로봇에게 전송하는 문서 감시 통보 시스템과 통보된 요약 정보를 토대로 웹 서버로부터 해당 문서를 전송받아 필요한 인덱스 정보를 추출하는 효율적인 웹 로봇을 제안한다.

  • PDF

병렬 코퍼스를 이용한 한중 기계번역 오류 탐지 방법 (Method for Detecting Errors of Korean-Chinese MT Using Parallel Corpus)

  • 김운;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.113-117
    • /
    • 2008
  • 본 논문에서는 패턴기반 자동번역시스템의 효율적인 번역 성능 향상을 위해 병렬 코퍼스(parallel corpus)를 이용한 오류 자동 탐지 방법을 제안하고자 한다. 번역시스템에 존재하는 대부분 오류는 크게 지식 오류와 엔진 오류로 나눌 수 있는데 통상 이런 오류는 이중 언어가 가능한 훈련된 언어학자가 대량의 자동번역 된 결과 문장을 읽음으로써 오류를 탐지하고 분석하여 번역 지식을 수정/확장하거나 또는 엔진을 개선하게 된다. 하지만, 이런 작업은 많은 시간과 노력을 필요로 하게 된다. 따라서 본 논문에서는 병렬 코퍼스 중의 목적 언어(Target Language) 문장 즉, 정답 문장과 자동번역 된 결과 문장을 다양한 방법으로 비교하면서 번역시스템에 존재하고 있는 지식 및 엔진 오류를 자동으로 탐지하는 방법을 제안한다. 제안한 방법은 한-중 자동번역시스템에 적용하여 그 정확률과 재현률을 측정하였으며, 자동적으로 오류를 탐지하여 추출 할 수 있음을 증명하였다.

  • PDF

기술 문헌 분석 테스트베드 툴킷 개발 (Developing a Test-Bed Toolkit for Scientific Document Analysis)

  • 최성필;송사광;정한민
    • 한국콘텐츠학회논문지
    • /
    • 제12권8호
    • /
    • pp.13-19
    • /
    • 2012
  • 본 논문은 논문, 특허, 연구보고서 등과 같은 다양한 과학 기술 문헌에 포함된 기술 지식을 효과적으로 추출하는데 필요한 텍스트 분석 엔진들의 효과적인 모니터링 및 성능 최적화를 위한 테스트베드 도구를 소개한다. 이 도구는 과학 기술 분야의 전문 용어를 비롯한 인명, 지명, 기관명 등을 자동으로 인식하는 기술 개체 인식 엔진을 위한 테스트베드와 인식된 기술 개체 간의 의미적 연관 관계를 자동으로 추출하는 기술개체 간 관계 추출 테스트베드로 구성되어 있다. 이를 활용함으로써 사용자 및 개발자들은 기술 문헌 분석 엔진의 실행 모니터링은 물론 오류 분석을 효율적으로 수행할 수 있다.

사례기반추론을 이용한 워크플로우 관리시스템에서의 지식경영 (Knowledge Management in Workflow Management System using Case Based Reasoning)

  • 김승;배혜림;강석호
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2003년도 추계학술대회 및 정기총회
    • /
    • pp.49-52
    • /
    • 2003
  • 워크플로우 관리시스템(WfMS: Workflow Management System)은 업무 프로세스를 컴퓨터에 의해 정의, 실행 및 관리하기 위한 소프트웨어 시스템이다. WfMS에서는 업무 프로세스의 로직을 컴퓨터가 이해 가능한 언어로 표현하므로 다수의 사용자가 이기종의 분산된 환경에서 참여하는 업무 흐름을 관리 하는데에는 효율적이나 지식경영 측면에서의 지원은 미약하다. 본 연구에서는 WfMS 구조하에서 효과적인 지식 관리를 위해 인공지능 기법의 하나인 사례기반추론(CBR: Case Based Reasoning)을 활용하여 업무 흐름상에서 발생하는 지식을 생성, 저장, 추출되도록 하는 업무 지원 시스템을 개발한다. 지식의 생성을 위해 폼 기반 워크플로우 관리 시스템을 활용하고 CBR 엔진은 제약 조건의 형태로 이뤄지는 쿼리에 대해 유사 사례 추출을 담당한다. 사례 베이스의 저장 형식은 XML(extensible Markup Language)을 이용한다. 본 연구에서 개발된 업무 지원 시스템을 활용함으로써 업무 조정자만으로서의 WfMS의 한계를 벗어나 지식경영 도구로서의 WfMS를 기대할 수 있다.

  • PDF

웹의 개념지식을 위한 Anchor Text에서의 키워드 추출 알고리즘의 구현 (A Implementation of Keyword Extraction Algorithm Using Anchor Text for Web's Conceptual Knowledge)

  • 조남덕;배환국;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.72-74
    • /
    • 2000
  • 인터넷을 효과적으로 검색하기 위하여 검색엔진을 많이 이용하고 있다. 그런데 문서의 키워드를 추출할 적에 지금까지는 Anchor Text를 염두에 두지 않았었다. Anchor Text는 사람이 직접 요약한 것이고(요약성), 하이퍼링크를 포함하는 웹 문서에 반드시 존재하므로(보편성) 그 하이퍼링크가 가리키는 곳의 문서의 키워드를 추출에 적합한 용도가 될 수 있다. 웹 그래프는 이러한 Anchor Text를 이용하여 키워드를 추출함으로써 문서와 문서간, 단어와 단어간의 관계(연관성)까지도 나타내 줄 수 있게 한 검색 엔진 시스템이다. 그러나 Anchor Text 자체가 본문의 내용이 아니고, Anchor Text를 작성한 사람에 따라 다르게 작성되며, 본문의 내용과 무관한 내용도 작성할 수 있다. 따라서 Anchor Text 자체를 어떠한 여과 없이 문서의 키워드로 받아들이긴 힘들다. 본 논문에서는 TFIDF를 통해 좀 더 정확성이 있는 키워드를 추출하였다.

  • PDF

Web 문서의 효율적인 실시간 검색을 위한 잡음 제거와 패턴 정합 기법 (Noise Removal and Pattern Matching for Efficient Meta-Search of Web Documents)

  • 강대기;이제선;함호상
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.132-134
    • /
    • 1998
  • 웹 상의 메타 검색 엔진, Push 프로그램 그리고 에이전트와 같은 웹 기반 응용 프로그램들은 웹 문서의 취득과 자동 필터링에 대한 능력을 필요로 한다. 이를 위한 인터페이스의 지식들은 대부분 코드 내에서 ad-hoc으로 구현되어 왔다. 본 논문에서는 취득된 웹 문서를 전처리하고 원하는 정보를 추출하기 위한 방법을 제시하고, 웹 상위 신문 기사에 대한 검색으로 실험해 보았다. 검색 시스템은 웹 문서의 전처리 과정을 통해 필요한 정보에만 집중할 수 있고, 아주 적은 양의 일반화된 지식을 토대로 원하는 정보를 용이하게 찾을 수 있었으며, 또한 웹 문서의 형식이 바뀌더라도 크게 영향을 받지 않으며, 새로운 웹사이트의 추가도 용이하였다. 본 논문의 방법으로 구현된 신문 기사 검색 시스템은, URL과 아주 적은 양의 지식만으로도, 10 개의 신문 웹사이트에서 문서를 가져와 효과적으로 해석할 수 있었다. 본 논문의 방법은 메타 검색 엔진이나, 잡지나 신문 기사 정보의 푸쉬(Push) 솔루션, 또는 상품 정보 검색 시스템 등의 설계에 활용될 수 있다.

  • PDF

기계학습 기법을 사용한 캐릭터 제어 엔진의 설계 및 구현 (Design and Implementation of Engine to Control Characters By Using Machine Learning Techniques)

  • 이재문
    • 한국게임학회 논문지
    • /
    • 제6권4호
    • /
    • pp.79-87
    • /
    • 2006
  • 본 논문은 기계학습 기법을 이용한 게임 캐릭터를 제어하는 엔진을 설계하고 구현하는 것을 제안한다. 제안된 엔진은 실제 게임에서 상황 데이터를 추출하여 지식 데이터로 사용하므로 지능 캐릭터의 행동 패턴을 게이머들이 쉽게 인식하지 못하는 장점이 있다. 이를 위하여 상황 데이터를 추출하여 학습하는 모듈과 임의의 상황 데이터에 대하여 최적의 상황 제어를 판단하는 시험 모듈을 개발하는 것을 제안하였다. 구현된 엔진은 FEAR에 이식되고 Quake2 게임에 적용되었다. 또한 개발된 엔진의 올바른 동작과 효율성을 위하여 다양한 실험을 하였다. 실험으로부터 개발된 엔진이 올바르게 동작할 뿐만 아니라 제한된 시간 내에 효율적으로 동작함을 알 수 있었다.

  • PDF