• Title/Summary/Keyword: 지식 추출

Search Result 1,094, Processing Time 0.028 seconds

An Extraction of Property of Ontology Instance Using Stratification of Domain Knowledge (도메인지식의 계층화를 통한 온톨로지 인스턴스의 속성정보 추출)

  • Chang, Moon-Soo;Kang, Sun-Mee
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.17 no.3
    • /
    • pp.291-296
    • /
    • 2007
  • The ontology has been used widely in recent years with its aim to accumulate knowledge that machine can comprehend. We believe that machine can manage and analyze information on its own using the ontology. In this paper, we propose an algorithm that allows us to extract properties of ontology instances from structured information already existing in web documents. In particular, by stratification of the domain knowledge that is composed of property information, we were able to make the algorithm better and improve the quality of extraction results. In our experiments with 20 thousands targeted documents, we were able to extract property information with 83% confidence.

A Domain-Dependent Question-Answering System (이벤트 탐색을 사용하는 일정 영역 질의 응답 시스템의 구현)

  • Chang, Du-Seong;Oh, Jong-Hun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.414-421
    • /
    • 2001
  • 본 논문에서는 한정된 영역을 대상으로 하는 질의응답 시스템에서 사용자의 질의를 해석하고 적당한 대답을 생성하기 위해 백과사전이나 일반사전 등과 같은 지식원에서 추출된 구조화된 지식을 사용하는 과정을 기술한다. 질의응답을 위하여 지식원은 그 단락의 의미에 따라 구조화되고 각 단락은 논리형식으로 변환되었으며, 논리형식 내 각 개체들은 사전 정의문에 따라 확장되었다. 이 구조화된 지식은 입력된 자연언어 질의문에서 질의의 의도를 추출하고, 질의에 포함되어 있는 지식에 의미속성을 부착하기 위해 사용된다. 지식원의 논리형식 변환을 위해 한국어의 논리형식이 도입되었으며, 사용된 지식원은 우리말 큰사전과 계몽백과사전의 30여개 질병정의문이다.

  • PDF

실시간 일정 계획을 위한 지식 획득용 Intelligent Simulator의 개발

  • 김기태;우상복;박찬권;박진우
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 1997.04a
    • /
    • pp.18-22
    • /
    • 1997
  • FMS를 포함한 다양한 형태의 생산 시스템에 있어서 일정계획문제는, 고가의 생산 설비를 효율적으로 운영한다는 의미에서 점점 더 중요해지고 있다. 일정 계획문제를 해결하 기 위하여 많은 방법들이 제시되었고 지금 현재도 다양한 방법들이 시도되고 있다. 이런 많 은 방법중에서 최적해를 구하는 수리계획법이 가장 우수한 대안을 제시하는 것으로 알려져 있지만, 최적해를 구하는 데 상당히 많은 시간이 필요한 것으로 알려져 있다. 다음으로 우 선 순위 규칙을 제공하는 방법은 짧은 시간을 이용하여 어느 정도 효율적인 일정계획을 제 시하지만, 생산 시스템의 구성과 상황에 따라서 가장 적합한 우선 순위 규칙이 변한다고 알 려져 있다. 이런 상황에 대응하여 시스템의 구성과 상황에 가장 적합한 규칙을 제안하는 전 문가시스템들이 연구되고 있다. 본 연구는 일정계획을 실시간에 수립하는 스케쥴러를 위한 지식을 획득하는 Intelligent Simulator 개발에 관한 연구이다. 일정계획을 위한 인공지능형 스케쥴러를 구축하는데 있어서 가장 큰 난관은 지식을 어떻게 획득할 것인가 하는 점이다. 이런 지식획득의 방법으로 주로 사용되는 벙법은 인간 전문가의 지식을 추출하는 방법이 있 다. 그러나 인간 전문가가 없거나 인간전문가의 지식으로는 부족한 경우에는 기계학습을 통 하여 지식을 추출한다. 기계학습을 위하여는 반드시 많은 case들을 통하여 지식을 획득하 게 되는 데 이런 case의 축적을 위하여는 실제의 시스템을 운영해본다는 것은 많은 비용을 필요로 한다. 이때 필요한 경험의 생성을 위하여 시뮬레이션은 그 중요한 효용성이 있어서 많은 연구자들이 사용하였다. 그러나 경험을 다 생성한 후 그 경험으로부터 지식을 획득하 다보니 서로 다른 방법의 사용에 의하여 동일한 경험으로부터 서로 다른 지식이 생성되는 가능성이 있다. 본 논문은 시뮬레이션이 계속 수행되는 상황하에서 일정계획에 관련된 지식 을 획득하여 축적할 수 있는 Intelligent Simulator의 개발에 관한 연구이다.

  • PDF

Fuzzy Cognitive Map-Based A, pp.oach to Causal Knowledge Base Construction and Bi-Directional Inference Method -A, pp.ications to Stock Market Analysis- (퍼지인식도에 기초한 인과관계 지식베이스 구축과 양방향 추론방식에 관한 연구 -주식시장 분석에의 적용을 중심으로-)

  • 이건창;주석진;김현수
    • Journal of Intelligence and Information Systems
    • /
    • v.1 no.1
    • /
    • pp.1-22
    • /
    • 1995
  • 본 연구에서 퍼지인식도(Fuzzy Cognitive Map) 개념을 기초로 하여 (1) 특정 문제영역에 대한 전문가의 인과관계 지식(causal knowledge)을 추출하는 알고리즘을 제시하고, (2) 이 알고리즘에 기초하여 작성된 해당 문제영역에 대한 여러 전문가들의 인과관계 지식을 계층별로 분해하여, (3) 해당 계층간의 양방향 추론이 가능한 추론메카니즘을 제시하고자 한다. 특정 문제영역에 있어서의 인과관계 지식이란 해당 문제를 구성하는 여러 개념간에 존재하는 인과관계를 표현한 지식을 의미한다. 이러한 인과관계 지식은 기존의 IF-THEN 형태의 규칙과는 달리 행렬형태로 표현되기 때문에 수학적인 연산이 가능하다. 특정 문제영역에 대한 전문가의 인과관계 지식을 추출하는 알고리즘은 집합연산에 의거하여 개발되었으며, 특히 상반된 의견을 보이는 전문가들의 의견을 통합하여 하나의 통합된 인과관계 지식베이스를 구축하는데 유용하다. 그러나, 주어진 문제가 복잡하여 다양한 개념들이 수반되면, 자연히 인과관계 지식베이스의 규모도 커지게 되므로 이를 다루는데 비효율성이 개재되기 마련이다. 따라서 이러한 비효율성을 해소하기 위하여 주어진 문제를 여러계측(Hierarchy)으로 분해하여, 해당 계층별로 인과관계 지식베이스를 구축하고 각 계층별 인과관계 지식베이스를 연결하여 추론하는 메카니즘을 개발하면 효과적인 추론이 가능하다. 이러한 계층별 분해는 행렬의 분해와 같은 개념으로도 이해될 수 있다는 특징이 있어 그 연산이 간단명료하다는 장점이 있다. 이와같이 분해된 인과관계 지식베이스는 계층간의 추론메카니즘을 통하여 서로 연결된다. 이를 위하여 본 연구에서는 상향 또는 하향방식이 추론이 가능한 양방향 추론방식을 제시하여 주식시장에서의 투자분석 문제에 적용하여 그 효율성을 검증하였다.

  • PDF

Utilization of Syllabic Nuclei Location in Korean Speech Segmentation into Phonemic Units (음절핵의 위치정보를 이용한 우리말의 음소경계 추출)

  • 신옥근
    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.5
    • /
    • pp.13-19
    • /
    • 2000
  • The blind segmentation method, which segments input speech data into recognition unit without any prior knowledge, plays an important role in continuous speech recognition system and corpus generation. As no prior knowledge is required, this method is rather simple to implement, but in general, it suffers from bad performance when compared to the knowledge-based segmentation method. In this paper, we introduce a method to improve the performance of a blind segmentation of Korean continuous speech by postprocessing the segment boundaries obtained from the blind segmentation. In the preprocessing stage, the candidate boundaries are extracted by a clustering technique based on the GLR(generalized likelihood ratio) distance measure. In the postprocessing stage, the final phoneme boundaries are selected from the candidates by utilizing a simple a priori knowledge on the syllabic structure of Korean, i.e., the maximum number of phonemes between any consecutive nuclei is limited. The experimental result was rather promising : the proposed method yields 25% reduction of insertion error rate compared that of the blind segmentation alone.

  • PDF

Automatic Dictionary Construction of Indonesian Field-Associated Terms by Using Korean Associated Knowledge (한국어의 분야 연상 지식의 추출 방법에 관한 연구)

  • Lee, Sang-Gon
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.205-210
    • /
    • 2016
  • 인간은 문서전체를 읽지 않고 대표적인 단어를 보는 것만으로 정치나 스포츠 등의 분야를 정확히 인지할 수 있다. 문서 전체는 물론 부분 텍스트(단락)에 출현하는 소수의 단어 정보에서 문서의 분야를 정확히 결정하기 위한 분야연상어의 구축은 중요한 연구과제이다. 미리 분야체계를 정의하고, 각 분야에 해당하는 문서를 인터넷이나 서적을 통해 수집한다. 본 논문은 수집 문서의 분야를 정확히 지시하는 분야연상어를 수집하는 방법을 제안한다. 문서의 분야결정 시점을 고려하여 분야연상어의 수준을 정하였다. 인도네시아어의 분야연상어 사전을 자동으로 구축하기 위해 먼저 한국어로 구축한 분야 연상 지식을 추출하는 방법을 제안한다.

  • PDF

A Study on the Extraction of Knowledge for Image Understanding (영상이해를 위한 지식유출에 관한 연구)

  • 곽윤식;이대영
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.18 no.5
    • /
    • pp.757-772
    • /
    • 1993
  • This paper describes the knowledge extraction for image understanding in knowledge based system. The current set of low level processes operate on the numerical pixel arrays, to segment the image into region and to convert the image into directional image, and to calculate feature for these regions. The current set of intermedate level processes operate on the results of earlier knowledge source to build more complex representations of the data. We have grouped into thee categories : feature based classification, geometric token relation, perceptual organization and grouping.

  • PDF

Automatic Dictionary Construction of Indonesian Field-Associated Terms by Using Korean Associated Knowledge (한국어의 분야 연상 지식의 추출 방법에 관한 연구)

  • Lee, Sang-Gon
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.205-210
    • /
    • 2016
  • 인간은 문서전체를 읽지 않고 대표적인 단어를 보는 것만으로 정치나 스포츠 등의 분야를 정확히 인지할 수 있다. 문서 전체는 물론 부분 텍스트(단락)에 출현하는 소수의 단어 정보에서 문서의 분야를 정확히 결정하기 위한 분야연상어의 구축은 중요한 연구과제이다. 미리 분야체계를 정의하고, 각 분야에 해당하는 문서를 인터넷이나 서적을 통해 수집한다. 본 논문은 수집 문서의 분야를 정확히 지시하는 분야연상어를 수집하는 방법을 제안한다. 문서의 분야결정 시점을 고려하여 분야연상어의 수준을 정하였다. 인도네시아어의 분야연상어 사전을 자동으로 구축하기 위해 먼저 한국어로 구축한 분야 연상 지식을 추출하는 방법을 제안한다.

  • PDF

Query Expansion based on Knowledge Extraction and Latent Dirichlet Allocation for Clinical Decision Support (의학 문서 검색을 위한 지식 추출 및 LDA 기반 질의 확장)

  • Jo, Seung-Hyeon;Lee, Kyung-Soon
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.31-34
    • /
    • 2015
  • 본 논문에서는 임상 의사 결정 지원을 위한 UMLS와 위키피디아를 이용하여 지식 정보를 추출하고 질의 유형 정보를 이용한 LDA 기반 질의 확장 방법을 제안한다. 질의로는 해당 환자가 겪고 있는 증상들이 주어진다. UMLS와 위키피디아를 사용하여 병명과 병과 관련된 증상, 검사 방법, 치료 방법 정보를 추출한다. UMLS와 위키피디아를 사용하여 추출한 의학 정보를 이용하여 질의와 관련된 병명을 추출한다. 질의와 관련된 병명을 이용하여 추가 증상, 검사 방법, 치료 방법 정보를 확장 질의로 선택한다. 또한, LDA를 실행한 후, Word-Topic 클러스터에서 질의와 관련된 클러스터를 추출하고 Document-Topic 클러스터에서 초기 검색 결과와 관련이 높은 클러스터를 추출한다. 추출한 Word-Topic 클러스터와 Document-Topic 클러스터 중 같은 번호를 가지고 있는 클러스터를 찾는다. 그 후, Word-Topic 클러스터에서 의학 용어를 추출하여 확장 질의로 선택한다. 제안 방법의 유효성을 검증하기 위해 TREC Clinical Decision Support(CDS) 2014 테스트 컬렉션에 대해 비교 평가한다.

  • PDF

Information Extraction Based on Property Patterns to Construct a Knowledgebase for Encyclopedia Person Domain (인물 백과사전 지식베이스 구축을 위한 속성패턴기반 정보추출)

  • 왕지현;김현진;장명길
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.793-795
    • /
    • 2004
  • 본 논문은 인물 도메인의 백과사전 지식베이스를 구축하기 위하여 백과사전 본문의 자연어 문장으로부터 인물 표제어의 특징을 잘 나타내는 속성 값을 인식하여 추출하는 방법에 관하여 기술한다. 속성은 인물 공통 및 세부 분야별로 총 52개의 속성을 정의하였고 이를 태그셋으로 정의하여 1천 문서의 백과사전 인물 속성태깅코퍼스를 구축하였다. 속성태깅코퍼스로부터 반자동으로 약 1천 8백여 개의 속성패턴을 추출하였고 백과사전 인물 표제어 24,848개에 대해 속성패턴을 적용하여 지식베이스를 구축하였다. 추출성능은 f-score 0.68의 결과를 나타내었다.

  • PDF