• Title/Summary/Keyword: 도메인 용어

Search Result 58, Processing Time 0.025 seconds

Medicine Ontology Building based on Semantic Relation and Its Application (의미관계 정보를 이용한 약품 온톨로지의 구축과 활용)

  • Lim Soo-Yeon;Park Seong-Bae;Lee Sang-Jo
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.5
    • /
    • pp.428-437
    • /
    • 2005
  • An ontology consists of a set and definition of concepts that represents the characteristics of a given domain and relationship between the elements. To reduce time-consuming and cost in building ontology, this paper proposes a semiautomatic method to build a domain ontology using the results of text analysis. To do this, we Propose a terminology processing method and use the extracted concepts and semantic relations between them to build ontology. An experiment domain is selected by the pharmacy field and the built ontology is applied to document retrieval. In order to represent usefulness for retrieving a document using the hierarchical relations in ontology, we compared a typical keyword based retrieval method with an ontology based retrieval method, which uses related information in an ontology for a related feedback. As a result, the latter shows the improvement of precision and recall by $4.97\%$ and $0.78\%$ respectively.

Ontology Modeling of Thesaurus Using SKOS and LOD Publishing (SKOS를 이용한 시소러스의 온톨로지 모델링과 LOD 공개)

  • Hwang, Mi-Nyeong;Jeong, Do-Heon;Choi, Sung-Pil;Cho, Min-Hee;Jung, Han-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.92-94
    • /
    • 2012
  • 시맨틱 웹은 인터넷 환경에서 지식을 표현하고 공유하기 위한 표준 기술들의 집합체이며, 온톨로지는 특정 지식 도메인의 용어와 용어 사이의 관계를 정의한 지식 표현체계이다. 본 연구에서는 시소러스를 SKOS 기반 온톨로지로 모델링하여 LOD로 공개하는 실제적 방법을 제시한다. 시소러스의 어휘 용어 체계와 의미 관계를 분석하고, 이 분석 결과를 활용하여 변환 방식을 정의한 후, SKOS 온톨로지를 생성하며, 그 결과를 DataHub에 등록함으로써 LOD에 공개된다. 과학기술 분야의 한 중 일 대역어와 유사어, 관계어 등의 시소러스를 SKOS 온톨로지로 변환한 데이터는 http://thedatahub.org/dataset/steak에서 확인할 수 있다.

Verb Clustering for Defining Relations between Ontology Classes of Technical Terms Using EM Algorithm (EM 알고리즘을 이용한 전문용어 온톨로지 클래스간 관계 정의를 위한 동사 클러스터링)

  • Jin, Meixun;Nam, Sang-Hyob;Lee, Yong-Hoon;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.233-240
    • /
    • 2007
  • 온톨로지 구축에서 클래스간 관계 설정은 중요한 부분이다. 본 논문에서는 클래스간 상 하위 관계 외의 관계 설정을 위한 클래스간 관계 자동 정의를 목적으로 의존구문분석의 (주어, 용언) (목적어, 용언) 쌍들을 추출하고, 이렇게 추출된 데이터를 이용하여 용언들을 클러스터링 하는 방법을 제안한다. 도메인 전문 코퍼스 데이터 희귀성 문제를 해결하고자, 웹검색을 결합한 방식을 선택하여 도메인 온톨로지 구축 클래스간 관계 자동 설정에 대한 방법론을 제시한다.

  • PDF

표준품질지수

  • 한근식
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2004.11a
    • /
    • pp.41-48
    • /
    • 2004
  • 2002년 10월 유럽통계협회는 품질지수개발을 위해 협회소속국가들이 연합하여 특별연구팀을 발족시켰다. 이 팀의 주목적은 유럽통계협회에서 생산되는 자료의 품질을 측정하기 위해 대표성이 있으며, 계산하기 쉽고, 이해하기 쉬운 지수를 개발하는 것이었다. 유럽 통계협회는 연구팀에서 개발한 지수를 이용하여 내부품질보고서를 작성하도록 결정하였다. 개발된 풀질지수들은 유럽 통계협회 소속 국가에 의해 생산된 통계에 적용하기 적합해야하며 유럽전체를 위해 Eurostat 이 보유하고 있는 통계에도 적합해야한다. 그러므로 지수들은 각 국이 합의한 용어, 공식, 변수, 도메인, 분석의 정도를 고려하여 개발되도록 하였다. 이러한 지수는 정기적으로 생산되도록 규정하고 있으며 이 규정이 지켜지기 위해서는 동일한 변수, 공식 통이 적용되어야함은 물론이고 시계열의 유지를 위해 관련된 메타데이터가 제공되어야한다. 서로 다른 조사결과로부터 관련된 통계량의 측정과 개념들간의 차이를 확인하기 위해서 메타데이터는 반드시 필요하며 품질보고서가 있는 경우 많은 도움이 릴 것이다. 본 연구에서는 동계생산자의 관점에서 본 각각의 품질 요소에 따라서 생산된 다양한 통계의 풀질을 평가하기 위해서 개발된 일련의 표준화된 품질지수를 제시할 것이다. 각 지수들의 정의와 가장 대표적인 지수산출을 제안하고 지수산출을 위해 필요한 메타데이터를 선명한 것이다.

  • PDF

Document Retrieval using the Ontology Hierarchy (온톨로지내의 계층관계를 이용한 문서검색)

  • 임수연;송무희;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.640-642
    • /
    • 2004
  • 온톨로지는 주어진 응용 도메인의 특성을 나타내는 관련 개념들의 집합과 정의 그리고 그들간의 관계로 이루어진다. 본 논문에서는 코퍼스에 있는 텍스트의 분석 결과를 이용한 온톨로지를 구축방안과 이를 문서의 검색에 사용함으로써 해당정보가 있는 자원을 찾는 정확도를 향상시키는 방안을 제시하고자 한다. 이를 위하여, 실험 도메인의 문서 내에 출현한 전문 용어들의 결합형태를 분석하여 계층구조를 도출해내는 알고리즘을 제안하며 구축된 온톨로지를 문서의 검색에 응용하였다. 제안된 온톨로지는 전통적인 문서검색의 인덱스 파일과 같은 역할을 하게 되며, 질의로 들어온 키워드뿐 아니라 그에 대한 온톨로지 내 하위어들에 기반하여 검색을 수행함으로써 많은 의미정보를 포함하고 있으며 검색의 정확도를 높일 수 있었다.

  • PDF

A Method for Extracting Relationships Between Terms Using Pattern-Based Technique (패턴 기반 기법을 사용한 용어 간 관계 추출 방법)

  • Kim, Young Tae;Kim, Chi Su
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.7 no.8
    • /
    • pp.281-286
    • /
    • 2018
  • With recent increase in complexity and variety of information and massively available information, interest in and necessity of ontology has been on the rise as a method of extracting a meaningful search result from massive data. Although there have been proposed many methods of extracting the ontology from a given text of a natural language, the extraction based on most of the current methods is not consistent with the structure of the ontology. In this paper, we propose a method of automatically creating ontology by distinguishing a term needed for establishing the ontology from a text given in a specific domain and extracting various relationships between the terms based on the pattern-based method. To extract the relationship between the terms, there is proposed a method of reducing the size of a searching space by taking a matching set of patterns into account and connecting a join-set concept and a pattern array. The result is that this method reduces the size of the search space by 50-95% without removing any useful patterns from the search space.

A Sentence Sentiment Classification reflecting Formal and Informal Vocabulary Information (형식적 및 비형식적 어휘 정보를 반영한 문장 감정 분류)

  • Cho, Sang-Hyun;Kang, Hang-Bong
    • The KIPS Transactions:PartB
    • /
    • v.18B no.5
    • /
    • pp.325-332
    • /
    • 2011
  • Social Network Services(SNS) such as Twitter, Facebook and Myspace have gained popularity worldwide. Especially, sentiment analysis of SNS users' sentence is very important since it is very useful in the opinion mining. In this paper, we propose a new sentiment classification method of sentences which contains formal and informal vocabulary such as emoticons, and newly coined words. Previous methods used only formal vocabulary to classify sentiments of sentences. However, these methods are not quite effective because internet users use sentences that contain informal vocabulary. In addition, we construct suggest to construct domain sentiment vocabulary because the same word may represent different sentiments in different domains. Feature vectors are extracted from the sentiment vocabulary information and classified by Support Vector Machine(SVM). Our proposed method shows good performance in classification accuracy.

An Ontology-based Hotel Search System Using Semantic Web Technologies (시맨틱 웹 기술을 이용한 온톨로지기반 호텔 검색 시스템)

  • Yoo, Dong-Hee;Suh, Yong-Moo
    • The Journal of Society for e-Business Studies
    • /
    • v.13 no.4
    • /
    • pp.71-92
    • /
    • 2008
  • Currently, hotel search engines may help travelers find hotels, but the returned set of information is usually not satisfactory to them. It is because the engines do not understand what travelers want exactly and cannot deal with the travelers' interest which is expressed in various terms, even including some ambiguous ones. The objective of this research is to build hotel ontology using currently available semantic web technologies such as RDF, OWL and SWRL and to show how it can be used to help travelers find hotels of their interest. To that end, we analyzed available hotel-related ontologies and investigated typical terms which are used when searching for hotels in the Q&A communities. Based on the results of the analysis and investigation, we designed hotel domain ontology which consists of Objective Concepts Ontology(OCO), Universal Concepts Ontology(UCO), and Evaluation Concepts Ontology(ECO). To demonstrate the use of the ontology for a hotel search, we developed a Semantic Hotel Search System (SHSS).

  • PDF

Document Clustering based on Level-wise Stop-word Removing for an Efficient Document Searching (효율적인 문서검색을 위한 레벨별 불용어 제거에 기반한 문서 클러스터링)

  • Joo, Kil Hong;Lee, Won Suk
    • The Journal of Korean Association of Computer Education
    • /
    • v.11 no.3
    • /
    • pp.67-80
    • /
    • 2008
  • Various document categorization methods have been studied to provide a user with an effective way of browsing a large scale of documents. They do compares set of documents into groups of semantically similar documents automatically. However, the automatic categorization method suffers from low accuracy. This thesis proposes a semi-automatic document categorization method based on the domains of documents. Each documents is belongs to its initial domain. All the documents in each domain are recursively clustered in a level-wise manner, so that the category tree of the documents can be founded. To find the clusters of documents, the stop-word of each document is removed on the document frequency of a word in the domain. For each cluster, its cluster keywords are extracted based on the common keywords among the documents, and are used as the category of the domain. Recursively, each cluster is regarded as a specified domain and the same procedure is repeated until it is terminated by a user. In each level of clustering, a user can adjust any incorrectly clustered documents to improve the accuracy of the document categorization.

  • PDF

Relevance Feedback based on Medicine Ontology for Retrieval Performance Improvement (검색 성능 향상을 위한 약품 온톨로지 기반 연관 피드백)

  • Lim, Soo-Yeon
    • Journal of the Korean Society for information Management
    • /
    • v.22 no.2 s.56
    • /
    • pp.41-56
    • /
    • 2005
  • For the purpose of extending the Web that is able to understand and process information by machine, Semantic Web shared knowledge in the ontology form. For exquisite query processing, this paper proposes a method to use semantic relations in the ontology as relevance feedback information to query expansion. We made experiment on pharmacy domain. And in order to verify the effectiveness of the semantic relation in the ontology, we compared a keyword based document retrieval system that gives weights by using the frequency information compared with an ontology based document retrieval system that uses relevant information existed in the ontology to a relevant feedback. From the evaluation of the retrieval performance. we knew that search engine used the concepts and relations in ontology for improving precision effectively. Also it used them for the basis of the inference for improvement the retrieval performance.