• Title/Summary/Keyword: 연관용어

Search Result 165, Processing Time 0.021 seconds

An Experimental Study on Selecting Association Terms Using Text Mining Techniques (텍스트 마이닝 기법을 이용한 연관용어 선정에 관한 실험적 연구)

  • Kim, Su-Yeon;Chung, Young-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.23 no.3 s.61
    • /
    • pp.147-165
    • /
    • 2006
  • In this study, experiments for selection of association terms were conducted in order to discover the optimum method in selecting additional terms that are related to an initial query term. Association term sets were generated by using support, confidence, and lift measures of the Apriori algorithm, and also by using the similarity measures such as GSS, Jaccard coefficient, cosine coefficient, and Sokal & Sneath 5, and mutual information. In performance evaluation of term selection methods, precision of association terms as well as the overlap ratio of association terms and relevant documents' indexing terms were used. It was found that Apriori algorithm and GSS achieved the highest level of performances.

An Efficient Terminology Clustering Method Using Datamining Technique (데이타마이닝 기법을 이용한 효율적인 전문 용어 클러스터링)

  • 이정화;남상엽;문현정;우용태
    • Proceedings of the Korea Database Society Conference
    • /
    • 2000.11a
    • /
    • pp.210-215
    • /
    • 2000
  • 최근 대량의 텍스트 문서로부터 의미 있는 패턴이나 연관 규칙을 발견하기 위한 텍스트마이닝 기법에 대한 연구가 활발히 전개되고 있다. 하지만 비정형 텍스트 문서로부터 추출된 용어의 수는 불규칙적이고 일반적인 용어가 많이 추출되는 관계로 일반적인 연관 규칙 탐사 방법을 사용하게 되면 무의미한 연관 규칙이 대량으로 생성되어 지식 정보를 효과적으로 검색하기 어렵다. 본 논문에서는 연관 규칙 탐사 기법을 이용하여 대량의 문서로부터 유용한 지식 정보를 찾기 위하여 의미적으로 연관된 전문 용어들끼리 클러스터링 하기 위한 방법을 제안하였다. 학술 논문을 대상으로 전문 용어를 추출하여 관련된 용어들끼리 클러스터를 구성하는 실험을 통하여 제안된 방법의 효율성을 보였다.

  • PDF

A Clustering Technique Using Association Rules for The Library and Information Science Terminology (연관규칙을 이용한 문헌정보학 전문용어 클러스터링 기법에 관한 연구)

  • Seung, Hyon-Woo;Park, Mi-Young
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.37 no.2
    • /
    • pp.89-105
    • /
    • 2003
  • In this paper, an effective method for clustering terminologies extracted from text is proposed, in order to develope a search engine to extract relevant information from large web documents. To prevent frequency of the meaningless association rules among general terminologies, only useful association rules among terminologies are produced using database tables which consist of domain-specific terminologies. Such association rules are produced by applying the Apriori algorithm after forming transaction units from groups of association rules in a document. A group of association rules produced from a terminology forms in a cluster.

A Design and Implementation of Expert Search Engine Using DataMining (데이타마이닝을 이용한 전문 검색엔진의 설계 및 구현)

  • Hwang, Bo-Youn;Kim, Byung-Chan;Kim, Young-Ji;Mun, Hyeong-Jeong;Woo, Yong-Tae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04a
    • /
    • pp.43-46
    • /
    • 2001
  • 본 논문에서는 데이타마이닝 기법을 이용하여 지능형 전문 검색엔진을 설계하고 사용자 인터페이스를 구현하였다. 먼저, 컴퓨터 분야의 전문 용어에 대하여 연관 규칙 탐사 알고리즘을 이용하여 의미적으로 연관된 용어들끼리 클러스터로 구성하였다. 전문 용어별로 구성된 클러스터는 본 논문에서 제안한 지식베이스 테이블에 저장하여 의미적으로 연관된 용어를 포함하는 웹 문서를 검색하는 과정에서 이용하였다. 검색과정에서는 사용자가 제시한 키워드와 관련된 전문 용어들간의 연관정도를 가중치로 부여하여 연관 정도가 높은 웹 문서순으로 출력하였다. 제안된 방법을 통하여 사용자가 제시한 키워드와 의미적으로 연관된 웹 문서를 효과적으로 검색할 수 있었다.

  • PDF

A Study on Describing Relational Properties of Terms in Geographical Categories According to Conceptual Characteristics for Construction of Structured Glossary (구조적 학술용어사전 구축에 있어서 지역명의 개념적 특성에 따른 관계 속성 기술에 관한 연구)

  • Yim, Bolam
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2014.08a
    • /
    • pp.95-98
    • /
    • 2014
  • 본 연구는 지역명 범주에 속하는 용어들의 개념적 특성을 분석하고, 이를 토대로 다른 범주와의 관련도를 파악하여 지역명 범주 용어들을 중심으로 관계 속성들 사이의 논리적 연관성을 부여할 수 있는 모형 도출에 기반이 되는 기초 연구이다. 지역명 범주 용어 중 국가명에 한정하여 분석한 결과, 국가명 개념 속성 중심으로는 계층 구조 관계의 지역명 범주 용어들끼리 연관이 높으며, 전체 범주 용어들의 개념 속성 중심으로는 지역명 범주 용어가 지리적 위치로서의 의미로 주로 쓰이나, 행위의 주체 또는 객체의 의미나 시대의 개념으로도 많이 활용됨을 알 수 있었다. 국가명이 참조되는 개념 속성과 연관되어 활용되는 관계 속성의 경우의 일부는 참조하는 주요 개념 범주와 연관 관계를 토대로 논리적 의미 관계를 생각해볼 수 있는 것으로 나타났다.

  • PDF

Preliminary Study on the Analysis of Term Associations in Korean Text (한국어 텍스트 내 용어연관성 분석을 위한 기초 연구)

  • 정영미;이재윤
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1998.08a
    • /
    • pp.243-246
    • /
    • 1998
  • 텍스트 자동분석을 통해 얻어진 통계적인 용어연관성은 정보검색 및 언어 처리와 관련된 여러 분야에서 폭넓게 이용되고 있다. 용어연관성을 구하기 위한 연관계수는 여러 가지가 있지만 적용분야에 관계없이 유사계수 공식이나 상호정보량 공식이 주류를 차지하고 있다. 이런 공식들은 그 통계적 특성이 서로 다르기 때문에 알맞은 적용분야를 파악할 필요가 있다. 이 연구에서는 필요 연관계수 공식의 특성을 이론적으로 파악하였고, 실험으로 검증하기 위하여 240만 어절 분량의 실험용 한국어 신문기사 데이터베이스를 구축하였다.

  • PDF

A Study on the Types of the Associative Relationship in Thesauri (시소러스의 연관관계 유형에 관한 연구)

  • Jun, Mal-Suk
    • Journal of Information Management
    • /
    • v.29 no.1
    • /
    • pp.20-39
    • /
    • 1998
  • In order to index documents, a thesaurus which consists of terms and relationships between terms is used. When an index term is selected, retrieval performance in the information retrieval system could be improved by using the relationship between the terms in the thesaurus. Recently, the usage of a thesaurus are extended from information retrieval to language and knowledge engineering, but term relationships in a thesaurus are simply represented in equivalence, hierarchy, and association. Particularly the associative relationship is vague in its definition and range as compared with the other relationships, i.e. equivalence, hierarchy, therefore the terms that are selected through associative relationship aren't well controlled. This study examines the relationships of existing thesauri, especially the types and ranges of associative relationship, and suggests the adequate type of associative relationship.

  • PDF

Analyzing Architectural History Terminologies by Text Mining and Association Analysis (텍스트 마이닝과 연관 관계 분석을 이용한 건축역사 용어 분석)

  • Kim, Min-Jeong;Kim, Chul-Joo
    • Journal of Digital Convergence
    • /
    • v.15 no.1
    • /
    • pp.443-452
    • /
    • 2017
  • Architectural history traces the changes in architecture through various traditions, regions, overarching stylistic trends, and dates. This study identified terminologies related to the proximity and frequency in the architectural history areas by text mining and association analysis. This study explored terminologies by investigating articles published in the "Journal of Architectural History", a sole journal for the architectural history studies. First, key terminologies that appeared frequently were extracted from paper that had titles, keywords, and abstracts. Then, we analyzed some typical and specific key terminologies that appear frequently and partially depending on the research areas. Finally, association analysis was used to find the frequent patterns in the key terminologies. This research can be used as fundamental data for understanding issues and trends in areas on the architectural history.

Text mining on internet-news regarding climate change and food (기후변화 및 식품 관련 뉴스기사의 텍스트 마이닝)

  • Hyun, Yoonjin;Kim, Jeong Seon;Jeong, Jin-Wook;Yun, Simon;Lee, Moon-Soo
    • Journal of the Korean Data and Information Science Society
    • /
    • v.26 no.2
    • /
    • pp.419-427
    • /
    • 2015
  • Despite of correlation between climate changes and food-related information, it is still not easy for many users to get access to the information with interest. This study investigated how much climate change and food-related information are correlated with each other and how often they are exposed through frequency and correlation analysis on news articles on the internet portals. Through analysis on the frequency of climate change and food-related news articles, this study was able to figure out how often they are exposed at the same time by the internet news portals. In addition, a total of 59 correlation rules regarding the climate change and food-related vocabularies were derived from these news articles using the climate change and food-related glossaries. Then, a correlation between certain climate change-related and food-related words was analyzed in order to package the related words.

Document Summarization using Pseudo Relevance Feedback and Term Weighting (의사연관피드백과 용어 가중치에 의한 문서요약)

  • Kim, Chul-Won;Park, Sun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.16 no.3
    • /
    • pp.533-540
    • /
    • 2012
  • In this paper, we propose a document summarization method using the pseudo relevance feedback and the term weighting based on semantic features. The proposed method can minimize the user intervention to use the pseudo relevance feedback. It also can improve the quality of document summaries because the inherent semantic of the sentence set are well reflected by term weighting derived from semantic feature. In addition, it uses the semantic feature of term weighting and the expanded query to reduce the semantic gap between the user's requirement and the result of proposed method. The experimental results demonstrate that the proposed method achieves better performant than other methods without term weighting.