• 제목/요약/키워드: knowledge discovery system

검색결과 129건 처리시간 0.025초

연관규칙을 이용한 데이터 분석에 관한 연구 (A Study on the Analysis of Data Using Association Rule)

  • 임영문;최영두
    • 산업경영시스템학회지
    • /
    • 제23권61호
    • /
    • pp.115-126
    • /
    • 2000
  • In General, data mining is defined as the knowledge discovery or extracting hidden necessary information from large databases. Its technique can be applied into decision making, prediction, and information analysis through analyzing of relationship and pattern among data. One of the most important works is to find association rules in data mining. Association Rule is mainly being used in basket analysis. In addition, it has been used in the analysis of web-log and user-pattern. This paper provides the application method in the field of marketing through the analysis of data using association rule as a technique of data mining.

  • PDF

Data Mining for Knowledge Management in a Health Insurance Domain

  • Chae, Young-Moon;Ho, Seung-Hee;Cho, Kyoung-Won;Lee, Dong-Ha;Ji, Sun-Ha
    • 지능정보연구
    • /
    • 제6권1호
    • /
    • pp.73-82
    • /
    • 2000
  • This study examined the characteristicso f the knowledge discovery and data mining algorithms to demonstrate how they can be used to predict health outcomes and provide policy information for hypertension management using the Korea Medical Insurance Corporation database. Specifically this study validated the predictive power of data mining algorithms by comparing the performance of logistic regression and two decision tree algorithms CHAID (Chi-squared Automatic Interaction Detection) and C5.0 (a variant of C4.5) since logistic regression has assumed a major position in the healthcare field as a method for predicting or classifying health outcomes based on the specific characteristics of each individual case. This comparison was performed using the test set of 4,588 beneficiaries and the training set of 13,689 beneficiaries that were used to develop the models. On the contrary to the previous study CHAID algorithm performed better than logistic regression in predicting hypertension but C5.0 had the lowest predictive power. In addition CHAID algorithm and association rule also provided the segment characteristics for the risk factors that may be used in developing hypertension management programs. This showed that data mining approach can be a useful analytic tool for predicting and classifying health outcomes data.

  • PDF

확률적 퍼지 룰 기반 학습에 의한 개인화된 미디어 제어 방법 (Personalized Media Control Method using Probabilistic Fuzzy Rule-based Learning)

  • 이형욱;김용휘;이태엽;박광현;김용수;조준면;변증남
    • 한국지능시스템학회논문지
    • /
    • 제17권2호
    • /
    • pp.244-251
    • /
    • 2007
  • 사용자 의도 파악(intention reading) 기술은 스마트 홈과 같은 복잡한 유비쿼터스(ubiquitous) 환경에서 사용자에게 보다 편리하고 개인화된(personalized) 서비스 제공이 가능하도록 해준다. 또한 학습 기능(learning capability)은 지식 발견(knowledge discovery)의 관점에서 의도 파악 기술의 핵심 요소 기술의 하나로 자리 매김하고 있다 이 논문에서는 스마트 홈(smart home) 환경에서 제공 가능한 개인화된 서비스 중의 하나로, 개인화된 미디어 제어 방법에 대한 내용을 다룬다. 특히, 사람의 행동 패턴과 같은 데이터는 패턴 분류의 관점에서 구분해야 할 클래스(class)에 비해 입력 정보가 불충분한 경우가 많아서 비일관적인(inconsistent) 데이터가 많으므로, 퍼지 논리(fuzzy logic)와 확률 (probability)의 개념을 효과적으로 병행해야 의미 있는 지식을 추출해 낼 수 있다. 이를 위하여 반복 퍼지 지도 클러스터링(IFCS; Iterative Fuzzy Clustering with Supervision) 알고리즘에 기반하여 주어진 데이터 패턴으로부터 확률적 퍼지 룰(probabilistic fuzzy rule)을 얻어 내는 방법에 대해 설명한다. 또한 이를 이용한 다양한 학습 제어 구조를 바탕으로 개인화된 미디어 서비스를 추천해 줄 수 있는 방법에 대해서 설명하도록 하고, 실험 결과를 통해 제안된 시스템의 효용성을 보이도록 한다.

하이에크(Hayek)의 자생적 질서와 수산규제개혁 (Hayek′s Spontaneous Order and Korean Fisheries Regulatory Reform)

  • 박성쾌
    • 수산경영론집
    • /
    • 제29권2호
    • /
    • pp.47-64
    • /
    • 1998
  • This paper seeks to find out possibility of introducing market order into Korean fisheries regulatory system. Hayek tells us that market order is equivalent to spontaneous order, while regulations are man-made order created based on incomplete knowledge. He also sees market competition as a discovery procedure of knowledge and information. From this perspective is discussed Korean fisheries regulatory reform-particularly issues of establishing property right on fishery resources. It appears that there is quite a large room for substituting market functions for the regulations regarding fishery resources management, even though fishery resources have a very nature of common pool. Advanced fisheries suggest that successful regulatory reform require a well-prepared strategic plan and check list. In addition, the government should be able to secure sufficient monitoring and surveillance power and to play an important role as a fair supervisor.

  • PDF

웹 로그 화일에서 순회 패턴 탐사를 위한 시스템 (A System for Mining Traversal Patterns from Web Log Files)

  • 박종수;윤지영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.4-6
    • /
    • 2001
  • In this paper, we designed a system that can mine user's traversal patterns from web log files. The system cleans an input data, transactions of a web log file, and finds traversal patterns from the transactions, each of which consists of one user's access pages. The resulting traversal patterns are shown on a web browser, which can be used to analyze the patterns in visual form by a system manager or data miner. We have implemented the system in an IBM personal computer running on Windows 2000 in MS visual C++, and used the MS SQL Server 2000 to store the intermediate files and the traversal patterns which can be easily applied to a system for knowledge discovery in databases.

  • PDF

계량정보분석시스템으로서의 KnowledgeMatrix 개발 (Development of the KnowledgeMatrix as an Informetric Analysis System)

  • 이방래;여운동;이준영;이창환;권오진;문영호
    • 한국콘텐츠학회논문지
    • /
    • 제8권1호
    • /
    • pp.68-74
    • /
    • 2008
  • 데이터베이스로부터 지식을 발견하고 이를 연구기획자, 정책의사결정자들이 활용하는 움직임이 전세계적으로 활발해지고 있다. 이러한 연구분야 중 대표적인 것이 계량정보학이고 이 분야를 지원하기 위해서 주로 선진국을 중심으로 분석시스템이 개발되고 있다. 그러나 외국의 분석시스템은 실제 수요자의 요구를 충분히 반영하지 못하고 있고, 고가이면서 한글이 지원되지 않아 국내 연구기획자가 사용하기에 어려운 점이 있다. 따라서 한국과학기술정보연구원에서는 이러한 단점을 극복하기 위해서 계량정보분석시스템 KnowledgeMatrix를 개발하였다. KnowledgeMatrix는 논문 및 특허의 서지정보를 분석하여 지식을 발견하기 위한 목적으로 설계된 독립형(stand-alone) 시스템이다 KnowledgeMatrix의 주요 구성을 살펴보면 행렬 생성, 클러스터링, 시각화, 데이터 전처리로 요약된다. 본 논문에서 소개하고 있는 KnowledgeMatrix는 외국의 대표적인 정보분석시스템과 비교했을 때 다양한 기능을 제공하고 있고 특히 영문데이터 처리 이외에 한글데이터 처리가 가능하다는 장점을 갖고 있다.

Building Intelligent User Interface Agent for Semantically Reformulating User Query in Medicine

  • Lim, Chae-Myung;Chu, Sung-Joon;Lee, Dong-Hoon;Park, Duck-Whan;Park, Tae-Young;Yang, Jung-Jin
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2003년도 Proceeding
    • /
    • pp.57-64
    • /
    • 2003
  • Achieving the beneficiary goal of recent discovery in human genome project still needs a way to retrieve and analyze the exponentially expanding bio-related information. Research on bio-related fields naturally applies knowledge discovered to the current problem and make inferences to extract new information where shared concepts and data containing information need to be defined and used in a coherent way. In such a professional domain, while the need to help users reduce their work and to improve search results has been emerged. methods for systematic retrieval and adequate exchange of relevant information are still in their infancy. The design of our system aims at improving the quality of information retrieval in a professional domain by utilizing both corpus-based and concept-based ontology. Meta-rules of helping users to make an adequate query are formed into an ontology in the domain. The integration of those knowledge permits the system to retrieve relevant information in a more semantic and systematic fashion. This work mainly describes the query models with details of GUI and a secondary query generation of the system.

  • PDF

데이터 마이닝과 지능 모델링에 기반한 에칭공정의 공정관리시스템 설계 (Design of Process Management System based on Data Mining and Artificial Modelling for the Etching Process)

  • Bae, Hyeon;Kim, Sung-shin;Woo, Kwang-Bang
    • 한국지능시스템학회논문지
    • /
    • 제14권4호
    • /
    • pp.390-395
    • /
    • 2004
  • 반도체 공정은 많은 단위 공정으로 이루어진 복잡하고 동적인 공정이다. 그 중 에칭공정은 반도체 생산에서 중요한 공정중 하나이다. 본 논문에서는 데이터 마이닝과 지식 획득을 통한 의사지원시스템으로 생산성과 수율을 높일 수 있는 시스템을 구성하고자 하였다. 제안된 방법은 퍼지 논리와 신경망으로 구성되는데, 신경망으로 에칭공정의 품질을 나타내는 품질에 대한 결과를 예측하고, 예측된 결과를 퍼지 추론 시스템으로 분류하는 과정으로 수행된다. 퍼지 논리에 사용된 규칙은 전문가의 지식에 기반 하여 도출되거나 데이터로부터 도출된다. 본 시스템을 통해 공정의 최적 조건을 찾아 효율을 높이는 것이 본 연구의 주요 목표이다.

Hybrid Neural Networks for Intrusion Detection System

  • Jirapummin, Chaivat;Kanthamanon, Prasert
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.928-931
    • /
    • 2002
  • Network based intrusion detection system is a computer network security tool. In this paper, we present an intrusion detection system based on Self-Organizing Maps (SOM) and Resilient Propagation Neural Network (RPROP) for visualizing and classifying intrusion and normal patterns. We introduce a cluster matching equation for finding principal associated components in component planes. We apply data from The Third International Knowledge Discovery and Data Mining Tools Competition (KDD cup'99) for training and testing our prototype. From our experimental results with different network data, our scheme archives more than 90 percent detection rate, and less than 5 percent false alarm rate in one SYN flooding and two port scanning attack types.

  • PDF

공간 데이터 분석을 위한 공간 연관 규칙 탐사 시스템의 설계 및 구현 (Design and Implementation of Spatial Association Rule Discovery System for Spatial Data Analysis)

  • 안찬민;이윤석;박상호;이주홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.27-34
    • /
    • 2006
  • 최근 공간 정보들을 효과적으로 이용할 수 있는 기술에 대한 연구가 활발하게 이루어지고 있다. 효율적인 지식 탐사를 위해 다양한 기존의 데이터 마이닝 방법들이 확장되어 공간 데이터 마이닝에 사용되고 있다. 그러나 기존의 공간 연관 규칙 탐사 시스템들은 프레디킷 간의 연산을 통해 규칙을 발견함에 따라 질의 결과에 다양한 비공간 속성들을 반영하지 못하는 문제점을 가지고 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 공간 데이터베이스에서 사용되는 질의를 확장하고, 위상정보에 따른 데이터를 구성한 후 비공간 객체 속성간의 연관 규칙을 발견하는 시스템을 제안한다. 특히 지리 정보 시스템에 적용 가능한 모델을 구현하였다. 이렇게 구현된 시스템은 사용 중인 공간 데이터베이스를 확장하므로 이식성이 뛰어나고, 공간 속성뿐만 아니라 다양한 비공간 속성을 고려함으로써 좀 더 실생활에 유용한 공간 연관 규칙을 발견할 수 있다.

  • PDF