• 제목/요약/키워드: Classification rule

검색결과 544건 처리시간 0.024초

A Method to Minimize Classification Rules Based on Data Mining and Logic Synthesis

  • Kim, Jong-Wan
    • 한국멀티미디어학회논문지
    • /
    • 제11권12호
    • /
    • pp.1739-1748
    • /
    • 2008
  • When we conduct a data mining procedure on sample data sources, several rules are generated. But some rules are redundant or logically disjoint and therefore they can be removed. We suggest a new rule minimization algorithm inspired from logic synthesis to improve comprehensibility and eliminate redundant rules. The method can merge several relevant rules into one based on data mining and logic synthesis without high loss of accuracy. In case of two or more rules are candidates to be merged, we merge the rules with the attribute having the lowest information gain. To show the proposed method could be a reasonable solution, we applied the proposed approach to a problem domain constructing user preferred ontology in anti-spam systems.

  • PDF

미디어 분류를 위한 온톨로지 스키마 자동 생성 (Automated Modelling of Ontology Schema for Media Classification)

  • 이남기;박현규;박영택
    • 정보과학회 논문지
    • /
    • 제44권3호
    • /
    • pp.287-294
    • /
    • 2017
  • UCC와 SNS 등을 통해 개인 미디어가 다양한 방식으로 생성됨에 따라 미디어를 분석하고 인지하는 기술에 대한 연구가 진행되고 있으며, 이를 통해 객체 인지의 수준이 향상되었다. 그 결과 기존의 제목, 태그 및 스크립터 정보를 이용한 추론 방식과 달리 미디어에서 인지되는 객체를 활용하는 영상 분류 추론 연구가 수행되고 있다. 하지만 추론을 위한 미디어 온톨로지 모델링을 사람이 직접 수행해야 하기 때문에 많은 시간과 비용이 발생하는 단점이 있다. 따라서 본 논문에서는 미디어 분류를 위한 온톨로지 스키마 모델링의 자동화 방법을 제안한다. 영상에서 인지되는 객체의 빈도에 따른 OWL-DL 공리의 특성을 고려하여 온톨로지 모델 생성의 자동화 방안에 대하여 설명한다. 유튜브에서 수집한 15가지의 카테고리에 대한 영상으로부터 온톨로지 모델을 자동 생성하여 추론을 통해 미디어 분류의 정확도에 대한 실험을 수행하였다. 실험결과 15가지 영상 이벤트의 행위 약 1500개에 대하여 영상 분류를 수행한 결과, 86%의 정확도를 얻었고, 온톨로지 모델링의 자동화 방법에 대한 타당한 성능을 보였다.

비음수 행렬 분해와 동적 분류 체계를 사용한 자동 이메일 다원 분류 (Automatic Email Multi-category Classification Using Dynamic Category Hierarchy and Non-negative Matrix Factorization)

  • 박선;안동언
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권5호
    • /
    • pp.378-385
    • /
    • 2010
  • 이메일 사용의 증가로 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 늘고 있다. 현재의 이메일 분류는 SVM, 베이지안 분류자, 규칙 기반 분류자 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 그러나 이러한 지도 학습 방법들은 적합한 이메일을 인식하기 위하여서 사용자가 규칙이나 색인어 목록을 작성해야 한다. 비지도 학습 방법으로 군집을 이용한 다원 분류 방법은 메일의 분류 주제를 설정해주어야 한다. 본 논문에서는 비음수 행렬 분해(NMF, Non-negative Matrix Factorization)를 기반으로 한 자동 분류 주제 생성 방법과, 동적 분류 체계(DCH, Dynamic Category Hierarchy) 방법을 이용한 분류 주제 내에 이메일을 재구성하는 방법을 결합한 새로운 이메일 다원 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 다원 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 사용자가 분류 결과를 만족하지 못하면 분류 주제 내의 이메일을 동적으로 재구성하여 분류의 정확률을 높인다.

광용적맥파의 정량적 맥파형 분류에 관한 연구 (A Study on the Quantitative Pulse Type Classification of the Photoplethysmography)

  • 장대근;우말 파르크;박승훈;한민수
    • 대한의용생체공학회:의공학회지
    • /
    • 제31권4호
    • /
    • pp.328-334
    • /
    • 2010
  • Over the past few years, a considerable number of methods have been proposed and applied for the classification of photoplethysmography (PPG). Most of the previous studies, however, focused on the qualitative description of the pulse type according to specific disease and thus provided ambiguous criteria to interpreters. In order to screen out this problem, we present a quantitative method for the pulse type classification including the second derivative of photoplethysmography (SDPTG). In the PPG signal, we have classified the signal as 4 types using the position and the presence of the dicrotic wave. In addition, we have categorized the SDPTG signal as 7 types using the position and the presence of "c" and "d" wave and the sign of "c" wave. In order to check the efficacy of the proposed pulse type classification rule, we collected pulse signals from 155 subjects with different ages and sex. From the correlation analysis, Class 1(p<0.01) and Class 2(p<0.01) in the PPG signal are significantly correlated with ages. In a similar manner Class A(p<0.01), Class C(p<0.05), Class D(p<0.01), and Class F(p<0.01) in the SDPTG signal are considerably correlated with the ages. From these observations, and some earlier ones [4], [5], we can conclude that since the newly proposed method has objectivity and clarity in pulse type classification, this method can be used as an alternative of previous classification rules including similar age-related characteristics.

인터넷 라우터에서의 패킷 분류를 위한 2차원 이진 검색 트리 (Two-dimensional Binary Search Tree for Packet Classification at Internet Routers)

  • 이고은;임혜숙
    • 전자공학회논문지
    • /
    • 제52권6호
    • /
    • pp.21-31
    • /
    • 2015
  • 현재의 인터넷 사용자들은 실시간으로 다양한 멀티미디어 서비스를 제공 받길 원한다. 이에 네트워크 트래픽의 속도는 매우 빨라지고 있으며, 처리하여야 하는 데이터의 양은 해마다 기하급수적으로 증가하고 있다. 데이터는 '패킷'이라는 단위의 데이터 형식으로 전송되며, 패킷분류는 인터넷 라우터의 가장 어려운 기능 중 하나로 모든 패킷에 대하여 선속도로 처리되어야 한다. 다양한 패킷 분류 알고리즘 중, 영역분할 패킷분류 알고리즘은 5개의 패킷 헤더 필드 정보를 동시에 검색할 수 있는 효율적인 알고리즘이다. 영역 분할 사분 트라이는 가장 대표적인 영역분할 패킷분류 알고리즘으로 메모리 요구량이 적은 알고리즘이지 만, 빠른 검색성능을 보장하지 못하는 단점이 있다. 본 논문에서는, 영역 분할 사분 트라이의 단점을 이진 검색 트리를 사용해 보완하는 새로운 알고리즘을 제안한다. 실험을 통하여 제안하는 알고리즘은 입력과 비교되는 룰의 수에 있어 영역 분할 사분 트라이 보다 검색 성능이 향상됨을 보았다.

알려지지 않은 위협 탐지를 위한 CBA와 OCSVM 기반 하이브리드 침입 탐지 시스템 (A hybrid intrusion detection system based on CBA and OCSVM for unknown threat detection)

  • 신건윤;김동욱;윤지영;김상수;한명묵
    • 인터넷정보학회논문지
    • /
    • 제22권3호
    • /
    • pp.27-35
    • /
    • 2021
  • 인터넷이 발달함에 따라, IoT, 클라우드 등과 같은 다양한 IT 기술들이 개발되었고, 이러한 기술들을 사용하여 국가와 여러 기업들에서는 다양한 시스템을 구축하였다. 해당 시스템들은 방대한 양의 데이터들을 생성하고, 공유하기 때문에 시스템에 들어있는 중요한 데이터들을 보호하기 위해 위협을 탐지할 수 있는 다양한 시스템이 필요하였으며, 이에 대한 연구가 현재까지 활발히 진행되고 있다. 대표적인 기술로 이상 탐지와 오용 탐지를 들 수 있으며, 해당 기술들은 기존에 알려진 위협이나 정상과는 다른 행동을 보이는 위협들을 탐지한다. 하지만 IT 기술이 발전함에 따라 시스템을 위협하는 기술들도 점차 발전되고 있으며, 이러한 탐지 방법들을 피해서 위협을 가한다. 지능형 지속 위협(Advanced Persistent Threat : APT)은 국가 또는 기업의 시스템을 공격하여 중요 정보 탈취 및 시스템 다운 등의 공격을 수행하며, 이러한 공격에는 기존에 알려지지 않았던 악성코드 및 공격 기술들을 적용한 위협이 존재한다. 따라서 본 논문에서는 알려지지 않은 위협을 탐지하기 위한 이상 탐지와 오용 탐지를 결합한 하이브리드 침입 탐지 시스템을 제안한다. 두 가지 탐지 기술을 적용하여 알려진 위협과 알려지지 않은 위협에 대한 탐지가 가능하게 하였으며, 기계학습을 적용함으로써 보다 정확한 위협 탐지가 가능하게 된다. 오용 탐지에서는 Classification based on Association Rule(CBA)를 적용하여 알려진 위협에 대한 규칙을 생성하였으며, 이상 탐지에서는 One Class SVM(OCSVM)을 사용하여 알려지지 않은 위협을 탐지하였다. 실험 결과, 알려지지 않은 위협 탐지 정확도는 약 94%로 나타난 것을 확인하였고, 하이브리드 침입 탐지를 통해 알려지지 않은 위협을 탐지 할 수 있는 것을 확인하였다.

분류규칙과 강화 역전파 신경망을 이용한 이종 인공유기체의 공진화 (A Coevolution of Artificial-Organism Using Classification Rule And Enhanced Backpropagation Neural Network)

  • 조남덕;김기태
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.349-356
    • /
    • 2005
  • 동적이고 비정형적인 환경에서 작업을 수행하기 위해 인공유기체를 이용하는 응용 분야가 빠른 속도로 확대되고 있다. 이러한 분야에서 인공유기체의 행동 지식 표현법으로 일반적인 프로그래밍 또는 전통적인 인공지능 방법을 사용하면, 예측치 못한 상황으로 인한 빈번한 변경과 나쁜 응답성의 문제가 발생한다. 이들 문제들을 기계학습적으로 해결하기 위한 방법으로는 유전자 프로그래밍과 진화 신경망이 대표적이다. 그러나 아직까지도 인공유기체의 학습방법이 문제가 되고 있으며, 같은 환경 속에 서식하는 인공유기체의 종이 같아서 여러생명체를 대표할수 없는 문제점이 있다. 본 논문에서는 학습의 속도와 질을 향상시키기 위해 강화역전파 신경망과 분류규칙을 이용하였으며, 한 환경속에 서식하는 인공유기체의 종을 달리하였다. 제안된 모델을 평가하기 위해서 이종간 인공유기체 집단이 한 가상환경속에서 서로 경쟁하면서 생활하는 시뮬레이터를 설계 및 구현하였고, 그들의 행동진화를 수행결과로 보여주었으며, 타시스템과의 비교분석을 하였다. 결과적으로, 학습의 속도와 질적인 면에서 제안된 모델이 모두 우수한 것을 확인하였다. 본 모델의 특징으로는, 유전자 알고리즘에 의해서 염색체에 표현된 분류 규칙들과 신경망의 학습이 동시에 수행되며, 분류 규칙과 강화역전파 신경망의 2단계의 처리 과정으로 인하여 학습 능력이 강화된다는 점이다.

미디어 영상 자동 분류를 위한 온톨로지 모델링 및 규칙 기반 추론 (Ontology Modeling and Rule-based Reasoning for Automatic Classification of Personal Media)

  • 박현규;소치승;박영택
    • 정보과학회 논문지
    • /
    • 제43권3호
    • /
    • pp.370-379
    • /
    • 2016
  • 최근 스마트 디바이스가 많이 보급되면서 개인 영상 미디어가 다양한 방식으로 생성되어 영상 미디어를 이용한 서비스가 요구되고 있다. 이에 따라 영상 미디어 분석 및 인지 기술에 대한 연구가 활발히 진행되어, 영상으로부터 의미 있는 객체를 인지할 수 있게 되었다. 기존의 미디어 온톨로지를 이용한 시스템은 영상의 제목, 태그 및 스크립터 정보를 이용하기 때문에 영상에 등장하는 객체를 통해 미디어 분류를 수행할 수 없는 단점이 있다. 따라서 본 논문에서는 영상 미디어 데이터에서 인지되는 객체들을 이용해 해당 영상이 속하는 범주로 자동 분류하기 위해 서술논리 기반(Description Logic) 추론 시스템과 순서에 따라 달라질 수 있는 이벤트 처리를 위한 규칙 기반 추론 시스템을 제안한다. 제안하는 서술논리 기반 추론 시스템은 영상 미디어에서 인지되는 객체들의 관계를 서술논리로 정의된 행위(Activity) 온톨로지로 표현하고, 실체화 추론을 통해 인지된 객체가 행위로 추론되는 방법에 대해 설명한다. 규칙 기반 추론 시스템은 추론된 행위의 순서에 따른 이벤트를 정의하고 순서 기반 규칙 추론을 이용하여 범주에 알맞은 이벤트로 자동 분류하는 방법에 대하여 설명한다. 제안하는 방법의 타당성을 증명하기 위해 유투브의 영상에 대한 분석을 통해 올바른 범주로 분류된 미디어 데이터를 구성하여 제안하는 시스템의 타당성을 증명하였다.

Identification of a Gaussian Fuzzy Classifier

  • Heesoo Hwang
    • International Journal of Control, Automation, and Systems
    • /
    • 제2권1호
    • /
    • pp.118-124
    • /
    • 2004
  • This paper proposes an approach to deriving a fuzzy classifier based on evolutionary supervised clustering, which identifies the optimal clusters necessary to classify classes. The clusters are formed by multi-dimensional weighted Euclidean distance, which allows clusters of varying shapes and sizes. A cluster induces a Gaussian fuzzy antecedent set with unique variance in each dimension, which reflects the tightness of the cluster. The fuzzy classifier is com-posed of as many classification rules as classes. The clusters identified for each class constitute fuzzy sets, which are joined by an "and" connective in the antecedent part of the corresponding rule. The approach is evaluated using six data sets. The comparative results with different classifiers are given.are given.

Add-on selling strategies in an online open market

  • Shim, Beomsoo;Lee, Hanjun
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권4호
    • /
    • pp.985-995
    • /
    • 2015
  • Add-on selling can provide new chances to increase sellers' profits and meet customers' needs. Although prior studies have advocated add-on selling for its business value, there is an argument that add-on selling can cause customer repulsion. Therefore, we need to understand customer purchasing pattern related to add-on selling in order to promote it and to mitigate the customer repulsion. To that end, we applied data mining techniques to the 24,925 transactions of data from an online open market in Korea. We then conducted feature selection to investigate the most influential factors that can explain the characteristics of add-on selling transactions using a classification model. We also identified association rules among add-on selling and promotions. Finally, based on the findings in our experiments, we proposed add-on selling strategies for the target online market.