• 제목/요약/키워드: Rule-Based Classification

검색결과 330건 처리시간 0.024초

비음수 행렬 분해와 동적 분류 체계를 사용한 자동 이메일 다원 분류 (Automatic Email Multi-category Classification Using Dynamic Category Hierarchy and Non-negative Matrix Factorization)

  • 박선;안동언
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권5호
    • /
    • pp.378-385
    • /
    • 2010
  • 이메일 사용의 증가로 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 늘고 있다. 현재의 이메일 분류는 SVM, 베이지안 분류자, 규칙 기반 분류자 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 그러나 이러한 지도 학습 방법들은 적합한 이메일을 인식하기 위하여서 사용자가 규칙이나 색인어 목록을 작성해야 한다. 비지도 학습 방법으로 군집을 이용한 다원 분류 방법은 메일의 분류 주제를 설정해주어야 한다. 본 논문에서는 비음수 행렬 분해(NMF, Non-negative Matrix Factorization)를 기반으로 한 자동 분류 주제 생성 방법과, 동적 분류 체계(DCH, Dynamic Category Hierarchy) 방법을 이용한 분류 주제 내에 이메일을 재구성하는 방법을 결합한 새로운 이메일 다원 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 다원 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 사용자가 분류 결과를 만족하지 못하면 분류 주제 내의 이메일을 동적으로 재구성하여 분류의 정확률을 높인다.

인터넷 라우터에서의 패킷 분류를 위한 2차원 이진 검색 트리 (Two-dimensional Binary Search Tree for Packet Classification at Internet Routers)

  • 이고은;임혜숙
    • 전자공학회논문지
    • /
    • 제52권6호
    • /
    • pp.21-31
    • /
    • 2015
  • 현재의 인터넷 사용자들은 실시간으로 다양한 멀티미디어 서비스를 제공 받길 원한다. 이에 네트워크 트래픽의 속도는 매우 빨라지고 있으며, 처리하여야 하는 데이터의 양은 해마다 기하급수적으로 증가하고 있다. 데이터는 '패킷'이라는 단위의 데이터 형식으로 전송되며, 패킷분류는 인터넷 라우터의 가장 어려운 기능 중 하나로 모든 패킷에 대하여 선속도로 처리되어야 한다. 다양한 패킷 분류 알고리즘 중, 영역분할 패킷분류 알고리즘은 5개의 패킷 헤더 필드 정보를 동시에 검색할 수 있는 효율적인 알고리즘이다. 영역 분할 사분 트라이는 가장 대표적인 영역분할 패킷분류 알고리즘으로 메모리 요구량이 적은 알고리즘이지 만, 빠른 검색성능을 보장하지 못하는 단점이 있다. 본 논문에서는, 영역 분할 사분 트라이의 단점을 이진 검색 트리를 사용해 보완하는 새로운 알고리즘을 제안한다. 실험을 통하여 제안하는 알고리즘은 입력과 비교되는 룰의 수에 있어 영역 분할 사분 트라이 보다 검색 성능이 향상됨을 보았다.

Layered Classifier System by Classification of Environment

  • Kim, Ji-Yoon;Lee, Dong-Wook;Sim, Kwee-Bo
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.1517-1520
    • /
    • 2003
  • Generally, the environment we want to apply classifier system to is composed of several state spaces. So in this paper, we propose the layered classifier system having multifarious rule bases. From sensor's inputs, the lower layer of the layered classifier system learns strategies for each environmental state space. The higher layer learns how to allot each rule base of the strategy for environmental state space properly. To evaluate the proposed architecture of classifier system, we designed virtual environment having multifarious state spaces and from the analysis of the experimental results, we affirm that layered classifier system could find better strategies during a little time than other established classifier system's findings.

  • PDF

The Development of Relative Interestingness Measure for Comparing with Degrees of Association

  • Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권4호
    • /
    • pp.1269-1279
    • /
    • 2008
  • Data mining is the technique to find useful information in huge databases. One of the well-studied problems in data mining is exploration for association rules. An association rule technique finds the relation among each items in massive volume databases by several interestingness measures. An important and useful classification scheme of interestingness measures may be based on user-involvement. This results in two categories - objective and subjective measures. This paper present some relative interestingess measures to compare with degrees of association for two groups. A comparative study with some relative interestingness measures is shown by numerical example. The results show that the relative net confidence is the best relative interestingness measure.

  • PDF

딥러닝 기반의 반려묘 모니터링 및 질병 진단 시스템 (Cat Monitoring and Disease Diagnosis System based on Deep Learning)

  • 최윤아;채희찬;이종욱;박대희;정용화
    • 한국멀티미디어학회논문지
    • /
    • 제24권2호
    • /
    • pp.233-244
    • /
    • 2021
  • Recently, several ICT-based cat studies have produced some successful results, according to academic and industry sources. However, research on the level of simply identifying the cat's condition, such as the behavior and sound classification of cats based on images and sound signals, has yet to be found. In this paper, based on the veterinary scientific knowledge of cats, a practical and academic cat monitoring and disease diagnosis system is proposed to monitor the health status of the cat 24 hours a day by automatically categorizing and analyzing the behavior of the cat with location information using LSTM with a beacon sensor and a raspberry pie that can be built at low cost. Validity of the proposed system is verified through experimentation with cats in actual custody (the accuracy of the cat behavior classification and location identification was 96.3% and 92.7% on average, respectively). Furthermore, a rule-based disease analysis system based on the veterinary knowledge was designed and implemented so that owners can check whether or not the cats have diseases at home (or can be used as an auxiliary tool for diagnosis by a pet veterinarian).

Hypercube 영역의 집합으로 표현된 패턴인식 알고리즘의 설계 (A Design of Pattern Recognition Algorithm as a Collection of Hypercubic Regions)

  • Baek Sop Kim
    • 전자공학회논문지B
    • /
    • 제29B권7호
    • /
    • pp.23-29
    • /
    • 1992
  • In this paper, a method of representing the pattern classifier as a collection of hypercubic regions is proposed. This representation has following advantages over the conventional ones : 1) a simple form of human knowledge can be used in designing the classifier, 2) the form of the classifier is suit for the rule-based system, and 3) this can reduce the classification time. A method of synthesis of the classifier under this representation is also proposed and the experimental result shows that the proposed method is faster than the well-known nearest neighbor classifier.

  • PDF

효율적인 문서 자동 분류를 위한 대표 색인어 추출 기법 (A Feature Selection Technique for an Efficient Document Automatic Classification)

  • 김지숙;김영지;문현정;우용태
    • 정보기술과데이타베이스저널
    • /
    • 제8권1호
    • /
    • pp.117-128
    • /
    • 2001
  • Recently there are many researches of text mining to find interesting patterns or association rules from mass textual documents. However, the words extracted from informal documents are tend to be irregular and there are too many general words, so if we use pre-exist method, we would have difficulty in retrieving knowledge information effectively. In this paper, we propose a new feature extraction method to classify mass documents using association rule based on unsupervised learning technique. In experiment, we show the efficiency of suggested method by extracting features and classifying of documents.

  • PDF

CAD 시스템에 의한 선체중앙단면의 최소중량설계에 관한 연구 (Minimum Weight Design of Midship Structure by the CAD System)

  • 박명규;양영태
    • 한국항해학회지
    • /
    • 제13권2호
    • /
    • pp.75-95
    • /
    • 1989
  • The study presents the optimum design of B/C midship structure based on the classification society's Rule. The SUMT (Sequential Unconstrained Minimization Technique), using the Direct Search Methods (Hooke and Jeeves, Simplex) is applied to the solution of this nonlinear optimum design problem with constraints. Through the optimum designs of existing ships(60k, 186k, 220k), the amount 0.45-6.18% in weight of their midship structures are obtained on the viewpoint of minimum weight design.

  • PDF

사이버교육활성화를 위한 CRM방법의 적용에 관한 연구 (A Study on the CRM Application for Activation of Cyber Education)

  • 김한신;이공섭;이창호
    • 대한안전경영과학회지
    • /
    • 제4권2호
    • /
    • pp.103-111
    • /
    • 2002
  • Nowdays cyber education based on the internet is actively developed. But the management of the customers in the cyber education field is not enough. Then, in this paper, we provide the learner with the proposals of lectures to be extremely matched by analyzing the learning capacity and the greatest concern of him(her) using the methods of data mining, such as RFM, prediction, slickness, association rule, classification, and so on.

규칙 기반의 기계학습을 통한 고유명사의 추출과 분류 (Extraction and Classification of Proper Nouns by Rule-based Machine Learning)

  • 노태길;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.170-172
    • /
    • 2000
  • 고유명사를 추출하고 그 범주를 파악할 수 있다면, 이는 정보 추출이나 정보 검색, 문서 요약과 같은 분야에 도움을 줄 수 있다. 본 논문에서는 고유명사를 추출하고 그 범주를 찾는 방법을 제시한다. 고유명사가 태깅된 코퍼스로부터, 고유명사의 내부와 주변에 반복적으로 나타나는 실마리들을 규칙 기반으로 학습한다. 이를 통하여 고유명사를 찾고 그 범주를 정한다. 구현한 시스템은 경제기사 코퍼스에서 4가지 범주로 고유명사를 추출하고 분류함에 있어 79.8%의 재현율과 92.9%의 정확률, 그리고 F 평가치에서 85.8의 성능을 보인다.

  • PDF