• Title/Summary/Keyword: 논문 분류

Search Result 12,526, Processing Time 0.052 seconds

Word Ambiguity Resolution for Concept-based Text Classification (개념 기반 문서 분류를 위한 단어 애매성 해소)

  • 강원석;황도삼
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.167-169
    • /
    • 2000
  • 문서 분류 시스템은 문서에 나타난 용어나 개념의 출현 정보를 이용한다. 개념 기반문서분류는 용어를 사용하지 않고 문서의 단어에 나타난 의미를 이용한다. 단어가 중의성을 가지는 경우 그 뜻을 정확히 가리지 않으면 문서에 출현하지 않은 의미를 이용하게 되므로 문서 분류 시스템의 성능이 저하된다. 본 논문은 개념 기반 문서분류를 위하여 단어 애매성 해소를 시도하였다. 문서에 출현된 의미 정보를 이용하여 의미들간의 공기정보를 구하고 이를 이용하여 단어의 애매성을 해소하였다. 단어의 의미정보는 시소러스 도구를 통해 획득하고 의미들간의 공기정보는 의미들간의 동시 출현 정보를 획득하여 구축하였다. 본 시스템은 문서 분류 등 자연어처리 분야에 이용할 수 있어 효용가치가 높다.

  • PDF

Gene Selection based on Class Information (클래스 정보에 기반한 유전자 선택)

  • Lee Hyunjin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.469-472
    • /
    • 2004
  • 여러 분류 문제에 다층퍼셉트론이 적용되어 좋은 성능을 보이고 있다. 하지만, 암 분류를 위한 분류기로 사용되는데 있어서 문제점은 샘플데이터 수에 비해 입력으로 사용되는 유전자의 수가 너무 많기 때문에 좋은 성능을 기대하기 힘들다는 점이다. 또한 많은 입력노드로 인해 가중치 파라메터들의 수가 증가하기 때문에 학습시에 계산량의 부담을 가중시킨다. 따라서 본 논문에서는 많은 유전자중에서 암분류에 중요한 영향을 끼치는 유전자를 선택하는 방법을 제안한다. 이러한 유전자 선택을 위하여 클래스의 정보를 나타내는 척도를 분석하고 이를 기반으로 하여 분류율을 향상시킬 수 있는 유전자를 선택하는 방법을 제안한다. 이렇게 선택된 유전자를 입력으로 하여 분류기를 구성하여, 제안하는 방법의 우수성을 검증한다.

  • PDF

A Text Classification System for Hierarchical Categories (계층구조 카테고리를 가지는 텍스트 분류 시스템)

  • 박지호;김진상
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.128-130
    • /
    • 2000
  • 인터넷의 발전으로 온라인 문서들의 양이 급증하여 문서의 자동 분류 기술의 중요성이 증대되고 있다. 문서를 미리 정의된 카테고리로 분류할 때 카테고리는 평면구조보다 계층구조를 갖도록 하는 것이 사용자의 측면에서 볼 때 훨씬 더 자연스럽다. 본 논문에서는 계층구조 카테고리를 가지는 문서를 분류하는 방법을 연구하고 실제 20개의 유스넷 뉴스그룹 문서들을 분류하도록 시험하였다. 여기서 사용한 알고리즘은 하이퍼링크 정보를 이용하여 웹 문서분류를 목적으로 개발된 IBM의 TAPER(taxonomy and path enhanced retrieval system) 알고리즘을 변형한 것이다.

  • PDF

국방과학기술 정보의 분류체계 고찰

  • Hur, Ara;Ryu, Yeonseung
    • Review of KIISC
    • /
    • v.28 no.6
    • /
    • pp.25-32
    • /
    • 2018
  • 국방과학기술 중 국가안보를 위해 보호해야 하는 기술을 방위산업기술로 정의하고 있다. 방위산업기술보호법의 대상기관은 보유 또는 연구개발 중인 방위산업기술을 식별한 후, 방위산업기술 정보를 적절한 보호등급으로 분류하여 보호하여야 한다. 이를 위해서는 국방과학기술 정보의 분류체계 국가 표준이 수립되어야 하지만 아직까지 분류체계가 정립되어 있지 않고 대상기관 별로 자체 내규로 정하도록 지침이 마련 중으로 향후 혼란을 야기할 수 있어 이에 대한 개선이 필요하다. 본 논문에서는 현행 국방과학기술 정보의 분류체계와 미국 국방부의 과학기술 정보의 분류체계를 비교하고 발전방향을 고찰해본다.

BClassifier : A Bookmark-Classification Agent Based on Naive Bayesian Learning Method (BClassifier : 나이브 베이지안 학습법에 기초한 북마크 분류 에이전트)

  • 최정민;김인철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.81-83
    • /
    • 2000
  • 최근 고성능 PC의 보급과 네트워크의 발달로 인하여 인터넷의 가용 정보가 폭발적으로 증가하고 있다. 이러한 추세에 따라 우리는 인터넷을 사용하여 많은 정보를 얻고 있다. 그러나 인터넷에 존재하는 정보는 수많은 웹 서버에 주소(URL)를 가지고 존재하게 되는데 사용자는 자신이 관심 있는 정보의 사이트를 재방문하기 위하여 웹 브라우저 북 마크 기능을 사용한다. 그러나, 북 마크를 효율적으로 사용하기 위해서는 북 마크 분류, 수정, 편집, 정렬등의 북 마크 관리가 필수적이지만 이와 같은 북 마크 관리 작업이 전반적으로 수작업으로 이루어져야 하는 단점이 있다. 이러한 문제점을 해결하기 위한 한가지 방법으로 웹 문서 분류를 위한 기계학습법을 적용하여 사용자의 북 마크를 카테고리별로 자동으로 분류, 재정렬해주는 북 마크 자동 분류 에이전트를 개발하고자 한다. 대표적인 분류 에이전트 시스템으로는 전자우편 분류 에이전트인 Maxims, 뉴스 기사 분류 에이전트인 NewT, 엔터테인먼트 선별 에이전트인 Ringo 등이 있으며, 이러한 시스템들은 분류 대상과 분류 방법, 기능 등에서 차이를 보이고 있다. 본 논문에서는 대표적인 교사학습 방법인 나이브 베이지안 학습법을 사용하여 북 마크를 자동으로 분류하는 북 마크 자동 분류 에이전트를 설계, 구현하였다.

  • PDF

A Study on the Theory and Historical Development of Official Document Classification Scheme in Korea - Since Chosun Dynasty to Current Korea Government - (문서분류의 이론과 변천에 관한 연구 - 조선조이후 현행 '정부공문서분류'까지 -)

  • Choe, Jung-Tai;Lee, Ju-Yeon
    • Journal of Korean Society of Archives and Records Management
    • /
    • v.3 no.2
    • /
    • pp.1-33
    • /
    • 2003
  • This study is to aim on the theory of document classification system and historical development of official document classification scheme since Chosun dynasty to Republic of Korea. We have been new version of classification scheme 'Document Classification Standard' is scheduled in 2004, though there are many fundamental problems in governmental agencies and record centers. Thus new 'Document Classification Standard' should be make discussion and inquire.

Web Page Classification System based upon Ontology (온톨로지 기반의 웹 페이지 분류 시스템)

  • Choi Jaehyuk;Seo Haesung;Noh Sanguk;Choi Kyunghee;Jung Gihyun
    • The KIPS Transactions:PartB
    • /
    • v.11B no.6
    • /
    • pp.723-734
    • /
    • 2004
  • In this paper, we present an automated Web page classification system based upon ontology. As a first step, to identify the representative terms given a set of classes, we compute the product of term frequency and document frequency. Secondly, the information gain of each term prioritizes it based on the possibility of classification. We compile a pair of the terms selected and a web page classification into rules using machine learning algorithms. The compiled rules classify any Web page into categories defined on a domain ontology. In the experiments, 78 terms out of 240 terms were identified as representative features given a set of Web pages. The resulting accuracy of the classification was, on the average, 83.52%.

Sasang Constitution Classification by Speech Signal Processing (음성 신호 분석에 의한 사상 체질 분류)

  • Cho Dong-Uk
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.31 no.5C
    • /
    • pp.548-555
    • /
    • 2006
  • This paper proposes on the Sasang constitution classification method which is the most important things in the Sasang constitution medicine. Pre-existing methods of Sasang constitution classification are a shape of the body and its countenance & morpological aspect and temper. Many diagnostic methods have been developed and used including the questionnaires on personal life style and propensities(QSCC, QSCC II), and the tonal analysis of person's voice. Recently the constitutional acupunture and the herbal medicine response analyses are developed and used additionally. But these methods which is done by the doctor's intuition. In this article, I propose a methodology to classify the Sasang constitution. pitch, intensity and formants are used to classify the Sasang constitution by comparing the similarities and differencies of tonal analysis. Finally, the validity of the method is proven through the experiments.

Research on improving correctness of cardiac disorder data classifier by applying Best-First decision tree method (Best-First decision tree 기법을 적용한 심전도 데이터 분류기의 정확도 향상에 관한 연구)

  • Lee, Hyun-Ju;Shin, Dong-Kyoo;Park, Hee-Won;Kim, Soo-Han;Shin, Dong-Il
    • Journal of Internet Computing and Services
    • /
    • v.12 no.6
    • /
    • pp.63-71
    • /
    • 2011
  • Cardiac disorder data are generally tested using the classifier and QRS-Complex and R-R interval which is used in this experiment are often extracted by ECG(Electrocardiogram) signals. The experimentation of ECG data with classifier is generally performed with SVM(Support Vector Machine) and MLP(Multilayer Perceptron) classifier, but this study experimented with Best-First Decision Tree(B-F Tree) derived from the Dicision Tree among Random Forest classifier algorithms to improve accuracy. To compare and analyze accuracy, experimentation of SVM, MLP, RBF(Radial Basic Function) Network and Decision Tree classifiers are performed and also compared the result of announced papers carried out under same interval and data. Comparing the accuracy of Random Forest classifier with above four ones, Random Forest is the best in accuracy. As though R-R interval was extracted using Band-pass filter in pre-processing of this experiment, in future, more filter study is needed to extract accurate interval.

러프집합과 계층적 분류구조를 이용한 데이터마이닝에서 분류지식발견

  • Lee, Chul-Heui;Seo, Seon-Hak
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.12 no.3
    • /
    • pp.202-209
    • /
    • 2002
  • This paper deals with simplification of classification rules for data mining and rule bases for control systems. Datamining that extracts useful information from such a large amount of data is one of important issues. There are various ways in classification methodologies for data mining such as the decision trees and neural networks, but the result should be explicit and understandable and the classification rules be short and clear. The rough sets theory is an effective technique in extracting knowledge from incomplete and inconsistent data and provides a good solution for classification and approximation by using various attributes effectively This paper investigates granularity of knowledge for reasoning of uncertain concopts by using rough set approximations and uses a hierarchical classification structure that is more effective technique for classification by applying core to upper level. The proposed classification methodology makes analysis of an information system eary and generates minimal classification rules.