• 제목/요약/키워드: 분류시스템

검색결과 6,451건 처리시간 0.028초

한글 텍스트 문서 분류시스템을 위한 속성선택 (Feature Selection for a Hangul Text Document Classification System)

  • Lee, Jae-Sik;Cho, You-Jung
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2003년도 춘계학술대회
    • /
    • pp.435-442
    • /
    • 2003
  • 정보 추출(Information Retrieval) 시스템은 거대한 양의 정보들 가운데 필요한 정보의 적절한 탐색을 도와주기 위한 도구이다. 이는 사용자가 요구하는 정보를 보다 정확하고 보다 효과적이면서 보다 효율적으로 전달해주어야만 한다. 그러기 위해서는 문서내의 무수히 많은 속성들 가운데 해당 문서의 특성을 잘 반영하는 속성만을 선별해서 적절히 활용하는 것이 절실히 요구된다. 이에 본 연구는 기존의 한글 문서 분류시스템(CB_TFIDF)[1]의 정확도와 신속성 두 가지 측면의 성능향상에 초점을 두고 있다. 기존의 영문 텍스트 문서 분류시스템에 적용되었던 다양한 속성선택 기법들 가운데 잘 알려진 세가지 즉, Information Gain, Odds Ratio, Document Frequency Thresholding을 통해 선별적인 사례베이스를 구성한 다음에 한글 텍스트 문서 분류시스템에 적용시켜서 성능을 비교 평가한 후, 한글 문서 분류시스템에 가장 적절한 속성선택 기법과 속성 선택에 대한 가이드라인을 제시하고자 한다.

  • PDF

다중 분류기 시스템을 이용한 자동 문서 분류 (Automatic Document Classification Using Multiple Classifier Systems)

  • 김인철
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.545-554
    • /
    • 2004
  • 단일 분류기에 비해 높은 분류성능을 얻기 위해 다수의 분류기들을 결합하여 사용하는 방법은 폭넓게 이용되어 온 기술이다. 하나의 다중 분류기 시스템을 구성하는 일은 다음 두 가지 문제들을 가지고 있다. 첫째는 어떻게 기반 분류기들을 생성하느냐 하는 것이고 둘째는 이들의 예측결과를 어떻게 결합하느냐 하는 것이다. 본 논문에서는 Bagging, Boosting, Stacking 등 기존의 대표적인 다중 분류기 시스템들의 특징을 살펴보고, 문서 분류를 위한 새로운 다중 분류기 시스템들인 Stacked Bagging, Stacked Boosting, Bagged Stacking, Boosted Stacking들을 제안한다. 이들은 Bagging, Boosting, Stacking과 같은 기존 다중 분류기 시스템들의 장점들을 결합한 일종의 혼합형 다중 분류기 시스템들이다. 본 논문에서는 제안된 다중 분류기 시스템들의 성능을 평가하기 위해 MEDLINE, 유즈넷 뉴스, 웹 문서 등의 문서집합을 이용한 문서 분류 실험들을 전개하였다. 그리고 이러한 실험결과를 통해 제안한 혼합형 다중 분류기 시스템들은 전반적으로 기존 시스템들보다 우수한 성능을 보이는 것으로 나타났다.

분류시스템의 분류 규칙 발견을 위한 유전자 알고리즘 (Genetic Algorithm to find Classification Rule for Classifier Systems)

  • 김대희;박상호
    • 한국산업정보학회논문지
    • /
    • 제9권4호
    • /
    • pp.16-25
    • /
    • 2004
  • 분류시스템은 현재의 유용한 규칙들로부터 새로운 규칙들을 만들어 가기 위해 학습하는 규칙 기반 시스템이다. 본 논문에서는 방대한 데이터베이스에서 유용한 정보를 얻는 분류시스템의 분류 규칙 발견을 위한 유전자 알고리즘 을 제안하였다. 제안된 방법을 자동차 보험문제에 적용하여 제안된 유전자 알고리즘 기반 분류시스템의 성능을 평가하였다.

  • PDF

서포트 벡터 기반 퍼지 분류 시스템을 이용한 물체 인식 (The study on the object recognition using Fuzzy Classification system based on Support Vector)

  • 김성진;원상철
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 A
    • /
    • pp.167-170
    • /
    • 2003
  • 본 논문에서는 패턴 인식의 전형적인 경우인 보이기 기반 물체 인식(Appearance based object recognition)을 수행하기 위하여, 일반적인 퍼지 분류 모델과, 서포트 벡터 머신을 하이브리드(hybrid) 하게 연결한 서포트 벡터 기반 퍼지 분류 시스템이라는 새로운 방법을 제안하고 이에 대하여 연구한다. 일반적인 분류(classification)문제의 경우 두 클래스로 구분하는데 최적의 성능을 가지고 있는 서포트 벡터 머신이 다중클래스(Multiclass)의 경우 발생 하는 계산량의 증가 문제를 해 결하기 위하여 다중 클래스 분류(Multiclass classification)에 장점을 가진 퍼지 분류 시스템을 도입, 서포트 벡터 머신에 연결함으로써 단점을 보완하는 시스템을 제안한다. 즉 서포트 벡터 머신을 통해 퍼지 시스템의 구조를 러닝(learning)하는데 사용하여 최종 적으로는 퍼지 분류 시스템(Fuzzy Classifier)이 나오도록 하는 것이다. 이 시스템의 성능을 확인하고자 여러 가지 물체들에 대한 이미지를 가지고 있는 COIL(Columbia Object Image Library) 데이터 베이스를 사용하여 보이기 기반 물체 인식(Appearance based Object Recognition)을 수행 하였으며 이를 순수한 서포트 벡터 머신만을 이용하여 물체 인식을 수행한 경우와 정확도 및 인식 시간에 대하여 비교하였다.

  • PDF

룰 클러스터링에 의한 실시간 적응행동 분류자 시스템 (Classifier System for Real time Adaptive Behavior Based on Rule Clustering)

  • 황철민;김지윤;김현영;심귀보
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.47-50
    • /
    • 2003
  • 기계학습의 한 종류인 분류자 시스템은 간단한 문제에 대하여 실시간 처리와 온라인 학습이 가능하다. 그러나 복잡한 환경에서는 빠른 적응이 힘들다. 본 논문에서는 복잡한 환경에서 분류자 시스템의 적응 성능을 개선함으로써 실시간이 가능하도록 전체 환경을 분류하고 각기 다른 룰 셋을 이용하는 룰 클러스터링에 의한 분류자 시스템을 제안한다 환경을 상황에 따라 나눔으로써 전체 환경이 변화하였을 경우 각 상황에 따른 변화에 대해서만 추가적으로 학습함으로써 탐색 공간을 줄여 학습 시간을 감소시킨다. 제안한 시스템은 분류자 시스템 중 ZCS을 이용하여 로봇축구 시스템에 적용하여 기존의 방법과 그 성능을 비교 검토한다.

  • PDF

디자인 패턴을 적용한 위성영상처리를 위한 군집화 분류시스템의 설계 (A Design of Clustering Classification Systems using Satellite Remote Sensing Images Based on Design Patterns)

  • 김동연;김진일
    • 정보처리학회논문지B
    • /
    • 제9B권3호
    • /
    • pp.319-326
    • /
    • 2002
  • 본 논문에서는 위성영상을 처리하기 위한 무감독분류 기법인 군집분류 시스템을 설계하고 구현하였다. 구현된 시스템은 새로운 위성영상 포맷과 군집분류 기법의 지원이 용이하고, 확장성 있는 시스템의 설계를 위하여 팩토리 패턴과 전략적 패턴 등 다양한 디자인 패턴을 적용하였다. 군집분류 시스템은 순차군집분류 기법, K-Means 군집분류 기법, ISODATA 기법, Fuzzy C-Means군집분류 기법을 설계, 구현하였으며 Landsat TM 위성영상을 분류기의 입력영상으로 실험하였다. 그 결과 군집분류 기법은 사전지식이 없는 위성영상의 분류를 위한 표본영역의 추출작업과 위성영상의 실시간 분류에 효과적인 사용이 가능함을 보였으며, 재사용성 및 확장성이 우수한 시스템을 개발하였다.

고해상도 위성영상을 위한 감독분류 시스템 (Supervised Classification Systems for High Resolution Satellite Images)

  • 전영준;김진일
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권3호
    • /
    • pp.301-310
    • /
    • 2003
  • 본 논문에서는 고해상도 위성영상의 효과적인 분류를 위한 감독분류 시스템을 설계하고 구현하였다. 구현된 시스템은 분류의 정확도 향상을 위한 훈련데이타의 효율적인 선택을 위해서 다양한 인터페이스와 통계자료를 제공한다. 또한, 다양한 위성영상 포맷의 지원과 새로운 감독분류 알고리즘의 확장을 용이하게 하기 위하여 시스템을 모듈화 하였으며, 분광 특성을 고려한 분류의 적용이 가능하다. 분류 알고리즘으로는 평행육면체 분류, 최소거리 분류, 마하라노비스 거리 분류, 최대우도 분류, 퍼지 분류의 감독분류기법을 이용하여 고해상도 위성영상의 처리를 지원한다. 본 시스템의 적용은 고해상도 IKONOS 위성영상을 입력으로 하고, 그 결과를 분석하여 봄으로써 시스템의 응용 가능성을 보여준다.

유전 알고리즘 기반 귀납적 학습 환경에서 다중 분류기 시스템의 구축을 위한 메타 학습법 (A Meta-learning Approach for Building Multi-classifier Systems in a GA-based Inductive Learning Environment)

  • 김영준;홍철의
    • 한국정보통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.35-40
    • /
    • 2015
  • 본 논문은 유전 알고리즘 기반 귀납적 학습 환경 하에서 메타 학습법을 이용한 다중 분류기 시스템의 구축에 관한 것이다. 메타 학습법을 이용한 다중 분류기 시스템의 구축에서 분류기는 일반 분류기와 메타 분류기로 구성된다. 메타 분류기는 사례에 대한 일반 분류기의 분류 결과에 학습 알고리즘을 적용하여 얻어진다. 분류시스템의 의사 결정과정에서 메타 분류기의 역할은 일반 분류기의 분류 결과를 평가하여 최종 의사 결정 과정에의 참여 여부를 결정하는 것이다. 분류 시스템은 분류기의 분류 결과가 옳은 것으로 평가된 결과들만 취합하여 이를 바탕으로 최종 분류 결과를 도출해 낸다. 메타 학습법이 다중 분류기 시스템의 성능에 미치는 영향을 다수의 사례 집합을 이용하여 평가하였다.

인트라넷 기반의 최적의 웹문서 자동 분류기법 선정 (The selection of Best suited Automatic Web Document Classification Based on Intranet)

  • 김국희;윤희병
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.423-426
    • /
    • 2004
  • 인트라넷에서는 증가하는 웹문서의 검색을 목적으로 웹 검색엔진의 도입이 활발히 진행 중이며 대부분 찾아야할 키워드를 알고 접근하는 검색엔진 형태이다. 그러나 사용자가 무엇을 찾아야 하는지 모르는 경우 웹문서 분류체계는 효율적인 방법을 제시할 수 있다. 일부 구축되어 있는 분류체계는 수작업에 의한 분류로 인해 증가하는 웹문서의 양에 효율적으로 대처하기 곤란하므로 자동분류기법을 활용한 분류가 더 효율적일 것이다. 본 논문에서는 국방인트라넷의 수작업으로 구축된 분류체계를 대상으로 용어 가중치를 계산하는 방법을 달리하여 다양한 분류기법을 적용하여 성능을 비교평가하고 웹문서 자동분류시스템에 적용하여 분류성능의 향상을 도모하고자 한다.

  • PDF

단백질 구조 분류의 통합 검색을 위한 웹 정보시스템 (A Web-Based Information System for the Integrated Search for Protein Structure Classifications)

  • 신원준;황의윤;김진홍;안건태;이명준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.274-276
    • /
    • 2004
  • 단백질은 대부분 공간상의 특징을 고려할 때 유사한 부분을 기준으로 분류되는 경우가 많다 단백질 구조 분류 데이터베이스는 단백질이 가지는 다양한 구조 정보를 바탕으로 단백질 구조 분류 정보를 제공하고 있다. 대표적인 단백질 구조 분류 데이터베이스에는 CATH와 SCOP 데이터베이스가 있다. 이들 데이터베이스는 서로 다른 구조 분류 기준으로 단백질 구조를 분류하고 있으며, 단백질 구조 분류 정보를 검색하는 웹 서비스를 개별적으로 제공하고 있다. 따라서 여러 종류의 단백질 구조 분류 정보를 하나의 웹 사이트에서 검색할 수 있으면 유용할 것이다. 본 논문에서는 CATH와 SCOP에서 정의한 단백질 구조 분류 정보의 통합적인 검색 기능 일 통계 정보를 체계적으로 제공하는 웹 정보시스템에 관하여 기술한다. 제안된 시스템은 CATH와 SCOP에서 제공하는 각각의 데이터를 가공하여 효과적인 구조 분류 검색을 지원하는 구조화된 데이터베이스를 구축하였다. 개발된 시스템은 PDB 식별자, CAT터 식별자. 그리고 SCOP 식별자 또는 단백질 분류 이름으로 한번의 검색으로 두 데이터베이스에서 제공하는 계층적 구조 분류 정보를 제공한다. 또한, 단백질 구조에 대한 유용한 통계 정보를 제공한다.

  • PDF