• 제목/요약/키워드: Attribute Reduct

검색결과 7건 처리시간 0.02초

Ensemble of Classifiers Constructed on Class-Oriented Attribute Reduction

  • Li, Min;Deng, Shaobo;Wang, Lei
    • Journal of Information Processing Systems
    • /
    • 제16권2호
    • /
    • pp.360-376
    • /
    • 2020
  • Many heuristic attribute reduction algorithms have been proposed to find a single reduct that functions as the entire set of original attributes without loss of classification capability; however, the proposed reducts are not always perfect for these multiclass datasets. In this study, based on a probabilistic rough set model, we propose the class-oriented attribute reduction (COAR) algorithm, which separately finds a reduct for each target class. Thus, there is a strong dependence between a reduct and its target class. Consequently, we propose a type of ensemble constructed on a group of classifiers based on class-oriented reducts with a customized weighted majority voting strategy. We evaluated the performance of our proposed algorithm based on five real multiclass datasets. Experimental results confirm the superiority of the proposed method in terms of four general evaluation metrics.

속성 변동 최소화에 의한 러프집합 누락 패턴 부합 (Missing Pattern Matching of Rough Set Based on Attribute Variations Minimization in Rough Set)

  • 이영천
    • 한국전자통신학회논문지
    • /
    • 제10권6호
    • /
    • pp.683-690
    • /
    • 2015
  • 러프집합에서 누락된 속성 값들은 Reduct와 Core 계산, 더 나아가서 결정 트리 구축에 있어서 식별 불능의 패턴 부합 문제를 가진다. 현재 누락된 속성 값들의 추정과 관련하여 보편적인 속성 값으로의 대체, 속성들의 모든 가능한 값 할당, 이벤트 포장 방법, C4.5, 특수한 LEM2 알고리즘과 같은 접근방식들이 적용되고 있다. 그렇지만, 이들 접근방식은 결국 전형적으로 자주 등장하는 속성 값 혹은 가장 보편적인 속성 값으로의 단순 대체를 나타내기 때문에, 주요 속성 값들이 누락된 경우에 정보 손실이 큰 의사 결정 규칙들이 유도되기 때문에 의사결정 규칙들의 교차 검증에서 문제가 된다. 본 연구에서는 이러한 문제점을 개선시키기 위해 속성들간에 엔트로피 변동을 활용하여 정보 이득이 높은 방향으로 누락된 속성 값들을 대체하는 방식을 제안한다. 제안된 접근방식에 관한 타당성 검토는 비교적 가까운 유사 관계에 의해 누락 값 대체 방식을 적용하는 ROSE 프로그램과의 비교를 나타낸다.

러프셋에 기반한 정보필터링 웹에이전트 모듈 설계 (Design of Web Agents Module for Information Filtering Based on Rough Sets)

  • 김형수;이상부
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.552-556
    • /
    • 2004
  • 본 논문은 대용량의 데이터베이스 내에서 유용한 정보를 검색하기 위해 웹 기반하에 적응형 정보추출 에이전트 모듈 설계이다. 인터넷을 통한 정보 검색이 일반화됨에 따라 검색시간의 최소화를 기하면서 사용자의 요구조건에 맞는 유용한 정보 제공이 필요하다. 구축되는 지식베이스 시스템의 스키마 구성요소의 도메인이 이진 검색이 가능한 필드 도메인이 있는 가하면 그렇지 않은 불확실한 도메인도 존재한다. 최초의 대용량 지식베이스에서 사용자의 자연어 질의어에 대해 러프셋의 리턱트롤 통해 최소지식베이스를 생성한 후, 축소된 스키마의 도메인의 불확실성찬 값에 대한 연산을 처리는 퍼지합성 연산처리 모듈에 의해 소프팅 컴퓨팅이 수행토록 설계하였다.

  • PDF

데이터 마이닝을 위한 제어규칙의 생성 (The Generation of Control Rules for Data Mining)

  • 박인규
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.343-349
    • /
    • 2013
  • 러프집합에서는 동치류와 근사공간의 개념을 이용하여 데이터 마이닝 분야에서 중복되는 정보로부터 특징점을 효율적으로 추출하여 최적화된 제어규칙을 유도할 수 있다. 이러한 추출과정에서 가장 중요하게 고려되어져야 할 부분은 많은 속성에 대한 감축이다. 본 논문에서는 속성간의 관계에서 러프엔트로피를 이용하여 가장 신뢰도가 우수한 속성을 구할 수 있는 정보이론적인 척도를 제시한다. 제안된 방법은 러프엔트로피를 기반으로 불필요한 속성을 제거함으로써 유용한 리덕트를 생성하고 이들에 대한 코어를 형성한다. 결과적으로 원시정보의 내용은 변하지 않으면서 지식감축을 통하여 간소화된 제어규칙을 구축할 수 있음을 보인다.

범주형 데이터의 러프집합 분석을 통한 의사결정 향상기법 (An Improvement of the Decision-Making of Categorical Data in Rough Set Analysis)

  • 박인규
    • 디지털융복합연구
    • /
    • 제13권6호
    • /
    • pp.157-164
    • /
    • 2015
  • 최적의 의사결정시스템에서 효율적인 정보검색을 위해서는 정보의 감축이 필수적이다. 다양한 종류의 데이터에 존재하는 유용한 정보를 찾는 데이터 마이닝 기법에 대한 많은 연구가 활발하게 진행되어 왔고 타 산업과의 융복합을 위한 빅데이터 활용이 높아져 가고 있다. 유용한 지식의 발견을 위한 여러 가지 기법들이 특징을 가지고 있지만 단점이 존재하기 마련이다. 따라서 그러한 특징을 수렴하는 하나의 새로운 기법이 필요하다. 본 논문에서는 베이지언 정리를 이용하여 정보의 대수학적인 확률을 측정하고 이 확률에 대하여 정보엔트로피를 계산함으로써 정보의 불확실성을 계산한다. 제안된 척도를 기반으로 불필요한 속성을 제거하여 최소의 리덕트를 생성하고 이를 기반으로 결정규칙을 유도하는 알고리즘을 제안한다. 제안된 방법의 효율성을 위하여 콘텍트 렌즈를 결정하는 실험을 통하여 기존방법과 비교 결과, 본 연구가 의사결정의 유용성면에 있어 일반성이 있음을 보인다.

퍼지지식베이스에서의 효율적인 정보검색을 위한 규칙생성 및 근사추론 알고리듬 설계 (Rule Generation and Approximate Inference Algorithms for Efficient Information Retrieval within a Fuzzy Knowledge Base)

  • 김형수
    • 디지털콘텐츠학회 논문지
    • /
    • 제2권2호
    • /
    • pp.103-115
    • /
    • 2001
  • 본 논문은 퍼지지식베이스에서 러프 집합과 요인공간이론을 적용하여 최소 결정규칙 생성과 근사추론 연산을 수행하는 두 개의 알고리듬을 제안한다. 최소 결정규칙의 생성은 속성요인에 관련한 상관분석과 베이지안 정리를 응용한 데이터의 분류기법과 리덕트에 의해 수행된다. 이 결정규칙으로 이루어진 최소지식 베이스의 탐색공간에서 소속함수와 t-norm의 합성 연산을 정의한 근사추론 방식에 의해 특정 객체를 검색한다. 본 연구의 러프와 퍼지연산 모듈을 수행하는 제안 알고리듬 기법을 객체및 속성수를 증가시키는 시뮬레이션을 통해 다른 검색이론 및 합성연산 방식과 비교하였다. 그 결과 다른 제 방법보다 본 연구에서 제안하는 기법이 특정 객체를 추출하기 위한 검색연산 시간에 있어 보다 빠르게 검색됨을 입증하였다.

  • PDF

확률적 러프 집합에 기반한 근사 규칙의 간결화 (Reduction of Approximate Rule based on Probabilistic Rough sets)

  • 권은아;김홍기
    • 정보처리학회논문지D
    • /
    • 제8D권3호
    • /
    • pp.203-210
    • /
    • 2001
  • 본 논문에서는 저장 데이터베이스의 정보 시스템을 정제하여 새로운 객체를 근사 추론하기 위한 규칙 생성에 관한 연구이다. 이 때 많은 수의 규칙 생성은 의사결정자로 하여금 직관적인 판단을 어렵게 하며 의사 결정 시 부가되는 시간적인 단점도 있다. 그러므로 본 논문에서는 확률적 러프 이론에 기반하여 규칙을 최대한 간결화 하는 데 주안점을 두었다. 제안하는 알고리즘은 러프 이론에 기반한 최적 리덕트를 생성하는 과정에 확률적 개념을 도입하여 리덕트 생성에서부터 어느 정도의 허용치를 부여함으로써 기존의 규칙 생성 알고리즘의 근사 결정 규칙을 보다 간결하게 표현할 수 있다. 이 과정에서 제안한 확률적 최소 리덕트 생성 알고리즘은 기존의 리덕트를 더욱 작게하여 추론에 필요한 조건 속성의 수를 최소화하였고 이는 확률적 근사 결정 규칙의 생성 과정에서 시간 복잡도에 따른 시간을 줄일 수 있다. 제안된 알고리즘을 이용하여 패턴 분류 문제에 표준적으로 사용되는 IRIS 데이터와 Wisconsin Breast Cancer 데이터에 대해 실험하였으며 허용된 분류율 하에서 규칙의 수와 간결함의 정도를 기존 알고리즘과 비교하였다.

  • PDF