• 제목/요약/키워드: Information on iris

검색결과 228건 처리시간 0.02초

패턴 분류 성능을 개선하기 위한 수정된 LVQ 방식 (The Modified LVQ method for Performance Improvement of Pattern Classification)

  • 엄기환;정경권;정성부
    • 전자공학회논문지CI
    • /
    • 제43권2호
    • /
    • pp.33-39
    • /
    • 2006
  • 본 논문에서는 수정된 LVQ를 이용한 패턴 분류 방식을 제안한다. 제안한 방식은 입력 패턴의 분류 성능을 개선하기 위하여 입력 벡터와 기준 벡터 사이의 확률 분포의 비대칭도를 계산하여 학습에 이용한다. 학습을 하는 동안 기준 벡터는 입력 벡터의 확률 분포에 근접하게 되고, 기준 벡터는 Bayes 분류기의 결정 경계에 근접하게 위치한다. 가우시안 분포의 데이터와 Fisher의 IRIS 데이터 분류를 실험하여 LVQ1, LVQ2, GLVQ와 비교하여 제안한 방식이 우수한 분류 성능을 나타냄을 확인하였다.

퍼지 결정 트리를 이용한 효율적인 퍼지 규칙 생성 (Efficient Fuzzy Rule Generation Using Fuzzy Decision Tree)

  • 민창우;김명원;김수광
    • 전자공학회논문지C
    • /
    • 제35C권10호
    • /
    • pp.59-68
    • /
    • 1998
  • 데이터 마이닝의 목적은 유용한 패턴을 찾음으로써 데이터를 이해하는데 있으므로, 찾아진 패턴은 정확할뿐 아니라 이해하기 쉬워야한다. 따라서 정확하고 이해하기 쉬운 패턴을 추출하는 데이터 마이닝에 대한 연구가 필요하다. 본 논문에서는 퍼지 결정 트리를 이용한 효과적인 데이터 마이닝 알고리즘을 제안한다. 제안된 알고리즘은 ID3, C4.5와 같은 결정 트리 알고리즘의 이해하기 쉬운 장점과 퍼지의 표현력을 결합하여 간결하고 이해하기 쉬운 규칙을 생성한다. 제안된 알고리즘은 히스토그램에 기반하여 퍼지 소속함수를 생성하는 단계와 생성된 소속 함수를 이용하여 퍼지 결정 트리를 구성하는 두 단계로 이루어진다. 또한 제안된 방법의 타당성을 검증하기 위하여 표준적인 패턴 분류 벤치마크 데이터인 Iris 데이터와 Wisconsin Breast Cancer 데이터에 대한 실험 결과를 보인다.

  • PDF

New Inference for a Multiclass Gaussian Process Classification Model using a Variational Bayesian EM Algorithm and Laplace Approximation

  • Cho, Wanhyun;Kim, Sangkyoon;Park, Soonyoung
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제4권4호
    • /
    • pp.202-208
    • /
    • 2015
  • In this study, we propose a new inference algorithm for a multiclass Gaussian process classification model using a variational EM framework and the Laplace approximation (LA) technique. This is performed in two steps, called expectation and maximization. First, in the expectation step (E-step), using Bayes' theorem and the LA technique, we derive the approximate posterior distribution of the latent function, indicating the possibility that each observation belongs to a certain class in the Gaussian process classification model. In the maximization step, we compute the maximum likelihood estimators for hyper-parameters of a covariance matrix necessary to define the prior distribution of the latent function by using the posterior distribution derived in the E-step. These steps iteratively repeat until a convergence condition is satisfied. Moreover, we conducted the experiments by using synthetic data and Iris data in order to verify the performance of the proposed algorithm. Experimental results reveal that the proposed algorithm shows good performance on these datasets.

확률적 러프 집합에 기반한 근사 규칙의 간결화 (Reduction of Approximate Rule based on Probabilistic Rough sets)

  • 권은아;김홍기
    • 정보처리학회논문지D
    • /
    • 제8D권3호
    • /
    • pp.203-210
    • /
    • 2001
  • 본 논문에서는 저장 데이터베이스의 정보 시스템을 정제하여 새로운 객체를 근사 추론하기 위한 규칙 생성에 관한 연구이다. 이 때 많은 수의 규칙 생성은 의사결정자로 하여금 직관적인 판단을 어렵게 하며 의사 결정 시 부가되는 시간적인 단점도 있다. 그러므로 본 논문에서는 확률적 러프 이론에 기반하여 규칙을 최대한 간결화 하는 데 주안점을 두었다. 제안하는 알고리즘은 러프 이론에 기반한 최적 리덕트를 생성하는 과정에 확률적 개념을 도입하여 리덕트 생성에서부터 어느 정도의 허용치를 부여함으로써 기존의 규칙 생성 알고리즘의 근사 결정 규칙을 보다 간결하게 표현할 수 있다. 이 과정에서 제안한 확률적 최소 리덕트 생성 알고리즘은 기존의 리덕트를 더욱 작게하여 추론에 필요한 조건 속성의 수를 최소화하였고 이는 확률적 근사 결정 규칙의 생성 과정에서 시간 복잡도에 따른 시간을 줄일 수 있다. 제안된 알고리즘을 이용하여 패턴 분류 문제에 표준적으로 사용되는 IRIS 데이터와 Wisconsin Breast Cancer 데이터에 대해 실험하였으며 허용된 분류율 하에서 규칙의 수와 간결함의 정도를 기존 알고리즘과 비교하였다.

  • PDF

머신러닝 기반 유클리드 거리를 이용한 붓꽃 품종 분류 재구성 (A Reconstruction of Classification for Iris Species Using Euclidean Distance Based on a Machine Learning)

  • 남수태;신성윤;진찬용
    • 한국정보통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.225-230
    • /
    • 2020
  • 기계학습은 데이터를 기반으로 한 컴퓨터를 학습시켜 컴퓨터 스스로 데이터의 경향성을 파악하게 하여 새로운 입력 데이터의 출력을 예측하도록 하는 알고리즘이다. 기계학습은 크게 지도학습, 비지도학습, 강화학습으로 나눌 수 있다. 지도학습은 데이터에 대한 레이블이 주어진 상태로 기계를 학습시키는 방법이다. 즉, 데이터 및 레이블의 쌍을 통해 해당 시스템의 함수를 추론하는 방법으로 새로운 입력 데이터에 대해서 추론한 함수를 이용하여 결과를 예측한다. 그리고 예측하는 결과 값이 연속 값이면 회귀분석, 예측하는 결과 값이 이산 값이면 분류로 사용된다. 새로운 붓꽃 데이터 Sepal length(5.01)과 Sepal width(3.43)을 이용하여 기초 데이터와 유클리드 거리를 분석하였다. 분석결과, 테이블 3의 8번(5, 3.4, setosa), 27번(5, 3.4, setosa), 41번(5, 3.5, setosa), 44번(5, 3.5, setosa) 그리고 40번(5.1, 3.4, setosa)의 데이터 순으로 유사도가 높은 붓꽃으로 분류되었다. 따라서 이론적 실무적 시사점을 제시하였다.

GIS 기법을 이용한 폐석면 광산의 위해성 평가 (Health Risk Assessments using GIS Method for the Abandoned Asbestos Mines)

  • 최진범;손일;노진환
    • 한국광물학회지
    • /
    • 제24권1호
    • /
    • pp.43-53
    • /
    • 2011
  • 폐석면 광산의 위해성 평가는 통상 ABS 방식에 의해 이루어지지만, 조사지역 전반에 관한 위해성 경향을 파악하는 데 그치는 한계를 지닌다. 이 연구에서는 새로운 평가방식으로 잠재적 위해지수(PIHR)라는 개념을 도입하여 석면 위해도를 계랑화하였다. PIHR 값에 대해 석면이 인체에 위해를 주는 요인들을 고려하여 적절한 가중치를 부여한 후, 토양 내 석면 농도 값을 적용하여 지리정보시스템(GIS)의 적지선정기법을 활용하여 위해성 평가를 실시하였다. 충청남도 보령시에 위치한 어느 폐석면 광산에 적용한 결과, 잠재적 위해 지수가 매우 높은 지역은 전체 면적의 7.8%에 해당되는 27.3 ha이며, 위해성 평가는 미국 환경보호청의 종합위해정보시스템(IRIS) 모델을 적용하여 각각 만 명당 1명(석면농도 0.36% 이상), 3만 명당 1명(석면농도 0.1% 이상), 10만 명당 1명(석면농도 0.04% 이상) 평생초과 발암 위험도 기준으로 관리할 경우 3.0, 12.9, 19.5 ha로 면적이 증가한다. 이러한 결과는 향후 광해 복원범위 선정에 효과적으로 적용할 수 있다.

SOM의 출력 뉴런의 승리 기대값을 이용한 LVQ 네트워크의 최적 설계 (Optimal Design of LVQ Network using the Winning Expectation of Output Neurons of SOM)

  • 정경권;엄기환;이용구;손동설
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1267-1270
    • /
    • 2003
  • In this paper, we propose a optimal design method of the LVQ network. The proposed method determines the initial reference vectors and optimal network structure using the winning expectation of output neurons of SOM. In order to verify the effectiveness of the proposed method, we performed experiments on the Fisher's IRIS data. The experimental results showed that the proposed method improves considerably on the performance of the conventional LVQ networks.

  • PDF

GA-Based Construction of Fuzzy Classifiers Using Information Granules

  • Kim Do-Wan;Lee Ho-Jae;Park Jin-Bae;Joo Young-Hoon
    • International Journal of Control, Automation, and Systems
    • /
    • 제4권2호
    • /
    • pp.187-196
    • /
    • 2006
  • A new GA-based methodology using information granules is suggested for the construction of fuzzy classifiers. The proposed scheme consists of three steps: selection of information granules, construction of the associated fuzzy sets, and tuning of the fuzzy rules. First, the genetic algorithm (GA) is applied to the development of the adequate information granules. The fuzzy sets are then constructed from the analysis of the developed information granules. An interpretable fuzzy classifier is designed by using the constructed fuzzy sets. Finally, the GA is utilized for tuning of the fuzzy rules, which can enhance the classification performance on the misclassified data (e.g., data with the strange pattern or on the boundaries of the classes). To show the effectiveness of the proposed method, an example, the classification of the Iris data, is provided.

A Construction of Fuzzy Model for Data Mining

  • Kim, Do-Wan;Joo, Young-Hoon;Park, Jin-Bae
    • 한국지능시스템학회논문지
    • /
    • 제13권2호
    • /
    • pp.209-215
    • /
    • 2003
  • A new GA-based methodology using information granules is suggested for the construction of fuzzy classifiers. The proposed scheme consists of three steps: selection of information granules, construction of the associated fuzzy sets, and tuning of the fuzzy rules. First, the genetic algorithm (GA) is applied to the development of the adequate information granules. The fuzzy sets are then constructed from the analysis of the developed information granules. An interpretable fuzzy classifier is designed by using the constructed fuzzy sets. Finally, the GA are utilized for tuning of the fuzzy rules, which can enhance the classification performance on the misclassified data (e.g., data with the strange pattern or on the boundaries of the classes). To show the effectiveness of the proposed method, an example, the classification of the Iris data, is provided.

Design of Fuzzy Model for Data Mining

  • Kim, Do-Wan;Joo, Young-Hoon;Park, Jin-Bae
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.107-113
    • /
    • 2003
  • A new GA-based methodology using information granules is suggested for the construction of fuzzy classifiers. The proposed scheme consists of three steps: selection of information granules, construction of the associated fuzzy sets, and tuning of the fuzzy rules. First, the genetic algorithm (GA) is applied to the development of the adequate information granules. The fuzzy sets are then constructed from the analysis of the developed information granules. An interpretable fuzzy classifier is designed by using the constructed fuzzy sets. Finally, the GA are utilized for tuning of the fuzzy rules, which can enhance the classification performance on the misclassified data (e.g., data with the strange pattern or on the boundaries of the classes). To show the effectiveness of the proposed method, an example, the classification of the Iris data, is provided.