• 제목/요약/키워드: 혼합 특징 집합

검색결과 17건 처리시간 0.029초

효율적인 문서 분류를 위한 혼합 특징 집합과 하이브리드 특징 선택 기법 (Combined Feature Set and Hybrid Feature Selection Method for Effective Document Classification)

  • 인주호;김정호;채수환
    • 인터넷정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.49-57
    • /
    • 2013
  • 본 연구에서는 효율적인 온 라인 문서 자동 분류를 위해 매우 중요한 분류 작업의 전처리 단계인 특징선택을 위한 새로운 방법이 제안된다. 대부분의 기존 특징선택 방법 연구에서는 특징 집합의 모집단이 단일 모집단으로써 한 모집단이 가지는 정보만으로 분류에 적합한 특징들을 선택하여 특징 집합을 구성하였다. 본 연구에서는 단일 모집단에 한하여 수행되는 특징선택 뿐 만 아니라, 다중 모집단을 가지는 혼합 특징 집합에 대해서 특징선택을 함으로써 다양한 정보를 바탕으로 한 특징 집합을 구성하였다. 혼합 특징 집합은 두 종류의 특징 집합으로 구성된다. 즉 각각 문서로부터 추출한 단어로 구성된 원본 특징 집합과 원본 특징 집합으로부터 LSA를 이용하여 새로 생성한 변형 특징 집합이다. 혼합 특징 집합으로부터 필터 방법과 래퍼 방법을 이용한 하이브리드 방식의 특징 선택을 통해 최적의 특징 집합을 찾고, 이를 이용하여 문서 분류 실험을 수행하였다. 다양한 모집단의 특징들의 정보를 모두 고려함으로써 보다 향상된 분류 성능을 보일 것이라고 기대하였고, 인터넷 뉴스 기사를 대상으로 분류 실험한 결과 90% 이상의 향상된 분류성능을 확인하였다. 특히, 재현율과 정밀도 모두 90%이상의 성능을 보였으며, 둘 사이의 편차가 낮은 것을 확인하였다.

특징 래핑을 통한 숫자형 특징과 범주형 특징이 혼합된 데이터의 클래스 분류 성능 향상 기법 (Improving Classification Performance for Data with Numeric and Categorical Attributes Using Feature Wrapping)

  • 이재성;김대원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권12호
    • /
    • pp.1024-1027
    • /
    • 2009
  • 본 논문에서는 혼합형 데이터에 대한 특징 선별 기법의 효율성을 비교하기 위해 특징 필터링과 특징 래핑을 통한 특징 선별 후, 클래스 분류 성능을 측정하였다. 혼합형 데이터는 숫자형 특징과 범주형 특징이 함께 혼합되어 있으므로, 숫자형 특징을 범주형 특징으로 이산화를 하여 단일형 데이터로 변환한 뒤 특징 선별 기법 등을 적용할 수 있다. 본 연구에서는 혼합형 데이터를 전처리하여 단일형 데이터로 변환하고, 널리 활용되는 특징 필터링 기법과 특징 래핑 기법을 통해 클래스 분류 성능을 높일 수 있는 특징 집합을 선별하였다. 선별된 특징 집합을 통한 클래스 분류 성능을 비교한 결과, 특징 필터링에 비해 특징 래핑을 통해 선별한 특징 집합을 활용하여 클래스 분류를 하였을 때 분류 정확도가 높은 것을 확인할 수 있었다.

특징 선택을 위한 혼합형 유전 알고리즘과 분류 성능 비교 (Hybrid Genetic Algorithms for Feature Selection and Classification Performance Comparisons)

  • 오일석;이진선;문병로
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.1113-1120
    • /
    • 2004
  • 이 논문은 특징 선택을 위한 새로운 혼합형 유전 알고리즘을 제안한다. 탐색을 미세 조정하기 위한 지역 연산을 고안하였고, 이들 연산을 유전 알고리즘에 삽입하였다. 연산의 미세 조정 강도를 조절할 수 있는 매개 변수를 설정하였으며, 이 변수에 따른 효과를 측정하였다. 다양한 표준 데이타 집합에 대해 실험한 결과, 제안한 혼합형 유전 알고리즘이 단순 유전 알고리즘과 순차 탐색 알고리즘에 비해 우수함을 확인하였다.

뉴로-퍼지 알고리즘을 이용한 원격탐사 화상의 지표면 패턴 분류시스템 구현 (An Implementation of Neuro-Fuzzy Based Land Convert Pattern Classification System for Remote Sensing Image)

  • 이상구
    • 한국지능시스템학회논문지
    • /
    • 제9권5호
    • /
    • pp.472-479
    • /
    • 1999
  • 본 논문에서는 뉴로-퍼지 알고리즘을 이용한 원격탐사 화상의 지표면 패턴분류기를 제안한다. 제안된 패턴 분류기는 일반적인 퍼지 인식기를 가지고 있는 3층 전방향 신경회로망 구조로 되어 있고 가중치들은 퍼지집합으로 구성된다. 이러한 퍼지-뉴로 패턴분류 시스템을 Visual C++ 환경을 구현한다. 성능평가를 위해 기존의 역전파 학습기능을 가진 신경회로망과 Maximum-likelihood 알고리즘을 이용해처리한 결과와비교분석한다. 대표적인 지표면 특징을 나타내는 8개의 클래스에 대해 훈련집합을 선정하고 각각의 분류 알고리즘에 같은 훈련집합을 사용하여 학습시킨 후 실험화상을 적용하여 지표면 특징을 8개의 클래스로 분류하였다. 실험결과 제안된 뉴로-퍼지 분류기는 여러개의 클래스로 혼합된 패턴에 대해서 기존의 분류기들에 비해 보다 더 좋은 성능을 보인다.

  • PDF

Haar-like 특징을 이용한 유해영상 분류 (An adult image classification using Haar-like feature)

  • 박민수;김용민;박찬우;박기태;문영식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.372-373
    • /
    • 2011
  • 인터넷 매체가 급증함에 따라 많은 이들에게 쉽게 노출 되어 유포되고 있는 유해 영상을 검출하기 위해 다양한 분류 방법에 대한 연구들이 이루어지고 있다. 본 논문에서 유해 영상 내의 피부색 영역에서의 Haar-like 특징을 추출하여 유해 영상을 분류하는 방법을 제안한다. 이를 위해, 첫 번째 단계에는 샘플 영상에 대하여 기존에 제안된 피부색 검출 방법을 적용하고, 두 번째 단계에는 검출된 피부색 영역 내의 Haar-like 특징을 추출한다. 각 샘플 영상에서 추출한 특징들은 SVM(Support Vector Machine)을 이용하여 각각 2000 장의 유해, 무해 영상을 학습한다. 학습된 모델은 유해 및 무해 영상이 혼합되어 있는 영상 집합들을 분류하는데 사용한다.

은닉 마코프 모델을 이용한 행동 분류 연구 (A Study on Human Behavior Classification using a Hidden Markov Model)

  • 서정우;오현교;조승호;이호석;문봉희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1354-1357
    • /
    • 2013
  • 최근 다양한 센서들이 일상생활에 활용되어, 일정한 환경에서 사람의 행동을 분류하고 인식하기 위한 연구들이 활발하게 진행되고 있다. 본 연구에서는 2개의 진동센서 값과 1개의 적외선 센서 값을 은닉 마코프 모델에 적용하여 침대 위에 있는 사람의 3가지 행동유형-눕기, 뒤척임, 일어나기-을 분류하고자 한다. 3개 센서 값의 특징들을 기초로 은닉 마코프 모델에 학습시키고, 특징집합과 학습 데이터량을 변화시키면서 사람의 행동유형에 대한 인식 실험을 수행하였다. 특징 개수 혼합에 따른 인식률의 차이는 거의 없는 것으로 나타났으나, 학습 데이터량을 증가시켜 가면서 수행한 실험에서는 인식률이 평균 78.127%로 향상되는 성과를 거두었다.

모션 데이터를 이용한 3차원 아바타 얼굴 표정 제어 (Facial Expression Control of 3D Avatar using Motion Data)

  • 김성호;정문렬
    • 정보처리학회논문지A
    • /
    • 제11A권5호
    • /
    • pp.383-390
    • /
    • 2004
  • 본 논문은 사용자로 하여금 얼굴표정들의 공간으로부터 일련의 표정을 실시간 적으로 선택하게 함으로써 3차원 아바타의 얼굴 표정을 제어하는 기법을 제안하고, 해당 시스템을 구축한다. 본 시스템에서는 얼굴 모션 캡쳐 데이터로 구성된 2400여개의 표정 프레임을 이용하여 표정공간을 구성하였다. 본 기법에서는 한 표정을 표시하는 상태표현으로 얼굴특징 점들 간의 상호거리를 표시하는 거리행렬을 사용한다. 이 거리행렬의 집합을 표정공간으로 한다. 그러나 이 표정공간은 한 표정에서 다른 표정까지 이동할 때 두 표정간의 직선경로를 통해 이동할 수 있는 그런 공간이 아니다. 본 기법에서는 이 경로를 표정 데이터로부터 근사적으로 유추한다. 우선, 각 표정상태를 표현하는 거리행렬간의 거리가 일정 값 이하인 경우 두 표정을 인접해 있다고 간주한다. 임의의 두 표정 상태가 일련의 인접표정들의 집합으로 연결되어 있으면 두 표정간에 경로가 존재한다고 간주한다. 한 표정에서 다른 표정으로 변화할 때 두 표정간의 최단경로를 통해 이동한다고 가정한다. 두 표정간의 최단거리를 구하기 위해 다이내믹 프로그래밍 기법을 이용한다. 이 거리행렬의 집합인 표정공간은 다차원 공간이다. 3차원 아바타의 얼굴 표정은 사용자가 표정공간을 항해하면서 원하는 표정을 실시간 적으로 선택함으로써 제어한다. 이를 도와주기 위해 표정공간을 다차원 스케일링 기법을 이용하여 2차원 공간으로 가시화 했다. 본 시스템이 어떤 효과가 있는지를 알기 위해 사용자들로 하여금 본 시스템을 사용하여 3차원 아바타의 얼굴 표정을 제어하게 해본 결과, 3차원 아바타의 실시간 얼굴 표정 제어가 필요한 각 분야에서 매우 유용하게 사용될 것으로 판단되었다.24시간 경과시킨 후 치아의 장축에 따라 절단하여 침투된 색소의 정도를 광학현미경상에서 40배로 관찰하였다. 각각의 실험결과는 ANOVA/Tukey's test 및 Kruskal-Wallis non-parametric independent analysis와 Mann-Whitney U test에 의하여 통계 분석하여 다음과 같은 결론을 얻었다. 1. 대조군에 있어서 혼합형 복합레진의 미세인장 결합강도는 미세혼합형에 비하여 높았으며, 실험군 사이에는 유의차를 보이지 않았다. 2.모든 복합레진의 미세인장 결합강도는 와동의 C-factor증가에 따라 감소하는 경향을 나타내었고, 혼합형 복합레진의 실험군은 대조군에 비하여 낮게 나타났으며, 미세혼합형 복합레진에서는 유의차를 보이지 않았다. 3. 절단측 및 치은측 변연부의 미세누출정도는 혼합형 복합레진이 미세혼합형에 비하여 대체로 높게 나타났다. 4. 모든 실험군에서 미세누출은 C-factor증가에 따라 증가하였고 절단측에 비하여 치은측 변연이 높게 나타났으나 통계학적 유의차는 보이지 않았다. C-factor의 변화에 대하여 필러함량과 탄성계수가 높은 혼합형 복합레진이 미세혼합형에 비하여 더 민감한 결과를 보인다. 이는 복합레진 수복시 재료의 선택과 중합수축의 적절한 조절이 중요한 요소임을 시사한다.s에서는 1주, 2주에서 강한 염증반응을 보였으나 12주에서는 염증반응이 감소하였다. 4) 새로 개발된 봉함제 Adseal-1,2는 1주, 2주에서는 가장 약한 염증반응을 보이나 4주, 12주 후에는 AH Plus와 비슷한 수준의 염증 반응을 보였다. 5) Pulp Canal Sealer를 제외한 모든 군에서 인정할 만한 생체친화성을 보였다. 6)

밀양 고알루미나 점토광상 다이아스포아 단괴내의 진동누대 전기석의 화학적 특징 (Chemical Characterization of Oscillatory Zoned Tourmaline from Diaspore Nodule, an Aluminum-rich Clay Deposit, Milyang, South Korea)

  • 추창오;김영규
    • 한국광물학회지
    • /
    • 제18권3호
    • /
    • pp.227-236
    • /
    • 2005
  • 밀양점토광상의 알루미늄이 풍부한 다이아스포아 단괴에서 열수변질 기원 전기석은 집합체나 미립으로 산출한다 대부분의 전기석 결정은 미세한 대구조가 특징적인데, 이는 열수변질 작용동안 개방계의 유체혼합과 같은 변동이 심한 환경에서 형성되었음을 지시한다. 본 전기석의 화학적 진동누대 구조의 양상은 결정축의 방향과는 무관하게 흡사한 특징을 보인다. Mg는 결정성장 초기, Fe는 후기 단계동안에 부화되었으며, Fe/Mg의 비는 규칙적으로 진동함을 보여 준다. 화학분석, 후방산란영상(BSE), X-선 화학분석도에 따르면 전기석내 진동누대구조는 Fe와 Mg 함량변화에 주로 제어되었으며 봉소함량의 기여도는 미미하다. 전기석이 다이아스포아와 딕카이트로 변질되는 것으로 볼 때 전기석은 B, Fe, Mg의 활동도가 감소하면서 이들 고알루미나 광물에 비하여 불안정해 진다. 그러므로 열수계내 알루미늄 활동도가 전기석의 안정성을 제어하는 것으로 볼 수 있다.

ELECTRE IS의 수학적 구현모형을 활용한 댐군 연계운영 (Coordinated Multireservoir Operation Using a Mathematical Model Implementing ELECTRE IS)

  • 김재희;이용대;김승권
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.318-322
    • /
    • 2006
  • 댐군 운영 문제는 여러 상충되는 목적 및 구성 요소들 간의 타협, 조정을 위한 다목적 특성을 갖고 있다. 본 연구의 목적은 댐군 연계 운영 문제에 대해 다기준 의사결정 기법을 적용하여 최선의 운영 계획을 수립하는 것이다. 이를 위해 순위선호(outranking) 관계와 유사기준(pseudo-criteria)을 기반으로 해서 여러 선호 대안을 선정하는 데 유용한 ELECTRE (ELimination Et Choice Translating REality)를 적용하고자 한다. ELECTRE IS는 주어진 후보 대안들 중에서 원하는 수의 대안을 선정하는 데 유용하다. 그러나 기존의 ELECTRE IS는 대안선정 과정에서 의사결정자에게 기준들의 가중치(weight), 유사기준판정 경계치(pseudo-criteria thresholds), 그리고 일치판정 기준비율(concordance level)의 매개변수에 대한 설정을 요구하고 이들의 설정 상태에 따라 도출되는 대안의 수가 달라질 수 있는 성질을 갖고 있다. 특히 일치판정 기준비율은 ELECTRE IS의 최종적인 순위선호 관계의 형성여부에 결정적 영향을 주어 매개변수의 아주 작은 변화에도 선정되는 대안의 수가 달라질 수 있다. 따라서 실제 ELECTRE IS를 적용하여 원하는 수의 대안을 선정하기 위해서는 일치판정 기준비율에 대한 반복적용이 불가피하다. 이에 본 연구에서는 CoMOM (Coordinated Multireservoir Operating Model)을 활용한 댐군 연계운영 시 제시되는 파레토 최적해 집합(Pareto set)중에서 최선의 파레토 최적해를 선정할 때 ELECTRE IS의 수학적 구현 모형을 활용할 것을 제안하고 그 방법론을 제시한다. 제안된 모형은 혼합정수계획모형으로서 ELECTRE IS를 적용하는 과정에서 일치판정 기준비율을 자동으로 도출하고, 궁극적으로 많은 반복 없이 원하는 수나 그에 근사한 수의 선호대안(핵심대안)을 도출할 수 있는 특징을 갖고 있다. 이 모형을 낙동강 수계의 댐군 연계운영 문제에 적용해 보고, 핵심대안을 효율적으로 도출할 수 있음을 보인다.

  • PDF

다중 분류기 시스템을 이용한 자동 문서 분류 (Automatic Document Classification Using Multiple Classifier Systems)

  • 김인철
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.545-554
    • /
    • 2004
  • 단일 분류기에 비해 높은 분류성능을 얻기 위해 다수의 분류기들을 결합하여 사용하는 방법은 폭넓게 이용되어 온 기술이다. 하나의 다중 분류기 시스템을 구성하는 일은 다음 두 가지 문제들을 가지고 있다. 첫째는 어떻게 기반 분류기들을 생성하느냐 하는 것이고 둘째는 이들의 예측결과를 어떻게 결합하느냐 하는 것이다. 본 논문에서는 Bagging, Boosting, Stacking 등 기존의 대표적인 다중 분류기 시스템들의 특징을 살펴보고, 문서 분류를 위한 새로운 다중 분류기 시스템들인 Stacked Bagging, Stacked Boosting, Bagged Stacking, Boosted Stacking들을 제안한다. 이들은 Bagging, Boosting, Stacking과 같은 기존 다중 분류기 시스템들의 장점들을 결합한 일종의 혼합형 다중 분류기 시스템들이다. 본 논문에서는 제안된 다중 분류기 시스템들의 성능을 평가하기 위해 MEDLINE, 유즈넷 뉴스, 웹 문서 등의 문서집합을 이용한 문서 분류 실험들을 전개하였다. 그리고 이러한 실험결과를 통해 제안한 혼합형 다중 분류기 시스템들은 전반적으로 기존 시스템들보다 우수한 성능을 보이는 것으로 나타났다.