• 제목/요약/키워드: PCA(principal component analysis)

검색결과 1,222건 처리시간 0.042초

주성분 분석을 이용한 문서 주제어 추출 (Document Thematic words Extraction using Principal Component Analysis)

  • 이창범;김민수;이기호;이귀상;박혁로
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권10호
    • /
    • pp.747-754
    • /
    • 2002
  • 본 논문에서는 문서의 내용을 대표할 수 있는 주제어를 추출하는데 있어 다변량 통계 분석 기법 중의 하나인 주성분 분석을 이용하는 모델을 제안한다. 제안한 모델은 고유값과 고유벡터를 이용하여 문서 자체내의 단어의 흐름을 파악한 후 주제어를 추출하는 방법이다. 제안한 모델을 문서 요약에 적용하여 그 성능을 평가하였다. 신문기사를 대상으로 실험한 결과 제안한 모델이 단어의 출현 빈도를 고려하는 방법, 시소러스를 이용하는 방법 모두에 비해 더 좋은 성능을 보였다. 제안한 모델은 정보검색, 정보추출, 문서요약 등에 이용될 수 있으리라 기대된다.

커널 주성분 분석의 앙상블을 이용한 다양한 환경에서의 화자 식별 (Speaker Identification on Various Environments Using an Ensemble of Kernel Principal Component Analysis)

  • 양일호;김민석;소병민;김명재;유하진
    • 한국음향학회지
    • /
    • 제31권3호
    • /
    • pp.188-196
    • /
    • 2012
  • 본 논문에서는 커널 주성분 분석 (KPCA, kernel principal component analysis)으로 강화한 화자 특징을 이용하여 복수의 분류기를 학습하고 이를 앙상블 결합하는 화자 식별 방법을 제안한다. 이 때, 계산량과 메모리 요구량을 줄이기 위해 전체 화자 특징 벡터 중 일부를 랜덤 선택하여 커널 주성분 분석의 기저를 추정한다. 실험 결과, 제안한 방법이 그리디 커널 주성분 분석 (GKPCA, greedy kernel principal component analysis)보다 높은 화자 식별률을 보였다.

깊이 추정을 위한 PCA기반의 특징 축소 (PCA-Based Feature Reduction for Depth Estimation)

  • 신성식;권오봉
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.29-35
    • /
    • 2010
  • 본 논문에서는 한 장의 정지 영상에서 학습을 통한 방법으로 깊이 정보를 추정하는데 사용되어지는 특징 정보를 PCA(Principal Component Analaysis)기반으로 축소하여 깊이 정보의 정확성을 향상시키는 방법에 대하여 기술한다. 정지 영상에서 깊이 정보를 추정하기 위하여 이미지의 에너지 값과 기울기와 같은 특징을 추출하며 특징들의 관계를 이용하여 각 영역의 깊이 정보를 추정한다. 이 때 영상 필터를 사용하여 많은 특징을 추출하지만 특징의 중요성을 판단하지 않고 모두 사용하면 오히려 성능에 좋지 않은 영향을 미친다. 본 논문에서는 한 장의 정지 영상의 깊이 추정을 위해 PCA를 기반으로 중요도를 판단하여 특징 벡터의 차원을 줄이고 깊이를 정확하게 추정할 수 있는 방법에 대하여 제안한다. 제안한 방법을 스탠포드 대학의 평가 데이터로 실험한 결과, 깊이를 추정하는데 있어서 전체 특징 벡터의 30%만을 이용하여 평균 0.4%에서 최대 2.5%의 정확도가 향상되었다.

특징벡터를 사용한 얼굴 영상 인식 연구 (A Study on Face Image Recognition Using Feature Vectors)

  • 김진숙;강진숙;차의영
    • 한국정보통신학회논문지
    • /
    • 제9권4호
    • /
    • pp.897-904
    • /
    • 2005
  • 영상 인식은 영상획득이 용이하다는 것과 실생활에서 광범위하게 사용될 수 있다는 것으로 인해 활발하게 연구되고 있는 분야이다. 그러나 얼굴영상은 높은 차원의 영상공간으로 인해 이미지 처리가 쉽지 않다. 본 논문은 얼굴 영상 데이터의 차원을 특징적인 벡터로 표현하고 이러한 특징벡터를 통해 얼굴 영상을 인식하는 방법은 제안한다. 제안되는 알고리즘은 두 부분으로 나뉜다. 첫째로는 칼라 영상을 그레이 영상으로 변환할 때 RGB 세 개의 플레인의 평균이 아닌 세 플레인의 주성분을 사용하는 PCA(Principal Component Analysis)를 적용한다. PCA는 칼라 영상을 그레이 영상으로 변환하는 과정과 인식률을 높이기 위한 영상 대비 개선 과정이 동시에 수행한다. 두 번째로는 PCA와 LDA(Linear Discriminant Analysis) 방식을 하나의 과정으로 통합하는 개선된 통합 LDA 방법이다. 두 과정을 통합함으로서 간결한 알고리즘 표현이 가능하며 분리된 단계에서 있을 수 있는 정보 손실을 방지할 수 있다. 제안된 알고리즘은 잘 제어된 대용량 얼굴 데이터베이스에서 개인을 확인하는 분야에 적용되어 성능을 향상시키고 있음을 보여주었고, 추후에는 실시간 상황에서 특정 개인을 확인하는 분야의 기초 알고리즘으로 적용될 수 있다.

PCA에 의한 도서분류에 관한 연구( I ) (A Study on the Classification of Islands by PCA ( I ))

  • 이강우
    • 수산경영론집
    • /
    • 제14권2호
    • /
    • pp.1-14
    • /
    • 1983
  • This paper considers a classification of the 88 islands located at Kyong-nam area in Korea, using by examples of 12 components of the islands. By means of principal component analysis 2 principle components were extracted, which explained a total of 73.7% of the variance. Using an eigen variable criterion (λ>1), no further principle components were discussed. Principal component 1 and 2 explained 63.4% and 10.3% of the total variance respectively, The representation of the unrelated factor scores along the first and second principal axes produced a new information with respect to the classification of the islands. Based upon the representation, 88 islands were classified into 6 groups i. e. A, B, C, D, E, and F according to similarity of the components among them in this paper. The "Group F" belongs to a miscellaneous assortment that does not fit into the logical category. category.

  • PDF

FT-IR 스펙트럼 데이터 기반 다변량통계분석기법을 이용한 아티초크의 대사체 수준 품종 분류 (Establishment of discrimination system using multivariate analysis of FT-IR spectroscopy data from different species of artichoke (Cynara cardunculus var. scolymus L.))

  • 김천환;성기철;정영빈;임찬규;문두경;송승엽
    • 원예과학기술지
    • /
    • 제34권2호
    • /
    • pp.324-330
    • /
    • 2016
  • 본 연구는 FT-IR 스펙트럼 데이터를 기반한 다변량통계분석을 이용한 대사체 수준에서 아티초크(Cynara cardunculus var. scolymus L.) 품종 구분하였다. FT-IR 스펙트럼 데이터로부터 PCA(principal component analysis), PLS-DA(partial least square discriminant analysis) 그리고 HCA(hierarchical clustering analysis) 분석을 실시하였다. 아티초크 품종들은 1700-1500, 1500-1300, $1100-950cm^{-1}$ 부위에서 대사체의 양적, 질적 패턴 변화가 FT-IR 스펙트럼상에서 나타났다. FT-IR 스펙트럼의 $1700-1500cm^{-1}$ 부위는 주로 Amide I 과 II을 포함하는 아미노산 및 단백질계열의 화합물들의 질적, 양적 정보를 나타내고, $1700-1300cm^{-1}$ 부위는 phosphodiester group을 포함한 핵산 및 인지질의 정보가 반영이 되고, $1100-950cm^{-1}$ 부위는 단당류나 복합 다당류를 포함하는 carbohydrates 계열의 화합물들이 질적, 양적 정보가 반영되는 부위이다. PCA 상에 나타난 10품종의 아티초크들은 품종간에 중첩이 많이 이뤄지는 모습을 나타냈다. 아티초크 10개의 품종 중에서 'Cardoon'과 'Green Globe'가 계통분류학적으로 유연관계가 낮고, 서로간에 대사체 수준의 차이가 뚜렷하게 나타나는 것으로 보아 대사체 수준에서 마커 탐색에 가장 중요한 품종으로 작용할 것으로 판단된다. PLS-DA 분석의 경우 PCA 분석 보다 아티초크의 종간 식별이 뚜렷하게 나타났다. 따라서 본 연구에서 확립된 대사체 수준에서 아티초크의 품종 식별 기술은 품종, 계통의 신속한 선발 수단으로 활용이 가능할 것으로 기대되며 육종을 통한 품종개발 가속화에 기여 할 수 있을 것으로 예상된다.

PCA 기반 군집화를 이용한 해슁 기법 (A Hashing Method Using PCA-based Clustering)

  • 박정희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권6호
    • /
    • pp.215-218
    • /
    • 2014
  • 해슁(hashing)을 기반으로 한 근사 최근접 이웃 탐색(approximate nearest neighbors search, ANN search) 방법에서는 데이터 샘플들을 k-비트 이진 코드로 변환하는 해쉬 함수들을 이용함으로써 근접 이웃 탐색이 이진변환 공간에서 이루어지게 된다. 본 논문에서는 PCA 기반 군집화 방법인 Principal Direction Divisive Partitioning(PDDP)를 이용한 해슁 방법을 제안한다. PDDP는 가장 큰 분산을 가지는 클러스터를 선택하여 그 클러스터의 첫 번째 주성분 방향을 이용하여 두 개의 클러스터로 분할하는 과정을 반복적으로 시행하는 군집화 방법이다. 제안하는 해슁 방법에서는 PDDP에서 분할을 위해 사용하는 주성분방향을 바이너리 코딩을 위한 사영벡터로서 사용한다. 실험결과는 제안하는 방법이 다른 해슁 방법들과 비교하여 경쟁력 있는 방법임을 입증한다.

주성분 분석을 이용한 포커스 측정 기법 (A New Focus Measure Using Principal Component Analysis)

  • 이익현;타릭마무드;최태선
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.1007-1008
    • /
    • 2008
  • This paper introduces a new focus measure using Principal Component Analysis (PCA) for Shape from Focus (SFF). A neighborhood consisting of seven pixels is taken and the focus quality is computed over the whole sequence. The experimental results demonstrate effectiveness and robustness of the proposed method.

  • PDF

주성분 분석을 이용한 최적 흉부음 데이터 검출 (Optimal Thoracic Sound Data Extraction Using Principal Component Analysis)

  • 임선희;박기영;최규훈;박강서;김종교
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2156-2159
    • /
    • 2003
  • Thoracic sound has been widely known as a good method to examine thoracic disease. But, it's difficult to diagnose with correct data according to patient's thoracic position from same patient who has thoracic disease. Therefore, it is necessary to normalize the data for lung sound objectively In this paper, we'd like to detect a useful data for medical examination by applying PCA(Principal Component Analysis) to thoracic sound data and then present a objective data about lung and heart sound for thoracic disease.

  • PDF

주성분분석에서의 제안된 GBD 알고리즘을 이용한 다중해상도 거리 측정 (A Multi-Resolution Distance Measure Using Grey Block Distance Algorithms for Principal Component Analysis)

  • 홍준식
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2002년도 하계학술대회 논문집 D
    • /
    • pp.2671-2673
    • /
    • 2002
  • 본 논문에서는 주성분분석(principal component analysis; 이하 PCA)기법을 이용, 이차원 영상을 분류하여 다중해상도에서 기존의 그레이 블록 거리(grey block distance; GBD, 이하 GBD)알고리즘과 비교하여 이차원 영상간의 상대적 식별을 더 용이하게 하기 위한 새로운 GBD 알고리즘 방법을 제안한다. 이 제시된 방법은 다중해상도에서 기존의 GBD 알고리즘과 비교해서 영상이 급격히 변화하는 부분의 정보를 잃지 않게 개선할 수 있었다. 모의 실험 결과로부터 기존의 GBD 알고리즘에 비하여 상대적 식별이 더 용이함을 확인하였다.

  • PDF