• 제목/요약/키워드: kNN분류기

검색결과 90건 처리시간 0.028초

학습문헌집합에 기 부여된 범주의 정확성과 문헌 범주화 성능 (The Effect of the Quality of Pre-Assigned Subject Categories on the Text Categorization Performance)

  • 심경;정영미
    • 정보관리학회지
    • /
    • 제23권2호
    • /
    • pp.265-285
    • /
    • 2006
  • 문헌범주화에서는 학습문헌집합에 부여된 주제범주의 정확성이 일정 수준을 가진다고 가정한다. 그러나, 이는 실제 문헌집단에 대한 지식이 없이 이루어진 가정이다. 본 연구는 실제 문헌집단에서 기 부여된 주제범주의 정확성의 수준을 알아보고, 학습문헌집합에 기 부여된 주제범주의 정확도와 문헌범주화 성능과의 관계를 확인하려고 시도하였다. 특히, 학습문헌집합에 부여된 주제범주의 질을 수작업 재색인을 통하여 향상시킴으로써 어느 정도까지 범주화 성능을 향상시킬 수 있는가를 파악하고자 하였다. 이를 위하여 과학기술분야의 1,150 초록 레코드 1,150건을 전문가 집단을 활용하여 재색인한 후, 15개의 중복문헌을 제거하고 907개의 학습문헌집합과 227개의 실험문헌집합으로 나누었다. 이들을 초기문헌집단, Recat-1, Recat-2의 재 색인 이전과 이후 문헌집단의 범주화 성능을 kNN 분류기를 이용하여 비교하였다. 초기문헌집단의 범주부여 평균 정확성은 16%였으며, 이 문헌집단의 범주화 성능은 $F_1$값으로 17%였다. 반면, 주제범주의 정확성을 향상시킨 Recat-1 집단은 $F_1$값 61%로 초기문헌집단의 성능을 3.6배나 향상시켰다.

점진적 모델에 기반한 다채널 시계열 데이터 EEG의 특징 분석 (Feature Analysis of Multi-Channel Time Series EEG Based on Incremental Model)

  • 김선희;양형정;;정종문
    • 정보처리학회논문지B
    • /
    • 제16B권1호
    • /
    • pp.63-70
    • /
    • 2009
  • BCI 기술은 생체신호인 뇌파를 수집하여 신호처리를 거친 후 실질적인 기기제어 및 통신 시스템 등을 제어하는 시스템 관련 기술이다. BCI 시스템 구현을 위해서는 뇌파의 특성을 실시간으로 분석하여 학습 시키고 학습된 뇌파의 특성을 적용하는 단계가 요구된다. 본 논문에서는 EEG 데이터를 효율적으로 분석하기 위해 점진적으로 갱신되는 주성분 분석을 이용하여 왼손/오른손 동작에 영향을 미치는 EEG 신호의 특징을 찾고, 이를 반영하여 데이터의 차원을 축소한다. 입력 자료의 특징을 충분히 포함하면서 낮은 차원을 가지는 데이터를 이용한다면 분류를 위한 계산량을 감소시킬 수 있을 뿐만 아니라 불필요한 특징을 제거함으로써 분류 성능을 향상 시킬 수 있다. 본 논문에서는 점진적으로 갱신되는 주성분 분석을 이용하여 데이터의 차원을 축소하고 이에 대한 효율성을 검증하기 위해 K-NN분류기를 이용하여 분류 정확도 측정을 수행하였다. 그 결과 주성분 분석을 이용하여 특징을 추출하고 분류율을 측정한 경우보다 평균 5% 높은 분류 정확율을 보였다.

바닥 진동을 통한 노인 낙상 검출 (Fall detection of the elderly through floor vibrations)

  • 김동완;유종현;백승화
    • 전기전자학회논문지
    • /
    • 제18권1호
    • /
    • pp.134-139
    • /
    • 2014
  • 노인의 생활안전 사고 유형 중 가장 높은 비율을 차지하는 낙상은 57.2%이상이 가정에서 발생하는 것으로 조사되었다. 본 연구에서는 실내 바닥의 진동을 측정, 분석하여 낙상의 유무를 판별하고자 하였으며, 이를 위해 압전필름과 연산증폭기로 증폭 및 필터링 회로를 제작하여 진동 센서 모듈을 구성하였다. 진동 센서 모듈에서 증폭 및 필터링 과정을 거친 진동 신호는 데이터 수집 장치를 통해 디지털 신호로 변환되어 PC로 전송된다. 진동 신호는 k-NN 분류기를 이용하여 낙상 유무를 판별한다. 피험자 10명을 대상으로 낙상 실험결과, 분류기는 93.6%의 인식율을 나타내었다. 제작된 센서 모듈은 낙상 검출에 유용한 것으로 판단된다.

특성함수 및 k-최근접이웃 알고리즘을 이용한 국악기 분류 (Classification of Korean Traditional Musical Instruments Using Feature Functions and k-nearest Neighbor Algorithm)

  • 김석호;곽경섭;김재천
    • 한국멀티미디어학회논문지
    • /
    • 제9권3호
    • /
    • pp.279-286
    • /
    • 2006
  • 주파수 분포벡터를 이용한 분류방법을 국악기 분류 및 인식에 적용하였으며 분류에 사용되는 주파수 분포 벡터 중에서 리듬성분을 수치화한 평균피크값을 제안하였다. 대부분의 주파수 처리함수들은 주파수값의 평균, 통계적특성에 기반을 두고 있으며 국악기자동분류를 위해 신호의 평균, 분산, 영교차율, 균형주파수, 평균 피크값을 이용하여 실험하였다. 국악의 장르 구분을 위한 선행 연구로서 음악신호를 함수처리하고 k-최근접이웃 분류알고리즘을 적용하여 분류하였다. 기존의 주파수 분포벡터를 이용하여 발표되었던 서양음악의 분류 성공률 87%보다 향상된 94.44%의 성공률을 나타냈다.

  • PDF

개인화 검색시스템 평가에 관한 연구 (A Study of Personalized Retrieval System Evaluation)

  • 김광영;최호섭;진두석;김진숙
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.39-42
    • /
    • 2010
  • 본 논문에서는 주제별 분류기반의 개인화 검색시스템의 평가를 위해서 기존의 한글 정보 검색시스템 평가를 위해서 사용하는 한글 테스트 컬렉션(HANTEC v2.0)을 사용하였다. 주제별 분류기반의 개인화 검색 시스템의 평가를 위해서 첫째, 한글 테스트 컬렉션을 한국일보-40075 문서분류 테스트 컬렉션을 이용하여 주제별 분류를 수행 하였다. 둘째, 한국일보-40075 문서분류 테스트 컬렉션의 분류 체계에 다라 한글 테스트 컬렉션의 문서들을 kNN 분류기를 이용하여 분류를 수행하였다. 마지막으로 구축된 컬렉션을 이용하여 주제별 분류기반의 개인화 검색시스템의 성능 평가를 수행하였다.

  • PDF

단어선택과 SMOTE 알고리즘을 이용한 불균형 텍스트 데이터의 소수 범주 예측성능 향상 기법 (Improving minority prediction performance of support vector machine for imbalanced text data via feature selection and SMOTE)

  • 김종찬;장성준;손원
    • 응용통계연구
    • /
    • 제37권4호
    • /
    • pp.395-410
    • /
    • 2024
  • 텍스트 데이터는 일반적으로 많은 다양한 단어들로 구성되어 있다. 평범한 텍스트 데이터의 경우에도 수만 개의 서로 다른 단어들을 포함하고 있는 경우를 흔히 관찰할 수 있으며 방대한 양의 텍스트 데이터에서는 수십만 개에 이르는 고유한 단어들이 포함되어 있는 경우도 있다. 텍스트 데이터를 전처리하여 문서-단어 행렬을 만드는 경우 고유한 단어를 하나의 변수로 간주하게 되는데 이렇게 많은 단어들을 각각 하나의 변수로 간주한다면 텍스트 데이터는 매우 많은 변수를 가진 데이터로 볼 수 있다. 한편, 텍스트 데이터의 분류 문제에서는 분류의 목표변수가 되는 범주의 비중에 큰 차이가 나는 불균형 데이터 문제를 자주 접하게 된다. 이렇게 범주의 비중에 큰 차이가 있는 불균형 데이터의 경우에는 일반적인 분류모형의 성능이 크게 저하될 수 있다는 사실이 잘 알려져 있다. 따라서 불균형 데이터에서의 분류 성능을 개선하기 위해 소수집단의 관측값들을 합성하여 소수집단에 포함되는 새로운 관측값을 생성하는 합성과표집기법(synthetic over-sampling technique; SMOTE) 등의 알고리즘을 적용할 수 있다. SMOTE는 k-최근접이웃(k-nearset neighbor; kNN) 알고리즘을 이용하여 새로운 합성 데이터를 생성하는데 텍스트 데이터와 같이 많은 변수를 가진 데이터의 경우에는 오차가 누적되어 kNN의 성능에 문제가 생길 수 있다. 이 논문에서는 변수선택을 통해 변수가 많은 불균형 텍스트 데이터를 오차가 축소된 공간에 표현하고 이 공간에서 새로운 합성 관측값을 생성하여 불균형 텍스트 데이터에서 소수 범주에 대한 SVM 분류모형의 예측 성능을 향상시키는 방법을 제안한다.

노인의 낙상 검출 시스템에 관한 연구 (A simulation on fall detection system for the elders)

  • 김동완;유종현;백승화
    • 전기전자학회논문지
    • /
    • 제17권1호
    • /
    • pp.22-28
    • /
    • 2013
  • 노인의 생활안전 사고 유형 중 가장 높은 비율을 차지하는 낙상은 50% 이상이 가정에서 발생하는 것으로 조사되었다. 또한 만 65세 이상 노인의 67.1%는 자녀와 동거를 희망하지 않으며 점점 더 독거노인의 비율은 늘어나, 낙상으로 인한 사고의 발생률은 더 높아질 것이다. 본 연구에서는 실내 바닥의 진동을 측정, 분석하여 낙상의 유무를 판별하고자 하였으며 이를 위해 피에조 필름 센서와 Op-Amp, DAQ를 이용하여 하드웨어를 구성하였다. 여기서 제안한 시스템은 바닥 진동을 측정할 수 있는 신호 처리부, 낙상 발생 시 사용자의 의식 확인을 위한 경보부로 구성하였다. 진동 신호는 k-NN분류기를 이용하여 낙상 유무를 판별한다. 실험결과, 분류기는 3.8%의 오차를 나타내어, 진동을 이용한 낙상 검출 가능성을 보여주고 있다.

모델기반 특징추출을 이용한 지역변화 특성에 따른 개체기반 표정인식 (Facial Expression Recognition with Instance-based Learning Based on Regional-Variation Characteristics Using Models-based Feature Extraction)

  • 박미애;고재필
    • 한국멀티미디어학회논문지
    • /
    • 제9권11호
    • /
    • pp.1465-1473
    • /
    • 2006
  • 본 논문에서는 Active Shape Models(ASM)과 상태기반 모델을 사용하여 동영상으로부터 얼굴 표정을 인식하는 방법을 제시한다. ASM을 이용하여 하나의 입력 영상에 대한 얼굴요소특징점들을 정합하고, 그 과정에서 생성되는 모양변수벡터를 추출한다. 동영상에 대해 추출되는 모양변수벡터 집합을 세 가지 상태 중 한 가지를 가지는 상태벡터로 변환하고 분류기를 통해 얼굴의 표정을 인식한다. 분류단계에서는 표정별 표정변화에 따른 변화영역의 차이를 고려한 새로운 유사도 측정치를 제안한다. 공개데이터베이스 KCFD에 대한 실험에서는 제안한 측정치와 기존의 이친 측정치를 사용한 k-NN의 인식률이 k가 1일 때 각각 89.1% 및 86.2%을 보임으로써, 제안한 측정치가 기존의 이진 측정치보다 더 높은 인식률을 나타내는 것을 보인다.

  • PDF

다중 등급 유해문서 분류를 위한 워크벤치 프로그램 구현 (Implementation of Workbench Program for Multi-Level Harmful Document Classification)

  • 이원휘;조윤정;정성종;안동언
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.691-692
    • /
    • 2008
  • 유해 문서를 분류하기 위한 고정된 등급에 의한 분류가 아닌 사용자의 필요에 의해 다양한 등급으로 분류할 수 있는 분류기를 구현하였다. 자질 생성을 위해 ${\chi}^2$, IG, DF, ICF를 이용하였으며, 분류를 위해 나이브 베이지언, C4.5, kNN, SVM을 이용하였다.

  • PDF

KPCA 특징추출기법을 이용한 유도전동기 결함 진단 연구 (Study on Faults Diagnosis of Induction Motor Using KPCA Feature Extraction Technique)

  • 한상보;황돈하;강동식
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 제38회 하계학술대회
    • /
    • pp.1063-1064
    • /
    • 2007
  • 본 연구는 유도전동기 진단시스템을 개발하기 위하여 테스트 전동기 내부에 취부된 자속센서 신호를 사용한 알고리즘 적용 결과를 논한 것으로서 분류기별 고장 판별 정확도에 대하여 서술하였다. 특징추출은 Kernel Principal Component Analysis (KPCA) 방법을 이용 하였으며, 테스트 샘플들에 대해서는 LDA(Linear Discriminant Analysis)와 k-NN(k-Nearest neighbors) 분류기법을 이용하여 판별하였다. 회전자 바 손상이나 편심(동적/정적)인 경우는 두 가지 분류기 모두 95[%]이상의 높은 분류 정확도를 보였지만, LDA인 경우 정상상태를 비롯한 베이링 불량이나, 샤프트 변형인 경우는 낮은 분류율을 보였다.

  • PDF