• 제목/요약/키워드: k-NN 분류

검색결과 189건 처리시간 0.03초

사물인터넷 관련 버그 정정을 위한 버그리포트 속성 분석 (Bug Reports Attribute Analysis for Fixing The Bug on The Internet of Things)

  • 권기문;정성순
    • 전자공학회논문지
    • /
    • 제52권5호
    • /
    • pp.235-241
    • /
    • 2015
  • 최근 사물인터넷과 관련된 연구와 산업이 급속히 발전하고 있다. 사물인터넷과 관련된 소프트웨어 개발 및 유지보수 활동에서 버그 정정은 큰 비중을 차지하는 활동이다. 본 논문에서는 사물인터넷과 관련된 버그를 정정하는데 소요되는 시간을 분석함으로써 버그 정정 시간에 영향을 미칠 수 있는 속성이 무엇인지 분석한다. 버그 리포트가 제공하는 속성 정보에 따라 k-NN 분류 방법을 사용하여 버그 리포트를 분류하고 유사한 속성을 가진 버그 리포트를 선별한다. 유사한 버그 리포트의 버그 정정 시간을 계산하여 새로운 버그의 정정 시간을 예측한다. 예측 정확도에 따라 버그 정정 시간에 영향을 미치는 속성 중 운영체제(os), 컴포넌트, 리포터, 할당자(assignee) 속성을 사용했을 때 버그 정정 시간 예측에 가장 좋은 정확도를 나타냈다.

나이브 베이지안 분류기를 이용한 게시물 자동 분류를 위한 eCRM 에이전트 시스템 (eCRM Agent System for Articles Automatic Classification System based on Naive Bayesian Classifier)

  • 최정민;이병수
    • 전기전자학회논문지
    • /
    • 제8권2호
    • /
    • pp.216-223
    • /
    • 2004
  • 최근 전자 상거래에서 사용하고 있는 게시판은 고객의 능동적인 참여로 운영되며, 게시물은 고객의 직접적인 의사를 들을 수 있는 인 바운드(Inbound)정보로서 다른 eCRM을 위한 고객 접점 채널 과는 성격이 다른 도구이다. 또한 게시판의 효과적인 운영은 게시판 자체의 신뢰도를 향상 시키고 나아가 전자 상거래 전체의 신뢰도를 높여 줄 수 있는 중요한 eCRM 도구이다. 그러나 현재 대부분의 전자상거래에서 운영하는 게시판은 기 분류된 카테고리를 고객이 직접 수동으로 선정하도록 되어 있고, 이렇게 임의로 분류되는 게시물에 대하여 체계적인 처리 과정 없이 답변이 이루어지기 때문에 답변을 하는데 많은 시간이 소요 되고 있으며, 정확한 답변이 이루어지지 않고 있는 실정이다. 따라서, 본 논문에서는 여러 가지 종류의 게시물에 대하여 나이브 베이지안 분류기를 이용하여 게시판의 기존 문제점의 해결과 효과적인 운영 그리고 게시물의 체계적인 분류 관리를 할 수 있는 게시물 자동 분류기를 설계하고 구현하였다. 아울러 문서 분류 학습 기법 중 대표적인 TFIDF. k-NN, 나이브 베이지안 기법들의 게시물 분류 성능을 측정하여 채택한 나이브 베이지안 분류기의 우수성을 확인 하였다.

  • PDF

심전도를 이용한 통증자각 패턴분류기 설계 (Design of a Pattern Classifier for Pain Awareness using Electrocardiogram)

  • 임현준;유선국
    • 한국멀티미디어학회논문지
    • /
    • 제20권9호
    • /
    • pp.1509-1518
    • /
    • 2017
  • Although several methods have been used to assess the pain levels, few practical methods for classifying presence or absence of the pain using pattern classifiers have been suggested. The aim of this study is to design an pattern classifier that classifies the presence or absence of the pain using electrocardiogram (ECG). We measured the ECG signal from 10 subjects with the painless state and the pain state(Induced by mechanical stimulation). The 10 features of heart rate variability (HRV) were extracted from ECG - MeanRRI, SDNN, rMSSD, NN50, pNN50 in the time domain; VLF, LF, HF, Total Power, LF/HF in the frequency domain; and we used the features as input vector of the pattern classifier's artificial neural network (ANN) / support vector machine (SVM) for classifying the presence or absence of the pain. The study results showed that the classifiers using ANN / SVM could classify the presence or absence of the pain with accuracies of 81.58% / 81.84%. The proposed classifiers can be applied to the objective assessment of pain level.

다중 모달 생체신호를 이용한 딥러닝 기반 감정 분류 (Deep Learning based Emotion Classification using Multi Modal Bio-signals)

  • 이지은;유선국
    • 한국멀티미디어학회논문지
    • /
    • 제23권2호
    • /
    • pp.146-154
    • /
    • 2020
  • Negative emotion causes stress and lack of attention concentration. The classification of negative emotion is important to recognize risk factors. To classify emotion status, various methods such as questionnaires and interview are used and it could be changed by personal thinking. To solve the problem, we acquire multi modal bio-signals such as electrocardiogram (ECG), skin temperature (ST), galvanic skin response (GSR) and extract features. The neural network (NN), the deep neural network (DNN), and the deep belief network (DBN) is designed using the multi modal bio-signals to analyze emotion status. As a result, the DBN based on features extracted from ECG, ST and GSR shows the highest accuracy (93.8%). It is 5.7% higher than compared to the NN and 1.4% higher than compared to the DNN. It shows 12.2% higher accuracy than using only single bio-signal (GSR). The multi modal bio-signal acquisition and the deep learning classifier play an important role to classify emotion.

유효 주파수 선택과 선형판별분석기법을 이용한 유도전동기 고장진단 시스템 (Induction Motor Diagnosis System by Effective Frequency Selection and Linear Discriminant Analysis)

  • 이대종;조재훈;윤종환;전명근
    • 한국지능시스템학회논문지
    • /
    • 제20권3호
    • /
    • pp.380-387
    • /
    • 2010
  • 본 논문에서는 3상 유도전동기의 고장진단을 수행하기 위해 상호정보량과 선형판별분석기법에 기반을 둔 진단 알고리즘을 제안한다. 실험 장치는 유도전동기 구동의 기계적 모듈과 고장신호를 구하기 위한 데이터 획득 모듈로 구성하였다. 제안된 방법은 취득된 전류신호를 DFT에 의해 주파수 영역으로 변환한 후 분산정보를 이용하여 고장상태별로 차별성이 큰 순서대로 유효 주파수 성분을 추출한다. 다음 단계로 선택된 주파수 성분에 대해서 선형판별분석기법을 적용하여 고장상태별 특징들을 추출한 후 k-NN 분류기에 의해 유도전동기의 상태를 진단하게 된다. 제안된 방법의 타당성을 보이기 위해 다양한 조건하에서 실험한 결과 기존방법에 비하여 우수한 결과를 나타냈다.

3차원 학습 데이터를 이용한 PIC 보의 강성 향상에 대한 연구 (Stiffness Enhancement of Piecewise Integrated Composite Beam using 3D Training Data Set)

  • 지승민;함석우;최진경;전성식
    • Composites Research
    • /
    • 제34권6호
    • /
    • pp.394-399
    • /
    • 2021
  • Piecewise Integrated Composite(PIC) 보는 구간 조합 복합재 보로 구간 마다 적층 각도 및 순서를 다르게 적용하여 보의 강성과 강도를 향상시킬 수 있는 복합재료 보의 새로운 개념이다. 본 연구에서는 보의 거동을 고려하기 어려운 2차원 학습 데이터를 대신하여 3차원 학습 데이터가 적용된 머신 러닝 모델을 이용한 PIC 보가 제안되었다. 학습 데이터 및 훈련 데이터 셋(Training Data Set)은 지정된 참조 요소에서 3축 특성 값(Stress Triaxiality Factor)을 추출하여 세 가지 하중 유형(인장, 압축 그리고 전단)으로 분류되어 구성되었고, 이에 따른 하이퍼파라미터(Hyperparameter)가 제안되었다. 이를 통하여 예측된 PIC 보로 유한 요소 해석이 진행되었고 3차원 학습 데이터로 예측된 모델이 처짐 변형량이 감소된 것이 확인되었다. 이를 통해 3차원 학습 데이터를 이용하는 것이 경쟁력있는 것으로 판단되었고 처짐 변형량의 감소로 타당성이 검증되었다.

멀웨어 검출을 위한 기계학습 알고리즘과 특징 추출에 대한 성능연구 (A Study on Performance of ML Algorithms and Feature Extraction to detect Malware)

  • 안태현;박재균;권영만
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.211-216
    • /
    • 2018
  • 이 논문에서는 알려지지 않은 PE 파일이 멀웨어의 여부를 분류하는 방법을 연구하였다. 멀웨어 탐지 영역의 분류 문제에서는 특징 추출과 분류가 중요하다. 위와 같은 목적으로 멀웨어 탐지를 위해 우리는 어떠한 특징들이 분류기에 적합한지, 어떠한 분류기가 선택된 특징들에 대해 연구하였다. 그래서 우리는 멀웨어 탐지를 위한 기능과 분류기의 좋은 조합을 찾기 위해 실험하였다. 이를 위해 두 단계로 실험을 실시하였다. 1 단계에서는 Opcode, Windows API, Opcode + Windows API의 특징들을 이용하여 정확도를 비교하였다. 여기에서 Opcode + Windows API 특징이 다른 특징보다 더 좋은 결과를 나타내었다. 2 단계에서는 나이브 베이즈, K-NN, SVM, DT의 분류기들의 AUC 값을 비교하였다. 그 결과 DT의 분류기가 더 좋은 결과 값을 나타내었다.

Opcode와 Windows API를 사용한 멀웨어 탐지 (Malware Detection Method using Opcode and windows API Calls)

  • 안태현;오상진;권영만
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.11-17
    • /
    • 2017
  • 본 논문에서는 멀웨어 탐지 방법으로 Opcode (operation code)와 실행 파일에서 추출한 Windows API Call로 구성된 특징 벡터를 사용하는 방법을 제안한다. 먼저 PE 파일에서 추출한 opcode와 windows API로 특징 벡터를 구성하고 Bernoulli Naïve Bayes과 K-Nearest Neighbor 분류기 알고리즘을 사용하여 성능을 각각 측정하였다. 실험결과, 제안한 방법과 KNN 분류기를 사용하여 분류하면 95.21%의 멀웨어 탐지 정확도를 얻을 수 있었다. 결과적으로 기존의 Opcode 또는 Windows API 호출 중 하나만 사용하는 방법보다 제안한 방법이 멀웨어 탐지 정확도에서 높은 성능을 보인다.

난소적출 백서에서 estrogen투여가 실험적 치아이동에 미치는 영향 (The Effects of Estrogen on Experimental Tooth Movement in Ovariectomized Rats)

  • 진근호;김정기;박병건;김오환
    • 대한치과교정학회지
    • /
    • 제27권4호
    • /
    • pp.585-597
    • /
    • 1997
  • 난소를 적출한 백서에서 실험적 치아이동 동안 치주와 치조골 조직의 반응에 대한 에스트로젠의 효과를 알아보기 위하여 체중 250gm 내외의 성숙한 백서 80마리를 난소적출한(ON) 군과 난소적출하고 에스트로젠을 투여한(OE) 군, sham operation만 시행한(NN) 군, sham operation을 시행하고 에스트로젠을 투여한(NE) 군으로 각각 분류하여 교정력을 가하였다. OE군과 ON군은 교정력을 가하기 3주전에 난소를 적출하여 에스트로젠 결핍성 골다공증을 유발시켰다. OE군과 NE군에서는 2일에 한번씩 에스트로젠을 $50{\mu}g/kg\;BW.$씩 복강내에 주사하였다. 치근의 압박측과 인장측의 Howship's lacuna와 파골세포수를 비교 분석하였고, 치아 이동량을 계측 분석하였으며 그 결과는 다음과 같다. 1. 교정력을 가하기 전 NN군에서 보다 ON군에서 치조골 부위에 더 많은 Howship's lacuna와 파골세포가 관찰되었다. 2. 교정력을 가한 후 1일에서 15일까지 압박측의 lacuna와 파골세포의 증가 양상은 NN군에서 보다 ON군에서 더 컸으며, ON군의 lacuna수는 OE군보다 교정력을 가하는 전기간 동안 높은 수치를 나타냈다. 3. 인장측의 파골세포수는 ON군에서 3일까지 급격히 증가하고 이후 감소하였으나, 전기간 동안 NN군에 비해 높은 수치를 나타냈다. 4. 치아이동 속도는NN군, OE군, NE군에서 비슷하였고, ON군에서 7일에서 11일 사이에 다른군에 비해 뚜렷한 증가를 보였다. 5. 교정력 제거 후 7일간 재발을 관찰한 결과 처음 12시간이 가장 큰 재발 이동량을 나타냈으며, 모든 군에서 유사한 양의 재발을 보였다.

  • PDF

선택적 자질 차원 축소를 이용한 최적의 지도적 LSA 방법 (Optimal supervised LSA method using selective feature dimension reduction)

  • 김정호;김명규;차명훈;인주호;채수환
    • 감성과학
    • /
    • 제13권1호
    • /
    • pp.47-60
    • /
    • 2010
  • 기존 웹 페이지 자동분류 연구는 일반적으로 학습 기반인 kNN(k-Nearest Neighbor), SVM(Support Vector Machine)과 통계 기반인 Bayesian classifier, NNA(Neural Network Algorithm)등 여러 종류의 분류작업에서 입증된 분류 기법을 사용하여 웹 페이지를 분류하였다. 하지만 인터넷 상의 방대한 양의 웹 페이지와 각 페이지로부터 나오는 많은 양의 자질들을 처리하기에는 공간적, 시간적 문제에 직면하게 된다. 그리고 분류 대상을 표현하기 위해 흔히 사용하는 단일(uni-gram) 자질 기반에서는 자질들 간의 관계 분석을 통해 자질에 정확한 의미를 부여하기 힘들다. 특히 본 논문의 분류 대상인 한글 웹 페이지의 자질인 한글 단어는 중의적인 의미를 가지는 경우가 많기 때문에 이러한 중의성이 분류 작업에 많은 영향을 미칠 수 있다. 잠재적 의미 분석 LSA(Latent Semantic Analysis) 분류기법은 선형 기법인 특이치 분해 SVD(Singular Value Decomposition)을 통해 행렬의 분해 및 차원 축소(dimension reduction)를 수행하여 대용량 데이터 집합의 분류를 효율적으로 수행하고, 또한 차원 축소를 통해 새로운 의미공간을 생성하여 자질들의 중의적 의미를 분석할 수 있으며 이 새로운 의미공간상에 분류 대상을 표현함으로써 분류 대상의 잠재적 의미를 분석할 수 있다. 하지만 LSA의 차원 축소는 전체 데이터의 표현 정도만을 고려할 뿐 분류하고자 하는 범주를 고려하지 않으며 또한 서로 다른 범주 간의 차별성을 고려하지 않기 때문에 축소된 차원 상에서 분류 시 서로 다른 범주 데이터간의 모호한 경계로 인해 안정된 분류 성능을 나타내지 못한다. 이에 본 논문은 새로운 의미공간(semantic space) 상에서 서로 다른 범주사이의 명확한 구분을 위한 특별한 차원 선택을 수행하여 최적의 차원 선택과 안정된 분류성능을 보이는 최적의 지도적 LSA을 소개한다. 제안한 지도적 LSA 방법은 기본 LSA 및 다른 지도적 LSA 방법들에 비해 저 차원 상에서 안정되고 더 높은 성능을 보였다. 또한 추가로 자질 생성 및 선택 시 불용어의 제거와 자질에 대한 가중치를 통계적인 학습을 통해 얻음으로써 더 높은 학습효과를 유도하였다.

  • PDF