• 제목/요약/키워드: naive

검색결과 697건 처리시간 0.022초

Very Fast Decision Tree 기반 Naive Bayesian 알고리즘의 Weight 부여 기법 (An Attribute Weighting Approach for Naive Bayesian based on Very Fast Decision Tree)

  • 김세준;유승언;이병준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.139-140
    • /
    • 2018
  • 본 논문에서는 지도 기계 학습 알고리즘 중 하나인 Naive Bayesian (NB) 알고리즘의 데이터 분류 정확도를 향상시키기 위하여 데이터 속성에 Weight를 부여하는 새로운 기법을 제안하였다. 기존에 Decision Tree(DT) 알고리즘의 깊이를 이용하여 Weigth를 부여하는 방법이 제안되었으나, DT를 구축하는데 오버헤드가 크기 때문에 데이터의 실시간 분석이나 자원 제한적인 환경에서의 적용은 어렵다는 단점이 있다. 이를 해결하기 위하여 본 논문에서는 최소한의 데이터를 사용하여 신속하게 DT를 구축하는 Very Fast Decision Tree (VFDT) 알고리즘 기반의 Weight 부여 기법을 제안함으로써 적은 오버헤드로 NB의 정확도를 향상시킨다.

  • PDF

Text-independent Speaker Identification Using Soft Bag-of-Words Feature Representation

  • Jiang, Shuangshuang;Frigui, Hichem;Calhoun, Aaron W.
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제14권4호
    • /
    • pp.240-248
    • /
    • 2014
  • We present a robust speaker identification algorithm that uses novel features based on soft bag-of-word representation and a simple Naive Bayes classifier. The bag-of-words (BoW) based histogram feature descriptor is typically constructed by summarizing and identifying representative prototypes from low-level spectral features extracted from training data. In this paper, we define a generalization of the standard BoW. In particular, we define three types of BoW that are based on crisp voting, fuzzy memberships, and possibilistic memberships. We analyze our mapping with three common classifiers: Naive Bayes classifier (NB); K-nearest neighbor classifier (KNN); and support vector machines (SVM). The proposed algorithms are evaluated using large datasets that simulate medical crises. We show that the proposed soft bag-of-words feature representation approach achieves a significant improvement when compared to the state-of-art methods.

Naive Bayesian 알고리즘을 이용한 P2P 모바일 에이전트의 필터링 기법 (Filtering Technique of P2P Mobile Agent using Naive Bayesian Algorithm)

  • 이세일;이상용
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.363-366
    • /
    • 2005
  • 유비쿼터스 컴퓨팅에서 사용자에게 필요한 서비스를 지능적으로 제공하기 위해서는 컨텍스트 정보의 효과적인 필터링이 필요하다. 현재까지 사용되고 있는 필터링 기술은 온라인상에서 사용되는 사용자 정보를 기준으로 서비스를 제공하고 있다. 하지만 휴대용 유$\cdot$무선기기에서 컨텍스트 인식에 기반을 둔 서비스를 제공하기 위해서는 복잡한 필터링과정과 큰 저장 공간이 요구된다. 따라서 본 논문에서는 사용자 주변에 널려 있는 센서를 통해 입력된 컨텍스트 정보들을 효율적으로 필터링하여 사용자에게 필요한 서비스만을 제공하도록 하였다. 이를 위해서 기존의 P2P 모바일 에이전트에서 사용되는 협력적 필터링 기술에 Naive Bayesian 알고리즘을 혼합한 컨텍스트 협력적 필터링 알고리즘을 제안한다.

  • PDF

새로운 계절변화 실험모형이 초등예비교사의 개념 변화에 미치는 효과 (Preservice Students Concept형s Change on Change in Seasons through New Models)

  • 채동현
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제17권1호
    • /
    • pp.23-32
    • /
    • 1998
  • A good example of the persistence of naive theories about change in seasons is well knowned: A filmmaker carried a camera into the crowd of gowned graduates at the 1987 commencement of Harvard University and asked a simple question, that is, "Why is it hotter in summer than in winter?" to twenty five students chosen at random. All of the answers except two were that the Earth is closer to the Sun in summer, so it is hotter in summer, but the Earth is farther from the Sun in winter, so it is cooler in winter. Until now, naive theories about the cause in seasons have been extensively studied. However, few studies to overcome these naive theories were reported. Author takes two steps: first, a new model on the cause in seasons is developed. Second, preservice students concepts' change on the cause in seasons through the new model is observed. The author concludes that the new model have a good effect on the preservice students concepts' change on the cause in seasons.

  • PDF

자연 영상에 대한 Naive Convolutional Auto Encoder의 특징 추출 성능에 관한 연구 (A Study on Feature Extraction Performance of Naive Convolutional Auto Encoder to Natural Images)

  • 이성주;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1286-1289
    • /
    • 2022
  • 최근 영상 군집화 분야는 딥러닝 모델에게 Self-supervision을 주거나 unlabeled 영상에 유사-레이블을 주는 방식으로 연구되고 있다. 또한, 고차원 컬러 자연 영상에 대해 잘 압축된 특징 벡터를 추출하는 것은 군집화에 있어 중요한 기준이 된다. 본 연구에서는 자연 영상에 대한 Convolutional Auto Encoder의 특징 추출 성능을 평가하기 위해 설계한 실험 방법을 소개한다. 특히 모델의 특징 추출 능력을 순수하게 확인하기 위하여 Self-supervision 및 유사-레이블을 제공하지 않은 채 Naive한 모델의 결과를 분석할 것이다. 먼저 실험을 위해 설계된 4가지 비지도학습 모델의 복원 결과를 통해 모델별 학습 정도를 확인한다. 그리고 비지도 모델이 다량의 unlabeled 영상으로 학습되어도 더 적은 labeled 데이터로 학습된 지도학습 모델의 특징 추출 성능에 못 미침을 특징 벡터의 군집화 및 분류 실험 결과를 통해 확인한다. 또한, 지도학습 모델에 데이터셋 간 교차 학습을 수행하여 출력된 특징 벡터의 군집화 및 분류 성능도 확인한다.

  • PDF

자연어 처리 기반 『상한론(傷寒論)』 변병진단체계(辨病診斷體系) 분류를 위한 기계학습 모델 선정 (Selecting Machine Learning Model Based on Natural Language Processing for Shanghanlun Diagnostic System Classification)

  • 김영남
    • 대한상한금궤의학회지
    • /
    • 제14권1호
    • /
    • pp.41-50
    • /
    • 2022
  • Objective : The purpose of this study is to explore the most suitable machine learning model algorithm for Shanghanlun diagnostic system classification using natural language processing (NLP). Methods : A total of 201 data items were collected from 『Shanghanlun』 and 『Clinical Shanghanlun』, 'Taeyangbyeong-gyeolhyung' and 'Eumyangyeokchahunobokbyeong' were excluded to prevent oversampling or undersampling. Data were pretreated using a twitter Korean tokenizer and trained by logistic regression, ridge regression, lasso regression, naive bayes classifier, decision tree, and random forest algorithms. The accuracy of the models were compared. Results : As a result of machine learning, ridge regression and naive Bayes classifier showed an accuracy of 0.843, logistic regression and random forest showed an accuracy of 0.804, and decision tree showed an accuracy of 0.745, while lasso regression showed an accuracy of 0.608. Conclusions : Ridge regression and naive Bayes classifier are suitable NLP machine learning models for the Shanghanlun diagnostic system classification.

  • PDF

정신분열증에서의 연성 신경학적 증상과 항정신병 약물 치료의 관련성 (Relationship Between Neurologic Soft Signs and Neuroleptic Treatment in Patients with Schizophrenia)

  • 채정호;정찬호;함웅;이규항;이정균
    • 생물정신의학
    • /
    • 제1권1호
    • /
    • pp.117-123
    • /
    • 1994
  • 정신분열증 환자에서 연성 신경학적 증상이 많이 나타나는 것은 많은 연구에서 확인된 바 있으나 이것이 항정신병 약물 복용 등에 의하여 발생하는 부수적인 현상일 가능성이 배제되지 않고 있다. 본 연구는 항정신병 약물 복용군과 비복용군간의 연성 신경학적 증상 발현의 차이를 알아보고자 시도되었다. 항정신병 약물을 전혀 복용하지 않은 28명과 현재 항정신병 약물로 치료 중에 있는 31명의 정신분열증 환자에서 연성 신경학적 증상을 구조화된 평가척도인 한국어판 신경학적 평가척도로 조사하였고 약물용량과 투여기간 및 부작용과의 관계도 알아보았다. 항정신병 약물 비복용군의 신경학적 평가척도의 총점은 $27.14{\pm}5.66$점으로 복용군의 $19.58{\pm}6.55$점보다 유의하게 높았다 (t=-4.76, P<0.001). 하위 기능영역 중에서도 운동조정(t=-5.52, P<0.001), 복합운동활동 순서화(t=-2.20, P<0.05), 기타 항목(t=-5.14, P<0.001)등의 점수는 비복용군에서 높았다. 감각통합 영역은 약물 복용군과 비복용군 사이에 유의한 차이가 없었다. 약물 용량, 연령, 성별 등을 통제한 후의 조사에서는 총점(F=11.13, P=0.00), 운동조정(F=28.46, P=0.00), 기타 항목(F=10.79, P=0.00)등은 약물 비복용군에서 높았으나 복합운동활동 순서화는 이들 공변량의 영향을 받아 약물 복용군과 비복용군사이에 유의한 차이가 없었다. 약물 복용군에서 현재의 항정신병 약물 복용량은 신경학적 평가척도 점수 중 운동 조정 영역과만 유의한 상관성을 보였으며 약물 복용기간, 부작용 등은 연성 신경학적 증상과 상관성이 없었다. 위와 같은 결과로 항정신병 약물은 정신분열증의 신경학적 증상 발현에 상대적인 영향만을 준다고 할 수 있었으며 연성 신경학적 증상이 정신분열증의 주요한 형질 표지자의 하나가 될 가능성이 있다고 하겠다. 또한 향후 보다 통제된 집단에서의 추적연구가 필요할 것으로 생각되었다.

  • PDF

베이지언 문서분류시스템을 위한 능동적 학습 기반의 학습문서집합 구성방법 (An Active Learning-based Method for Composing Training Document Set in Bayesian Text Classification Systems)

  • 김제욱;김한준;이상구
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권12호
    • /
    • pp.966-978
    • /
    • 2002
  • 기계학습 기법을 이용한 문서분류시스템의 정확도를 결정하는 요인 중 가장 중요한 것은 학습문서 집합의 선택과 그것의 구성방법이다. 학습문서집합 선택의 문제란 임의의 문서공간에서 보다 정보량이 큰 적은 양의 문서집합을 골라서 학습문서로 채택하는 것을 말한다. 이렇게 선택한 학습문서집합을 재구성하여 보다 정확도가 높은 문서분류함수를 만드는 것이 학습문서집합 구성방법의 문제이다. 전자의 문제를 해결하는 대표적인 알고리즘이 능동적 학습(active learning) 알고리즘이고, 후자의 경우는 부스팅(boosting) 알고리즘이다. 본 논문에서는 이 두 알고리즘을 Naive Bayes 문서분류 알고리즘에 적응해보고, 이때 생기는 여러 가지 특징들을 분석하여 새로운 학습문서집합 구성방법인 AdaBUS 알고리즘을 제안한다. 이 알고리즘은 능동적 학습 알고리즘의 아이디어를 이용하여 최종 문서분류함수룰 만들기 위해 임시로 만든 여러 임시 문서분류함수(weak hypothesis)들 간의 변이(variance)를 높였다. 이를 통해 부스팅 알고리즘이 효과적으로 구동되기 위해 필요한 핵심 개념인 교란(perturbation)의 효과를 실현하여 문서분류의 정확도를 높일 수 있었다. Router-21578 문서집합을 이용한 경험적 실험을 통해, AdaBUS 알고리즘이 기존의 알고리즘에 비해 Naive Bayes 알고리즘에 기반한 문서분류시스템의 정확도를 보다 크게 향상시킨다는 사실을 입증한다.

나이브 베이즈 분류기를 이용한 돌발상황 검지 알고리즘 개발 (Development of Incident Detection Algorithm Using Naive Bayes Classification)

  • 강성관;권봉경;권철우;박상민;윤일수
    • 한국ITS학회 논문지
    • /
    • 제17권6호
    • /
    • pp.25-39
    • /
    • 2018
  • 본 연구에서는 최근 활발하게 활용되고 있는 머신러닝 기법을 교통분야에 적용하여 효율적인 돌발상황 검지 알고리즘을 개발하는 것을 목적으로 하였다. 미시교통시뮬레이션 모형을 통하여 대상지의 네트워크를 구축하였고 돌발상황에 영향을 줄 것으로 예상되는 변수의 여러 조합을 통해 시나리오를 설정하여 가상의 돌발상황 데이터를 수집하였다. 다음으로 대표적인 돌발상황 검지 알고리즘인 McMaster 알고리즘과 본 연구에서 개발한 나이브 베이즈 분류기를 구현하여 비교 평가하였다. 비교 결과, 나이브 베이즈 분류기가 McMaster 알고리즘에 비해 돌발상황 검지 간격에 따른 부정적인 영향이 적었고 더 우수한 검지율을 보였다. 하지만 검지율이 증가하는 만큼 오검지율 또한 증가하는 것을 확인할 수 있었다. McMaster 알고리즘은 4주기를 통해 검지가 가능하지만 나이브 베이즈 분류기는 1주기(30초)만으로 돌발상황을 판단할 수 있다. 본 연구를 통해 개발한 나이브 베이즈 분류기가 효율적으로 돌발을 파악할 수 있다는 것을 확인할 수 있었다.

인지적 형상 추출을 위한 문제 해결 환경 (Problem Solving Environment for Cognitive Support Imagery Exploitation)

  • 조영기;백성욱;김상수;조주상;장철호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.532-534
    • /
    • 2004
  • 본 논문은 분석가들에게 Naive Geography에 기반 한 형상 추출기술과 상식적 공간추론 기술을 제공하는 문제 해결 환경인 NG Analyst의 개발 사례에 대해 다뤘다. 지형과 각각의 객체에 대한 구성 정보는 분산된 지형공간의 지식을 사실적으로 묘사하는 추론집합에 의해 표현되며 사용자가 형상정보를 인지적으로 이해할 수 있도록 3차원으로 표현한다. 여러 그래픽 적인 요소들로 표현된 Naive Geography 정보들은 분석가들에게 실세계의 공간과 객체들을 유사하게 구성하여 제공함으로서 직관적으로 이해하고 상호작용 할 수 있는 문제 해결 환경을 제공한다.

  • PDF