• 제목/요약/키워드: 원인분류

검색결과 1,264건 처리시간 0.028초

하이브리드 다중모델 학습기법을 이용한 자동 문서 분류 (Automatic Text Categorization Using Hybrid Multiple Model Schemes)

  • 명순희;김인철
    • 정보관리학회지
    • /
    • 제19권4호
    • /
    • pp.35-51
    • /
    • 2002
  • 본 논문에서는 다중 모델 기계학습 기법을 이용하여 자동 문서 분류의 성능과 신뢰도를 향상시킬 수 있는 연구와 실험 결과를 기술하였다. 기존의 다중 모델 기계 학습법들이 훈련 데이터 또는 학습 알고리즘의 편향에 의한 오류를 극복하고자 한 것인데 비해 본 논문에서 제안한 메타 학습을 이용한 하이브리드 다중 모델 방식은 이 두 가지의 오류 원인을 동시에 해소하고자 하였다. 다양한 문서 집합에 대한 실험 결과. 본 논문에서 제안한 하이브리드 다중 모델 학습법이 전반적으로 기존의 일반 다중모델 학습법들에 비해 높은 성능을 보였으며, 다중 모델의 결합 방식으로서 메타 학습이 투표 방식에 비해 효율적인 것으로 나타났다.

빌딩 보안 네트워크상의 정보폭주 방지를 위한 분류 알고리즘에 관한 연구 (A study on the classification algorithm in order to information explosion prevention in building security network)

  • 김계국;서창옥
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.133-140
    • /
    • 2005
  • 출입 보안 시스템에서 과다한 이벤트 발생으로 인해 네트워크가 마비되는 경우가 종종 발생된다. 이때 이벤트 발생 원인을 분석하고 이를 대처하기 위해서는 많은 시간이 소요되며 그 시간동안 ACU와 출입보안 서버와의 연결이 끊어지게 되어 출입 현황 및 출입자 정보의 갱신 등을 실시간으로 처리할 수 없게 된다. 본 논문에서는 이벤트에 의한 정보폭주를 방지하기 위하여 분류알고리즘을 제안하였다.

  • PDF

오피니언 마이닝을 통한 학습자 상태 분류 및 활동 모니터링 시스템 (Classifying learner's states and Monitoring it by using opinion Mining)

  • 김동현;장두수;최용석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.640-643
    • /
    • 2016
  • 오피니언 마이닝은 객관적인 정보를 필요로 하는 많은 분야에서 쓰이는 기법이다. 그러나 표현의 자유도가 높은 한글 Text를 분석하는 것은 상당히 어려운 일이다. 또한 한글 파괴 현상도 하나의 원인으로 대두되고 있다. 본 논문에서는 Text를 음소단위로 분할하는 Trigrarn-Signature 기법과 구문태그 패턴 기법을 통합한 새로운 상태 분류 기법을 제안했고, 만족, 불만, 낙담, 의문, 흥분 5가지 감정 분류를 시도했다. 이를 토대로 사용자의 정보를 그래프로 보여주는 시각화 시스템을 제안한다.

신에너지전원이 연계된 배전계통에서 분류효과에 의한 보호기기 부동작에 관한 연구 (A Study on the Mal-Function of Protection Devices By Dividing Effect in Distribution System with New Energy Sources)

  • 박현석;이범태;박오성;노대석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 춘계학술발표논문집
    • /
    • pp.641-644
    • /
    • 2009
  • 일반적으로 신에너지전원(분산전원)이 설치되면, 연계지점 위치와 사고발생 위치에 따라 % 임피던스의 병렬화로 사고전류가 감소하는 분류효과가 발생할 수 있다. 이 때, 보호기기의 최소 정정치 이하로 사고전류가 감소하여 보호기기가 부 동작(동작해야 하는데 동작하지 않은 경우)하는 문제점이 발생한다. 본 연구에서는 현행 분산전원 연계기준 및 선로운영기준을 토대로 어떤 경우에 각 보호기기의 최소 정정치에 미달하는 지 사례 및 최악조건을 제시한다. 본 논문에서는 대칭좌표법을 이용하여 보호기기의 부 동작의 주요 원인이 되는 분류효과에 대한 문제점을 분석하고, 이에 대한 대책방안을 제시한다.

  • PDF

충전식 랜턴 화재 사례에 관한 연구 (A case study of storage lantern fire)

  • 박지훈;김응식;김장환;김응진
    • 한국화재소방학회:학술대회논문집
    • /
    • 한국화재소방학회 2010년도 춘계학술논문발표회 논문집
    • /
    • pp.192-199
    • /
    • 2010
  • 본 연구에서는 전기를 이용한 발화 관련기기중 하나인 충전식 랜턴의 화재사례를 살펴보고 원인 규명을 위한 가상의 시나리오를 작성하여 충전식 랜턴의 충전회로에서 일어날 수 있는 사례와 배터리의 이상으로 인한 화재 모의실험 연구를 하였다. 실험 결과 충전식 랜턴의 화재 발화요인으로 가능성이 있는 만큼 국가화재 분류체계의 발화 관련기기에서 기타로 분류하고 있는 것을 충전식 랜턴 조사항목으로 분류해야 한다.

  • PDF

작은 데이터에 대한 베이지안망 분류기(BNC)의 베이지안 모델 평균화(BMA) 성능 평가 (Evaluation of Bayesian Model Averaging (BMA) of Bayesian Network Classifiers (BNCs) on Small Datasets)

  • 황규백;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.22-24
    • /
    • 2003
  • 작은 데이터에서 베이지안망 분류기(Bayesian network classifier, BNC)를 학습할 때, 과대적합(overfitting)으로 인한 일반화 성능의 저하가 초래된다 이런 경우, 베이지안 모델 평균화(Bayesian model averaging, BMA)는 모델 자체에 대한 불확실성을 분석 과정에서 고려함으로써, 성능 저하를 피할 수 있는 수단을 제공한다. 본 논문에서는 BNC의 BMA의 작은 데이터에 대한 성능을 평가 및 분석한다. 특히, 노드의 순서에 대한 평균화의 효과가 연구된다. 인공데이터에 대한 실험 결과, 노드의 순서가 BNC의 BMA의 분류 성능에 미치는 영향은 지대하며, 이는 데이터의 크기가 극히 작은 경우의 성능 저하에 직접적인 원인이 된다.

  • PDF

Greedy Emsemble Selection을 이용한 심장병 데이터 분석 (The heart disease data analysis based on Greedy Emsemble Selection)

  • 남세종;신동규;신동일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.205-210
    • /
    • 2010
  • 심장질환은 암 다음으로 높은 사망 원인으로 초기 진단은 치료에 매우 중요한 문제로 대두 되고 있다. 심장병을 분석하기 위해서는 임상 데이터에 대해 자세히 알고 분석 하는 것이 중요하다. 본 논문에서는 심장 질환 데이터를 효율적으로 분석하기 위해 배깅 알고리즘을 사용하여 중요 검사 항목을 추출해내고 분석하는 방법을 제안한다. 데이터를 분석하는 과정에 있어서 분류자들을 생성하고 앙상블 하는 과정에 효과적인 결과를 얻기 위해서 다양한 알고리즘들을 결합해야 구성해야한다. 앙상블을 이용하여 가장 좋은 의 분류 효과를 얻기 위해서는 수천가지의 분류자들을 훈련시켜 성능이 좋은 앙상블을 구성한다.

  • PDF

광고 랜딩 페이지를 이용한 문맥 광고 시스템 (Contextual Advertising System using ad landing pages)

  • 이정현;하종우;정다운;이상근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.62-64
    • /
    • 2010
  • 문맥 광고의 의미론적 매칭에서 웹 페이지와 광고의 매칭 정확도는 웹 페이지와 광고의 분류 성능에 종속적이다. 그러나 광고의 짧은 텍스트는 광고 분류 성능을 하락시키는 원인이 되고 있다. 본 논문에서는, 광고 분류 성능을 높이기 위하여, 광고 랜딩 페이지를 활용하여 광고 텍스트를 확장시키는 방법을 제안하고, 실험을 통하여 그 효과를 입증한다. 추가로, 구문론적 매칭과 의미론적 매칭 방법을 적용하여 개발된 문맥 광고 엔진의 프로토타입을 제시한다.

한국어 뉴스 헤드라인의 토픽 분류에 대한 실증적 연구 (An Empirical Study of Topic Classification for Korean Newspaper Headlines)

  • 박제윤;김민규;오예림;이상원;민지웅;오영대
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.287-292
    • /
    • 2021
  • 좋은 자연어 이해 시스템은 인간과 같이 텍스트에서 단순히 단어나 문장의 형태를 인식하는 것 뿐만 아니라 실제로 그 글이 의미하는 바를 정확하게 추론할 수 있어야 한다. 이 논문에서 우리는 뉴스 헤드라인으로 뉴스의 토픽을 분류하는 open benchmark인 KLUE(Korean Language Understanding Evaluation)에 대하여 기존에 비교 실험이 진행되지 않은 시중에 공개된 다양한 한국어 라지스케일 모델들의 성능을 비교하고 결과에 대한 원인을 실증적으로 분석하려고 한다. KoBERT, KoBART, KoELECTRA, 그리고 KcELECTRA 총 네가지 베이스라인 모델들을 주어진 뉴스 헤드라인을 일곱가지 클래스로 분류하는 KLUE-TC benchmark에 대해 실험한 결과 KoBERT가 86.7 accuracy로 가장 좋은 성능을 보여주었다.

  • PDF

ProtBERT를 활용한 독성 단백질 분류 (Fine-Tuned ProtBERT for Toxic Protein Classification)

  • 안성윤;이상웅
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.673-674
    • /
    • 2022
  • 살아있는 유기체에 의해 분비되는 독소는 대부분의 경우 인간에게 유해하다. 가령 여름철 날것이나 오래된 음식에서 쉽게 식중독에 걸릴 수 있는데, 이는 주로 Clorustidium Botulinum이 만들어낸 보툴리눔 독소가 원인이다. 유기체에 의해 생성된 모든 독소는 단백질이며 이는 아미노산 서열로 나타낼 수 있다. 이를 통해 생물정보학 분야의 많은 연구자들이 많은 머신러닝 기술을 통해 단백질의 독성을 예측할 수 있었다. 최근 몇 년 동안 SVM를 사용하는 BTXpred와 CNN을 사용하는 ToxDL과 같은 모델이 각각 박테리아와 동물 독소의 독성을 예측하기 위해 제안되었다. 시대가 변함에 따라 BERT와 같은 성능이 더욱 뛰어난 모델이 시퀀스 분류를 위해 도입되었다. 본 논문은 독성 단백질을 분류를 위해 ProtBERT를 사용할 경우 이의 성능을 보여주고자 한다.

  • PDF