• 제목/요약/키워드: 베이즈모델

검색결과 59건 처리시간 0.032초

확률모델을 이용한 산림전용지역의 스크리닝방법 개발 (Development of a Screening Method for Deforestation Area Prediction using Probability Model)

  • 이정수
    • 한국지리정보학회지
    • /
    • 제11권2호
    • /
    • pp.108-120
    • /
    • 2008
  • 본 연구에서는 행정정보, GIS, RS정보, 확률모델을 이용하여 교토의정서에서 정의하는 산림전용지역의 추출가능성에 대하여 검토하였다. 1989년의 정사사진과 2001년의 IKONOS화상을 이용한 산림전용지역의 특성을 보면, 1989년부터 2001년까지의 산림전용지역은 약 40ha로 나타났다. 산림전용지역의 종류를 살펴보면, 도로(임도) 개설 및 주택지 개발을 위한 산림전용이 대부분을 차지하였고, 택지전용지의 80%는 기존의 도로로부터 100m이내에 분포하였으며, 신설된 도로 또한 20% 이상이 기존의 도로로부터 100m이내에 분포하였다. 산림전용지역의 추출모델 구축을 위하여 지형인자와 위성영상인자를 이용하였으며, 확률 개념을 도입한 산림전용지 발생 확률 지도를 작성하였다. 구축한 산지전용지 발생 모델의 유효성을 검증하기 위하여, 대상지역을 시스템적으로 구분하여, 추출 정도를 비교 검토하였다. 베이즈 모델과 Regression모델을 비교한 결과, 베이즈모델이 Regression모델보다 높은 추출확률을 나타냈다. 모델의 적합성을 평가하기위해서 대상지역을 2지역으로 구분하여 한쪽의 정보만을 가지고 발생확률지도를 작성하고, 나머지 지역에 대하여 발생확률을 검토한 결과에서도 베이즈모델이 높은 추출확률을 나타냈다.

  • PDF

KoBERT, 나이브 베이즈, 로지스틱 회귀의 한국어 쓰기 답안지 점수 구간 예측 성능 비교 (Comparison of Automatic Score Range Prediction of Korean Essays Using KoBERT, Naive Bayes & Logistic Regression)

  • 조희련;임현열;차준우;이유미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.501-504
    • /
    • 2021
  • 한국어 심층학습 언어모델인 KoBERT와, 확률적 기계학습 분류기인 나이브 베이즈와 로지스틱 회귀를 이용하여 유학생이 작성한 한국어 쓰기 답안지의 점수 구간을 예측하는 실험을 진행하였다. 네가지 주제('직업', '행복', '경제', '성공')를 다룬 답안지와 점수 레이블(A, B, C, D)로 쌍을 이룬 학습데이터 총 304건으로 다양한 자동분류 모델을 구축하여 7-겹 교차검증을 시행한 결과 KoBERT가 나이브 베이즈나 로지스틱 회귀보다 약간 우세한 성능을 보였다.

나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정 (Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR)

  • 노경목;김창현;천민아;김재훈
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정 (Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR)

  • 노경목;김창현;천민아;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어 모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

메타데이터를 활용한 조사자료의 문서범주화에 관한 연구 (An Exploratory Study on Survey Data Categorization using DDI metadata)

  • 박자현;송민
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2012년도 제19회 학술대회 논문집
    • /
    • pp.73-76
    • /
    • 2012
  • 본 연구는 DDI 메타데이터를 활용하여 귀납적 학습모델(supervised learning model)의 문서범주화 실험을 수행함으로써 조사자료의 체계적이고 효율적인 분류작업을 설계하는데 그 목적이 있다. 구체적으로 조사자료의 DDI 메타데이터를 대상으로 단순 TF 가중치, TF-IDF 가중치, Okapi TF 가중치에 따른 나이브 베이즈(Naive Bayes), kNN(k nearest neighbor), 결정트리(Decision tree) 분류기의 성능비교 실험을 하였다. 그 결과, 나이브 베이즈가 가장 좋은 성능을 보였으며, 단순 TF 가중치와 TF-IDF 가중치는 나이브 베이즈, kNN, 결정트리 분류기에서 동일한 성능을 보였으나, Okapi TF 가중치의 경우 나이브 베이즈에서 가장 좋은 성능을 보였다.

  • PDF

퍼지-베이즈 이론에 의한 기존구조물의 신뢰성평가모델 (Reliability Assessment Models of Existing Structures by Fuzzy-Bayesian Approach)

  • 백대우;이증빈;박주원;강수경
    • 전산구조공학
    • /
    • 제11권4호
    • /
    • pp.219-227
    • /
    • 1998
  • 실제 구조물에 있어 확률, 통계 및 이론으로 구해진 랜덤성을 갖는 객관적 불확실성뿐만 아니라 설계자의 경험이나 공학적 판단에 의해 주관적으로 평가되는 인간오차나 시공중의 과오 또는 구조설계에 미치는 사회적, 정치적 및 경제적 요청 등의 퍼지성을 갖는 주관적 불확실성이 존재하기 때문에 현실적으로 랜덤성과 퍼지성을 동시에 고려한 실뢰성평가 즉, 안전성평가에 대한 퍼지이론의 도입이 필수 불가결하다. 따라서 본 연구에서는 기존 구조물의 객관적·주관적 불확실성을 동시에 고려한 신뢰성해석방법으로 베이즈의 의사결정이론에 퍼지이론을 병합한 퍼지-베이즈 신뢰성해석 알고리즘을 개발하여 건축구조물의 신뢰성평가 및 안전성평가에 적용하여 분석하였다.

  • PDF

나이브베이즈분류기의 정확도 향상을 위한 자질변수통합 (Combining Feature Variables for Improving the Accuracy of $Na\ddot{i}ve$ Bayes Classifiers)

  • 허민오;김병희;황규백;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.727-729
    • /
    • 2005
  • 나이브베이즈분류기($na\ddot{i}ve$ Bayes classifier)는 학습, 적용 및 계산자원 이용의 측면에서 매우 효율적인 모델이다. 또한, 그 분류 성능 역시 다른 기법에 비해 크게 떨어지지 않음이 다양한 실험을 통해 보여져 왔다. 특히, 데이터를 생성한 실제 확률분포를 나이브베이즈분류기가 정확하게 표현할 수 있는 경우에는 최대의 효과를 볼 수 있다. 하지만, 실제 확률분포에 존재하는 조건부독립성(conditional independence)이 나이브베이즈분류기의 구조와 일치하지 않는 경우에는 성능이 하락할 수 있다. 보다 구체적으로, 각 자질변수(feature variable)들 사이에 확률적 의존관계(probabilistic dependency)가 존재하는 경우 성능 하락은 심화된다. 본 논문에서는 이러한 나이브베이즈분류기의 약점을 효율적으로 해결할 수 있는 자질변수의 통합기법을 제시한다. 자질변수의 통합은 각 변수들 사이의 관계를 명시적으로 표현해 주는 방법이며, 특히 상호정보량(mutual information)에 기반한 통합 변수의 선정이 성능 향상에 크게 기여함을 실험을 통해 보인다.

  • PDF

점진적 특징 가중치 기법을 이용한 나이브 베이즈 문서분류기의 성능 개선 (Improving Naïve Bayes Text Classifiers with Incremental Feature Weighting)

  • 김한준;장재영
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.457-464
    • /
    • 2008
  • 실제 운용 환경에서 자동문서분류시스템의 성공을 위해서 충분하지 못한 학습문서의 문제와 특징 공간들에 대한 사전지식이 없는 상황을 해결하는 것이 관건이다. 이런 맥락에서 많은 자동문서분류 시스템의 구축을 위해 나이브 베이즈 문서분류 알고리즘을 사용한다. 이는 기존 학습된 분류모델과 특징 공간을 점진적으로 갱신함으로써 분류모델을 향상시키는 것이 매우 용이하기 때문이다. 본 논문에서는 특징 가중치를 이용하여 문서분류기의 성능을 향상시키는 기법을 제안한다. 기본 아이디어는 문서분류 모델의 인자로서 특징들의 분포뿐만 아니라 각 특징들의 중요도를 반영하는 것이다. 속성 선택을 미리 수행하여 학습모델을 만드는 것이 아니라, 속성 중요도를 나이브 베이즈 학습 모델에 포함시킴으로써 보다 정확한 모델을 생성할 수 있다. 또한 동적 환경에서 점진적인 특징 가중치 부여를 위해 기존의 특징 갱신 기법을 확장한 알고리즘도 제안한다. 본 논문에서 제안된 기법을 평가하기 위해서 Reuters-21578과 20Newsgroup 문서집합 이용한 실험을 실시하여, 제안된 기법이 전통적인 나이브 베이즈 분류기의 성능을 크게 향상시킴을 증명한다.

몬테카를로 시뮬레이션, 알파고 제로, 베이즈 정리를 이용한 최적의 항만 화물차 입항 스케줄링 시스템에 대한 연구 (Research on optimal port cargo vehicle arrival scheduling system using Monte Carlo simulation, AlphaGo Zero, and Bayes' theorem)

  • 김민경;박수아;이해영;김나영;유상오
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1096-1097
    • /
    • 2023
  • 본 연구에서는 항만 교통 혼잡 문제를 해결하기 위해 최적화와 관련된 요소와 트럭 운전기사와 터미널 사이의 협상과 관련된 요소를 새로운 방식으로 고려한 중장기 및 실시간 스케줄링 모델을 제시한다. 중장기 스케줄링 모델은 몬테카를로 시뮬레이션, 실시간 스케줄링 모델은 알파고 제로의 원리와 베이즈 정리를 이용하여 구현했다. 실험 결과 제시된 알파고 제로를 이용한 실시간 스케줄링 시스템이 화물차 평균 지연시간을 30분에서 4분으로 대폭 줄여 지연 시간을 최소화하는 것을 입증했다. 실험 관련 코드는 다음 주소에서 확인할 수 있다 : https://github.com/yulleta/Application_of_AlphaGo-Zero_to_port_arrival_scheduling

베이즈 방법과 뮤직 알고리즘을 이용한 간섭과 잡음제거를 위한 원하는 목표물의 도래방향 추정 (Direction of Arrival Estimation for Desired Target to Remove Interference and Noise using MUSIC Algorithm and Bayesian Method)

  • 이관형;강경식
    • 한국정보전자통신기술학회논문지
    • /
    • 제8권5호
    • /
    • pp.400-404
    • /
    • 2015
  • 본 논문에서는 공간에서 원하는 신호를 추정하기 위해서 도래방향 MUSIC 공간 스펙트럼 알고리즘에 대해서 연구한다. 본 연구에서 제안하는 MUSIC 공간 스펙트럼 알고리즘은 모델 오차와 베이즈 정리를 적용한 방법으로 목표물의 위치를 정확히 추정한다. 적응 배열 안테나를 사용한 수신기의 배열 응답 벡터는 베이즈 방법을 이용하고 모델 오차방법으로 수신 신호의 가중치를 갱신하여 원하는 목표물의 도래 방향을 정확히 추정한다. 본 연구에서 원하는 도래방향 목표물의 신호 추정은 입사 신호의 간섭과 잡음을 제거한 후 배열 응답 벡터를 신호 공분산 행렬의 가중치에 적용한다. 모의실험을 통해서 본 논문에서 제안한 방법과 기존의 도래방향 알고리즘을 비교 분석한다.