• Title/Summary/Keyword: 베이즈모델

Search Result 59, Processing Time 0.022 seconds

Development of a Screening Method for Deforestation Area Prediction using Probability Model (확률모델을 이용한 산림전용지역의 스크리닝방법 개발)

  • Lee, Jung-Soo
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.11 no.2
    • /
    • pp.108-120
    • /
    • 2008
  • This paper discusses the prediction of deforestation areas using probability models from forest census database, Geographic information system (GIS) database and the land cover database. The land cover data was analyzed using remotely-sensed (RS) data of the Landsat TM data from 1989 to 2001. Over the analysis period of 12 years, the deforestation area was about 40ha. Most of the deforestation areas were attributable to road construction and residential development activities. About 80% of the deforestation areas for residential development were found within 100m of the road network. More than 20% of the deforestation areas for forest road construction were within 100m of the road network. Geographic factors and vegetation change detection (VCD) factors were used in probability models to construct deforestation occurrence map. We examined the size effect of area partition as training area and validation area for the probability models. The Bayes model provided a better deforestation prediction rate than that of the regression model.

  • PDF

Comparison of Automatic Score Range Prediction of Korean Essays Using KoBERT, Naive Bayes & Logistic Regression (KoBERT, 나이브 베이즈, 로지스틱 회귀의 한국어 쓰기 답안지 점수 구간 예측 성능 비교)

  • Cho, Heeryon;Im, Hyeonyeol;Cha, Junwoo;Yi, Yumi
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.501-504
    • /
    • 2021
  • 한국어 심층학습 언어모델인 KoBERT와, 확률적 기계학습 분류기인 나이브 베이즈와 로지스틱 회귀를 이용하여 유학생이 작성한 한국어 쓰기 답안지의 점수 구간을 예측하는 실험을 진행하였다. 네가지 주제('직업', '행복', '경제', '성공')를 다룬 답안지와 점수 레이블(A, B, C, D)로 쌍을 이룬 학습데이터 총 304건으로 다양한 자동분류 모델을 구축하여 7-겹 교차검증을 시행한 결과 KoBERT가 나이브 베이즈나 로지스틱 회귀보다 약간 우세한 성능을 보였다.

Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR (나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정)

  • Noh, Kyung-Mok;Kim, Chang-Hyun;Cheon, Min-Ah;Kim, Jae-Hoon
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR (나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정)

  • Noh, Kyung-Mok;Kim, Chang-Hyun;Cheon, Min-Ah;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어 모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

An Exploratory Study on Survey Data Categorization using DDI metadata (메타데이터를 활용한 조사자료의 문서범주화에 관한 연구)

  • Park, Ja-Hyun;Song, Min
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2012.08a
    • /
    • pp.73-76
    • /
    • 2012
  • 본 연구는 DDI 메타데이터를 활용하여 귀납적 학습모델(supervised learning model)의 문서범주화 실험을 수행함으로써 조사자료의 체계적이고 효율적인 분류작업을 설계하는데 그 목적이 있다. 구체적으로 조사자료의 DDI 메타데이터를 대상으로 단순 TF 가중치, TF-IDF 가중치, Okapi TF 가중치에 따른 나이브 베이즈(Naive Bayes), kNN(k nearest neighbor), 결정트리(Decision tree) 분류기의 성능비교 실험을 하였다. 그 결과, 나이브 베이즈가 가장 좋은 성능을 보였으며, 단순 TF 가중치와 TF-IDF 가중치는 나이브 베이즈, kNN, 결정트리 분류기에서 동일한 성능을 보였으나, Okapi TF 가중치의 경우 나이브 베이즈에서 가장 좋은 성능을 보였다.

  • PDF

Reliability Assessment Models of Existing Structures by Fuzzy-Bayesian Approach (퍼지-베이즈 이론에 의한 기존구조물의 신뢰성평가모델)

  • 백대우;이증빈;박주원;강수경
    • Computational Structural Engineering
    • /
    • v.11 no.4
    • /
    • pp.219-227
    • /
    • 1998
  • 실제 구조물에 있어 확률, 통계 및 이론으로 구해진 랜덤성을 갖는 객관적 불확실성뿐만 아니라 설계자의 경험이나 공학적 판단에 의해 주관적으로 평가되는 인간오차나 시공중의 과오 또는 구조설계에 미치는 사회적, 정치적 및 경제적 요청 등의 퍼지성을 갖는 주관적 불확실성이 존재하기 때문에 현실적으로 랜덤성과 퍼지성을 동시에 고려한 실뢰성평가 즉, 안전성평가에 대한 퍼지이론의 도입이 필수 불가결하다. 따라서 본 연구에서는 기존 구조물의 객관적·주관적 불확실성을 동시에 고려한 신뢰성해석방법으로 베이즈의 의사결정이론에 퍼지이론을 병합한 퍼지-베이즈 신뢰성해석 알고리즘을 개발하여 건축구조물의 신뢰성평가 및 안전성평가에 적용하여 분석하였다.

  • PDF

Combining Feature Variables for Improving the Accuracy of $Na\ddot{i}ve$ Bayes Classifiers (나이브베이즈분류기의 정확도 향상을 위한 자질변수통합)

  • Heo Min-Oh;Kim Byoung-Hee;Hwang Kyu-Baek;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.727-729
    • /
    • 2005
  • 나이브베이즈분류기($na\ddot{i}ve$ Bayes classifier)는 학습, 적용 및 계산자원 이용의 측면에서 매우 효율적인 모델이다. 또한, 그 분류 성능 역시 다른 기법에 비해 크게 떨어지지 않음이 다양한 실험을 통해 보여져 왔다. 특히, 데이터를 생성한 실제 확률분포를 나이브베이즈분류기가 정확하게 표현할 수 있는 경우에는 최대의 효과를 볼 수 있다. 하지만, 실제 확률분포에 존재하는 조건부독립성(conditional independence)이 나이브베이즈분류기의 구조와 일치하지 않는 경우에는 성능이 하락할 수 있다. 보다 구체적으로, 각 자질변수(feature variable)들 사이에 확률적 의존관계(probabilistic dependency)가 존재하는 경우 성능 하락은 심화된다. 본 논문에서는 이러한 나이브베이즈분류기의 약점을 효율적으로 해결할 수 있는 자질변수의 통합기법을 제시한다. 자질변수의 통합은 각 변수들 사이의 관계를 명시적으로 표현해 주는 방법이며, 특히 상호정보량(mutual information)에 기반한 통합 변수의 선정이 성능 향상에 크게 기여함을 실험을 통해 보인다.

  • PDF

Improving Naïve Bayes Text Classifiers with Incremental Feature Weighting (점진적 특징 가중치 기법을 이용한 나이브 베이즈 문서분류기의 성능 개선)

  • Kim, Han-Joon;Chang, Jae-Young
    • The KIPS Transactions:PartB
    • /
    • v.15B no.5
    • /
    • pp.457-464
    • /
    • 2008
  • In the real-world operational environment, most of text classification systems have the problems of insufficient training documents and no prior knowledge of feature space. In this regard, $Na{\ddot{i}ve$ Bayes is known to be an appropriate algorithm of operational text classification since the classification model can be evolved easily by incrementally updating its pre-learned classification model and feature space. This paper proposes the improving technique of $Na{\ddot{i}ve$ Bayes classifier through feature weighting strategy. The basic idea is that parameter estimation of $Na{\ddot{i}ve$ Bayes considers the degree of feature importance as well as feature distribution. We can develop a more accurate classification model by incorporating feature weights into Naive Bayes learning algorithm, not performing a learning process with a reduced feature set. In addition, we have extended a conventional feature update algorithm for incremental feature weighting in a dynamic operational environment. To evaluate the proposed method, we perform the experiments using the various document collections, and show that the traditional $Na{\ddot{i}ve$ Bayes classifier can be significantly improved by the proposed technique.

Research on optimal port cargo vehicle arrival scheduling system using Monte Carlo simulation, AlphaGo Zero, and Bayes' theorem (몬테카를로 시뮬레이션, 알파고 제로, 베이즈 정리를 이용한 최적의 항만 화물차 입항 스케줄링 시스템에 대한 연구)

  • Min-Gyeong Kim;Sua Park;Hae-Young Lee;Na-Young Kim;Sang-Oh Yoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.1096-1097
    • /
    • 2023
  • 본 연구에서는 항만 교통 혼잡 문제를 해결하기 위해 최적화와 관련된 요소와 트럭 운전기사와 터미널 사이의 협상과 관련된 요소를 새로운 방식으로 고려한 중장기 및 실시간 스케줄링 모델을 제시한다. 중장기 스케줄링 모델은 몬테카를로 시뮬레이션, 실시간 스케줄링 모델은 알파고 제로의 원리와 베이즈 정리를 이용하여 구현했다. 실험 결과 제시된 알파고 제로를 이용한 실시간 스케줄링 시스템이 화물차 평균 지연시간을 30분에서 4분으로 대폭 줄여 지연 시간을 최소화하는 것을 입증했다. 실험 관련 코드는 다음 주소에서 확인할 수 있다 : https://github.com/yulleta/Application_of_AlphaGo-Zero_to_port_arrival_scheduling

Direction of Arrival Estimation for Desired Target to Remove Interference and Noise using MUSIC Algorithm and Bayesian Method (베이즈 방법과 뮤직 알고리즘을 이용한 간섭과 잡음제거를 위한 원하는 목표물의 도래방향 추정)

  • Lee, Kwan-Hyeong;Kang, Kyoung-Sik
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.8 no.5
    • /
    • pp.400-404
    • /
    • 2015
  • In this paper, we study for direction of arrival MUSIC spatial spectrum algorithm in order to desired signal estimation in spatial. Proposal MUSIC spatial spectrum algorithm in paper use model error and Bayesian method to estimation on correct target position. Receiver array response vector using adaptive array antenna use Bayesian method, and target position estimate to update weight value with model error method. Target's signal estimation of desired direction of arrival in this paper apply weight value of signal covariance matrix for array response vector after removing incident signal interference and noise, respectively. Though simulation, we analyze to compare proposed method with general method.