• Title/Summary/Keyword: 사전분포

Search Result 552, Processing Time 0.033 seconds

Bayes' Excuse for the Introduction of Prior Uniform Distribution (베이즈의 사전균등분포의 도입에 대한 변명)

  • PARK, Sun-Yong
    • Journal for History of Mathematics
    • /
    • v.35 no.6
    • /
    • pp.149-170
    • /
    • 2022
  • This study discusses in terms of historical genesis whether it is reasonable for Bayes to introduce a prior uniform distribution. In this study, we try to analyze the way he dealt with postulates, lemmas, and propositions in Bayes' essay and to understand its characteristics. The results of the study show that Bayes used random variables for two parameters and that the two random variables were converted to each other through cumulative distribution. Furthermore, it is revealed that the introduction of prior uniform distribution can be justified by this way.

Syllable-Based Korean Morphological Analyzer (음절에 기반한 한국어 형태소 분석기)

  • Jang, Dong-Su;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.331-339
    • /
    • 1993
  • 본 논문에서는 한국어의 음절 특성을 이용한 한국어 형태소 분석기를 제시하였다. 이 형태소 분석기는 품사별 음절 정보, 불규칙 음절 정보, 활용어절 음절 정보, 선어말 어미 음절 정보 등을 이용하여 음절 단위로 형태소 분석을 한다. 음절 단위의 형태소 분석 방법은 음소 단위의 방법보다 형태소 분석시에 생성될 수 있는 잘못된 중간 분석 결과를 크게 감소시켜, 사전 탐색 부담을 최소화한다. 시스템의 사전은 품사별 결합 특성과 사전 표제어의 길이별 분포 특성을 이용하여 구성하였으며, 그 규모는 약 16만 어휘이다. 이러한 사전 구성은 효율적인 사전검색을 제공하며, 특히 철자 검색기와 자동 인덱싱 등의 다양한 응용 시스템 요구를 곧바로 수용할 수 있는 유연성과 효율성을 갖고 있다.

  • PDF

Dictionary Making for Disambiguation (동사의 애매성 해소를 위한 구문의미사전의 구축)

  • Song, Young-Bin;Chae, Young-Soog;Park, Yong-Il;Lee, Jun-Min;Seol, Kah-Young;Hwang, Hye-Ri;Han, Na-Ri;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.280-287
    • /
    • 1999
  • 동사의 애매성이란 동일 동사 내부에서 공기하는 명사의 상충적 의미의 분포에 의해 발생한다. 이는 동일한 동사라 하더라도 명사의 상위개념, 흑은 개개의 명사에 따라 동사의 의미가 달라진다는 것을 의미한다. 동사의 애매성 해소를 위한 구문의미사전은 동사가 갖는 격틀과 논항에 오는 명사의 단어 집합에 의해 구성된다. 기계용 사전에서의 동사의 애매성이란 명사의 상위개념, 혹은 개개의 명사에 관한 정보가 결여될 때 나타난다. 지금까지의 구문의미사전은 개개의 동사가 갖는 격틀을 중심으로 논합명사의 예만을 제시하거나 명사의 상위개념을 기술하는 형식으로 구성되어 왔다. 이는 형식적인 패턴의 추출에는 유용하지만 대역어 선정을 위한 구문의미사전과 같은 섬세한 의미 정보를 필요로 하는 사전에서는 거의 효력을 발휘하지를 못한다. 다국어를 전제로 한 동사 대역어의 추출을 목적으로 하는 구문의미사전에서는 동사와 공기하는 논항명사의 철저한 추출과 검증에 의한 명사목록의 구축이 애매성 해소와 정확한 동사 대역어의 선정에 전제가 된다. 본 논문에서는 KAIST Corpus를 기반으로 현재 구축 중인 한국어 구문의미사전의 개요와 구축 과정에서 얻어진 방법론을 소개한다. 이 연구개발 결과는 과학기술부 KISTEP 특정연구개발과제 핵심소프트웨어개발 국어정보처리기술개발 중 "대용량 국어정보 심층 처리 및 품질 관리 기술 개발"의 지원을 받았다.

  • PDF

Huff 강우분포의 손실률과 유출수문곡선 분석

  • Kim, Kyo-Sik;Park, Ki-Bum;Park, Jong-Kwon;Cha, Sang-Hwa
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.680-683
    • /
    • 2008
  • 최근의 사전재해영향성 평가 등에서 많이 사용되고 있는 Huff 강우분포는 실제 호우사상의 적용성 보다는 최빈분위의 적용에 따라 특히나 재해 관련하여서는 홍수량이 크게 산정된다는 이유로 인하여 Huff 4분위를 채택하고 있다. 시간분포는 설계홍수량 수문곡선의 모양과 첨두홍수량에 많은 영향을 미치므로 신중하게 적용하여야 한다. 원칙적으로는 해당 지역의 과거 강우자료로부터 강우지속기간 동안에 총강우량이 시간이 경과함에 따라 어떻게 분포되었는지를 통계학적으로 분석하여 그 지역에 적합한 시간분포 모형을 작성하여 사용하여야 한다. 그러나 유출수문곡선에 영향을 미치는 점에 있어 분위별 강우 분포에 따른 손실율과 유출수문곡선과의 관계는 아직 연구가 부족하여 본 연구에서는 확률강우량의 시간분포 산정 방법 중 Huff분포를 이용하여 각 분위별로 유출수문곡선을 산정하였으며, 유효우량 손실과 유출수문곡선과의 관계를 비교 분석하였다. 강우의 손실율은 유출수문곡선의 상승부와 첨두전의 유출총량의 변화에 어떠한 영향을 미치는지 분석하였다.

  • PDF

A Bayesian Poisson model for analyzing adverse drug reaction in self-controlled case series studies (베이지안 포아송 모형을 적용한 자기-대조 환자군 연구에서의 약물상호작용 위험도 분석)

  • Lee, Eunchae;Hwang, Beom Seuk
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.2
    • /
    • pp.203-213
    • /
    • 2020
  • The self-controlled case series (SCCS) study measures the relative risk of exposure to exposure period by setting the non-exposure period of the patient as the control period without a separate control group. This method minimizes the bias that occurs when selecting a control group and is often used to measure the risk of adverse events after taking a drug. This study used SCCS to examine the increased risk of side effects when two or more drugs are used in combination. A conditional Poisson model is assumed and analyzed for drug interaction between the narcotic analgesic, tramadol and multi-frequency combination drugs. Bayesian inference is used to solve the overfitting problem of MLE and the normal or Laplace prior distributions are used to measure the sensitivity of the prior distribution.

Construction of Onion Sentiment Dictionary using Cluster Analysis (군집분석을 이용한 양파 감성사전 구축)

  • Oh, Seungwon;Kim, Min Soo
    • Journal of the Korean Data Analysis Society
    • /
    • v.20 no.6
    • /
    • pp.2917-2932
    • /
    • 2018
  • Many researches are accomplished as a result of the efforts of developing the production predicting model to solve the supply imbalance of onions which are vegetables very closely related to Korean food. But considering the possibility of storing onions, it is very difficult to solve the supply imbalance of onions only with predicting the production. So, this paper's purpose is trying to build a sentiment dictionary to predict the price of onions by using the internet articles which include the informations about the production of onions and various factors of the price, and these articles are very easy to access on our daily lives. Articles about onions are from 2012 to 2016, using TF-IDF for comparing with four kinds of TF-IDFs through the documents classification of wholesale prices of onions. As a result of classifying the positive/negative words for price by k-means clustering, DBSCAN (density based spatial cluster application with noise) clustering, GMM (Gaussian mixture model) clustering which are partitional clustering, GMM clustering is composed with three meaningful dictionaries. To compare the reasonability of these built dictionary, applying classified articles about the rise and drop of the price on logistic regression, and it shows 85.7% accuracy.

신뢰도분석을 위한 감마사전확률분포의 추정

  • 전치혁;박영신;김지수
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1993.04a
    • /
    • pp.294-300
    • /
    • 1993
  • 어떤 무기체계의 임무신뢰도분석에 베이지안기법을 사용하는데 있어 고장율이 주어졌을 때 고장간 시간이 지수분포를 따른다는 가정하에 이의 Conjugate Prior인 감마분포의 추정문제를 다룬다. 임무별 고장간시간에 대한 예측분포를 유도하였으며, 실제 측정된 기존의 임무별 고장간시간이 이 예측분포를 따른다는 전제하에 비선형 최소자승법을 이용하여 감마분포의 두 파라메터를 추정하는 방안을 제시하였다. 또한 대상 무기체계의 실제 고장자료를 이용하여 추정치를 구하였다.

  • PDF

CNN based battery SOC estimation using thermal distribution image (CNN 기반 열 분포 영상을 이용한 배터리 SOC 추정 연구)

  • Kwon, Sanguk;Kim, Jaeho;Kim, Yongsoon;Ahn, Jeongho;Choi, Eojin;Pack, Jinu;Kim, Jonghoon
    • Proceedings of the KIPE Conference
    • /
    • 2019.07a
    • /
    • pp.453-454
    • /
    • 2019
  • 본 논문은 ESS(Energy Storage System)의 과충전, 과방전으로 인한 열 폭주 현상을 방지하기 위한 사전 연구로 원통형 리튬이온 단일 셀의 충/방전에 따른 열 분포를 열화상 카메라로 촬영하여 분석하였다. 실험을 통한 열 분포 이미지를 학습 데이터로 구성하여, SOC(State of Charge)를 추정하는 CNN(Convolution Neural Network) 모델을 제안한다.

  • PDF

Stochastic Pronunciation Lexicon Modeling for Large Vocabulary Continous Speech Recognition (확률 발음사전을 이용한 대어휘 연속음성인식)

  • Yun, Seong-Jin;Choi, Hwan-Jin;Oh, Yung-Hwan
    • The Journal of the Acoustical Society of Korea
    • /
    • v.16 no.2
    • /
    • pp.49-57
    • /
    • 1997
  • In this paper, we propose the stochastic pronunciation lexicon model for large vocabulary continuous speech recognition system. We can regard stochastic lexicon as HMM. This HMM is a stochastic finite state automata consisting of a Markov chain of subword states and each subword state in the baseform has a probability distribution of subword units. In this method, an acoustic representation of a word can be derived automatically from sample sentence utterances and subword unit models. Additionally, the stochastic lexicon is further optimized to the subword model and recognizer. From the experimental result on 3000 word continuous speech recognition, the proposed method reduces word error rate by 23.6% and sentence error rate by 10% compare to methods based on standard phonetic representations of words.

  • PDF