• 제목/요약/키워드: 베이즈주의

검색결과 17건 처리시간 0.03초

베이즈주의와 헴펠: 베이즈주의자들은 헴펠의 직관을 포착하는가? (Bayesian Confirmation Theory and Hempel's Intuitions)

  • 이일권
    • 논리연구
    • /
    • 제22권3호
    • /
    • pp.351-395
    • /
    • 2019
  • 까마귀 역설의 역설적 결론은 입증에 대해 헴펠이 가지고 있던 직관이다. 베이즈주의자들의 표준적 해결책(SBS)은 이 직관을 포착함으로써, 입증에 대한 헴펠의 직관을 정교화 시켰다는 평가를 받는다. 하지만 헴펠이 제시한 직관은 그것만이 아니었다. 헴펠은 그 역설적 결론과 더불어 또 하나의 직관을 제시했다. SBS는 엄밀한 의미에서 이 두 번째 직관을 포착하지 못한다. 하지만 나는 베이즈주의자들이 그들의 전형적인 전략을 이용하여 이 두 번째 직관을 구제할 것으로 예상한다. 그런 전략이 인정된다면, SBS에 대한 긍정적 평가는 건재하다. 역설에 대한 헴펠의 해명은 이들 두 직관이 제공하는 입증관계를 비교한다. 헴펠이 제시한 두 직관을 받아들이면 그런 비교에 대한 헴펠의 또 다른 직관이 도출된다. 따라서 그 세 번째 직관을 포착하지 못한다면, 헴펠의 직관을 제대로 포착한다고 말할 수 없다. 나는 이 글에서 헴펠의 주요 직관들이 SBS와 양립불가능하다는 것을 보인다. 그리하여 결국 이들이 양립가능하기 위해서는 SBS의 중요한 가정 하나를 거부해야 한다고 주장한다.

딥러닝 모형을 사용한 한국어 음성인식 (Korean speech recognition using deep learning)

  • 이수지;한석진;박세원;이경원;이재용
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.213-227
    • /
    • 2019
  • 본 논문에서는 베이즈 신경망을 결합한 종단 간 딥러닝 모형을 한국어 음성인식에 적용하였다. 논문에서는 종단 간 학습 모형으로 연결성 시계열 분류기(connectionist temporal classification), 주의 기제, 그리고 주의 기제에 연결성 시계열 분류기를 결합한 모형을 사용하였으며. 각 모형은 순환신경망(recurrent neural network) 혹은 합성곱신경망(convolutional neural network)을 기반으로 하였다. 추가적으로 디코딩 과정에서 빔 탐색과 유한 상태 오토마타를 활용하여 자모음 순서를 조정한 최적의 문자열을 도출하였다. 또한 베이즈 신경망을 각 종단 간 모형에 적용하여 일반적인 점 추정치와 몬테카를로 추정치를 구하였으며 이를 기존 종단 간 모형의 결괏값과 비교하였다. 최종적으로 본 논문에 제안된 모형 중에 가장 성능이 우수한 모형을 선택하여 현재 상용되고 있는 Application Programming Interface (API)들과 성능을 비교하였다. 우리말샘 온라인 사전 훈련 데이터에 한하여 비교한 결과, 제안된 모형의 word error rate (WER)와 label error rate (LER)는 각각 26.4%와 4.58%로서 76%의 WER와 29.88%의 LER 값을 보인 Google API보다 월등히 개선된 성능을 보였다.

ISSR 표지자를 이용한 느릅나무 자연집단의 유전변이 분석 (Population Genetic Variation of Ulmus davidiana var. japonica in South Korea Based on ISSR Markers)

  • 안지영;홍경낙;이제완;양병훈
    • 한국산림과학회지
    • /
    • 제102권4호
    • /
    • pp.560-565
    • /
    • 2013
  • 국내의 느릅나무(Ulmus davidiana var. japonica) 집단에 대한 유전구조와 유전다양성을 분석하였다. 느릅나무 7개 자연집단, 171개체에 대하여 7개 ISSR 표지자를 이용하여 총45개의 다형적 증폭산물을 확인하였다. 유효대립인자와 다형적 유전자좌 비율의 평균값은 1.5개와 89%이었다. Shannon의 다양성 지수(I)가 0.435, 빈도주의 방법에 의한 이형접합도 기대치($H_e$)는 0.289, 베이즈 추정에 의한 이형접합도 기대치(hs)가 0.323으로 나타났다. AMOVA 분석에서 느릅나무 집단의 유전변이 중 4.2%가 집단간 차이(${\Phi}_{ST}=0.042$)에 기인하였으며, 95.8%를 집단내 개체들이 보유하고 있었다. 베이즈 추정에 의한 집단간 유전분화율(${\theta}^{II}$)은 0.043으로 나타났다. 국내 느릅나무 집단의 유전다양성은 다른 느릅나무속 수종과 유사한 수준에 해당하였으나, 집단간 유전분화 정도는 매우 낮았다. 베이즈 근사추정에서 집단별 고정지수(평균 $PS-F_{IS}=0.822$)나 집단 특이적 유전분화율(평균 $PS-F_{ST}=0.101$)에서 유의할 만한 차이를 보이는 집단은 없었다. 군집분석과 주성분분석에서 7개의 집단들을 3개 군집으로 나눌 수 있었으나, 두 방법의 군집 양상은 일치하지 않았다. 또한 베이즈 군집분석에서 집단간 유연관계와 지리적 분포의 상관성을 확인할 수 없었다.

제 18대 국회 기명투표 분석: 베이즈(Bayesian) 방법론 적용 (The Analysis of Roll Call Data from the 18th Korean National Assembly: A Bayesian Approach)

  • 한규섭;김윤응;임종호;임요한;권수현;이경은
    • 응용통계연구
    • /
    • 제27권4호
    • /
    • pp.523-541
    • /
    • 2014
  • 본 연구는 국회의 기명투표 분석에 적용될 수 있는 베이즈 방법론을 사용하여 지난 18대 국회에서 처리된 2,389개의 법안에 대한 표결기록을 분석하였다. 기명투표 분석은 의정연구에 관련된 이론적 가설의 실증적 검증을 위한 기초 데이터를 제공하는 경우가 많아 정치학 연구 전반의 발전을 위해 매우 중요한 의미를 가진다. 기명투표 분석에 있어 베이즈 방법론은 기존의 빈도주의적 방법론을 적용할 때 발생할 수 있는 통계적 문제들에 대한 훌륭한 대안을 제시한다. 본 연구에서는 Clinton 등 (2004)가 제안한 베이지언 방법론을 적용, 18대 국회에서 처리된 모든 법안에 대한 표결기록을 분석하여 개별 의원들의 최대선호점(ideal points)과 신뢰구간을 추정했다. 본 연구에서 제안한 방법론의 유용성 을 보여주기 위해 시범적으로 두 가지 경우에 대한 분석을 실시하였다. 하나는 널리 알려진 세 개의 의원 소모임의 최대선호점을 살펴봄으로써 한국 의회 내에 유의미한 표결성향의 스펙트럼이 존재하는지를 살펴보았다. 다른 하나는 제안된 방법론을 활용하여 어떻게 이론적 가설의 검증이 이루어질 수 있는지를 보여주기 위해 18대 국회의 '중간축'과 '몸싸움 방지축'의 위치와 두 중추적 위치에 해당할 가능성이 높은 의원들이 누구인지를 살펴보았다.

ISSR 분석에 의한 전나무 집단의 유전변이 (Genetic Variation of Abies holophylla Populations in South Korea Based on ISSR Markers)

  • 김영미;홍경낙;이제완;양병훈
    • 한국산림과학회지
    • /
    • 제103권2호
    • /
    • pp.182-188
    • /
    • 2014
  • ISSR 표지를 이용하여 전나무 6개 집단의 유전다양성과 유전구조를 분석하였다. 6개 ISSR primer로 유전다양성을 추정한 결과, 집단별 다형성 유전자좌의 비율은 평균 85.6%, 이형접합도 기대치($H_e$)는 0.288로 나타났다. AMOVA 결과, 전체 유전변이에서 5.6%는 집단간, 94.4%는 집단내 개체간 차이에 기인하는 것으로 나타났다. 베이즈 추론에 근거한 유전분화는 ${\theta}^{II}$$G_{ST}$가 각각 0.045, 0.038로, 근연교배 정도는 0.509로 추정되었다. Mental 검증에서 집단간 지리적 거리가 멀수록 유전적으로 상이한 것으로 판명되었다(r = 0.74, P < 0.05). UPGMA 방법과 PCA 결과에 따라서 남원, 청도, 문경 집단을 한 군집으로, 인제, 홍천, 평창 집단을 다른 군집으로 나눌 수 있었다. 베이즈 군집분석에서는 유전변이 분포에 따라서 남원, 문경 집단이 한 군집으로 인제, 홍천, 평창, 청도 집단이 다른 한 군집으로 묶여서 2개의 상위 군집으로 나뉘었다. 빈도주의 분석에 따른 '군집'을 반영한 AMOVA 결과에서 전체 유전변이의 3.9%를 군집의 영향으로 설명할 수 있었으며, 전나무 집단의 지리적 분포는 베이즈 분석보다는 UPGMA 방법에 의한 구분과 일치하는 것으로 나타났다.

고령운전자 운전 및 신체특성을 반영한 교통사고 분석 연구 (Analysis of Elderly Drivers' Accident Models Considering Operations and Physical Characteristics)

  • 임삼진;박준태;김영일;김태호
    • 대한교통학회지
    • /
    • 제30권6호
    • /
    • pp.37-46
    • /
    • 2012
  • 65세 이상 고령운전자의 경우 지난 10년 새 교통사고건수는 3만 7,000건에서 27만 4,000건으로 무려 640.5% 증가되었다. 이는 전체사고에서 차지하는 비율이 1.2%에서 3.1배 증가한 3.7%를 차지하고 있는 것으로 교통안전 관련기관에서는 여러 대책을 강구하고 있다. 무엇보다 고령운전자의 행동특성 및 신체특성에 대한 심층연구를 통해 안전대책과 연계하는 방안이 중요하다 할 수 있다. 본 연구에서는 고령운전자의 행동특성을 측정할 수 있는 운전자 적성검사(Driving Aptitude) 항목과 교통사고 자료를 토대로 고령운전자 운전특성과 사고특성을 연결한 실증연구를 수행하였다. 영향모형 개발을 위해 활용한 방법론은 영과잉 회귀모형을 적용하였고, ZIP 회귀모형과 ZINB 회귀모형에 대하여 베이지안 추론을 이용한 사고예측 모형을 선택하였다. AAE분석결과 ZIP 회귀모형이 적합하며, 3가지 변수속도예측, 주의전환, 인지능력이 고령자사고와 영향관계에 있음을 확인할 수 있었다.

ESTP 표지를 이용한 국내 소나무 집단의 유전변이 (Genetic Variation of Pinus densiflora Populations in South Korea Based on ESTP Markers)

  • 안지영;홍경낙;이제완;홍용표;강호덕
    • 한국자원식물학회지
    • /
    • 제28권2호
    • /
    • pp.279-289
    • /
    • 2015
  • 소나무의 유전다양성과 유전구조를 추정하기 위해 9개의 ESTP 표지를 13개 소나무 집단에 적용하였다. 소나무 집단의 유전다양성은 관찰된 대립유전자 수(A)가 2.2개, 유효 대립유전자 수(Ae)가 1.8개, 다형적 유전자좌 비율(P)이 98.8%, 이형접합도 관찰치(Ho)가 0.391, 이형접합도 기대치(He)가 0.402로 나타났다. 안강과 강릉 집단을 제외한 11개 집단이 하디-바인베르그 평형을 만족하였다. 집단간 유전분화도(FST)는 0.057으로, 동위효소나 nSSR 표지분석 결과보다 강하게 나타났다. 군집분석에서 집단의 유전적 거리와 지리적 분포간에 뚜렷한 연관성은 확인할 수 없었으며, 집단의 유전분화와 지리적 인접성도 상관이 없는 것으로 나타났다(Mantel 검증, r = 0.017, P = 0.344). 유전자좌에 대한 FST-outlier 분석을 실시한 결과, 빈도주의 방법에서는 FST 값이 신뢰하한 이하인 3개 유전자좌와 신뢰상한 이상인 3개 유전자좌가 특이값으로 추정되었고, 베이즈 방법에서는 3개 유전자좌들만 특이값으로 확인되었다. 두 방법에서 공히 특이값으로 판정된 3개 유전자좌(sams2+AluⅠ, sams2+RsaⅠ, PtNCS_p14A9+HaeⅢ)중 sams2 표지에서 유래된 2개 유전자좌는 balancing selection의 영향을 받는 것으로 추정되었다.