• Title/Summary/Keyword: bayesian test

Search Result 243, Processing Time 0.023 seconds

범주형 자료에서 경험적 베이지안 오분류 분석 (Empirical Bayesian Misclassification Analysis on Categorical Data)

  • 임한승;홍종선;서문섭
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.39-57
    • /
    • 2001
  • 범주형 자료에서 오분류는 자료를 수집하는 과정에서 발생될 수 있다. 오분류되어 있는 자료를 정확한 자료로 간주하여 분석한다면 추정결과에 편의가 발생하고 검정력이 약화되는 결과를 초래하게 되며, 정확하게 분류된 자료를 오분류하고 판단한다면 오분류의 수정을 위해 불필요한 비용과 시간을 낭비해야 할 것이다. 따라서 정확하게 분류된 표본인지 오분류된 표본인지를 판정하는 것은 자료를 분석하기 전에 이루어져야할 매우 중요한 과정이다. 본 논문은 I$\times$J 분할표로 주어지는 범주형 자료에서 두 변수 중 하나의 변수에서만 오분류가 발생되는 경우에 오분류 여부를 검정하기 위해서 오분류 가능성이 없는 변수에 대한 주변합은 고정시키고, 오분류 여부를 가능성이 있는 변수의 주변합을 Sebastiani와 Ramoni(1997)가 제안한 Bound와 외부정보로 표현되는 Collapse의 개념, 그리고 베이지안 방법을 확장하여 자료에 적합한 모형과 사전정보를 고려한 사전모수를 다양하게 설정하면서 재분류하는 연구를 하였다. 오분류에 대한 정보를 얻기 위해서 Tenenbein(1970)에 의해 연구된 이중추출법을 이용하여 오분류 검정을 위한 새로운 통계량을 제안하였으며, 제안된 오분류 검정통계량에 관한 분포를 다양한 모의실험을 통하여 연구하였다.

  • PDF

사용자 컨텍스트 공유를 위한 상황인지 메신저 (A Context-aware Messenger for Sharing User Contextual Information)

  • 홍진혁;양성익;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권9호
    • /
    • pp.906-910
    • /
    • 2008
  • 모바일 환경이 보편화됨에 따라 사용자의 상황을 인식하고 관련된 각종 컨텍스트를 공유하는 기술에 대한 관심이 높아지고 있다. 컨텍스트 공유는 사용자의 의사소통을 보다 풍부하게 할 뿐만 아니라 사회적 관계를 원만하게 유지하도록 도와준다. 최근 각종 메신저나 모바일 어플리케이션에는 간단한 수준의 사용자 컨텍스트 공유가 적용되고 있으나 사용자 환경이 복잡해짐에 따라 더욱 다양한 컨텍스트의 인식과 공유가 요구된다. 본 논문에서는 다양한 센서 정보를 수집하여 사용자의 대표적 컨텍스트인 감정, 스트레스, 행동을 동적 확률 모델을 이용하여 인식하고 메신저에 연동하여 컨텍스트 정보를 공유하는 상황인지 메신저를 개발한다. 다양한 컨텍스트를 인식하기 위한 다중모델을 효과적으로 구성하고 아이콘 방식으로 컨텍스트를 표시한다. 개발한 시스템을 사용자 시나리오를 바탕으로 평가하여 유용성을 검증하였다.

디리슈레 혼합모형을 이용한 함정 전투체계 부품의 고장시간 분포 추정 (An Application of Dirichlet Mixture Model for Failure Time Density Estimation to Components of Naval Combat System)

  • 이진환;김정훈;정봉주;김경택
    • 산업경영시스템학회지
    • /
    • 제42권4호
    • /
    • pp.194-202
    • /
    • 2019
  • Reliability analysis of the components frequently starts with the data that manufacturer provides. If enough failure data are collected from the field operations, the reliability should be recomputed and updated on the basis of the field failure data. However, when the failure time record for a component contains only a few observations, all statistical methodologies are limited. In this case, where the failure records for multiple number of identical components are available, a valid alternative is combining all the data from each component into one data set with enough sample size and utilizing the useful information in the censored data. The ROK Navy has been operating multiple Patrol Killer Guided missiles (PKGs) for several years. The Korea Multi-Function Control Console (KMFCC) is one of key components in PKG combat system. The maintenance record for the KMFCC contains less than ten failure observations and a censored datum. This paper proposes a Bayesian approach with a Dirichlet mixture model to estimate failure time density for KMFCC. Trends test for each component record indicated that null hypothesis, that failure occurrence is renewal process, is not rejected. Since the KMFCCs have been functioning under different operating environment, the failure time distribution may be a composition of a number of unknown distributions, i.e. a mixture distribution, rather than a single distribution. The Dirichlet mixture model was coded as probabilistic programming in Python using PyMC3. Then Markov Chain Monte Carlo (MCMC) sampling technique employed in PyMC3 probabilistically estimated the parameters' posterior distribution through the Dirichlet mixture model. The simulation results revealed that the mixture models provide superior fits to the combined data set over single models.

Spatial Analysis of Common Gastrointestinal Tract Cancers in Counties of Iran

  • Soleimani, Ali;Hassanzadeh, Jafar;Motlagh, Ali Ghanbari;Tabatabaee, Hamidreza;Partovipour, Elham;Keshavarzi, Sareh;Hossein, Mohammad
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권9호
    • /
    • pp.4025-4029
    • /
    • 2015
  • Background: Gastrointestinal tract cancers are among the most common cancers in Iran and comprise approximately 38% of all the reported cases of cancer. This study aimed to describe the epidemiology and to investigate spatial clustering of common cancers of the gastrointestinal tract across the counties of Iran using full Bayesian smoothing and Moran I Index statistics. Materials and Methods: The data of the national registry cancer were used in this study. Besides, indirect standardized rates were calculated for 371 counties of Iranand smoothed using Winbug 1.4 software with a full Bayesian method. Global Moran I and local Moran I were also used to investigate clustering. Results: According to the results, 75,644 new cases of cancer were nationally registered in Iran among which 18,019 cases (23.8%) were esophagus, gastric, colorectal, and liver cancers. The results of Global Moran's I test were 0.60 (P=0.001), 0.47 (P=0.001), 0.29 (P=0.001), and 0.40 (P=0.001) for esophagus, gastric, colorectal, and liver cancers, respectively. This shows clustering of the four studied cancers in Iran at the national level. Conclusions: High level clustering of the cases was seen in northern, northwestern, western, and northeastern areas for esophagus, gastric, and colorectal cancers. Considering liver cancer, high clustering was observed in some counties in central, northeastern, and southern areas.

일상생활 시각화와 검색을 위한 확률망과 의미망 기반 라이프 브라우저 (A Life Browser based on Probabilistic and Semantic Networks for Visualization and Retrieval of Everyday-Life)

  • 이영설;황금성;김경중;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권3호
    • /
    • pp.289-300
    • /
    • 2010
  • 최근 휴대폰, 스마트폰, PDA와 같은 모바일 기기로 위치, 전화기록, SMS, 사진, 동영상 등 사용자에 관한 다양한 정보를 지속적으로 수집할 수 있게 되었다. 이에 모바일 기기로부터 수집된 정보를 토대로 개인의 일상을 검색 및 요약하는 서비스에 대한 연구가 활발하다. 본 논문에서는 이전 연구에서 개발된 라이프 브라우저를 소개하고, 이전 연구에서 확장된 내용으로 LPS 서버와 GPS 위치 보정을 추가로 설명하며, LPS 성능 평가 및 키워드 확장 검색에 대한 평가 실험 결과를 보인다. 라이프 브라우저는 모바일 기기에서 수집된 개인 정보를 효과적으로 검색할 수 있도록 해주고, 개념 네트워크를 이용하여 일반 상식으로부터 단편적인 키워드에 관련된 정보를 검색하는 기능을 지원한다. 사전 지식을 통해 설계된 베이지안 네트워크를 이용하여 확률적으로 연관성이 있는 장소를 검색할 수 있는 기능도 지원한다 실험에서는 실제 사용자를 대상으로 수집한 정보를 라이프 브라우저를 통해 시각화 하였으며, LPS 서버를 사용할 경우에 더 정확한 결과를 보일 수 있다는 점과 사용자 질의어의 개념을 개념 네트워크와 베이지안 네트워크로 확장하여 검색한 경우 더 유용한 결과를 보임을 확인하였다.

고차원 국부이진패턴과 결합베이시안 알고리즘을 이용한 얼굴인증 임베디드 시스템 구현 (Implementation of a Face Authentication Embedded System Using High-dimensional Local Binary Pattern Descriptor and Joint Bayesian Algorithm)

  • 김동주;이승익;강석근
    • 한국정보통신학회논문지
    • /
    • 제21권9호
    • /
    • pp.1674-1680
    • /
    • 2017
  • 본 논문에서는 고차원 국부이진패턴과 결합베이시안 알고리즘을 이용한 얼굴인증 임베디드 시스템을 제안한다. 또한, 제안된 알고리즘에 대한 임베디드 시스템을 라즈베리파이 3을 이용하여 구현한 결과를 제시한다. 제안된 얼굴인증 알고리즘에 대한 평가는 500명의 얼굴 데이터가 저장된 데이터베이스를 이용하여 수행하였다. 여기서 각각의 얼굴 데이터는 학습용과 테스트용 이미지로 구성하였다. 성능평가를 위한 척도로는 주성분분석법의 차원에 따른 스코어 분포와 얼굴인증 시간을 이용하였다. 그 결과, 최적화된 임베디드 환경에서 우수한 얼굴인증 성능을 가지는 임베디드 시스템을 상대적으로 저렴한 비용으로 구현할 수 있음을 확인하였다.

Genetic Diversity and Population Genetic Structure of Cephalotaxus koreana in South Korea

  • Hong, Kyung Nak;Kim, Young Mi;Park, Yu Jin;Lee, Jei Wan
    • 한국자원식물학회지
    • /
    • 제27권6호
    • /
    • pp.660-670
    • /
    • 2014
  • The Korean plum yew (Cephalotaxus koreana Nakai) is a shade-tolerant, coniferous shrub. The seeds have been used as a folk medicine in Korea, and an alkaloid extract (HTT) is known to have anticancer properties. We estimated the genetic diversity of 429 trees in 16 populations in South Korea using 194 polymorphic amplicons from seven combinations of AFLP primer-restriction enzymes. The average number of effective alleles and the percentage of polymorphic loci were 1.37 and 79.4%, respectively. Shannon's diversity index and the expected heterozygosity were 0.344 and 0.244, respectively. We divided 16 populations into four groups on the UPGMA dendrogram and the PCA biplot. The first two principal components explained 84% of the total genetic variation. Genetic differentiation between populations explained 14% of total genetic variation, and the remaining 86% came from difference between individuals within populations, as determined by an analysis of molecular variance (AMOVA). However, the genetic differentiation did not correlate with the geographic distance between populations from the Mantel test. The Bayesian statistics, which are comparable to Wright's $F_{ST}$ and Nei's $G_{ST}$, were ${\theta}^I=0.406$ and ${\theta}^{II}=0.172$, respectively. The population genetic diversity was slightly lower, and the strength of genetic differentiation was much weaker, than the average of those plants having similar life histories, as assessed using arbitrary marker systems. We discuss strategies for the genetic conservation of the plum yew in Korea.

베이지안 다중 비교차 분위회귀 분석 기법을 이용한 비정상성 빈도해석 모형 개발 (A Development of Nonstationary Frequency Analysis Model using a Bayesian Multiple Non-crossing Quantile Regression Approach)

  • 오랑치맥 솜야;김용탁;권영준;권현한
    • 한국연안방재학회지
    • /
    • 제4권3호
    • /
    • pp.119-131
    • /
    • 2017
  • Global warming under the influence of climate change and its direct impact on glacial and sea level are known issue. However, there is a lack of research on an indirect impact of climate change such as coastal structure design which is mainly based on a frequency analysis of water level under the stationary assumption, meaning that maximum sea level will not vary significantly over time. In general, stationary assumption does not hold and may not be valid under a changing climate. Therefore, this study aims to develop a novel approach to explore possible distributional changes in annual maximum sea levels (AMSLs) and provide the estimate of design water level for coastal structures using a multiple non-crossing quantile regression based nonstationary frequency analysis within a Bayesian framework. In this study, 20 tide gauge stations, where more than 30 years of hourly records are available, are considered. First, the possible distributional changes in the AMSLs are explored, focusing on the change in the scale and location parameter of the probability distributions. The most of the AMSLs are found to be upward-convergent/divergent pattern in the distribution, and the significance test on distributional changes is then performed. In this study, we confirm that a stationary assumption under the current climate characteristic may lead to underestimation of the design sea level, which results in increase in the failure risk in coastal structures. A detailed discussion on the role of the distribution changes for design water level is provided.

사출 성형 공정에서의 변수 최적화 방법론 (Methodology for Variable Optimization in Injection Molding Process)

  • 정영진;강태호;박정인;조중연;홍지수;강성우
    • 품질경영학회지
    • /
    • 제52권1호
    • /
    • pp.43-56
    • /
    • 2024
  • Purpose: The injection molding process, crucial for plastic shaping, encounters difficulties in sustaining product quality when replacing injection machines. Variations in machine types and outputs between different production lines or factories increase the risk of quality deterioration. In response, the study aims to develop a system that optimally adjusts conditions during the replacement of injection machines linked to molds. Methods: Utilizing a dataset of 12 injection process variables and 52 corresponding sensor variables, a predictive model is crafted using Decision Tree, Random Forest, and XGBoost. Model evaluation is conducted using an 80% training data and a 20% test data split. The dependent variable, classified into five characteristics based on temperature and pressure, guides the prediction model. Bayesian optimization, integrated into the selected model, determines optimal values for process variables during the replacement of injection machines. The iterative convergence of sensor prediction values to the optimum range is visually confirmed, aligning them with the target range. Experimental results validate the proposed approach. Results: Post-experiment analysis indicates the superiority of the XGBoost model across all five characteristics, achieving a combined high performance of 0.81 and a Mean Absolute Error (MAE) of 0.77. The study introduces a method for optimizing initial conditions in the injection process during machine replacement, utilizing Bayesian optimization. This streamlined approach reduces both time and costs, thereby enhancing process efficiency. Conclusion: This research contributes practical insights to the optimization literature, offering valuable guidance for industries seeking streamlined and cost-effective methods for machine replacement in injection molding.

ISSR 분석에 의한 전나무 집단의 유전변이 (Genetic Variation of Abies holophylla Populations in South Korea Based on ISSR Markers)

  • 김영미;홍경낙;이제완;양병훈
    • 한국산림과학회지
    • /
    • 제103권2호
    • /
    • pp.182-188
    • /
    • 2014
  • ISSR 표지를 이용하여 전나무 6개 집단의 유전다양성과 유전구조를 분석하였다. 6개 ISSR primer로 유전다양성을 추정한 결과, 집단별 다형성 유전자좌의 비율은 평균 85.6%, 이형접합도 기대치($H_e$)는 0.288로 나타났다. AMOVA 결과, 전체 유전변이에서 5.6%는 집단간, 94.4%는 집단내 개체간 차이에 기인하는 것으로 나타났다. 베이즈 추론에 근거한 유전분화는 ${\theta}^{II}$$G_{ST}$가 각각 0.045, 0.038로, 근연교배 정도는 0.509로 추정되었다. Mental 검증에서 집단간 지리적 거리가 멀수록 유전적으로 상이한 것으로 판명되었다(r = 0.74, P < 0.05). UPGMA 방법과 PCA 결과에 따라서 남원, 청도, 문경 집단을 한 군집으로, 인제, 홍천, 평창 집단을 다른 군집으로 나눌 수 있었다. 베이즈 군집분석에서는 유전변이 분포에 따라서 남원, 문경 집단이 한 군집으로 인제, 홍천, 평창, 청도 집단이 다른 한 군집으로 묶여서 2개의 상위 군집으로 나뉘었다. 빈도주의 분석에 따른 '군집'을 반영한 AMOVA 결과에서 전체 유전변이의 3.9%를 군집의 영향으로 설명할 수 있었으며, 전나무 집단의 지리적 분포는 베이즈 분석보다는 UPGMA 방법에 의한 구분과 일치하는 것으로 나타났다.