• 제목/요약/키워드: Inference models

검색결과 449건 처리시간 0.025초

Bayesian inference of the cumulative logistic principal component regression models

  • Kyung, Minjung
    • Communications for Statistical Applications and Methods
    • /
    • 제29권2호
    • /
    • pp.203-223
    • /
    • 2022
  • We propose a Bayesian approach to cumulative logistic regression model for the ordinal response based on the orthogonal principal components via singular value decomposition considering the multicollinearity among predictors. The advantage of the suggested method is considering dimension reduction and parameter estimation simultaneously. To evaluate the performance of the proposed model we conduct a simulation study with considering a high-dimensional and highly correlated explanatory matrix. Also, we fit the suggested method to a real data concerning sprout- and scab-damaged kernels of wheat and compare it to EM based proportional-odds logistic regression model. Compared to EM based methods, we argue that the proposed model works better for the highly correlated high-dimensional data with providing parameter estimates and provides good predictions.

On-the-fly ionizing photon non-conservation correction for the Excursion-set reionization models

  • Park, Jaehong;Greig, Bradley;Mesinger, Andrei
    • 천문학회보
    • /
    • 제46권1호
    • /
    • pp.30.3-30.3
    • /
    • 2021
  • In order to generate the 3D structure of the 21-cm signal during the reionization, semi-numerical simulations based on Excursion set formalism are broadly used. However, semi-numerical simulations in the realization of the 3D structure are known to be the ionizing photon non-conserving by the structure of the Excursion set approach. Recently, explicit photon conserving algorithms for semi-numerical simulations introduced, but they are still too slow when forward modelling the 21-cm signal with high-dimensional parameter spaces. Here, we introduce a new method for approximately correcting photon non-conservation, which can be applied on-the-fly. This method is tailored towards the efficient simulation and Bayesian inference with high-dimensional parameter space. Then, we investigate how large an impact that photon non-conservation has on astrophysical parameter inference by performing an MCMC analysis. We find that the ionizing escape parameter is deviated from the fiducial value by 2 sigma when we infer astrophysical parameters without this correction.

  • PDF

Inference on the Joint Center of Rotation by Covariance Pattern Models

  • Kim, Jinuk
    • 한국운동역학회지
    • /
    • 제28권2호
    • /
    • pp.127-134
    • /
    • 2018
  • Objective: In a statistical linear model estimating the center of rotation of a human hip joint, which is the parameter related to the mean of response vectors, assumptions of homoscedasticity and independence of position vectors measured repeatedly over time in the model result in an inefficient parameter. We, therefore, should take into account the variance-covariance structure of longitudinal responses. The purpose of this study was to estimate the efficient center of rotation vector of the hip joint by using covariance pattern models. Method: The covariance pattern models are used to model various kinds of covariance matrices of error vectors to take into account longitudinal data. The data acquired from functional motions to estimate hip joint center were applied to the models. Results: The results showed that the data were better fitted using various covariance pattern models than the general linear model assuming homoscedasticity and independence. Conclusion: The estimated joint centers of the covariance pattern models showed slight differences from those of the general linear model. The estimated standard errors of the joint center for covariance pattern models showed a large difference with those of the general linear model.

영과잉 포아송 회귀모형에 대한 베이지안 추론: 구강위생 자료에의 적용 (Bayesian Analysis of a Zero-inflated Poisson Regression Model: An Application to Korean Oral Hygienic Data)

  • 임아경;오만숙
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.505-519
    • /
    • 2006
  • 셀 수 있는 이산 자료(discrete count data)에 대한 분석은 여러 분야에서 활용되고 있지만 영(zero)을 과도하게 포함하고 있는 영과잉 자료는 자료의 성격상 포아송 분포를 따르지 못할 때가 있어 분석에 어려움이 따른다. Zero-Inflated Poisson(ZIP)모형은 이런 어려움을 극복하기 위하여 영에 대한 점확률을 가지는 분포와 포아송 분포를 합성하여 과도한 영과 영이 아닌 자료를 설명하는 모형이다. 설명 변수가 존재할 때는 포아송 분포 부분에서 반응변수의 평균과 공변량사이에 로그선형 연결함수를 사용한 Zero-Inflated Poisson Regression(ZIPR)모형이 사용될 수 있다. 본 논문에서는 Markov Chain Monte Carlo 기법을 이용한 ZIPR모형의 베이지안 추론방법을 제안하고, 이를 실제 구강위생 자료에 적용하며 다른 모형들과 비교한다. 그 결과 베이지안 추론 방법을 적용한 영과잉 모형의 추정오차가 다른 모형들의 추정오차보다 작았고, 예측치가 더 정확했다는 점에서 우수함을 알 수 있었다.

헬스 빅데이터 플랫폼에서 이기종 라이프로그 마이닝 모델 (Heterogeneous Lifelog Mining Model in Health Big-data Platform)

  • 강지수;정경용
    • 한국융합학회논문지
    • /
    • 제9권10호
    • /
    • pp.75-80
    • /
    • 2018
  • 본 논문에서는 헬스 빅데이터 플랫폼에서 이기종 라이프로그 마이닝 모델을 제안한다. 이는 사용자의 라이프 로그를 실시간으로 수집하고 헬스케어 서비스를 제공하기 위한 온톨로지 기반의 마이닝 모델이다. 제안하는 방법은 이기종 라이프 로그 데이터를 분산처리하고, 클라우드 컴퓨팅 환경에서 실시간으로 처리한다. 이를 이기종 온톨로지를 기반으로 구성한 환경에 적합하도록 상위 온톨로지 방식으로 지식베이스를 재구성한다. 재구성한 지식베이스는 Jena 4.0 추론엔진을 이용해 추론 규칙들을 생성하고, 규칙 기반 추론 방법으로 실시간 헬스 서비스를 제공한다. 라이프로그 마이닝을 숨겨진 관계에 대한 분석과 시계열적 생체신호에 대한 예측모델을 구성한다. 이는 관계나 추론규칙에서 포함되지 않은 음의 상관관계나 양의 상관관계를 탐색하여 사용자의 생체신호에 대한 변화를 감지하고 예방 의료 서비스를 현실화하는 실시간 헬스케어 서비스가 가능하다. 성능 평가는 제안한 이기종 라이프로그 마이닝 모델 방법이 정확도에서 0.734, 재현율에서 0.752로 다른 모델에 비해 우수하게 나타난다.

잠재변수를 이용한 NHPP 베이지안 소프트웨어 신뢰성 모형에 관한 연구 (The NHPP Bayesian Software Reliability Model Using Latent Variables)

  • 김희철;신현철
    • 융합보안논문지
    • /
    • 제6권3호
    • /
    • pp.117-126
    • /
    • 2006
  • 본 논문은 소프트웨어 신뢰성장 모형에 대한 베이지안 모수추론과 모형선택 방법이 연구되었다. 소프트웨어 성장 모형은 내재되어 있는 오류와 고장 간격시간으로 모형화하면 소프트웨어 개발 단계에서 유용하게 사용할 수 있다. 본 논문에서는 사후 분포의 정보를 얻기 위한 다중 적분문제에 있어서 일종의 마코브 체인 몬테칼로 방법인 깁스 샘플링을 사용하여 사후 분포의 계산이 이루어졌다. 확산 사전 분포를 가진 소프트웨어 신뢰성에 의존된 일반적 순서 통계량 모형에 대하여 베이지안 모수 추정이 이루어 졌고 효율적인 모형의 선택방법도 시행되었다. 모형 설정과 선택 판단기준은 편차 자승합을 이용한 적합도 검정과 추세 검정이 사용되었다. 본 논문에서 사용된 소프트웨어 고장 자료는 Minitab(version 14) 통계 페키지에 있는 와이블분포(형상모수가 2이고 척도모수가 5)에서 발생시킨 30개의 난수를 이용한 모의 실험자료를 이용하여 고장자료 분석을 시행하였다.

  • PDF

양자화 기반의 모델 압축을 이용한 ONNX 경량화 (Lightweight of ONNX using Quantization-based Model Compression)

  • 장두혁;이정수;허준영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.93-98
    • /
    • 2021
  • 딥 러닝의 발전으로 다양한 AI 기반의 응용이 많아지고, 그 모델의 규모도 매우 커지고 있다. 그러나 임베디드 기기와 같이 자원이 제한적인 환경에서는 모델의 적용이 어렵거나 전력 부족 등의 문제가 존재한다. 이를 해결하기 위해서 클라우드 기술 또는 오프로딩 기술을 활용하거나, 모델의 매개변수 개수를 줄이거나 계산을 최적화하는 등의 경량화 방법이 제안되었다. 본 논문에서는 다양한 프레임워크들의 상호 교환 포맷으로 사용되고 있는 ONNX(개방형 신경망 교환 포맷) 포맷에 딥러닝 경량화 방법 중 학습된 모델의 양자화를 적용한다. 경량화 전 모델과의 신경망 구조와 추론성능을 비교하고, 양자화를 위한 다양한 모듈 방식를 분석한다. 실험을 통해 ONNX의 양자화 결과, 정확도는 차이가 거의 없으며 기존 모델보다 매개변수 크기가 압축되었으며 추론 시간 또한 전보다 최적화되었음을 알 수 있었다.

블랙 박스 모델의 출력값을 이용한 AI 모델 종류 추론 공격 (Model Type Inference Attack Using Output of Black-Box AI Model)

  • 안윤수;최대선
    • 정보보호학회논문지
    • /
    • 제32권5호
    • /
    • pp.817-826
    • /
    • 2022
  • AI 기술이 여러 분야에 성공적으로 도입되는 추세이며, 서비스로 환경에 배포된 모델들은 지적 재산권과 데이터를 보호하기 위해 모델의 정보를 노출시키지 않는 블랙 박스 상태로 배포된다. 블랙 박스 환경에서 공격자들은 모델 출력을 이용해 학습에 쓰인 데이터나 파라미터를 훔치려고 한다. 본 논문은 딥러닝 모델을 대상으로 모델 종류에 대한 정보를 추론하는 공격이 없다는 점에서 착안하여, 모델의 구성 레이어 정보를 직접 알아내기 위해 모델의 종류를 추론하는 공격 방법을 제안한다. MNIST 데이터셋으로 학습된 ResNet, VGGNet, AlexNet과 간단한 컨볼루션 신경망 모델까지 네 가지 모델의 그레이 박스 및 블랙 박스 환경에서의 출력값을 이용해 모델의 종류가 추론될 수 있다는 것을 보였다. 또한 본 논문이 제안하는 방식인 대소 관계 피쳐를 딥러닝 모델에 함께 학습시킨 경우 블랙 박스 환경에서 약 83%의 정확도로 모델의 종류를 추론했으며, 그 결과를 통해 공격자에게 확률 벡터가 아닌 제한된 정보만 제공되는 상황에서도 모델 종류가 추론될 수 있음을 보였다.

Application of expert systems in prediction of flexural strength of cement mortars

  • Gulbandilar, Eyyup;Kocak, Yilmaz
    • Computers and Concrete
    • /
    • 제18권1호
    • /
    • pp.1-16
    • /
    • 2016
  • In this study, an Artificial Neural Network (ANN) and Adaptive Network-based Fuzzy Inference Systems (ANFIS) prediction models for flexural strength of the cement mortars have been developed. For purpose of constructing this models, 12 different mixes with 144 specimens of the 2, 7, 28 and 90 days flexural strength experimental results of cement mortars containing pure Portland cement (PC), blast furnace slag (BFS), waste tire rubber powder (WTRP) and BFS+WTRP used in training and testing for ANN and ANFIS were gathered from the standard cement tests. The data used in the ANN and ANFIS models are arranged in a format of four input parameters that cover the Portland cement, BFS, WTRP and age of samples and an output parameter which is flexural strength of cement mortars. The ANN and ANFIS models have produced notable excellent outputs with higher coefficients of determination of $R^2$, RMS and MAPE. For the testing of dataset, the $R^2$, RMS and MAPE values for the ANN model were 0.9892, 0.1715 and 0.0212, respectively. Furthermore, the $R^2$, RMS and MAPE values for the ANFIS model were 0.9831, 0.1947 and 0.0270, respectively. As a result, in the models, the training and testing results indicated that experimental data can be estimated to a superior close extent by the ANN and ANFIS models.

Modern Methods of Text Analysis as an Effective Way to Combat Plagiarism

  • Myronenko, Serhii;Myronenko, Yelyzaveta
    • International Journal of Computer Science & Network Security
    • /
    • 제22권8호
    • /
    • pp.242-248
    • /
    • 2022
  • The article presents the analysis of modern methods of automatic comparison of original and unoriginal text to detect textual plagiarism. The study covers two types of plagiarism - literal, when plagiarists directly make exact copying of the text without changing anything, and intelligent, using more sophisticated techniques, which are harder to detect due to the text manipulation, like words and signs replacement. Standard techniques related to extrinsic detection are string-based, vector space and semantic-based. The first, most common and most successful target models for detecting literal plagiarism - N-gram and Vector Space are analyzed, and their advantages and disadvantages are evaluated. The most effective target models that allow detecting intelligent plagiarism, particularly identifying paraphrases by measuring the semantic similarity of short components of the text, are investigated. Models using neural network architecture and based on natural language sentence matching approaches such as Densely Interactive Inference Network (DIIN), Bilateral Multi-Perspective Matching (BiMPM) and Bidirectional Encoder Representations from Transformers (BERT) and its family of models are considered. The progress in improving plagiarism detection systems, techniques and related models is summarized. Relevant and urgent problems that remain unresolved in detecting intelligent plagiarism - effective recognition of unoriginal ideas and qualitatively paraphrased text - are outlined.