• 제목/요약/키워드: Multivariate algorithm

검색결과 186건 처리시간 0.024초

인공 신경망을 이용한 광대역 과정의 피로 손상 모델 개발 (Development of a Fatigue Damage Model of Wideband Process using an Artificial Neural Network)

  • 김호성;안인규;김유일
    • 대한조선학회논문집
    • /
    • 제52권1호
    • /
    • pp.88-95
    • /
    • 2015
  • For the frequency-domain spectral fatigue analysis, the probability density function of stress range needs to be estimated based on the stress spectrum only, which is a frequency domain representation of the response. The probability distribution of the stress range of the narrow-band spectrum is known to follow the Rayleigh distribution, however the PDF of wide-band spectrum is difficult to define with clarity due to the complicated fluctuation pattern of spectrum. In this paper, efforts have been made to figure out the links between the probability density function of stress range to the structural response of wide-band Gaussian random process. An artificial neural network scheme, known as one of the most powerful system identification methods, was used to identify the multivariate functional relationship between the idealized wide-band spectrums and resulting probability density functions. To achieve this, the spectrums were idealized as a superposition of two triangles with arbitrary location, height and width, targeting to comprise wide-band spectrum, and the probability density functions were represented by the linear combination of equally spaced Gaussian basis functions. To train the network under supervision, varieties of different wide-band spectrums were assumed and the converged probability density function of the stress range was derived using the rainflow counting method and all these data sets were fed into the three layer perceptron model. This nonlinear least square problem was solved using Levenberg-Marquardt algorithm with regularization term included. It was proven that the network trained using the given data set could reproduce the probability density function of arbitrary wide-band spectrum of two triangles with great success.

안정화된 딥 네트워크 구조를 위한 다항식 신경회로망의 연구 (A Study on Polynomial Neural Networks for Stabilized Deep Networks Structure)

  • 전필한;김은후;오성권
    • 전기학회논문지
    • /
    • 제66권12호
    • /
    • pp.1772-1781
    • /
    • 2017
  • In this study, the design methodology for alleviating the overfitting problem of Polynomial Neural Networks(PNN) is realized with the aid of two kinds techniques such as L2 regularization and Sum of Squared Coefficients (SSC). The PNN is widely used as a kind of mathematical modeling methods such as the identification of linear system by input/output data and the regression analysis modeling method for prediction problem. PNN is an algorithm that obtains preferred network structure by generating consecutive layers as well as nodes by using a multivariate polynomial subexpression. It has much fewer nodes and more flexible adaptability than existing neural network algorithms. However, such algorithms lead to overfitting problems due to noise sensitivity as well as excessive trainning while generation of successive network layers. To alleviate such overfitting problem and also effectively design its ensuing deep network structure, two techniques are introduced. That is we use the two techniques of both SSC(Sum of Squared Coefficients) and $L_2$ regularization for consecutive generation of each layer's nodes as well as each layer in order to construct the deep PNN structure. The technique of $L_2$ regularization is used for the minimum coefficient estimation by adding penalty term to cost function. $L_2$ regularization is a kind of representative methods of reducing the influence of noise by flattening the solution space and also lessening coefficient size. The technique for the SSC is implemented for the minimization of Sum of Squared Coefficients of polynomial instead of using the square of errors. In the sequel, the overfitting problem of the deep PNN structure is stabilized by the proposed method. This study leads to the possibility of deep network structure design as well as big data processing and also the superiority of the network performance through experiments is shown.

Decision based uncertainty model to predict rockburst in underground engineering structures using gradient boosting algorithms

  • Kidega, Richard;Ondiaka, Mary Nelima;Maina, Duncan;Jonah, Kiptanui Arap Too;Kamran, Muhammad
    • Geomechanics and Engineering
    • /
    • 제30권3호
    • /
    • pp.259-272
    • /
    • 2022
  • Rockburst is a dynamic, multivariate, and non-linear phenomenon that occurs in underground mining and civil engineering structures. Predicting rockburst is challenging since conventional models are not standardized. Hence, machine learning techniques would improve the prediction accuracies. This study describes decision based uncertainty models to predict rockburst in underground engineering structures using gradient boosting algorithms (GBM). The model input variables were uniaxial compressive strength (UCS), uniaxial tensile strength (UTS), maximum tangential stress (MTS), excavation depth (D), stress ratio (SR), and brittleness coefficient (BC). Several models were trained using different combinations of the input variables and a 3-fold cross-validation resampling procedure. The hyperparameters comprising learning rate, number of boosting iterations, tree depth, and number of minimum observations were tuned to attain the optimum models. The performance of the models was tested using classification accuracy, Cohen's kappa coefficient (k), sensitivity and specificity. The best-performing model showed a classification accuracy, k, sensitivity and specificity values of 98%, 93%, 1.00 and 0.957 respectively by optimizing model ROC metrics. The most and least influential input variables were MTS and BC, respectively. The partial dependence plots revealed the relationship between the changes in the input variables and model predictions. The findings reveal that GBM can be used to anticipate rockburst and guide decisions about support requirements before mining development.

Soft computing based mathematical models for improved prediction of rock brittleness index

  • Abiodun I. Lawal;Minju Kim;Sangki Kwon
    • Geomechanics and Engineering
    • /
    • 제33권3호
    • /
    • pp.279-289
    • /
    • 2023
  • Brittleness index (BI) is an important property of rocks because it is a good index to predict rockburst. Due to its importance, several empirical and soft computing (SC) models have been proposed in the literature based on the punch penetration test (PPT) results. These models are very important as there is no clear-cut experimental means for measuring BI asides the PPT which is very costly and time consuming to perform. This study used a novel Multivariate Adaptive regression spline (MARS), M5P, and white-box ANN to predict the BI of rocks using the available data in the literature for an improved BI prediction. The rock density, uniaxial compressive strength (σc) and tensile strength (σt) were used as the input parameters into the models while the BI was the targeted output. The models were implemented in the MATLAB software. The results of the proposed models were compared with those from existing multilinear regression, linear and nonlinear particle swarm optimization (PSO) and genetic algorithm (GA) based models using similar datasets. The coefficient of determination (R2), adjusted R2 (Adj R2), root-mean squared error (RMSE) and mean absolute percentage error (MAPE) were the indices used for the comparison. The outcomes of the comparison revealed that the proposed ANN and MARS models performed better than the other models with R2 and Adj R2 values above 0.9 and least error values while the M5P gave similar performance to those of the existing models. Weight partitioning method was also used to examine the percentage contribution of model predictors to the predicted BI and tensile strength was found to have the highest influence on the predicted BI.

확장 베이지안망을 적용한 고위험성 HRCT 영상 분류 (Classification of Very High Concerns HRCT Images using Extended Bayesian Networks)

  • 임채균;정용규
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.7-12
    • /
    • 2012
  • 최근 의료분야에서는 방대한 양의 정보를 효과적으로 처리하기 위하여 의사결정트리, 신경망, 베이지안망 등을 비롯한 각종 데이터마이닝 기법의 적용 방안을 연구하고 있다. 또한 환자의 기본적인 신상정보나 과거력, 가족력과 같은 정보 이외에도 MRI, HRCT 등의 영상정보를 추가적으로 수집하고 진단에 활용함으로써 질병진단의 정확도 향상을 도모하는 것이 일반적인 현황이다. 하지만 실제 상황에서는 결과에 영향을 미치는 다량의 변수가 존재하므로 특정 데이터마이닝 기법을 통하여 얻을 수 있는 정보가 상당히 제한적이라고 볼 수 있다. 그뿐만 아니라 촬영된 의료영상도 부수적으로 진단에 긍정적인 영향을 줄 수는 있지만, 주관적인 판단 비중이 높아 자동화된 시스템으로 처리하기가 난해한 문제이다. 이에 따라 현실의 복잡한 상황에서 상대적으로 대처가 유리하고 다변량 확률적인 모델을 기반으로 하는 베이지안망에서 K2나 TAN 등으로 탐색 알고리즘을 개선한 확장 모델이 제안되었다. 이 때, 적용되는 탐색 알고리즘의 종류에 따라 그 성능이 크게 좌우되는 확장 베이지안망의 특성상, 각 기법에 대한 성능과 적합성의 사실적인 평가가 요구된다. 따라서 본 논문에서는 확장 베이지안망에서 질병 진단에 대한 동일한 데이터를 이용하여 실험을 수행하였으며, K2, TAN과 같은 탐색 알고리즘에 변화를 주며 분류 정확도를 측정하였다. 실험에서는 10-fold 교차검증을 수행한 결과분석을 기반으로 성능을 비교평가하고, 발병 위험성이 높은 환자에 대한 HRCT 영상을 분류하여 고위험성의 데이터를 식별 가능하도록 하였다.

범주형 자료를 포함한 다형질 임계개체모형에서 유전능력 추정 알고리즘 (Computing Algorithm for Genetic Evaluations on Several Linear and Categorical Traits in A Multivariate Threshold Animal Model)

  • 이득환
    • Journal of Animal Science and Technology
    • /
    • 제46권2호
    • /
    • pp.137-144
    • /
    • 2004
  • 불연속 범주형 자료에 대한 잠재변수가 존재한다는 가정하에 임계값을 추정하고 잠재변수를 생성하며 생성된 잠재변수 및 기타 연속변량에 대한 관측치를 포함하는 다변량 임계개체모형을 설정하고 유전능력을 예측하기 위한 방법을 제시하였다. 각각의 범주형 조사 자료의 특성을 갖는 형질에 있어서 임계점의 추정은 추정 가능한 임계점에 대한 1차 미분값(gradient)과 2차 미분값(Hessian)을 이용한 Newton 방법을 이용하면 추정가능하며 지역모수인 육종가의 추정은 PCG 방법으로 구현 가능하다. 이러한 이론은 Quaas(2001)가 제시한 하나의 이산형 자료와 하나의 연속형 자료의 2변량 동시 분석방법을 확장하여 전개한 것이며 이때 잠재변수 및 임계점의 추정은 기타 형질의 잔차 회귀계수 및 상관을 고려해야 한다. 본 연구를 위한 모의실험은 2개의 연속변량으로 체중과 유량을 고려하였고 또 다른 2개의 불연속 변량인 분만난이도와 출생시 생존유무를 고려하여 4형질 동시 분석을 실시하였다. 임계모형에 의한 육종가 추정치의 정확도는 4개의 구간으로 분류되어 기록된 분만난이도의 경우에 91${\sim}$92%의 정확도를 보였고 이항분포인 분만시 생존유무에 대하여는 87~89%의 정확도를 보였다. 반면에 이들 범주형 자료를 선형으로 간주하고 분석한 선형 동물개체 혼합모형에서는 72${\sim}$84% 및 59${\sim}$70%으로 비교적 낮은 추정의 정확도를 보였다. 따라서 범주형 자료의 유전분석은 선형 혼합모형 보다 임계형 혼합모형이 크게 타당할 것으로 사료되었다.

FT-IR 스펙트럼 데이터의 다변량 통계분석을 이용한 고기능성 아프리칸 얌 식별 및 기능성 성분 함량 예측 모델링 (Discrimination of African Yams Containing High Functional Compounds Using FT-IR Fingerprinting Combined by Multivariate Analysis and Quantitative Prediction of Functional Compounds by PLS Regression Modeling)

  • 송승엽;지은이;안명숙;김동진;김인중;김석원
    • 원예과학기술지
    • /
    • 제32권1호
    • /
    • pp.105-114
    • /
    • 2014
  • 본 연구에서는 UV-VIS spectrophotometer를 이용한 total carotenoids, flavonoids, phenolics 함량 데이터와 FT-IR 스펙트럼 데이터를 다변량통계분석법을 통하여 기능성 성분 함량이 높은 아프리칸 얌 고속 선발 시스템을 구축하였다. 62개 아프리칸 얌의 total carotenoids 함량은 $0.01-0.91{\mu}g{\cdot}g^{-1}$ dry wt 나타냈다. Total flavonoids와 phenolics 함량은 $12.9-229.0{\mu}g{\cdot}g^{-1}$ dry wt와 $0.29-5.2mg{\cdot}g^{-1}$ dry wt로 각각 나타났다. 아프리칸 얌은 FT-IR 스펙트럼상의 1700-1500, 1500-1300, $1,100-950cm^{-1}$, 부위에서 중요한 스펙트럼 변화가 나타났다. 이 부위는 각각 amide I과 II을 포함하는 아미노산 및 단백질계열의 화합물, phosphodiester group을 포함한 핵산 및 인지질 그리고 단당류나 복합 다당류를 포함하는 carbohydrates 계열의 화합물들의 질적, 양적 정보를 반영하는 부위이다. PCA 분석과 PLS-DA 분석에서 62개 아프리칸 얌은 유연성이 높은 종으로 3개의 그룹을 형성하였다. 아프리칸 얌의 FT-IR 스펙트럼 데이터와 UV-VIS spectrophotometer을 이용한 total carotenoids, flavonoids, phenolics 함량 데이터 간에 PLS regression 분석하였다. Total carotenoids, flavonoids, phenolics 함량 성분의 실측 값과 예측 값간에 상관계수($R^2$)가 각각 0.83, 0.86, 0.72로 나타났다. 이 결과, 아프리칸 얌으로부터 FT-IR 스펙트럼을 이용한 total carotenoids, flavonoids, phenolics 함량 예측이 가능하였다. 본 연구에서 확립된 대사체 수준에서 아프리칸 얌의 유용 기능성 성분 함량 예측 모델링을 통해 품종, 계통의 신속한 선발 수단으로 활용이 가능할 것으로 예상된다.

적외선 분광스펙트럼 및 기체크로마토그라피 분석 데이터의 다변량 통계분석을 이용한 대두 종자 지방산 함량예측 (Simultaneous estimation of fatty acids contents from soybean seeds using fourier transform infrared spectroscopy and gas chromatography by multivariate analysis)

  • 안명숙;지은이;송승엽;안준우;정원중;민성란;김석원
    • Journal of Plant Biotechnology
    • /
    • 제42권1호
    • /
    • pp.60-70
    • /
    • 2015
  • 본 연구의 목적은 적외선 분광스펙트럼 데이터를 이용하여 대두 종자내의 지방산 함량을 동시에 예측할 수 있는지 여부를 조사하기 위한 것이다. 총 153종의 대두(Glycine max Merrill) 종자로부터 적외선 분광스펙트럼 및 지방산의 함량을 기체크로마토그라피 분석을 통하여 확인하였다. 적외선 분광스펙트럼 조사결과 대두는 단백질이나 아미노산의 amide bond region ($1,700{\sim}1,500cm^{-1}$), 핵산이나 인지질의 phosphodiester groups ($1,500{\sim}1,300cm^{-1}$) 그리고 탄수화물 등 다당류의 sugar region ($1,200{\sim}1,000cm^{-1}$)에서 계통별로 큰 차이가 이루어짐을 알 수 있었다. 총 29라인의 대두 계통별 시료로부터 지방산 함량을 조사한 결과 총 지방산의 함량은 건조 시료 0.1 g 당 $185.57{\mu}g$에서 $325.9{\mu}g$으로 계통간에 차이가 있었음을 알 수 있었으며 평균 함량은 $244.48{\mu}g$이었다. PLS regression 분석을 이용하여 총 5개 지방산(팔미틱산, 스테아릭산, 올레익산, 리노레익산 그리고 리노레닉산) 함량 예측 calibration models의 실측 검증 결과, 팔미틱산($R^2=0.8002$), 올레익산($R^2=0.8909$) 그리고 리노레익산($R^2=0.815$)은 회귀분석 상관계수가 0.8 이상으로 정확도 높음을 알 수 있었다. 그러나 스테아릭산($R^2=0.4598$)과 리노레닉산($R^2=0.6868$)의 경우 상관계수가 0.7 이하로 상대적으로 예측정확도가 낮음을 알 수 있었다. 본 연구에서 확립된 기술은 지방산의 조성 변환을 통하여 새로운 대두 품종 개발을 위한 계통선발 과정에서 매우 효율적인 수단으로 활용이 가능할 것으로 사료된다. 더 나아가 본 기술은 대두는 물론 대두 유래 농산물이나 식품의 품질 검증 수단으로 활용이 가능할 것으로 기대된다.

경시적 영과잉 가산자료와 생존자료의 결합모형 (A joint modeling of longitudinal zero-inflated count data and time to event data)

  • 김동욱;천지훈
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1459-1473
    • /
    • 2016
  • 시간의 흐름에 따라 관측되는 경시적(longitudinal) 자료의 경우, 경시적 자료와 생존(survival) 자료가 종종 동시에 수집된다. 이 때 경시적 자료에서 발생하는 결측이 생존자료와의 연관성으로 인해 발생한 무시할 수 없는 결측(non-ignorable missing)이라면, 경시적 자료분석 방법만으로는 두 자료 간의 연관성을 고려하지 않아 독립변수에 대한 효과는 편향된 결과를 얻게 된다. 이러한 문제를 해결하기 위해서 결측의 원인이 생존시간과 연관되어 있으므로 생존모형을 고려하여 불편추정량을 얻기 위해 경시적 자료와 생존자료의 결합모형에 대한 연구가 이루어져 왔다. 본 논문은 경시적 자료의 형태가 영이 많이 존재하는 영과잉 가산자료(zero-inflated count data)와 생존자료의 결합모형을 연구하였다. 경시적 영과잉 가산자료와 생존자료는 각각 허들모형(hurdle model)과 비례위험모형(proportional hazards model)의 부 모형을 적용하였고, 두 부 모형들의 변량효과가 다변량 정규분포를 따른다는 가정을 통하여 결합하였다. 모수의 최우추정법으로 EM 알고리즘을 활용하였고, 추정된 표준오차를 계산하기 위해 프로파일 우도(profile likelihood)를 이용하였다. 최종적으로 모의실험을 통해 두 부 모형의 변량효과 간 상관관계가 존재하는 경우 결합모형이 개별적 모형보다 편의와 포함확률(coverage probability)의 측면에서 더 우수함을 보였다.

라이다 파장 분석 방법론에 대한 연구 (Analysis Method for Full-length LiDAR Waveforms)

  • 정명희;윤의중;김천식
    • 전자공학회논문지CI
    • /
    • 제44권4호통권316호
    • /
    • pp.28-35
    • /
    • 2007
  • 최근 중요한 매핑기술이 된 LiDAR(Light Detection And Ranging)는 다른 수치표고자료 획득 기법에 비해 높은 정확도와 세밀한 밀도를 가지고 있어 3차원 모델링에 필요한 높이정보를 제공한다. 이러한 시스템의 가장 중요한 작업은 디지털화된 리턴 펄스의 모양을 이해하여 수신권내의 반사되어 오는 시간을 측정하여 이와 대응되는 표면 위치를 계산하고 이를 지리좌표와 연결시키는 것이다. 디지털화된 파형(waveform)은 수신권내의 지표 형태에 따라 다른데 처음 발생된 펄스와 같은 단일 모드이거나 수신권내에 여러 표면이 있는 경우 각 반사 표면에 해당하는 여러 모드로 구성된 복잡한 파형일 수 있다. 자료처리 과정에서 반사표면에 대해 일관성 있는 거리측정 지점을 찾기 위해서는 리턴 파장에서 각 모드의 중심위치나 피크 진폭의 위치를 찾아내는 방법이 필요하다. 복잡한 파장의 경우에는 여러 개의 반사지점에 대해 정확한 높이를 계산해 내는 것이 쉽지 않은데 이를 위해 각 모드가 수신권내의 반사 표면에서 레이저 에너지가 반사되는 분포를 나타낸다고 가정하고 리턴 파장을 각 구성 모드로 분해하는 방법이 제안되었다. 이때 분석을 단순화하기 위해 레이저 출력 펄스 모양이 가우시안 분포를 따른다고 가정하고 전체 리턴 파장을 다변량 가우시안(multivariate Gaussian) 분포를 이용하여 분석한다. 여기서는 혼합분포에서 정확한 피크 위치와 half-width와 같이 모형의 파라미터에 대한 추정치를 구하기 위해 EM 알고리즘을 적용하여 MLE 값을 구하였다. 그러나 실제 레이저 고도계에서 얻어진 데이터는 가우시안이 아닌 오른쪽으로 기울어진 분포를 보여주고 있어 응용분야에 따라 정확한 분석이 필요한 경우 이러한 펄스 모양을 고려한 방법이 필요하다. 본 연구에서는 이러한 펄스 모양을 처리하기 위한 새로운 방법론이 제시되어 있다.