• 제목/요약/키워드: Backpropagation

검색결과 591건 처리시간 0.024초

사출성형공정에서 CAE 기반 품질 데이터와 실험 데이터의 통합 학습을 통한 인공지능 품질 예측 모델 구축에 대한 연구 (A study on the construction of the quality prediction model by artificial neural intelligence through integrated learning of CAE-based data and experimental data in the injection molding process)

  • 이준한;김종선
    • Design & Manufacturing
    • /
    • 제15권4호
    • /
    • pp.24-31
    • /
    • 2021
  • In this study, an artificial neural network model was constructed to convert CAE analysis data into similar experimental data. In the analysis and experiment, the injection molding data for 50 conditions were acquired through the design of experiment and random selection method. The injection molding conditions and the weight, height, and diameter of the product derived from CAE results were used as the input parameters for learning of the convert model. Also the product qualities of experimental results were used as the output parameters for learning of the convert model. The accuracy of the convert model showed RMSE values of 0.06g, 0.03mm, and 0.03mm in weight, height, and diameter, respectively. As the next step, additional randomly selected conditions were created and CAE analysis was performed. Then, the additional CAE analysis data were converted to similar experimental data through the conversion model. An artificial neural network model was constructed to predict the quality of injection molded product by using converted similar experimental data and injection molding experiment data. The injection molding conditions were used as input parameters for learning of the predicted model and weight, height, and diameter of the product were used as output parameters for learning. As a result of evaluating the performance of the prediction model, the predicted weight, height, and diameter showed RMSE values of 0.11g, 0.03mm, and 0.05mm and in terms of quality criteria of the target product, all of them showed accurate results satisfying the criteria range.

A computational estimation model for the subgrade reaction modulus of soil improved with DCM columns

  • Dehghanbanadaki, Ali;Rashid, Ahmad Safuan A.;Ahmad, Kamarudin;Yunus, Nor Zurairahetty Mohd;Said, Khairun Nissa Mat
    • Geomechanics and Engineering
    • /
    • 제28권4호
    • /
    • pp.385-396
    • /
    • 2022
  • The accurate determination of the subgrade reaction modulus (Ks) of soil is an important factor for geotechnical engineers. This study estimated the Ks of soft soil improved with floating deep cement mixing (DCM) columns. A novel prediction model was developed that emphasizes the accuracy of identifying the most significant parameters of Ks. Several multi-layer perceptron (MLP) models that were trained using the Levenberg Marquardt (LM) backpropagation method were developed to estimate Ks. The models were trained using a reliable database containing the results of 36 physical modelling tests. The input parameters were the undrained shear strength of the DCM columns, undrained shear strength of soft soil, area improvement ratio and length-to-diameter ratio of the DCM columns. Grey wolf optimization (GWO) was coupled with the MLPs to improve the performance indices of the MLPs. Sensitivity tests were carried out to determine the importance of the input parameters for prediction of Ks. The results showed that both the MLP-LM and MLP-GWO methods showed high ability to predict Ks. However, it was shown that MLP-GWO (R = 0.9917, MSE = 0.28 (MN/m2/m)) performed better than MLP-LM (R =0.9126, MSE =6.1916 (MN/m2/m)). This proves the greater reliability of the proposed hybrid model of MLP-GWO in approximating the subgrade reaction modulus of soft soil improved with floating DCM columns. The results revealed that the undrained shear strength of the soil was the most effective factor for estimation of Ks.

Using Artificial Neural Network in the reverse design of a composite sandwich structure

  • Mortda M. Sahib;Gyorgy Kovacs
    • Structural Engineering and Mechanics
    • /
    • 제85권5호
    • /
    • pp.635-644
    • /
    • 2023
  • The design of honeycomb sandwich structures is often challenging because these structures can be tailored from a variety of possible cores and face sheets configurations, therefore, the design of sandwich structures is characterized as a time-consuming and complex task. A data-driven computational approach that integrates the analytical method and Artificial Neural Network (ANN) is developed by the authors to rapidly predict the design of sandwich structures for a targeted maximum structural deflection. The elaborated ANN reverse design approach is applied to obtain the thickness of the sandwich core, the thickness of the laminated face sheets, and safety factors for composite sandwich structure. The required data for building ANN model were obtained using the governing equations of sandwich components in conjunction with the Monte Carlo Method. Then, the functional relationship between the input and output features was created using the neural network Backpropagation (BP) algorithm. The input variables were the dimensions of the sandwich structure, the applied load, the core density, and the maximum deflection, which was the reverse input given by the designer. The outstanding performance of reverse ANN model revealed through a low value of mean square error (MSE) together with the coefficient of determination (R2) close to the unity. Furthermore, the output of the model was in good agreement with the analytical solution with a maximum error 4.7%. The combination of reverse concept and ANN may provide a potentially novel approach in designing of sandwich structures. The main added value of this study is the elaboration of a reverse ANN model, which provides a low computational technique as well as savestime in the design or redesign of sandwich structures compared to analytical and finite element approaches.

Visual Explanation of a Deep Learning Solar Flare Forecast Model and Its Relationship to Physical Parameters

  • Yi, Kangwoo;Moon, Yong-Jae;Lim, Daye;Park, Eunsu;Lee, Harim
    • 천문학회보
    • /
    • 제46권1호
    • /
    • pp.42.1-42.1
    • /
    • 2021
  • In this study, we present a visual explanation of a deep learning solar flare forecast model and its relationship to physical parameters of solar active regions (ARs). For this, we use full-disk magnetograms at 00:00 UT from the Solar and Heliospheric Observatory/Michelson Doppler Imager and the Solar Dynamics Observatory/Helioseismic and Magnetic Imager, physical parameters from the Space-weather HMI Active Region Patch (SHARP), and Geostationary Operational Environmental Satellite X-ray flare data. Our deep learning flare forecast model based on the Convolutional Neural Network (CNN) predicts "Yes" or "No" for the daily occurrence of C-, M-, and X-class flares. We interpret the model using two CNN attribution methods (guided backpropagation and Gradient-weighted Class Activation Mapping [Grad-CAM]) that provide quantitative information on explaining the model. We find that our deep learning flare forecasting model is intimately related to AR physical properties that have also been distinguished in previous studies as holding significant predictive ability. Major results of this study are as follows. First, we successfully apply our deep learning models to the forecast of daily solar flare occurrence with TSS = 0.65, without any preprocessing to extract features from data. Second, using the attribution methods, we find that the polarity inversion line is an important feature for the deep learning flare forecasting model. Third, the ARs with high Grad-CAM values produce more flares than those with low Grad-CAM values. Fourth, nine SHARP parameters such as total unsigned vertical current, total unsigned current helicity, total unsigned flux, and total photospheric magnetic free energy density are well correlated with Grad-CAM values.

  • PDF

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

인공신경망을 이용한 해안 조위예측 (Prediction of Shore Tide level using Artificial Neural Network)

  • 이경훈;문병석;김태경;오종양
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2005년도 학술발표회 논문집
    • /
    • pp.1068-1072
    • /
    • 2005
  • 조석이란, 해면의 완만한 주기적 승강을 말하며, 보통 그 승강은 1일 약 2회이나, 곳에 따라서는 1일 1회의 곳도 있다. 조석에 있어서는 이 밖에 수일의 주기를 갖는 약간 불규칙한 승강, 반년, 또는 1년을 주기로 하는 다소 규칙적인 승강까지 포함하여 취급한다. 그러나, 각 항만마다 갖는 특정적인 주기인 수분내지 수십분의 주기의 승강은 조석으로 취급하지 않는다. 조석은 해양의 제현상 중에서 예측가능성이 가장 큰 현장으로 이는 조석이 천체의 운행과 연관되기 때문이다. 조석이란 지구로부터 일정한 거리에서 각 고유의 속도를 가지는 적도상을 운행하는 무수의 가상천체에 기인하는 규칙적인 개개의 조석을 합성한 것이며 이 개개의 조석을 분조(Constituent)라 한다. 여기에서 사용되는 신경망 모형은 입력과 출력으로 구성되는 블랙박스 모형으로서 하나의 시스템을 병렬적으로 비선형적으로 구축할 수 있다는 장점 때문에 과거 하천유역의 강우-유출과정에서의 경우 유출현상을 해석하고 유출과정을 모형화 하기 위해 사용하였다. 본 연구에서는 기존의 조위 예측방법인 조화분석법이 아닌 인공신경망을 이용하여 조위예측을 실시하였다. 학습이라는 최적화 과정을 통해 구조와 기능이 복잡한 자연현상을 그대로 받아들여 축적시킴으로써 이를 지식으로 현상에 대한 재현능력이 뛰어나고, 또한 신경회로망의 연상기억능력에 적용하여 수학적으로 표현이 불가능한 불확실한 조위곡선에 적용하기에 유리한 장점을 가지고 있다. 본 연구의 목적은 과거 조위이론을 통해 이루었던 조위예측을 우리가 알기 쉬운 여러 기후인자(해면기압, 풍향, 풍속, 음력 등)에 따른 조위곡선을 예측하기 위해 신경망 모형을 이용하여 여수지역의 조위에 적용하여 비교 분석하고자 한다. May가 제안한 공식을 더 확장하여 적용할 수 있는 실험 공식으로 개선하였으며 다양한 조건에 대한 실험을 수행하여 보다 정밀한 공식으로 개선할 수 있었다.$10,924m^3/s$ 및 $10,075m^3/s$로서 실험 I의 $2,757m^3/s$에 비해 통수능이 많이 개선되었음을 알 수 있다.함을 알 수 있다. 상수관로 설계 기준에서는 관로내 수압을 $1.5\~4.0kg/cm^2$으로 나타내고 있는데 $6kg/cm^2$보다 과수압을 나타내는 경우가 $100\%$로 밸브를 개방하였을 때보다 $60\%,\;80\%$ 개방하였을 때가 더 빈번히 발생하고 있으므로 대상지역의 밸브 개폐는 $100\%$ 개방하는 것이 선계기준에 적합한 것으로 나타났다. 밸브 개폐에 따른 수압 변화를 모의한 결과 밸브 개폐도를 적절히 유지하여 필요수량의 확보 및 누수방지대책에 활용할 수 있을 것으로 판단된다.8R(mm)(r^2=0.84)$로 지수적으로 증가하는 경향을 나타내었다. 유거수량은 토성별로 양토를 1.0으로 기준할 때 사양토가 0.86으로 가장 작았고, 식양토 1.09, 식토 1.15로 평가되어 침투수에 비해 토성별 차이가 크게 나타났다. 이는 토성이 세립질일 수록 유거수의 저항이 작기 때문으로 생각된다. 경사에 따라서는 경사도가 증가할수록 증가하였으며 $10\% 경사일 때를 기준으로 $Ro(mm)=Ro_{10}{\times}0.797{\times}e^{-0.021s(\%)}$로 나타났다.천성 승모판 폐쇄 부전등을 초래하는 심각한 선

  • PDF

기업부도예측을 위한 인공신경망 모형에서의 사례선택기법에 의한 데이터 마이닝 (Data Mining using Instance Selection in Artificial Neural Networks for Bankruptcy Prediction)

  • Kim, Kyoung-jae
    • 지능정보연구
    • /
    • 제10권1호
    • /
    • pp.109-123
    • /
    • 2004
  • 기업부도예측은 재무와 경영의사결정문제에서의 주된 인공신경망 응용분야라 할 수 있다. 일반적으로 인공신경망은 이 분야에서 매우 좋은 성과를 보이는 것으로 알려져 있지만 종종 잡음이 심한 데이터에 대해서는 일관성 있고 예측가능한 성과를 보이지 못하는 경우가 있다. 특히 학습용 자료가 매우 많아서 학습시간과 자료수집비용이 과대한 경우에는 적절한 자료의 축소가 되지 않고는 인공신경망을 학습시키는 것이 불가능한 경우도 있다. 사례선택기법은 자료의 차원을 축약시켜 주며 직접적으로 자료를 축소시켜 주는 방법이다. 사례기반 학습기법에서는 이미 몇 연구가 사례선택기법의 필요성을 주장한 바 있으나 인공신경망 모형에서 사례선택기법의 필요성을 주장한 연구는 거의 없다. 본 연구에서는 기업부도예측을 위한 인공신경망 모형에서 유전자 알고리즘을 이용한 사례선택기법을 제안한다. 본 연구에서 유전자 알고리즘은 다층 인공신경망에서의 계층별 연결강도를 최적화하고, 동시에 학습에 적합한 사례를 선택한다. 유전자 알고리즘에 의해 결정된 계층별 연결강도는 역전파오류 학습기법에서 종종 발생하는 국부 최적해에 수렴하는 현상을 최소화해 줄 것으로 기대되고, 선택된 학습용 사례는 학습시간의 단축과 예측성과를 향상시켜 줄 것으로 기대된다. 본 연구에서는 제안한 모형과 주요 데이터 마이닝 기법들의 성과를 비교 연구한다. 실험결과, 제안된 방법이 인공신경망에서의 사례선택기법으로 유용한 것으로 나타났다.

  • PDF

인공지능과 국토정보를 활용한 노인복지 취약지구 추출방법에 관한 연구 (A Study on the Methodology of Extracting the vulnerable districts of the Aged Welfare Using Artificial Intelligence and Geospatial Information)

  • 박지만;조두영;이상선;이민섭;남한식;양혜림
    • 지적과 국토정보
    • /
    • 제48권1호
    • /
    • pp.169-186
    • /
    • 2018
  • 급속한 고령화 사회에서 노인인구가 갖는 사회적 영향력은 더욱 가속화될 것이다. 본 연구에서는 인공지능 방법론 중 머신러닝, 인공신경망, 국토정보 분석을 통해 노인복지 취약지구를 추출하는 방법론을 정립하는데 목적을 두었다. 분석방향 정립을 위해 65세 이상 노인, 공무원, 노인복지 시설물 담당자와 인터뷰 후 방향을 설정하였다. 경기도 용인시를 대상으로 500 m 공간단위 벡터 기반 격자에 15분 이내 지리적 거리 수용력, 노인복지 향유도, 공시지가, 이동통신 기반 노인활동을 지표로 설정하였다. 10단계 군집형성 후 모의학습 결과 RBF 커널 알고리즘을 활용한 머신러닝 서포트 벡터머신에서 83.2%의 예측정확도가 나타났다. 그리고 역전파 알고리즘을 활용한 인공신경망에서 높은 상관성 결과(0.63)가 나타났다. 변수간 공간적 자기상관성을 분석하기 위해 지리적 가중회귀분석을 수행했다. 분석결과 결정계수가 70.1%로 모형으로 나타나 설명력이 우수한 것으로 나타났다. 변수의 공간적 이상값 여부와 분포패턴을 검토하기 위해 국지적인 공간적 자기상관성 지수인 Moran's I 계수와 Getis-Ord Gi 계수를 분석하였다. 분석결과 용인시 신도시인 수지 기흥구에서 노인복지 취약지구가 발생하는 특성을 보였다. 본 연구의 인공지능 모의방법과 국토정보 분석의 연계는 최근 정부의 지역여건을 고려한 노인복지 불균형을 해결하는데 활용될 수 있을 것이다.

오프라인 필기체 한글 자소 인식에 있어서 특징성능의 비교 (Comparison of Feature Performance in Off-line Hanwritten Korean Alphabet Recognition)

  • 고태석;김종렬;정규식
    • 인지과학
    • /
    • 제7권1호
    • /
    • pp.57-74
    • /
    • 1996
  • 본 논문에서는 근래의 필기체 한글인식에서 상요되고 있는 특징들의 인식 성능을 비교한다.본 연구는 인식률 뿐만 아니라 인식시스템의 효율성을 향상시키기 위한 특징 선택의 기반을 마련함에 그 목적이 있다.특징성능 비교를 위해 그 특징들의 특성들을 분석하였고,그 특성에 따라 특징들을 전역적 특징(영상변환,통계적 특징,지역/위상적 특징의 3가지 종류로 분류하였다.각 종류별로 한글 자소 특징을 나타내는데 적합한 특징들을 4-5가지씩 선정하였고,인식실험을 한글의 초성자음,횡모음,종모음별로 수행하였다. 실험에 사용된 인식기로는 오류역전파 알고리즘으로 학습된 은닉층이 하나인 다층 퍼셉트론이 사용되었다.실험에 사용된 학습 및 시험용 데이타는 PE92중 30벌이다.실험결과를 보면,1)지역/위상적 특징들이 다른 종류의 특징들보다 인식 성능이 우수하였으며,2) 통계적 특징 중에서는 망 특징과 투영특징이,전역적인 특징들 중에서는 왈쉬특징과 DCT특징이,지역/위상적 특징에서는 윤곽선 위상변화 특징과 오목성 특징이 각각 성능이 우수하였다.

  • PDF

신경망을 이용한 퍼지 규칙 생성과 추론망 구축 (Fuzzy Rule Generation and Building Inference Network using Neural Networks)

  • 이상령;이현숙;오경환
    • 한국지능시스템학회논문지
    • /
    • 제7권3호
    • /
    • pp.43-54
    • /
    • 1997
  • 퍼지 시스템의 구현에 있어 가장 어려운 과정 중 하나는 정확한 지식의 획득이다. 이는 퍼지 시스템의 응용 영역이 커지고 그 응용 영역의 입출력 변수가 많아질수록 전문가가 그 변수들 간의 관계를 정확히 파악하는 것이 어렵교, 더구나 복잡한 시스템의 제어 과정을 언어 변수를 표현하는 것이 전문가에게 힘든 일이기 때문이다. 또 하나의 어려운 고정은 퍼지 변수의 적절한 소속함수 정의와 조정이다. 그래서 기존의 언어 변수를 포함하는 퍼지 규칙을 사용하여 설계된 퍼지 시스템에서는 기술된 퍼지 규칙들이 시스템의 특성을 제대로 반영하도록 퍼지 변수의 소속 함수 모양을 조정하는 작업을 필요로 한다. 본 논문에서는 기존의 퍼지 시스템 구현에 있어서 어려운 과정인 지식 획득과 소속함수 정의부분의 개선을 위한 새로운 퍼지 시스템 구현 방법으로 코호넨 신경망과 역전파 신경망을 이용한 퍼지 규칙 자동 생성과 추론망 구축 방법을 제안한다. 제안된 방법은 시스템의 입력과 출력으로 구성된 데이터들로부터 퍼지 규칙을 신경망의 학습기능을 이용하여 자동 생성한다. 또한 데이터 변수간의 퍼지 관계에 기반을 두고 추론이 이루어지므로 각 퍼지변수에 대한 소속 함수 정의가 필요 없게 된다. 따라서 퍼지 시스템의 구현이 쉽게 이루어질 수 있다. 실험에서는 제안된 방법으로 자동차 정속 주행을 위한 추론만을 구축하고 실험차의 단독 주행의 여러 상황을 고려한 모의 주행 실험을 통해 새로운 방법의 타당성을 보인다.

  • PDF