• 제목/요약/키워드: Random process

검색결과 1,682건 처리시간 0.031초

기계 학습을 활용한 논증 수준 자동 채점 및 논증 패턴 분석 (Automated Scoring of Argumentation Levels and Analysis of Argumentation Patterns Using Machine Learning)

  • 이만형;유선아
    • 한국과학교육학회지
    • /
    • 제41권3호
    • /
    • pp.203-220
    • /
    • 2021
  • 이 연구는 과학적 논증 담화에 대한 자동 채점의 성능 개선 방향을 탐색하였으며, 자동 채점 모델을 활용하여 논증 담화의 양상과 패턴을 분석하였다. 이를 위해 과학적 논증 수업에서 발생한 학생 발화를 대상으로 논증 수준을 평가하는 자동 채점을 수행하였다. 이 자동 채점의 데이터셋은 4가지 단위의 논증 피처와 논증 수준 평가틀로 구성되었다. 특히, 자동 채점에 논증 패턴을 반영하기 위하여 논증 클러스터와 n-gram을 활용하였다. 자동 채점 모델은 3가지의 지도 학습 기법으로 구성되었으며, 그 결과 총 33개의 자동 채점 모델이 구성되었다. 자동 채점의 결과, 최대 85.37%, 평균 77.59%의 채점 정확도를 얻었다. 이 과정에서 논증 담화의 패턴이 자동 채점의 성능을 개선하는 주요한 피처임을 확인하였다. 또한, 의사결정 나무와 랜덤 포레스트의 모델을 통하여 과학적 논증 수준에 따른 논증의 양상과 패턴을 분석하였다. 이를 통하여 주장, 자료와 함께 정당화가 체계적으로 구성된 과학적 논증과 자료에 대한 활발한 상호작용이 이루어진 과학적 논증이 논증 수준의 발달을 이끈다는 점 등을 확인하였다. 이와 같은 자동 채점 모델의 해석은 논증 패턴을 분석하는 새로운 연구 방법을 제언하는 것이다.

품질경영에서 측정시스템분석 방안 (Approaches to measurement system analysis in quality management)

  • 백재욱
    • 산업진흥연구
    • /
    • 제6권3호
    • /
    • pp.19-24
    • /
    • 2021
  • 과학적 품질경영을 하기 위해서는 측정시스템에 문제가 없어야 한다. 이에 본 논문에서는 측정과정 중 측정결과에 영향을 미칠 수 있는 요인들이 무엇인지 확인하여 측정결과가 위치와 변동 면에서 문제점이 발생할 때 이를 야기하는 요인을 나열하고자 한다. 측정시스템의 변동은 크게 위치와 산포의 두 가지 속성으로 묘사되는데, 위치와 관련된 속성으로는 정확성, 안정성, 직선성이 있고, 산포와 관련된 속성으로는 재현성과 반복성이 있다. 측정시스템분석에서는 산포와 관련된 요소를 분석하는 것이 R&R분석인데, 여기서 반복성과 재현성의 크기는 여러 차례의 측정치간 차이인 범위와 측정자간 차이인 범위로 나타내며, 이들 범위를 이용한 99%의 산포로 그 크기를 파악한다. 측정시스템분석은 R&R분석이외에 실험계획을 활용하여 측정치의 변동을 유발하는 요인의 변동의 크기를 추정할 수 있다. 이때 변동을 야기하는 요인인 작업자와 제품이 랜덤요인인지 또는 고정요인인지 점검하여 그에 맞게 각 요인의 변동의 크기를 구해야 적절한 분석이 이루어진다.

사출성형공정에서 CAE 기반 품질 데이터와 실험 데이터의 통합 학습을 통한 인공지능 품질 예측 모델 구축에 대한 연구 (A study on the construction of the quality prediction model by artificial neural intelligence through integrated learning of CAE-based data and experimental data in the injection molding process)

  • 이준한;김종선
    • Design & Manufacturing
    • /
    • 제15권4호
    • /
    • pp.24-31
    • /
    • 2021
  • In this study, an artificial neural network model was constructed to convert CAE analysis data into similar experimental data. In the analysis and experiment, the injection molding data for 50 conditions were acquired through the design of experiment and random selection method. The injection molding conditions and the weight, height, and diameter of the product derived from CAE results were used as the input parameters for learning of the convert model. Also the product qualities of experimental results were used as the output parameters for learning of the convert model. The accuracy of the convert model showed RMSE values of 0.06g, 0.03mm, and 0.03mm in weight, height, and diameter, respectively. As the next step, additional randomly selected conditions were created and CAE analysis was performed. Then, the additional CAE analysis data were converted to similar experimental data through the conversion model. An artificial neural network model was constructed to predict the quality of injection molded product by using converted similar experimental data and injection molding experiment data. The injection molding conditions were used as input parameters for learning of the predicted model and weight, height, and diameter of the product were used as output parameters for learning. As a result of evaluating the performance of the prediction model, the predicted weight, height, and diameter showed RMSE values of 0.11g, 0.03mm, and 0.05mm and in terms of quality criteria of the target product, all of them showed accurate results satisfying the criteria range.

Predicting As Contamination Risk in Red River Delta using Machine Learning Algorithms

  • Ottong, Zheina J.;Puspasari, Reta L.;Yoon, Daeung;Kim, Kyoung-Woong
    • 자원환경지질
    • /
    • 제55권2호
    • /
    • pp.127-135
    • /
    • 2022
  • Excessive presence of As level in groundwater is a major health problem worldwide. In the Red River Delta in Vietnam, several million residents possess a high risk of chronic As poisoning. The As releases into groundwater caused by natural process through microbially-driven reductive dissolution of Fe (III) oxides. It has been extracted by Red River residents using private tube wells for drinking and daily purposes because of their unawareness of the contamination. This long-term consumption of As-contaminated groundwater could lead to various health problems. Therefore, a predictive model would be useful to expose contamination risks of the wells in the Red River Delta Vietnam area. This study used four machine learning algorithms to predict the As probability of study sites in Red River Delta, Vietnam. The GBM was the best performing model with the accuracy, precision, sensitivity, and specificity of 98.7%, 100%, 95.2%, and 100%, respectively. In addition, it resulted the highest AUC of 92% and 96% for the PRC and ROC curves, with Eh and Fe as the most important variables. The partial dependence plot of As concentration on the model parameters showed that the probability of high level of As is related to the low number of wells' depth, Eh, and SO4, along with high PO43- and NH4+. This condition triggers the reductive dissolution of iron phases, thus releasing As into groundwater.

시각 피질의 발화 특성 추출을 위한 포아송 모델의 부공간 해석 (Subspace analysis of Poisson Model to extract Firing Characteristics in Visual Cortex)

  • 이영석
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권1호
    • /
    • pp.1-7
    • /
    • 2022
  • 인간의 시각 피질을 구성하고 있는 시각 뉴런은 모든 시각적 자극에 반응하는 것이 아니라 특정한 조건을 갖춘 시각적 자극에 반응한다는 것이 생리학적 실험을 통하여 밝혀졌다. 본 연구에서는 이와 같은 생리학적 실험을 해석하기 위하여 랜덤한 이득을 갖는 선형 필터를 포함하는 뉴런의 발화 특성을 시뮬레이션하고 설명할 수 있는 모델을 제안하였고 또한 제안한 모델의 선형 필터의 출력이 전체 자극 데이터의 부공간을 형성하고 있음을 실험을 통하여 증명하였다. 구현된 모델의 타당성을 검증하기 위하여 서로 다른 4개의 시각적 자극 데이터들로부터 임의로 추출한 2개의 화소에 대한 값의 분포를 관찰하였다. 전체 자극 데이터와 스파이크 발화 자극 데이터의 분포로부터 중심 좌표 값 즉, 가장 많은 값이 분포하는 좌표 값을 추출하여 두 분포 사이의 차이를 확인할 수 있었고 구현된 모델이 전형적인 LNP 모델과 동일하게 전체 자극 데이터가 전체 집합일 경우 스파이크를 발생시키는 자극 데이터가 전체 자극 데이터의 부공간 임을 실험을 통하여 증명하였다. 본 연구는 시각적 자극에 대한 스파이크의 발생기전과 관련된 기초 연구로 활용할 수 있다.

중고거래 어플리케이션 <당근마켓> 리뷰텍스트에 나타난 소비자의 인성 함축단어 텍스트마이닝 분석 (Analysis of Text Mining of Consumer's Personality Implication Words in Review of Used Transaction Application )

  • 정예린;주영애
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.1-10
    • /
    • 2021
  • 본 연구는 중고거래 어플리케이션 <당근마켓>의 리뷰텍스트에 나타난 소비자의 인성 함축단어의 사용실태를 분석하였다. 데이터 수집은 2021년 5월로부터 과거 6개월간 서울과 경기권을 대상으로 하였다. 이는 웹 크롤러를 개발하여 무작위 추출 총 1368건을 수집 후, 최종 570건을 전처리하여 사용하였다. 결과는 다음과 같다. 첫째, 제품의 상거래 플랫폼임에도 리뷰텍스트의 48.2%는 소비자의 인성 관련 내용이었다. 둘째, 리뷰 텍스트는 긍정적 반응이 주를 이루며 이는 감사라는 키워드를 기반으로 텍스트 네트워크 구조를 형성하였다. 셋째, 소비자 인성을 함축하는 리뷰 텍스트는 소비자의 '대타적 인성'과' 대내적 인성'으로 그룹화되었고, 이는 플랫폼에서 통합적으로 작용하였다. 결론적으로 인성 관련 요인들이 플랫폼 거래 과정의 상호작용에서 중요한 역할을 함을 확인하였고, 앞으로 플랫폼의 서비스 품질에도 소비자의 인성이 경쟁력으로 작용할 것이므로, 이에 대해 다각도에서 연구되어야 할 것임을 제언하였다.

Synthetic data augmentation for pixel-wise steel fatigue crack identification using fully convolutional networks

  • Zhai, Guanghao;Narazaki, Yasutaka;Wang, Shuo;Shajihan, Shaik Althaf V.;Spencer, Billie F. Jr.
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.237-250
    • /
    • 2022
  • Structural health monitoring (SHM) plays an important role in ensuring the safety and functionality of critical civil infrastructure. In recent years, numerous researchers have conducted studies to develop computer vision and machine learning techniques for SHM purposes, offering the potential to reduce the laborious nature and improve the effectiveness of field inspections. However, high-quality vision data from various types of damaged structures is relatively difficult to obtain, because of the rare occurrence of damaged structures. The lack of data is particularly acute for fatigue crack in steel bridge girder. As a result, the lack of data for training purposes is one of the main issues that hinders wider application of these powerful techniques for SHM. To address this problem, the use of synthetic data is proposed in this article to augment real-world datasets used for training neural networks that can identify fatigue cracks in steel structures. First, random textures representing the surface of steel structures with fatigue cracks are created and mapped onto a 3D graphics model. Subsequently, this model is used to generate synthetic images for various lighting conditions and camera angles. A fully convolutional network is then trained for two cases: (1) using only real-word data, and (2) using both synthetic and real-word data. By employing synthetic data augmentation in the training process, the crack identification performance of the neural network for the test dataset is seen to improve from 35% to 40% and 49% to 62% for intersection over union (IoU) and precision, respectively, demonstrating the efficacy of the proposed approach.

Classification Model of Food Groups in Food Exchange Table Using Decision Tree-based Machine Learning

  • Kim, Ji Yun;Kim, Jongwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.51-58
    • /
    • 2022
  • 본 논문에서 우리는 기존 식품과 웹 크롤링으로 찾은 식품 데이터에 대해 기계학습으로 식품군을 분류하여 식품교환표를 갱신하기 위한 의사결정트리 기반의 기계학습 모델을 제안한다. 식품교환표는 영양 관리가 필요한 환자의 식이요법이나 다이어트 식단을 편성할 때 식품 교환 섭취에 사용된다. 식단의 기준이 되는 식품교환표는 국민건강영양조사를 통한 개정과정에서 많은 인력과 시간이 소요되어 새로운 식품이나 트렌드에 따른 식품 변화를 신속하게 반영하기 어렵다. 제안 기법은 기존의 식품군을 바탕으로 새롭게 추가되는 식품을 분류하기 때문에 식품의 트렌드를 반영한 식품교환표 구성이 가능하다. 연구에서 제안 모델로 식품을 분류한 결과, 식품교환표의 식품군에 대한 정확도가 97.45%로 나타났으며, 본 식품 분류 모델은 병원, 요양원 등에서 식단 구성에 활용도가 높을 것으로 전망된다.

SVM 기반 Bagging과 OoD 탐색을 활용한 제조공정의 불균형 Dataset에 대한 예측모델의 성능향상 (Boosting the Performance of the Predictive Model on the Imbalanced Dataset Using SVM Based Bagging and Out-of-Distribution Detection)

  • 김종훈;오하영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권11호
    • /
    • pp.455-464
    • /
    • 2022
  • 제조업의 공정에서 생성되는 데이터셋은 크게 두 가지 특징을 가진다. 타겟 클래스의 심각한 불균형과 지속적인 Out-of-Distribution(OoD) 샘플의 발생이다. 클래스 불균형은 SMOTE 및 다양한 샘플링 전략을 통해서 대응할 수 있다. 그러나, OoD 탐색은 현재까지 인공신경망 영역에서만 다뤄져 왔다. OoD 탐색의 적용이 가능한 인공신경망은 제조공정 데이터셋에 대해서 만족스러운 성능을 발현하지 못한다. 원인은 제조공정의 데이터셋이 인공신경망에서 일반적으로 다루는 이미지, 텍스트 데이터셋과 비교해서 크기가 매우 작고, 노이즈가 심하다는 것이다. 또한 인공신경망의 과적합(overfitting) 문제도 제조업 데이터셋에서 인공신경망의 성능을 저하하는 원인으로 지적된다. 이에 현재까지 시도된 바 없는 SVM 알고리즘과 OoD 탐색의 접목을 시도하였다. 또한 예측모델의 정밀도 향상을 위해 배깅(Bagging) 알고리즘을 모델링에 반영하였다.

다성분계 물성을 예측하기 위한 BaTiO3기반 계산과학 플랫폼 구축 (Establishment of a BaTiO3-based Computational Science Platform to Predict Multi-component Properties)

  • 이동건;이한욱;임원빈;고현석;조성범
    • 센서학회지
    • /
    • 제31권5호
    • /
    • pp.318-323
    • /
    • 2022
  • Barium titanate (BaTiO3) is considered to be a beneficial ceramic material for multilayer ceramic capacitor (MLCC) applications because of its high dielectric constant and low dielectric loss. Numerous attempts have been made to improve the physical properties of BaTiO3 in response to recent market trends by employing multicomponent alloying strategies. However, owing to its significant number of atomic combinations and unpredictable physical properties, finding a traditional experimental approach to develop multicomponent systems is difficult; the development of such systems is also time-consuming. In this study, 168 new structures were fabricated using special quasi-random structures (SQSs) of Ba1-xCaxTi1-yZryO3, and 1680 physical properties were extracted from first-principles calculations. In addition, we built an integrated database to manage the computational results, and will provide big data solutions by performing data analysis combined with AI modeling. We believe that our research will enable the global materials market to realize digital transformation through datalization and intelligence of the material development process.