• 제목/요약/키워드: 기계 학습 알고리즘

검색결과 779건 처리시간 0.032초

건설현장 정형·비정형데이터를 활용한 기계학습 기반의 건설재해 예측 모델 개발 (Development of Machine Learning-based Construction Accident Prediction Model Using Structured and Unstructured Data of Construction Sites)

  • 조민건;이동환;박주영;박승희
    • 대한토목학회논문집
    • /
    • 제42권1호
    • /
    • pp.127-134
    • /
    • 2022
  • 현재 국내 건설업에서는 꾸준히 증가하는 건설재해를 예방하기 위해 다양한 정책적 노력과 연구가 활발하게 진행되고 있다. 기존 연구에서 건설재해 예방을 위해 개발한 예측 모델의 경우, 주로 정형데이터만을 활용하였기에 건설현장의 다양한 특성을 충분히 고려하지 못한 예측 결과가 도출되었다. 따라서, 본 연구에서는 정형데이터와 텍스트 형식의 비정형데이터를 동시에 활용하여 건설현장의 특성을 충분히 고려할 수 있는 기계학습 기반 건설재해 사전 예측 모델을 개발하였다. 본 연구는 기계학습을 위해 건설공사 안전관리 종합정보망(CSI)의 최근 3년간 건설재해 데이터 6,826건을 수집하였다. 수집된 데이터 중 정형데이터의 학습은 5가지 알고리즘의 성능 분석을 통해 Decision forest 알고리즘을 사용하였고 비정형데이터의 학습은 BERT 언어모델을 사용하였다. 정형 및 비정형데이터를 동시에 활용한 건설재해 예측 모델의 성능 비교 결과, 정형데이터만을 활용한 경우보다 약 20 % 향상된 95.41 %의 예측정확도가 도출되었다. 본 연구 결과, 비정형데이터를 동시에 활용함으로써 예측 모델의 효과적인 성능 향상을 확인하였으며, 보다 정확한 예측을 통한 건설재해 저감을 기대할 수 있다.

전문가의 형태소 분류를 활용한 과학 논증 자동 채점 (Automated Scoring of Scientific Argumentation Using Expert Morpheme Classification Approaches)

  • 이만형;유선아
    • 한국과학교육학회지
    • /
    • 제40권3호
    • /
    • pp.321-336
    • /
    • 2020
  • 본 연구는 실제 교실에서 이루어진 학생의 과학 논증과정을 기계학습을 활용한 자동 채점에 적용함으로써, 논증 자동 채점의 가능성 및 개선 방향을 탐색한다. 분자 구조에 대한 고등학생의 과학 논증수업 중 발생한 2,605개의 모든 발화를 대상으로 연구를 진행하였다. 지도 학습을 위해 5가지의 논증 요소로 발화를 분류하였고, 분류된 발화를 대상으로 텍스트 전처리를 수행하였다. 전처리된 학생 발화를 활용하여 서포트 벡터 머신, 의사결정나무, 랜덤 포레스트, 인공신경망의 기계 학습 방법으로 자동 채점 모델을 구성하였다. 불용어 처리가 되지 않은 학생 발화를 활용한 자동 채점의 결과 랜덤 포레스트의 정확도는 65.96%, kappa는 0.5298의 유미한 결과를 얻었다. 불용어 처리를 수행한 학생 발화를 활용한 새로운 채점 모델의 결과 채점의 정확도가 크게 변화하지 않음에도 논증 발화 중 과학 용어 및 논증 요소의 담화표지가 채점 모델의 분류 기준이 되는 결과를 얻었다. 또한 인간 전문가의 논증 채점 과정을 분석하여 얻어진 전문가 형태소를 자동 채점 모델에 생성 규칙 알고리즘으로 적용하였다. 그 결과 의사결정나무에서 반박에 대한 재현율(recall)이 21.74% 증가하였다. 이에 본 연구 결과는 과학 교육 연구에서 기계 학습 및 논증에 대한 자동 채점의 활용 가능성과 연구 방향성을 제안하였다.

기계학습 기반 접근관제구역 수용량 예측 모형 (Machine Learning Based Capacity Prediction Model of Terminal Maneuvering Area)

  • 한상혁;윤태경;김상현
    • 한국항공우주학회지
    • /
    • 제50권3호
    • /
    • pp.215-222
    • /
    • 2022
  • 항공교통흐름관리의 목적은 공항 및 공역의 수용량 안에서 항공교통 수요를 만족시키는 것이다. 그러므로 수용량을 정확하게 예측하는 것은 항공교통흐름관리의 성능에 많은 영향을 준다. 본 논문은 특정 공항의 예상 출·도착 수요, 시각, 기상 및 실제 처리한 항공기 대수 등 과거의 항공기운항 데이터를 기계학습의 한 방법론인 부스팅 앙상블 알고리즘으로 학습하여 시간당 출·도착하는 항공기의 수를 예측하는 회귀모형을 개발하였다. 기계학습을 통해 도출된 모델은 실제 인천국제공항의 출·도착 항공편 데이터를 이용해 검증하였으며, 결정계수가 0.95 이상으로 나타났다. 이 모델을 이용하여 접근관제구역의 수용량을 간접적으로 예측할 수 있었다.

SVM과 HMM을 이용한 $\alpha$-Helix 막횡단 단백질 예측 (Predicting Transmembrane $\alpha$-helix protein with SVM and HMM)

  • 송철환;유성준;김민경;설영주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.817-819
    • /
    • 2003
  • 현재 바이오인포매틱스(Bioinformatics) 분야에서 가장 중요한 부분 중의 하나는 유전자 및 단백질의 구조와 기능을 정확하게 예측하는 것이다. 이는 질병 치료 및 신약개발에 유용하여 이로부터 나온 결과로부터 경제적 산업적 효과를 기대할 수 있다. 이 논문에서는 기계학습(Machine Learning)의 한 분야인 SVM(Support Vector Machine)과 HMM(Hidden Markov Model)를 결합하여 단백질의 막횡단(Transmembrane) $\alpha$-Helix 단백질 지역을 예측하는 새로운 알고리즘을 개발, 구현 및 실험하였다. 그 결과 이 두 가지 알고리즘이 결합된 방식을 사용함으로써 성능을 향상 시킬 수 있음을 증명했다.

  • PDF

SQuAD를 활용한 MRC 알고리즘 성능 분석 연구 (A Study on Performance Analysis of MRC Algorithm Using SQuAD)

  • 임종혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.431-432
    • /
    • 2018
  • MRC(기계독해)는 Passage, Question, Answel 로 이루어진 Dataset 으로 학습된 모델을 사용하여 요청한 Question 의 Answer 를 같이 주어진 Passage 내에서 찾아내는 것을 목적으로 한다. 최근 MRC 시스템의 성능 측정 지표로 활용되는 SQuAD Dataset 을 활용하여 RNN 의 한 분류인 match-LSTM과 R-NET 알고리즘의 성능을 비교 분석하고자 한다.

심전도 및 맥파신호 기반의 감정인식 시스템에 관한 연구 (Research on the Emotion Recognition System based on Electrocardiograph and Pulse Signals)

  • 홍윤정;황윤경;신동규;김동현;신동일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.175-178
    • /
    • 2008
  • 본 논문은 생체 신호들 중 데이터 획득이 간편한 심전도와 맥파를 실시간으로 취득하여 기계학습 기법인 SVM (Support Vector Machine)알고리즘과 클러스터링 기법인 k-NN (Nearest Neighbor)알고리즘을 적용한 인간의 감정을 분석하는 시스템에 대한 연구결과를 제시한다.

유전 알고리즘을 이용한 천식과 단일염기다형성(SNP)의 연관성 (Detection of SNPs involved in the development of asthma with genetic algorithms)

  • 임상섭;김승현;위규범
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.605-608
    • /
    • 2007
  • 천식(Asthma)과 같은 복합질환(Complex Disease)의 원인과 작용 모델을 찾기 위해서 여러가지 통계적인 방법들과 기계 학습(Machine Learning)의 방법 등이 사용되고 있다. 본 연구에서는 유전 알고리즘을 이용하여 천식 환자와 대조군들을 분류할 수 있는 단일염기 다형성(SNP, Single Nucleotide Polymorphism)의 조합에 대하여 조사한다.

경계범주 자동탐색에 의한 확장된 학습체계 구성방법 (Construction Scheme of Training Data using Automated Exploring of Boundary Categories)

  • 최윤정;지정규;박승수
    • 정보처리학회논문지B
    • /
    • 제16B권6호
    • /
    • pp.479-488
    • /
    • 2009
  • 본 논문은 기존의 목표항목만을 위주로 한 학습체계에서 발생하는 오분류 문제의 해결을 위해 기존의 학습체계에 경계항목을 자동으로 탐 색하여 포함시켜 확대시키는 방법을 제안하고 있다. 여러 주제에 걸쳐 다양한 내용을 다루는 복잡한 문서들은 확실히 어느 범주로 분류해야 할 지 판가름하기 어려운 성질인 모호성이 강하다. 이러한 경우 모든 경우들을 정확히 구분할 수 있는 최적의 경계를 찾는 일은 더욱 어려운 일이 다. 복잡하고 불확실성이 높은 데이터들의 특징은 대부분 분류 경계영역에 위치하므로 이러한 분류경계의 데이터들을 새로운 학습 항목으로 인 식시키도록 하는 것이 필요하다. 본 연구에서는 주어진 목표항목 사이의 경계항목을 자동으로 탐색하여 학습체계에 추가하는 학습 체계 확장 알고리즘을 제시하고, 의도적인 학습오류를 발생시킨 후 기존방법과의 비교실험을 수행함으로써 제안방법의 정확성과 안정성을 비교하였다. 실 험결과 경계범주를 포함하여 학습 체계를 확장시켰을 때의 예측력은 기존 0.70에서 0.86으로 약 24% 향상 되었고, 오류를 포함시켰을 때의 예 측력은 기존 0.52에서 0.79로 약 49% 향상되었다.