• 제목/요약/키워드: Cross-Validation Approach

검색결과 130건 처리시간 0.023초

우리나라에서 일최심신적설의 추정을 위한 인공신경망모형의 활용 (Application of Artificial Neural Network for estimation of daily maximum snow depth in Korea)

  • 이건;이동률;김동균
    • 한국수자원학회논문집
    • /
    • 제50권10호
    • /
    • pp.681-690
    • /
    • 2017
  • 본 연구에서는 우리나라 전역에 대하여 인공신경망 기법을 사용하여 일최심신적설을 추정하였다. 인공신경망 모형 구조를 시행 착오법을 이용하여 설계한 결과, 입력자료는 일 최저 기온, 일 평균 기온, 강수량으로 정하였고, 은닉층과 노드의 수는 각각 1층, 10개로 정하였다. 관측값을 인공신경망의 입력자료로 활용하는 경우, 교차검증 상관계수는 0.87로 Ordinary Kriging기법을 활용하여 일최신심적설을 공간보간한 경우의 교차검증상관계수인 0.40보다 크게 높았다. 미계측 지역의 일최심신적설을 추정하는 경우의 인공신경망 모형의 성능을 알아보기 위하여 인공신경망 모형의 입력자료들을 Ordinary Kriging으로 공간보간하여 일최심신적설을 추정하였다. 이 경우 교차검증 상관계수는 0.49였다. 또한 해발 고도 200 m 이상의 산지에서의 인공신경망의 성능은 나머지 지역인 평지에서의 성능보다 다소 떨어짐을 확인하였다. 본 연구의 이러한 결과는 우리나라 전역에 걸친 정확한 적설량의 즉각적인 산정에 인공신경망 모형이 효과적으로 활용될 수 있음을 의미한다.

Comparison of genome-wide association and genomic prediction methods for milk production traits in Korean Holstein cattle

  • Lee, SeokHyun;Dang, ChangGwon;Choy, YunHo;Do, ChangHee;Cho, Kwanghyun;Kim, Jongjoo;Kim, Yousam;Lee, Jungjae
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제32권7호
    • /
    • pp.913-921
    • /
    • 2019
  • Objective: The objectives of this study were to compare identified informative regions through two genome-wide association study (GWAS) approaches and determine the accuracy and bias of the direct genomic value (DGV) for milk production traits in Korean Holstein cattle, using two genomic prediction approaches: single-step genomic best linear unbiased prediction (ss-GBLUP) and Bayesian Bayes-B. Methods: Records on production traits such as adjusted 305-day milk (MY305), fat (FY305), and protein (PY305) yields were collected from 265,271 first parity cows. After quality control, 50,765 single-nucleotide polymorphic genotypes were available for analysis. In GWAS for ss-GBLUP (ssGWAS) and Bayes-B (BayesGWAS), the proportion of genetic variance for each 1-Mb genomic window was calculated and used to identify informative genomic regions. Accuracy of the DGV was estimated by a five-fold cross-validation with random clustering. As a measure of accuracy for DGV, we also assessed the correlation between DGV and deregressed-estimated breeding value (DEBV). The bias of DGV for each method was obtained by determining regression coefficients. Results: A total of nine and five significant windows (1 Mb) were identified for MY305 using ssGWAS and BayesGWAS, respectively. Using ssGWAS and BayesGWAS, we also detected multiple significant regions for FY305 (12 and 7) and PY305 (14 and 2), respectively. Both single-step DGV and Bayes DGV also showed somewhat moderate accuracy ranges for MY305 (0.32 to 0.34), FY305 (0.37 to 0.39), and PY305 (0.35 to 0.36) traits, respectively. The mean biases of DGVs determined using the single-step and Bayesian methods were $1.50{\pm}0.21$ and $1.18{\pm}0.26$ for MY305, $1.75{\pm}0.33$ and $1.14{\pm}0.20$ for FY305, and $1.59{\pm}0.20$ and $1.14{\pm}0.15$ for PY305, respectively. Conclusion: From the bias perspective, we believe that genomic selection based on the application of Bayesian approaches would be more suitable than application of ss-GBLUP in Korean Holstein populations.

근적외선 분광법과 머신러닝을 이용한 메꽃과(Convolvulaceae) 식물의 분류 (Classification of Convolvulaceae plants using Vis-NIR spectroscopy and machine learning)

  • 이용호;손수인;홍선희;김창석;나채선;김인순;장민상;오영주
    • 환경생물
    • /
    • 제39권4호
    • /
    • pp.581-589
    • /
    • 2021
  • 본 연구는 메꽃과 6종의 식물에 대해 신속하고 비파괴적으로 분류하기 위해 근적외선(Vis-NIR) 스펙트럼을 이용하였고 데이터의 전처리와 머신러닝 기술을 적용하였다. 전국적으로 분포하는 메꽃과 6종에 대해 야외에서 휴대용 분광기를 이용하여 판별하였다. 식물의 잎의 표면에서 400~1,075 nm의 근적외선 스펙트럼(1.5 nm)을 수집하였다. 수집된 스펙트럼 데이터는 3가지의 전처리와 raw데이터를 이용하였고 4종류의 머신러닝 모델을 적용하여 높은 판별 정확도를 확인하였다. 전처리와 머신러닝 모델의 조합을 통해 분석된 판별의 정확도는 43~99%의 범위로 분석되었고, standard normal variate 전처리와 support vector machine 머신러닝 모델의 조합에서 판별 정확도가 98.6%로 가장 높게 나타났다. 본 연구에서 수집된 스펙트럼은 식물의 성장단계, 다양한 측정 지역 및 잎에서의 측정 위치 등과 같은 요인과 더불어 데이터 분석을 위한 조건으로 최적의 전처리와 머신러닝 기술을 적용한다면 메꽃과 식물의 야외에서의 정확한 분류가 가능하고 이들 식물의 효과적인 관리와 모니터링에 활용할 수 있을 것으로 판단되었다.

플랜트 설비 문서로부터 설비사양 추출 및 유사설비 사양 교차 검증 접근법 (A Method for Extracting Equipment Specifications from Plant Documents and Cross-Validation Approach with Similar Equipment Specifications)

  • 이재현;최승언;서효원
    • 한국산업정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.55-68
    • /
    • 2024
  • 플랜트 엔지니어링 기업은 서로 다른 공종별 부서에서 플랜트 공정/설비/파이프/계장 등 각 관련 분야의 요구사항 문서를 작성하거나 참조하게 된다. 공정 관련 요구사항 문서는 공정에 대한 설명과 함께 이를 운영할 설비 또는 관련 시설의 요구사항들을 포함한다. 각 공종별 문서에 기술된 설비 또는 부품에 관련된 요구사항과 사양 정보는 문서의 작성자와 검토자들이 다르기 때문에 상호 간에 불일치가 발생할 가능성이 있다. 이 사항들에 대한 일치성을 확인하는 것은 전체 플랜트 설계 정보의 신뢰도를 높일 수 있다. 하지만, 문서의 양이 방대하고 서로 다른 문서들에 동일한 설비 부품에 대한 요구사항들이 일반 문장 형태로 흩어져 있기에 이를 사람이 추적하여 관리하는 것은 한계가 있다. 본 논문에서는 서로 다른 문서들 내에 기술된 요구사항 문장들을 분석하여 설비 또는 설비 부품과 관련된 요구사항 문장의 유사도를 계산하여 의미적으로 동일한 문장을 찾아내는 방법을 제안한다. 요구사항 문장의 유사도를 계산하기 위하여 의미적으로 요구사항의 중심이 되는 부품과 속성을 개체명 인식 방법을 활용하여 찾아내고, 찾아진 부품과 속성들의 유사도를 계산하여 두문장이 의미적으로 동일함을 판단하는 방법을 제안한다. 플랜트 현장에서 사용하는 문서의 문장들을 예제로 하여 제안하는 방법을 설명하고 실험 결과를 설명한다.

위성 자료와 수치모델 자료를 활용한 스태킹 앙상블 기반 SO2 지상농도 추정 (Monitoring Ground-level SO2 Concentrations Based on a Stacking Ensemble Approach Using Satellite Data and Numerical Models)

  • 최현영;강유진;임정호;신민소;박서희;김상민
    • 대한원격탐사학회지
    • /
    • 제36권5_3호
    • /
    • pp.1053-1066
    • /
    • 2020
  • 이산화황(SO2)은 대기 중 화학 반응을 통해 2차 대기오염물질을 생성하는 전구체로, 주로 산업활동이나 주거 및 교통 활동 등을 통해 배출된다. 장기간 노출 시 호흡기 질환이나 심혈관 질환 등을 유발하여 인체 건강에 부정적인 영향을 미칠 수 있기 때문에 이에 대한 지속적인 모니터링이 필요하다. 우리나라에서는 SO2에 대해 관측소 기반의 모니터링이 수행되고 있으나 이는 공간적으로 연속적인 정보를 제공하는 데에 한계가 있다. 따라서, 본 연구에서는 위성자료와 수치모델 자료를 융합하여 일별 13시를 타겟으로 하는 1 km의 고해상도로 공간적으로 연속적인 SO2 지상농도를 산출하였다. 2015년 1월부터 2019년 4월까지의 기간 동안 남한 지역에 대하여 스태킹 앙상블 기법을 이용하여 SO2 지상농도 추정 모델을 개발하였다. 스태킹 앙상블 기법이란 여러가지 기계학습 기법을 두 단계로 쌓는 방식으로 융합하여 단일 모델 대비 더 향상된 성능을 도출하는 방법이다. 본 연구에서는 베이스 모델로는 RF (Random Forest)와 XGB (eXtreme Gradient BOOSTing) 기법이, 메타 모델로는 MLR (Multiple Linear Regression) 기법이 사용되었다. 구축된 모델의 교차검증 결과 메타 모델은 상관계수(R) = 0.69와 root-mean-squared-error(RMSE) = 0.0032 ppm의 결과를 보였으며 이는 베이스 모델의 평균 대비 약 25% 향상된 안정성을 보였다. 또한 모델 구축에 사용되지 않은 기간에 대한 예측 검증을 수행하여 모델의 일반화 가능성을 평가하였다. 구축된 모델을 이용하여 남한 지역의 SO2 지상농도 공간분포를 분석한 결과 일반적인 계절성과 배출원의 변화를 잘 반영하는 패턴을 보임을 확인하였다.

Sentinel 위성영상과 기계학습을 이용한 국내산불 피해강도 탐지 (Wildfire Severity Mapping Using Sentinel Satellite Data Based on Machine Learning Approaches)

  • 심성문;김우혁;이재세;강유진;임정호;권춘근;김성용
    • 대한원격탐사학회지
    • /
    • 제36권5_3호
    • /
    • pp.1109-1123
    • /
    • 2020
  • 국토 대부분이 산림으로 구성되어 있는 대한민국은 매 년 많은 산불이 발생한다. 산불은 토양의 전단강도를 약화시켜 산사태에 취약한 토양층을 만들기도 하고, 수목의 복구가능여부에 따라 다른 계획 설립이 필요하기 때문에 산불피해면적 뿐만 아니라 피해강도에 대한 파악도 중요하다. 위성 원격탐사를 통한 산불피해강도 추정 연구가 많이 수행되어 왔으나, NDVI(Normalized Difference Vegetation Index)와 NBR(Normalized Burn Ratio) 등과 같은 단일 인자의 시계열 변화만을 이용하여 피해강도를 파악하기에는 한계가 있다. 본 연구에서는 Sentinel-1A SAR-C (Synthetic Aperture Radar-C)와 Sentinel-2A MSI(Multi Spectral Instrument)센서의 자료를 이용하여 기계학습방법을 통한 산불 피해강도 탐지 모델들을 제시하였다. 2017년 5월 삼척, 2019년 4월 강릉·동해, 2019년 4월 고성·속초 총 세개의 산불사례를 이용하여 RF(Random forest), LR(Logistic regression), SVM(Support Vector Machine)기계학습 모델을 구축하였다. 연구결과, random forest 모델이 82.3%의 총정확도로 가장 높은 성능을 보여주었다. 모델의 범용성 및 학습자료 민감도 확인을 위해 사례교차검증도 추가 시행하였는데, 그 결과 사례들의 시기적 차이에 의한 식생활력 및 재생도의 차이에 민감도가 높음을 확인하였다. 이는 추후 다양한 시공간적 사례를 추가할 시 개선이 될 것으로 보인다.

사회연결망분석과 인공신경망을 이용한 추천시스템 성능 예측 (Predicting the Performance of Recommender Systems through Social Network Analysis and Artificial Neural Network)

  • 조윤호;김인환
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.159-172
    • /
    • 2010
  • 협업필터링 추천은 다양한 분야에서 활용되고 있지만 트랜잭션 데이터의 성격에 따라 추천 성능에 현저한 차이를 보이고 있다. 기존 연구에서는 이러한 추천 성능의 차이가 나타나는 이유에 대한 설명을 구체적으로 제시하지 못하고 있고 이에 따라 추천 성능의 예측 또한 연구된 바가 없다. 본 연구는 사회네트워크분석과 인공신경망 모형을 이용하여 협업필터링 추천시스템의 성능을 예측하고자 한다. 본 연구의 목적을 달성하기 위해 국내 백화점의 트랜잭션 데이터를 기반으로 형성되는 고객간 사회 네트워크의 구조적 지표를 측정한 후 이를 기반으로 인공신경망 모형을 구축하고 검증한다. 본 연구는 협업필터링 추천 성능을 예측할 수 있는 새로운 모형을 제시하였다는 점에서 그 의의가 있으며 이를 통해 기업들의 협업필터링 추천시스템 도입에 대한 의사결정에 도움을 줄 수 있을 것으로 기대된다.

GOCI-II 대기상한 반사도와 기계학습을 이용한 남한 지역 시간별 에어로졸 광학 두께 산출 (Retrieval of Hourly Aerosol Optical Depth Using Top-of-Atmosphere Reflectance from GOCI-II and Machine Learning over South Korea)

  • 양세영;최현영;임정호
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.933-948
    • /
    • 2023
  • 대기 중 에어로졸은 인체에 악영향을 끼칠 뿐 아니라 기후 시스템에도 직간접적인 영향을 미치므로 에어로졸의 특성과 시공간적인 분포에 대한 이해는 매우 중요하다. 이를 위해 위성기반 관측을 통해 에어로졸 광학 두께(Aerosol Optical Depth, AOD)를 산출하여 에어로졸을 모니터링하는 다양한 연구가 수행되어 왔다. 하지만 이는 주로 조견표를 활용한 역 산출 알고리즘에 기반하여 이루어지기 때문에 많은 계산량을 요구하며 불확실성이 존재한다. 따라서, 본 연구에서는 Geostationary Ocean Color Imager-II (GOCI-II)의 대기상한반사도와 30일 동안의 대기상한반사도 중 최솟값과 관측 시점 값의 차이 값, 수치 모델 기반 기상학적 변수 등을 활용하여 기계학습 기반 고해상도 AOD 직접 산출 알고리즘을 개발하였다. Light Gradient Boosting Machine (LGBM) 기법이 사용되었으며, 추정된 결과는 지상 관측 자료인 Aerosol Robotic Network (AERONET) AOD를 활용하여 랜덤, 시간 및 공간별 N-fold 교차검증을 통해 검증되었다. 세 가지 교차검증 결과 R2=0.70-0.80, RMSE=0.08-0.09, 기대오차(Expected Error, EE) 안에 있는 비율은 75.2-85.1% 수준으로 안정적인 성능을 보였다. Shapley Additive exPlanations (SHAP) 분석에서는 반사도 관련 변수들이 기여도의 상위권 대부분을 차지하고 있는 것을 통해 반사도 자료가 AOD 추정에 많은 기여를 하는 것을 확인하였다. 서울과 울산 지역에 대한 시간 별 AOD의 공간 분포를 분석한 결과, 개발된 LGBM 모델은 시간의 흐름에 따라 AERONET AOD 값과 유사한 수준으로 AOD를 추정하고 있었다. 이를 통해 높은 시공간 해상도(i.e., 시간별, 250 m)에서의 AOD 산출이 가능함을 확인하였다. 또한, 산출 커버리지 비교에서 LGBM 모델의 평균 산출 빈도가 GOCI-II L2 AOD 산출물 대비 8.8%가량 증가한 것을 통해 기존 물리모델기반 AOD 산출 과정에서 발생하던 밝은 지표면에 대한 과도한 마스킹의 문제점을 개선시킨 것을 확인하였다.

연관지식의 효율적인 표현 및 추론이 가능한 지식그래프 기반 지식지도 (Knowledge graph-based knowledge map for efficient expression and inference of associated knowledge)

  • 유기동
    • 지능정보연구
    • /
    • 제27권4호
    • /
    • pp.49-71
    • /
    • 2021
  • 문제해결을 위해 지식을 활용하는 사용자는 내용 면에서 관련된 또 다른 지식, 즉 연관지식에 대한 교차적이고 순차적인 탐색을 진행한다. 지식지도는 관리하는 지식의 현황을 보여주는 도식이자 지식저장소의 분류체계로서, 지식 간 연관성에 기반한 사용자의 지식 탐색을 지원하는 도구이다. 따라서 지식지도는 지식 간 연관성에 의한 네트워크 형식으로 표현되며, 이를 정의 및 추론하는 데에 최적화된 기술을 접목하여 구현되어야 한다. 이를 위해 본 연구는 관리하는 개체와 개체 간 관계를 표현 및 추론하는 데에 최적화된 기능성을 발휘하는 것으로 알려진 그래프DB를 이용하여 지식그래프 기반 지식지도를 개발하는 방법론을 제시한다. 제시된 방법론의 유효성을 확인하기 위하여, 선행 연구의 온톨로지 기반 지식지도 구축 사례 데이터를 그래프DB에 적용하여 지식그래프 기반 지식지도를 구현하고, 구현된 지식 네트워크의 유효성과 Class 자동 구성 능력을 선행 연구의 결과와 비교하는 성능 테스트를 진행한다. 성능 테스트 결과, 본 연구의 지식그래프 기반 지식지도는 선행 연구의 온톨로지 기반 지식지도와 동일한 수준의 성능을 나타냈으며, 지식 및 지식 간 관계 정의 및 추론을 더욱 효율적으로 진행할 수 있음을 확인하였다. 본 연구의 결과는 연관지식에 대한 사용자의 인지과정을 반영한 지식 탐색 기능의 구현에 활용될 수 있으며, 추론에 의한 새로운 연관지식의 발견을 통해 자율적으로 확장되는 지능적 지식베이스의 개발에 응용될 수 있다.

전자파표면유속계의 측정 각도에 따른 평수기 유속 측정 정확도 분석 (Accuracy evaluation of microwave water surface current meter for measurement angles in middle flow condition)

  • 손근수;김동수;김경동;김종민
    • 한국수자원학회논문집
    • /
    • 제53권1호
    • /
    • pp.15-27
    • /
    • 2020
  • 하천 유량관측은 수자원의 관리를 위해 활용되는 기초적이고 대표적인 자료로 하천에서 정확한 유량을 관측하는 것은 중요하다. 따라서 최근에는 다양한 첨단 장비들이 개발되어 전통적인 하천의 유량관측을 대체하거나 보완하고 있다. 여러 최신 장비들 중 전자파표면유속계는 홍수기와 같이 하천에 접근하여 직접유량계측이 위험하고 정확도 확보가 어려울 경우전자파를 이용하여 비접촉식으로 유량을 계측하는 장비로 홍수기 및 평갈수기에도 하천 유량계측에 활용되기 시작하였다. 전자파표면유속계는 사용법이 간단하고 간접적으로 유속을 측정하기 때문에 기존의 직접측정 방법에 비해 안전한 장점이 있어 현재 국내에서는 홍수기 또는 접근이 어려운 하천의 유속 측정을 위해 사용되고 있다. 국내에서는 1993년 유량측정 장치 개발을 위해 전자파표면유속계(MWSCM; Microwave Water Surface Current Meter)를 개발을 연구를 수행하였고, 최근에는 국내에서 개발된 전자파표면유속계을 활용하여 유량측정을 위해 사용되고 있다. 하지만 국내에서 개발된 전자파표면유속계가 실제 하천에서 유속측정의 정확도에 대한 연구는 부족한 실정이다. 전자파표면유속계는 기기로부터 전자파를 이용해 유속을 측정하기 때문에 수직각과 편각과 같은 각도 변화에 따라 측정정확도가 바뀔 수 있고, 전자파표면유속계 본체에서 발사되는 전자파의 측정영역에 따라 유속측정에 오차가 발생할 수 있다. 본 연구에서는 국내에서 개발 전자파표면유속계의 측정정확도를 분석하기 위해서 실제하천과 유사한 실규모 하천수로에서 수직각과 편각을 변화시키며 측정을 수행하여 수직각과 편각에 변화에 따른 유속측정 정확도를 분석하였다. 그리고 전자파표면유속계의 측정영역의 고려를 통해서 측정영역에 따른 유속측정결과를 분석하였다. 유속측정 결과를 통해서 수직각 15° 이하에서는 유속측정의 오차가 커지게 되는 것으로 나타났고, 편각이 커질수록 유속측정의 결과의 변동계수가 커지는 것으로 나타났다. 그리고 편각에 따른 오차의 영향은 전자파표면유속계의 측정영역에 따라 결과가 달라지는 것으로 나타났다.