• Title/Summary/Keyword: 데이터 선별

Search Result 576, Processing Time 0.029 seconds

Assessment of Linear Binary Classifiers and ROC Analysis for Flood Hazard Area Detection in North Korea (북한 홍수위험지역 탐지를 위한 선형이진분류법과 ROC분석의 적용성 평가)

  • Lee, Kyoung Sang;Lee, Dae Eop;Try, Sophal;Lee, Gi Ha
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.370-370
    • /
    • 2017
  • 최근 기후변화와 이상기후의 영향으로 인하여 홍수재해의 시 공간적 패턴은 보다 복잡해지고, 예측이 어려워지고 있다. 이러한 기상이변에 따른 홍수피해를 예방하기 위한 비구조적 대책으로 홍수위험등급 및 범람범위 등의 정보를 포함하고 있는 홍수위험지도의 작성이 필요하다. 실제로 고정밀도 홍수위험지도를 작성하기 위해서는 지형, 지질, 기상 등의 디지털 정보 및 사회 경제와 관련된 다양한 DB를 필요로 하며, 강우-유출-범람해석 모델링을 통해 범람면적 및 침수깊이 등의 정보를 획득하게 된다. 하지만 일부지역, 특히 개발도상국에서는 이러한 계측 홍수 데이터가 부족하거나 획득할 수가 없어 홍수위험지도 제작이 불가능하거나 그 정확도가 매우 낮은 실정이다. 따라서 본 연구에서는 ASTER 또는 SRTM과 같은 범용 DEM 등 지형자료만을 기반으로 한 선형이진분류법(Liner binary classifiers)과 ROC분석(Receiver Operation Characteristics)을 이용하여 미계측 유역 (DB부재 또는 부족으로 강우-유출-범람해석 모델링이 불가능한 북한지역)의 홍수위험지역을 탐지하고, 적용성을 평가하고자 한다. 5개의 단일 지형학적 지수와 6개의 복합 지형학적 지수를 이용하여 Area Under the Curve (AUC)를 계산하고, Sensitivity (민감도)와 Specificity (특이도)가 가장 높은 지수를 선별하여 홍수위험지도를 작성하고, 실제 홍수범람 영상(2007년 북한 함경남도지역 용흥강 홍수)과 비교 분석하였다. 본 연구에서 제시하는 선형이진분류법과 ROC분석 방법은 홍수범람해석을 위한 다양한 기초정보를 필요로 하지 않고, 지형정보만을 사용하기 때문에 관측 데이터가 없거나 부족한 지역에 대해서 우선적으로 홍수위험지역을 탐지하고, 선별하는데 유용할 것으로 판단된다.

  • PDF

Evaluation of Rainfall Erosivity Factor Estimation Using Machine and Deep Learning Models (머신러닝 및 딥러닝을 활용한 강우침식능인자 예측 평가)

  • Lee, Jimin;Lee, Seoro;Lee, Gwanjae;Kim, Jonggun;Lim, Kyoung Jae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.450-450
    • /
    • 2021
  • 기후변화 보고서에 따르면 집중 호우의 강도 및 빈도 증가가 향후 몇 년동안 지속될 것이라 제시하였다. 이러한 집중호우가 빈번히 발생하게 된다면 강우 침식성이 증가하여 표토 침식에 더 취약하게 발생된다. Universal Soil Loss Equation (USLE) 입력 매개 변수 중 하나인 강우침식능인자는 토양 유실을 예측할때 강우 강도의 미치는 영향을 제시하는 인자이다. 선행 연구에서 USLE 방법을 사용하여 강우침식능인자를 산정하였지만, 60분 단위 강우자료를 이용하였기 때문에 정확한 30분 최대 강우강도 산정을 고려하지 못하는 한계점이 있다. 본 연구의 목적은 강우침식능인자를 이전의 진행된 방법보다 더 빠르고 정확하게 예측하는 머신러닝 모델을 개발하며, 총 월별 강우량, 최대 일 강우량 및 최대 시간별 강우량 데이터만 있어도 산정이 가능하도록 하였다. 이를 위해 본 연구에서는 강우침식능인자의 산정 값의 정확도를 높이기 위해 1분 간격 강우 데이터를 사용하며, 최근 강우 패턴을 반영하기 위해서 2013-2019년 자료로 이용했다. 우선, 월별 특성을 파악하기 위해 USLE 계산 방법을 사용하여 월별 강우침식능인자를 산정하였고, 국내 50개 지점을 대상으로 계산된 월별 강우침식능인자를 실측 값으로 정하여, 머신러닝 모델을 통하여 강우침식능인자 예측하도록 학습시켜 분석하였다. 이 연구에 사용된 머신러닝 모델들은 Decision Tree, Random Forest, K-Nearest Neighbors, Gradient Boosting, eXtreme Gradient Boost 및 Deep Neural Network을 이용하였다. 또한, 교차 검증을 통해서 모델 중 Deep Neural Network이 강우침식능인자 예측 정확도가 가장 높게 산정하였다. Deep Neural Network은 Nash-Sutcliffe Efficiency (NSE) 와 Coefficient of determination (R2)의 결과값이 0.87로서 모델의 예측성을 입증하였으며, 검증 모델을 테스트 하기 위해 국내 6개 지점을 무작위로 선별하여 강우침식능인자를 분석하였다. 본 연구 결과에서 나온 Deep Neural Network을 이용하면, 훨씬 적은 노력과 시간으로 원하는 지점에서 월별 강우침식능인자를 예측할 수 있으며, 한국 강우 패턴을 효율적으로 분석 할 수 있을 것이라 판단된다. 이를 통해 향후 토양 침식 위험을 지표화하는 것뿐만 아니라 토양 보전 계획을 수립할 수 있으며, 위험 지역을 우선적으로 선별하고 제시하는데 유용하게 사용 될 것이라 사료된다.

  • PDF

A Feature Selection Technique for Multi-lingual Character Recognition (TV 제어 메뉴의 다국적 언어 인식을 위한 특징 선정 기법)

  • Kang, Keun-Seok;Park, Hyun-Jung;Kim, Ho-Joon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2005.11a
    • /
    • pp.199-202
    • /
    • 2005
  • TV OSD(On Screen Display) 메뉴 자동검증 시스템에서 다국적 언어의 문자 인식은 표준패턴의 구조적 분석이 쉽지 않을 뿐만 아니라 학습패턴 집합의 규모와 특징의 수가 증가함으로 인하여 특징추출 및 인식 과정에서 방대한 계산량이 요구된다. 이에 본 연구에서는 학습 데이터에 포함되는 다량의 특징 집합으로부터 인식에 필요한 효과적인 특징을 선별함으로써 패턴 분류기의 효율성을 개선하기 위한 방법론을 고찰한다. 이를 위하여 수정된 형태의 Adaboost 기법을 제안하고 이를 적용한 실험 결과로부터 그 유용성을 고찰한다. 제안된 알고리즘은 초기의 특징 집합을 취약한 성능을 갖는 다수의 분류기(classifier)로서 고려하며, 이로부터 반복학습을 통하여 개선된 분류기를 점진적으로 선별해 나가게 된다. 학습의 원리는 주어진 학습패턴 집합에 기초하여 일종의 교사학습(supervised learning) 방식으로 이루어진다. 각 패턴에 할당된 가중치 값은 각 단계에서 산출되는 분류결과에 따라 적응적으로 수정되어 반복학습이 진행됨에 따라 점차 보완적 성능을 갖는 분류기를 선택할 수 있게 한다. 즉, 주어진 각 학습패턴에 대하여 초기에 균등한 가중치가 부여되며, 반복학습의 각 단계에서 적용되는 분류기의 출력을 분석하여 오분류된 패턴의 가중치 분포를 증가시켜 나간다. 본 연구에서는 실제 응용으로서 OSD 메뉴검증 시스템을 대상으로 제안된 이론을 적용하고 그 타당성을 평가한다.

  • PDF

Odds ratio of major risk factors associated with delirium by Bayesian network (베이지안 네트워크를 활용한 정신장애 질병 섬망의 주요 위험인자와 오즈비)

  • Lee, Jea-Young;Choi, Young-Jin
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.2
    • /
    • pp.217-225
    • /
    • 2011
  • It is important to find risk factors associated with mental disorder. Also the hazard ratio that represent the relationship of risk factors with illness is main interest in medicine. Thus we used odds ratio to explore the relationship between mental disorder and risk factors. On this paper, when we applied Bayesian network to delirium of mental disorder, we selected major risk factors and calculated odds ratio. Especially we identified odds ratio of single risk factors and multiple risk factors.

Major gene interaction identification in Hanwoo by adjusted environmental effects (환경적인 요인을 보정한 한우의 우수 유전자 조합 선별)

  • Lee, Jea-Young;Jin, Mi-Hyun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.23 no.3
    • /
    • pp.467-474
    • /
    • 2012
  • Human diseases and livestock economic traits are not typically the result of variation of a single genetic locus, but are rather the result of interplay between interactions among multiple genes and a variety of environmental exposures. We have used linear regression model for adjusted environmental effects and multifactor dimensionality reduction (MDR) method to identify gene-gene interaction effect of statistical model in general. Of course, we use 5 SNPs (single uncleotide polymorphism) which were studied recently by Oh et al. (2011). We apply the MDR (multifactor demensionality reduction) method on the identify major interaction effects of single nucleotide polymorphisms responsible for economic traits in a Korean cattle population.

Develpment of Automatic Classification For Categorizing Recyclable Materials (딥러닝을 활용한 재활용 폐기물 선별 시스템 개발)

  • Park Seung Woo;Kim Hyung Don;Sim Sang Woo;Yoo, Seong Won;Kim Jae-Soo;Lee Sang Won;Jeon Woo jin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.739-740
    • /
    • 2023
  • 코로나19 의 여파로 생활 폐기물은 급속도로 늘어나는 반면 재활용 사업장의 여건은 개선되지 않고 있어 재활용 산업의 인력난 해결의 필요성이 떠오르고 있다. 이를 위해 본 논문에서는 딥러닝 모델을 활용하여 재활용 폐기물을 분류하는 방법을 제시한다. 딥러닝 모델은 최신 객체 탐지 모델인 YOLOv5를 사용하고, 객체 탐지 성능을 향상시키기 위해 실제 환경에서 수집된 학습용 데이터를 직접 라벨링하여 사용한다. 실험 결과 종류별 평균 0.69의 mAP50 스코어를 기록하였으며 이를 통해 딥러닝 모델을 활용하여 재활용 폐기물을 효율적으로 분류하는 것이 가능함을 확인하였다.

  • PDF

An Adaptive Recommendation System based on User Propensity (사용자 성향 기반 적응형 추천시스템)

  • Taehwan Kim;Seunghwa Lee;Jehwan Oh;Eunseok lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.68-71
    • /
    • 2008
  • 웹 상에 정보가 폭발적으로 증가함에 따라 각 사용자에게 맞는 정보를 선별하여 제공하는 개인화 서비스는 매우 중요한 이슈가 되었다. 기존 추천시스템들은 컨텐츠 기반 필터링과 협업 필터링 기법을 기반으로 한다. 그러나 이러한 방법들은 충분히 수집된 사용자 정보를 필요로 하기 때문에, 적절한 추천이 이루어지기 까지 다소 시간이 소요되는 문제를 가지고 있다. 또한 사용자의 성향이 지나치게 편중되는 경우, 사용자의 취향변화를 반영하여 새로운 상품을 추천하는 것은 어렵다. 실제로 사용자들은 웹 사이트의 방문 목적에 따라 개인화된 상품추천을 원하기도 하고, 많은 사용자들에게 인기 있는 상품을 원하기도 한다. 본 논문에서는 사용자의 행동분석을 기반으로, 협업 필터링을 기반으로 하는 개인화된 추천과 다수의 사용자들에게 공통적으로 인기 있는 상품의 추천 비율을 동적으로 조합하여 최종 추천 상품들을 선별하는 새로운 적응형 추천 시스템을 제안한다. 본 논문에서는 MovieLens의 데이터 셋을 이용하여 기존 추천기법들과 추천결과에 대한 정확도를 비교 실험하였으며, 보다 높은 정확도를 보이는 실험결과를 통해 제안시스템의 유효성을 확인하였다.

Contents-based Image Retrieval using Color and Invariant Moments (색상과 불변 모멘트를 이용한 내용기반 이미지 검색)

  • Kim, Mok-Ryun;Park, Young-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.161-164
    • /
    • 2007
  • 최근 인터넷과 멀티미디어 기술이 발달함에 따라 이미지 데이터의 양이 급속히 증가하고 있다. 증가하는 이미지를 효과적으로 관리하고 검색하기 위해 내용기반 이미지 검색에 대한 연구가 활발히 진행되고 있다. 대부분의 내용 기반 이미지 검색 시스템은 색상, 모양, 질감 특징을 이용한 유사도-기반검색에 초점을 맞추고 있다. 따라서 본 논문에서는 이미지에 나타나는 주요 색상과 색상의 공간적 특성을 포함하는 픽셀샘플링, 그리고 이미지의 외형적 변경에 강인함을 갖는 불변 모멘트 값을 이용한 내용기반 이미지 검색 시스템을 제안한다. 첫 번째 유사성 검사 단계에서는 이미지의 영역별로 가중치를 부여하여 추출한 대표색상을 사용하여, 유사하지 않은 이미지를 제거하여 검색대상의 수를 줄이며, 두 번째 유사성 검사 단계에서는 첫 번째 단계에서 선별된 후보 이미지에 색상의 공간적 정보를 포함한 픽셀샘플링을 이용하여 색상의 공간적인 위치까지 유사한 이미지만을 선별한다. 두 번째 유사성 검사단계에서 이미지가 외형적으로 변형된 유사이미지의 검출이 어려운 점을 보완하는 방법으로 이미지의 불변 모멘트를 이용하여 검색의 정확성을 높인다. 제안한 이미지 검색 방법은 10000개의 다양한 이미지로 구성된 데이터베이스에서 검색을 효율성을 실험하였다.

Design of VR Coordination system using 3D asset data (3D asset data를 사용한 VR Coordination system 설계)

  • Yeo, Chang Hyun;Park, Yong Je;Lee, Jae Won;Choi, Jae Won;Lee, Jeong Ho;Yoon, Seon Jeong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.07a
    • /
    • pp.107-109
    • /
    • 2016
  • 본 연구는 사용자의 신체 맞춤형 3D 가상모델에 VR을 이용한 패션 코디네이션이 가능하도록 설계한 시스템을 제안한다. 특별히 사용자의 신체 각 부위의 정보에 따라 3D모델을 조정할 수 있으며 의상데이터는 3D asset Database에서 최적의 조건으로 선별되어 VR 환경에서 코디네이션이 가능하도록 설계되었다. 따라서 사용자에게 가장 적합한 의상 정보를 현실감 있게 제공하여 만족도를 높일 것으로 기대한다. 본 시스템은 온오프라인에서 모두 활용 가능하며 가상 패션쇼, 가상 디자인, 패션 교육 등에 연계 가능하다.

  • PDF

Collection, Analysis and Classification of Pathological Voice from ARS using Neural Network (ARS와 신경회로망을 이용한 장애음성의 수집, 분석 및 식별에 관한 연구)

  • 김광인;조철우;김대현;왕수건;전계록;안시훈;김기련;김용주
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.955-958
    • /
    • 2000
  • 본 논문은 음성신호를 이용해 성대의 질환이 있는 환자를 진단하고 병명을 판별하게끔 유도하는 자동 진단 시스템을 개발하기 위한 연구의 일부로, 그중 ARS를 이용하여 환자의 음성을 수집, 분석, 식별의 실험에 대한 연구이다. 본 연구 팀에서는 이미 CSL을 이용한 장애음성 데이터의 수집과 식별에 관한 연구 결과를 발표한바 있다. 하지만 선행연구에서는 방음실에서 디지털 녹음기를 이용하여 수집한 음성을 사용했기 때문에, ARS를 통하여 녹음한 음성과는 샘플링 주파수나 대역폭, 잡음성분등의 데이터의 특성이 상당한 차이가 있다. 이러한 이유로 ARS를 통하여 녹음한 음성에 보다 적합한 파라미터 분석프로그램을 작성하여 파라미터를 구하였다. 이 파라미터들은 Kay사의 MDVP를 기초로하여 작성하였고, 대부분 80%정도의 신뢰성을 가졌다. 수집한 음성의 식별은 정상음성과 양성음성의 두가지 경우로 분리하였다. 식별기법으로는 신경망을 이용하였고, 식별파라미터는 구한 파라미터중 6개의 파라미터를 선별하여 식별한 결과 약 90%정도의 식별율을 가졌다.

  • PDF