• 제목/요약/키워드: 평가 데이터셋

검색결과 470건 처리시간 0.024초

수치지형도 일반화를 위한 도로 네트워크 데이터의 선택 기법 연구 (The Selection Methodology of Road Network Data for Generalization of Digital Topographic Map)

  • 박우진;이영민;유기윤
    • 한국측량학회지
    • /
    • 제31권3호
    • /
    • pp.229-238
    • /
    • 2013
  • 지도 일반화 기법을 이용하여 대축척 지도자료로부터 소축척 지도자료를 생산하기 위한 방법론 개발은 수치지형도의 제작, 갱신 등의 관리에 있어서 매우 중요하다. 본 연구에서는 수치지형도의 도로와 같은 네트워크 형태의 객체를 일반화하기 위한 하나의 단계인 선택 기법을 제안, 적용하였다. 이를 위해, 기존의 1:5,000 축척과 1:25,000 축척의 수치지형도를 상호 비교하여 도로 네트워크 객체의 선택과 관련된 기준(선택 객체의 개수, 상대적 중요도) 들을 T$\ddot{o}$pfer의 radical 법칙과 Logit 모형을 이용하여 분석하였다. 여기서 분석된 결과를 바탕으로 하여 테스트 데이터에 대해 선택 모델을 적용하여 1:5,000 수치지형도 도로중심선 레이어로부터 일반화된 1:18,000, 1:72,000 축척의 네트워크 데이터셋을 도출하였다. 일반화된 결과에 대하여 정성적, 정량적 평가를 실시한 결과, 상대적으로 높은 중요도를 가진 네트워크 객체들이 목표 축척수준에 맞게 적절히 선택된 결과를 나타내었다.

SWAT: 분산 인-메모리 시스템 기반 SWRL과 ATMS의 효율적 결합 연구 (SWAT: A Study on the Efficient Integration of SWRL and ATMS based on a Distributed In-Memory System)

  • 전명중;이완곤;바트셀렘;박현규;박영택
    • 정보과학회 논문지
    • /
    • 제45권2호
    • /
    • pp.113-125
    • /
    • 2018
  • 최근 빅데이터의 시대가 도래하여 다양한 분야로부터 다량의 지식을 얻을 수 있다. 수집된 지식은 정형화된 형태의 지식으로 가공하여 표현되며, 그 중 W3C의 온톨로지 표준 언어인 OWL이 대표적인 정형화 표현 형식이다. 이렇게 표현된 대용량의 온톨로지로부터 내재된 정보를 도출하기 위해 다양한 방법의 심볼릭 추론(Symbolic Reasoning) 연구가 활발하게 진행되고 있다. 그러나 대부분의 추론 연구들은 서술논리(Description Logic)표현 기반의 제한적인 규칙표현을 지원하며 실생활 기반의 서비스를 구축하기에는 많은 제약이 따른다. 또한 잘못된 지식으로부터 도출된 결과는 규칙들 사이의 종속관계에 따라 연쇄적으로 잘못된 지식이 생산될 수 있기 때문에 이러한 잘못된 지식에 대한 처리를 위한 지식관리가 필요하다. 따라서 본 논문에서는 해당 문제를 해결하기 위해 SWRL(Semantic Web Rule Language) 기반의 추론과 ATMS(Assumption-based Truth Maintenance System)간의 결합을 통해 새롭게 도출된 지식에 대한 관리를 할 수 있는 SWAT(SWRL + ATMS) 시스템을 제안한다. 또한 이 시스템은 대용량 데이터를 처리하기 위해 분산 인-메모리 프레임워크 기반의 SWRL추론과 ATMS를 병합 구축하였으며 이를 바탕으로 웹 형태의 ATMS 모니터링 시스템을 통하여 사용자가 손쉽게 잘못된 지식을 검색 및 수정할 수 있도록 한다. 본 논문에서 제안하는 방법에 대한 평가를 위해 LUBM(Lehigh University Benchmark)데이터 셋을 사용하였으며, 대용량 데이터에 대한 SWRL 추론과 잘못 추론된 정보에 대한 삭제를 통해 효율적인 추론과 관리가 가능한 결합 방법임을 증명한다.

기계학습을 이용한 기업가적 혁신성 예측 모델에 관한 연구 (Machine Learning for Predicting Entrepreneurial Innovativeness)

  • 정두희;윤진섭;양성민
    • 벤처창업연구
    • /
    • 제16권3호
    • /
    • pp.73-86
    • /
    • 2021
  • 이 연구의 목적은 기업가적 혁신성을 정확하게 예측하는 고도화된 분석 모델을 탐색하는 것이다. 기업가정신 연구 분야에서는 최초로, 데이터 과학적 접근방식에 해당되는 기계학습(Machine learning)을 이용해 기업가적 혁신성(entrepreneurial innovativeness)을 예측하는 모델을 제시한다. 예측모델을 구축하기 위하여 Global Entrepreneurship Monitor(GEM)의 62개국 22,099건 데이터를 이용한다. 27개 설명변수로 이뤄진 데이터 셋을 토대로 전통적 통계방법인 다중회귀분석과, 회귀트리, 랜덤포레스트, XG부스트, 인공신경망 등 기계학습을 이용한 예측모델을 구축하고 각 모델의 성능을 비교한다. 모델의 성능 평가를 위해 RMSE(Root mean square error), MAE(Mean absolute error)와 상관관계(Correlation) 등 지표를 사용한다. 분석 결과 5가지 기계학습 기반 모델은 모두 전통적 방법에 비해 우수한 성능을 보였으며, 예측 성능이 가장 좋은 모델은 XG부스트였다. XG부스트를 통한 기업가적 혁신성 예측에 있어서 기여도가 높은 변수는 창업가의 기회인지 및 시장 확장의 교차항 변수이며, 이는 신시장에서 기회를 획득하고자 하는 유형의 창업기업이 높은 혁신성을 보인다는 점을 확인했다. 이 연구는 고도화된 분석방법인 기계학습을 이용해 새로운 예측모델을 제시, 기업가정신 연구의 시야를 확장했다는 점에서 의의를 지닌다.

Yolov4와 전이학습을 기반으로한 실시간 철강 표면 결함 검출 연구 (Real-time Steel Surface Defects Detection Appliocation based on Yolov4 Model and Transfer Learning)

  • 김복경;배준희;환;이용은;옥영석
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.31-41
    • /
    • 2022
  • 철강은 기계 산업의 가장 기본적인 구성 요소 중 하나이다. 그러나 철강의 표면 결함은 제품의 품질에 큰 영향을 미친다. 따라서 연구자들은 표면 결함 감지기의 필요성에 주목하고 딥 러닝을 이용한 방법은 객체 결함 감지를 하는데 많이 사용된다. 연구 개발용으로 학습 모델 개발에 초점을 맞추지만 실제 산업환경에 실질적인 영향을 미치는 실시간 적용은 아직 적용되지 않는 한계와 개선의 여지가 필요하다. 본 연구는 YOLOv4를 기반으로 한 철강 표면 결함 감지의 실시간 적용을 제안한다. 첫째, 본 연구는 실시간 응용 모델을 적용하는 것을 목적으로 하며 실시간 객체 검출기의 가장 유명한 알고리즘 중 하나인 one-stage Detector의 YOLO 알고리즘을 중심으로 연구를 진행하였다. 둘째, 사전 훈련된 YOLOv4-Darknet 플랫폼 모델과 전이학습을 사용하여 철강 표면 오픈 소스 데이터셋 NEU-DET을 이용하여 학습과 테스트를 진행하였다. 본 연구에서는 철강 표면의 패치, 구멍 난 표면, 불순물, 스크래치 4가지 유형의 결함을 이용하였다. 셋째, 87.1% mAP@0.5의 정확도와 60fps 이상의 시스템 구축을 위해 YOLOv4를 이용하여 훈련된 모델의 실시간 성능을 평가하였다.

Lexicon transducer를 적용한 conformer 기반 한국어 end-to-end 음성인식 (Conformer with lexicon transducer for Korean end-to-end speech recognition)

  • 손현수;박호성;김규진;조은수;김지환
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.530-536
    • /
    • 2021
  • 최근 들어 딥러닝의 발달로 인해 Hidden Markov Model(HMM)을 사용하지 않고 음성 신화와 단어를 직접 매핑하여 학습하는 end-to-end 음성인식 방법이 각광을 받고 있으며 그 중에서도 conformer가 가장 좋은 성능을 보이고 있다. 하지만 end-to-end 음성인식 방법은 현재 시점에서 어떤 자소 또는 단어가 나타날지에 대한 확률에 대해서만 초점을 두고 있다. 그 이후의 디코딩 과정은 현재 시점에서 가장 높은 확률을 가지는 자소를 출력하거나 빔 탐색을 사용하며 이러한 방식은 모델이 출력하는 확률 분포에 따라 최종 결과에 큰 영향을 받게 된다. 또한 end-to-end 음성인식방식은 전통적인 음성인식 방법과 비교 했을 때 구조적인 문제로 인해 외부 발음열 정보와 언어 모델의 정보를 사용하지 못한다. 따라서 학습 자료에 없는 발음열 변환 규칙에 대한 대응이 쉽지 않다. 따라서 본 논문에서는 발음열 정보를 담고 있는 Lexicon transducer(L transducer)를 이용한 conformer의 디코딩 방법을 제안한다. 한국어 데이터 셋 270 h에 대해 자소 기반 conformer의 빔 탐색 결과와 음소 기반 conformer에 L transducer를 적용한 결과를 비교 평가하였다. 학습자료에 등장하지 않는 단어가 포함된 테스트 셋에 대해 자소 기반 conformer는 3.8 %의 음절 오류율을 보였으며 음소 기반 conformer는 3.4 %의 음절 오류율을 보였다.

인공지능 기법을 이용한 조영제 부작용 예측 연구 (Contrast Media Side Effects Prediction Study using Artificial Intelligence Technique)

  • 김상현
    • 한국방사선학회논문지
    • /
    • 제17권3호
    • /
    • pp.423-431
    • /
    • 2023
  • 본 연구의 목적은 환자의 신체정보와 인공지능 기법을 활용하여 부작용에 영향을 미치는 인자들을 분석하고 조영제 부작용의 정도를 예측하여 이를 완화하는 기초자료로 활용되고자 한다. 연구에 사용한 데이터는 서울 소재 종합병원의 검진을 시행한 CT 검사 58,000건 중 조영제 부작용이 발생한 1,235건 중 과거력 조사에서 조영제 부작용이 없었던 606명의 검사자를 대상자로 하였다. 606개 샘플 중 70%는 훈련 셋으로 사용하고 나머지 30%는 검증을 위한 테스트 셋으로 사용하였다. 나이, BMI(Body Mass Index), GFR(Glomerular Filtration Rate), BUN(Blood Urea Nitrogen), GGT(Gamma Glutamyl Transgerase), AST(Aspartate Amino Transferase,), and ALT(Alanine Amiono Transferase)의 feature를 독립변수로 조영제 중증도를 목표변수로 사용하였다. AdaBoost, Tree, Neural network, SVM, Random foest 알고리즘을 통해 AUC(Area under curve), CA(Classification Accuracy), F1, Precision, Recall을 파악하였다. 분류 예측에 사용된 알고리즘 중 가장 높은 평가지표를 나타내 것은 AdaBoost와 Random Forest이다. 모든 모델의 예측에서 가장 큰 요인은 GFR, BMI, GGT 이였다. 이는 신장 여과 기능, 비만에 따라 주입되는 조영제 양의 차이와 대사증후군의 여부에 따라 조영제 부작용 중증도에 영향을 미치는 것을 알 수 있었다.

Swin Transformer와 Sentinel-1 영상을 이용한 우리나라 저수지의 수체 탐지 (Waterbody Detection for the Reservoirs in South Korea Using Swin Transformer and Sentinel-1 Images)

  • 최소연;윤유정;강종구;김서연;정예민;임윤교;서영민;김완엽;최민하;이양원
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.949-965
    • /
    • 2023
  • 본 연구에서는 Sentinel-1 synthetic aperture radar 영상을 활용하여 딥러닝 모델인 Swin Transformer로 국내 농업용 저수지의 수표면적을 모니터링 하는 방법을 제시한다. Google Earth Engine 플랫폼을 이용하여 70만톤 급, 90만톤급, 150만톤급 저수지 7개소에 대한 2017년부터 2021년 데이터셋을 구축하였다. 저수지 4개소에 대한 영상 1,283장에 대해서 셔플링(suffling) 및 5-폴드(fold) 교차검증 기법을 적용하여 모델을 학습하였다. 시험평가 결과 모델의 윈도우 크기를 12로 설정한 Swin Transformer Large 모델은 각 폴드에서 평균적으로 99.54%의 정확도와 95.15%의 mean intersection over union (mIoU)을 기록하여 우수한 의미론적 분할 성능을 보여주었다. 최고 성능을 보여준 모델을 나머지 3개소 저수지 데이터셋에 적용하여 성능을 검증한 결과, 모든 저수지에서 정확도 99% 및 mIoU 94% 이상을 달성함을 확인했다. 이러한 결과는 Swint Transformer 모델이 국내의 농업용 저수지의 수표면적 모니터링에 효과적으로 활용될 수 있음을 보여준다.

토지 보상비 결정 요인 분석 - 건설CALS 데이터 중심으로 (Analysis on the Determinants of Land Compensation Cost: The Use of the Construction CALS Data)

  • 이상규;서명배;김진욱
    • 한국산학기술학회논문지
    • /
    • 제21권10호
    • /
    • pp.461-470
    • /
    • 2020
  • 본 연구는 건설 전주기 (기획, 설계, 시공, 관리) 과정에서 생성되는 건설 CALS(Continuous Acquisition & Life-Cycle Support) 시스템 내의 데이터 셋 (443개)을 활용하여 토지보상비에 영향을 주는 주요 결정 요인을 분석한다. 해당 분석을 위해 기존 토지 비용 관련 연구에서 활용된 주요 변수를 활용하였다. 이를 기반으로 8개 (토지면적, 개별 공시지가, 감정평가액, 지목, 용도지역 1, 지형 고저, 지형 형상, 도로 접면)의 주요 변수를 활용하였다. 더불어, 해당 변수는 기계학습 알고리즘 기반의 Xgboost 알고리즘을 통해 변수별 중요도 평가를 진행하였고, 해당 변수 중, 개별공시지가가 가장 중요도가 높은 변수로 확인하였다. 토지보상비 결정 요인에 대한 분석 및 검증을 위해 선형다중회귀분석을 사용하였다. 검증을 위해 구성되는 변수로 종속변수는 개별공시지가 변수를 활용하였고, 독립변수는 연속형 변수 1개 (면적), 범주형 변수는 5개 (지목, 용도지역1, 지형고저, 지형형상, 도로접면)를 활용하였다. 본 연구의 모델에 대한 검증결과, 지목, 용도지역 1, 도로접면에 대한 독립 변수가 유의미한 것으로 확인하였다.

FPGA에서 에너지 효율이 높은 데이터 경로 구성을 위한 계층적 설계 방법 (A Model-based Methodology for Application Specific Energy Efficient Data path Design Using FPGAs)

  • 장주욱;이미숙;;최선일
    • 정보처리학회논문지A
    • /
    • 제12A권5호
    • /
    • pp.451-460
    • /
    • 2005
  • 본 논문은 ffGA상에서 에너지 효율이 높은 데이터 경로 설계 방법론을 제안한다. 에너지, 처리시간, 그리고 면적간의 트레이드오프를 이해하기 위하여, 도메인 특성 모델링, coarse-grained 성능평가, 설계공간 조사, 그리고 로우-레벨 시뮬레이션 과정들을 통합한다. 도메인 특성 모델링 기술은 도메인의 특성에 따른 시스템 전체의 에너지 모에 영향을 미치는 여러 가지 구성요소와 파라미터들을 식별함으로써 하이-레벨 모델을 명시한다. 도메인이란 주어진 어플리케이션 커널의 알고리즘에 대응하는 아키텍쳐 패밀리이다. 하이-레벨 모델 또한 에너지, 처리시간 그리고 면적을 예측하는 함수들로 구성되어 트레이드오프 분석을 용이하게 한다. 설계 공간 조사(DSE)는 도메인에 명시된 설계 공간을 분석하여 설계 셋을 선택하도록 한다. 로우-레벨 시뮬레이션은 설계 공간 조사(DSE)에 의해 선택된 설계와 최종 선택된 설계의 정확한 성능평가를 위하여 사용된다. 본 논문에서 제안한 설계 방법은 매트릭스 곱셈에 대응하는 알고리즘과 아키텍쳐 패밀리를 사용한다. 제안된 방법에 의해 검증된 설계는 에너지, 처리시간과 면적간의 트레이드오프를 보인다. 제안된 설계 방법의 효율성을 보이기 위하여 Xilinx에서 제공되는 매트릭스 곱셈 커널과 비교하였다. 성능 비교 메트릭으로 평균 전력 밀도(E/AT)와 에너지 대 (면적 x 처리시간)비를 사용하였다. 다양한 문제의 크기에 대하여 Xilinx설계들과 비교하였을 때 제안한 설계 방법이 전력밀도(E/AT)에서 평균 $25\%$우수하였다. 또한 본 논문에 제안한 설계의 방법을 MILAN 프레임워크를 이용하여 구현하였다.

Word2Vec과 가속화 계층적 밀집도 기반 클러스터링을 활용한 효율적 봇넷 탐지 기법 (An Efficient BotNet Detection Scheme Exploiting Word2Vec and Accelerated Hierarchical Density-based Clustering)

  • 이태일;김관현;이지현;이수철
    • 인터넷정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.11-20
    • /
    • 2019
  • 수많은 기업체, 기관, 개인 사용자가 대규모 DDos(Distributed Denial of Service)공격에 의한 피해에 노출되고 있다. DDoS 공격은 좀비PC라 불리는 수많은 컴퓨터들과 계층적 지령구조를 좀비PC들을 제어하는 네트워크인 봇넷을 통하여 수행된다. 통상의 악성코드 탐지 소프트웨어나 백신은 멀웨어를 탐지하기 위해서 사전에 심층 분석을 통한 멀웨어 시그니처를 밝혀야 하며, 이를 탐지 소프트웨어나 백신에 업데이트하여야 한다. 이 과정은 방대한 시간과 비용이 소모된다. 본고에서는 인공신경망 모델을 이용하여 주기적인 시그니처 사전 업데이트가 필요 없는 봇넷 탐지기법을 제안한다. 제안하는 인공신경망 모델은 Word2Vec과 가속화 계층적 밀집도 기반 클러스터링을 활용한다. 제안기법의 봇넷 탐지성능은 CTU-13 데이터셋을 이용하여 평가하였다. 성능평가 결과, 분류 정확도 99.9%로 기존 방법에 비해 우수한 멀웨어 탐지율을 보인다.