• 제목/요약/키워드: comparison accuracy

검색결과 3,247건 처리시간 0.032초

이분형 자료의 분류문제에서 불균형을 다루기 위한 표본재추출 방법 비교 (Comparison of resampling methods for dealing with imbalanced data in binary classification problem)

  • 박근우;정인경
    • 응용통계연구
    • /
    • 제32권3호
    • /
    • pp.349-374
    • /
    • 2019
  • 이분형 자료의 분류에서 자료의 불균형 정도가 심한 경우 분류 결과가 좋지 않을 수 있다. 이런 문제 해결을 위해 학습 자료를 변형시키는 등의 연구가 활발히 진행되고 있다. 본 연구에서는 이러한 이분형 자료의 분류문제에서 불균형을 다루기 위한 방법들 중 표본재추출 방법들을 비교하였다. 이를 통해 자료에서 희소계급의 탐지를 보다 효과적으로 하는 방법을 찾고자 하였다. 모의실험을 통하여 여러 오버샘플링, 언더샘플링, 오버샘플링과 언더샘플링 혼합방법의 총 20가지를 비교하였다. 분류문제에서 대표적으로 쓰이는 로지스틱 회귀분석, support vector machine, 랜덤포레스트 모형을 분류기로 사용하였다. 모의실험 결과, 정확도가 0.5 이상이면서 민감도가 높았던 표본재추출 방법은 random under sampling (RUS)였다. 그 다음으로 민감도가 높았던 방법은 오버샘플링 ADASYN (adaptive synthetic sampling approach)이었다. 이를 통해 RUS 방법이 희소계급값을 찾기 위한 방안으로는 적합했다는 것을 알 수 있었다. 몇 가지 실제 자료에 적용한 결과도 모의실험의 결과와 비슷한 양상을 보였다.

비선형 모델을 이용한 결측 대체 방법 비교 (A comparison of imputation methods using nonlinear models)

  • 김혜인;송주원
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.543-559
    • /
    • 2019
  • 자료에는 다양한 원인에 의해 결측이 발생한다. 만약 결측치를 제외하고 완전히 관찰된 자료만으로 분석을 실시한다면 결측자료 메커니즘이 완전임의결측이 아닌 경우 결과에 편향이 발생하거나 제외된 개체로 인한 정보의 손실로 추정의 정밀도가 약화된다. 결측이 하나의 변수에서만 일어나지 않기 때문에, 자료에 변수가 많을 수록 이 문제는 심화된다. 문제를 개선하기 위해 결측치를 대체하는 여러가지 방법들이 제안되었다. 하지만 모수적인 모형을 이용한 대체 방법들은 가정에 위배되는 현실 데이터에는 적합하지 않다. 따라서 본 연구에서는 자료의 분포 가정에 덜 영향을 받는 커널, 리샘플링, 스플라인 방법을 활용한 비선형 대체 방법들을 리뷰하고 필요한 경우 기존의 비선형 대체 방법에 대체클래스를 사용하여 대체값의 정확도를 높이거나 랜덤성을 가지는 오차를 더해주어 추정치의 분산이 적게 추정되는 문제를 개선하는 확장된 결측 대체 방법을 제안한다. 본 연구에서 고려한 여러 가지 대체 방법들은 다양한 모의자료 설계 하에서 성능을 비교하였다. 모의실험 결과, 비선형 대체 방법들은 각 설계 하에 다른 성능을 보이며 전반적으로 커널 회귀나 스플라인을 활용한 대체 방법들이 좋은 성능을 보였다. 더불어, 확장된 대체 방법은 기존의 대체 방법이 가지는 문제점을 개선함을 확인할 수 있었다.

3D 프린팅 기술을 적용한 스플린트의 제작 용이성 향상을 위한 아래팔 기하 정보 비교에 관한 연구 (A Study for Comparison of Geometric Characteristics on Forearms for Improvement of Convinience in Splint Manufacturing with 3D Printing Technology)

  • 장지홍
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.475-481
    • /
    • 2019
  • 스플린트는 마비, 구축 등이 나타난 환측에 적용하는 대표적인 보조기로서 전통적으로 숙련된 전문가의 수작업을 통해 제작된다. 제작과정은 열가소성 소재를 가열한 후 부드러워진 소재를 환측 부위에 접촉하며 해당 부위의 표면에 피팅시키는 과정을 반복하여 이루어진다. 이러한 전통적 방식은 저온화상의 위험, 제작자의 숙련도에 따른 완성도의 차이 등 여러 문제점을 가지고 있다. 이러한 단점을 보완하기 위하여 3D 프린팅 기술을 이용한 다양한 접근이 시도되고 있으나 3D 스캐너를 이용하는 경우 고비용의 문제, 수작업 측정의 경우 정확도의 문제 등의 단점을 나타내고 있다. 본 연구는 인체의 좌우 대칭성에 착안하여 건측 아래팔의 기하 특징을 이용하여 환측 스플린트를 3D 프린팅 기술로 제작하는 가능성에 관한 사전 연구이다. 디지털 사진과 사진측량기법을 이용하여 건강한 성인 남성으로부터 양측 아래팔의 3차원 가상 모델을 생성하고, 매 20mm 위치마다 둘레 길이 및 단면적을 측정하였다. 동일한 피험자네서 우세측과 비우세측 사이의 둘레 길이 및 단면적은 허용할 만한 수준의 차이를 나타냈으며, 우세측과 비우세측 사이에서 동일한 변수들 간에 높은 수준의 양의 상관관계를 나타냈다. 이러한 결과로부터 건측 아래팔의 기하 특징을 이용하여 3D 프린팅 기술의 적용을 통해 환측 스플린트 제작 가능성을 확인하였다.

몰입 가상현실 환경에서 적응형 캐스팅을 통한 객체 선택 방법 (An Object Selection Method through Adaptive Casting in Immersive Virtual Reality)

  • 이준송;이준
    • 한국콘텐츠학회논문지
    • /
    • 제19권9호
    • /
    • pp.666-673
    • /
    • 2019
  • 몰입 가상현실 환경에서 사용자들은 다양한 가상객체들을 선택하여 목표로 하는 일을 수행할 수 있다. 사용자가 원하는 가상객체를 선택하기 위해서는 일반적으로 사용자의 시야에서 가상의 선분을 발사하여 그 선분과 객체가 일치되었을 때 객체를 선택하게 하는 Ray-Casting이나 여러 객체들을 동시에 선택해서 원하는 객체를 선택하는 Cone-Casting 기반의 객체선택 방법들이 널리 사용된다. 하지만 CAD에서 사용되는 가상객체들은 그 자체적으로 세부적인 작은 객체들로 구성되고 결합이 되어 있어서 사용자의 시야에서 원하는 객체를 기존 방법들로 선택하는 경우 사용자가 원하는 객체가 아니라 다른 객체가 선택되는 모호성 문제가 발생하여 원하는 객체를 선택하는데 문제가 발생하며, 그룹으로 객체를 선택하더라도 원하는 객체를 선택하기 위해서 결국 가상객체들의 위치 및 구조 등을 변경해야 하는 추가 작업을 해야 하는 문제가 발생한다. 본 논문에서는 가상객체가 여러 작은 세부적인 가상객체들로 구성이 되어 있더라도 이들이 가지고 있는 공간적인 연관 관계를 계산하고 이 연관 관계에 따라서 세부적인 가상객체들을 펼치거나 줄여서 사용자가 선택을 원하는 객체를 빠르고 정확하게 선택하는 방법을 제공한다. 본 논문에서는 본 논문에서 제안한 Adaptive-Casting 선택 방법과 기존의 Ray-Casting 과 Cone-Casting 방법들과 성능비교 실험을 하였다. 실험 결과 본 논문에서 제안한 방법이 사용자가 원하는 객체를 선택할 때 걸리는 속도가 가장 빠르면서 정확하다는 결과를 보여주었다.

터널 내 돌발상황 오탐지 영상의 반복 학습을 통한 딥러닝 추론 성능의 자가 성장 효과 (Effect on self-enhancement of deep-learning inference by repeated training of false detection cases in tunnel accident image detection)

  • 이규범;신휴성
    • 한국터널지하공간학회 논문집
    • /
    • 제21권3호
    • /
    • pp.419-432
    • /
    • 2019
  • 대부분 딥러닝 모델의 학습은 입력값과 입력값에 따른 출력값이 포함된 레이블링 데이터(labeling data)를 학습하는 지도 학습(supervised learning)으로 진행된다. 레이블링 데이터는 인간이 직접 제작하므로 데이터의 정확도가 높다는 장점이 있지만 비용과 시간의 문제로 인해 데이터의 확보에 많은 노력이 소요된다. 그리고 지도 학습의 목표는 정탐지 데이터(true positive data)의 인식 성능 향상에 초점이 맞추어져 있으며, 오탐지 데이터(false positive data)의 발생에 대한 대처는 미흡한 실정이다. 본 논문은 터널 관제센터에 투입된 딥러닝 모델 기반 영상유고 시스템의 모니터링을 통해 정탐지와 레이블링 데이터의 학습으로 예측하기 힘든 오탐지의 발생을 확인하였다. 오탐지의 유형은 작업차량의 경광등, 터널 입구부에서 반사되는 햇빛, 차선과 차량의 일부에서 발생하는 길쭉한 검은 음영 등이 화재와 보행자로 오탐지되고 있었다. 이러한 문제를 해결하기 위해 현장에서 발생한 오탐지 데이터와 레이블링 데이터를 동시에 학습하여 딥러닝 모델을 개발하였으며, 그 결과 기존 레이블링 데이터만 학습한 모델과 비교하면 레이블링 데이터에 대한 재추론 성능이 향상됨을 알 수 있었다. 그리고 오탐지 데이터에 대한 재추론을 한 결과 오탐지 데이터를 많이 포함하여 학습한 모델일 경우 보행자의 오탐지 개수가 훨씬 줄었으며, 오탐지 데이터의 학습을 통해 딥러닝 모델의 현장 적용성을 향상시킬 수 있었다.

GPS를 이용한 차량 연료차단 관성주행의 감지에 관한 연구 (A Study for Detecting Fuel-cut Driving of Vehicle Using GPS)

  • 고광호
    • 디지털융복합연구
    • /
    • 제17권11호
    • /
    • pp.207-213
    • /
    • 2019
  • 대부분의 차량에 적용되어 있는 연료차단(fuel-cut) 관성주행은 변속기어 체결 상태에서 가속페달을 방치할 때 자동으로 작동하게 된다. 이 때 연료분사가 일시적으로 중단되므로 연비 향상 효과가 상당하다. 본 연구에서는 GPS를 이용하여 측정된 차속, 가속도, 도로구배 등의 신호를 바탕으로 하는 연료차단 관성주행 감지법을 제안하였다. 관성 주행시 작용하는 주행저항력에 의해 계산되는 가속도값과 GPS에서 실시간으로 측정되는 가속도값을 비교하는 방식이다. 실도로 주행 데이터를 측정하여 이 감지법을 평가한 결과 약 80% 수준의 정확도를 얻을 수 있었다. 도로구배가 다소 큰 12km 정도의 국도를 16분 동안 주행하면서 측정한 약 9,600개의 속도, 가속도, 도로구배 및 연료소모량 데이터에 감지법을 적용하여 얻은 결과이다. 인젝터 분사파형 분석을 위한 배선작업 등이 불필요하여 간단하게 연료차단여부를 판정할 수 있는 장점이 있다. 다만, 속도, 가속도 및 도로구배의 변화율이 연료소모량의 변화율에 비해 훨씬 크게 나타나기 때문에 감지법의 오차도 다소 증가하는 것을 알 수 있었다.

YOLO v4 기반 혼잡도로에서의 움직이는 물체 검출 및 식별 (Detection and Identification of Moving Objects at Busy Traffic Road based on YOLO v4)

  • 이추담;정석용;왕욱비;진락;손진구;송정영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.141-148
    • /
    • 2021
  • 일부 네거리나 혼잡도로에서 특정 시간대에 행인이 많고 도로가 막혀서 발생하는 교통사고가 적지 않다. 특히 인근에 학교교차로가 있어 바쁜 시간에 학생들의 교통안전을 지키는 것이 중요하다. 과거에는 교통 신호등을 설 계 했을 때 행인의 안전성을 고려하지 않고 자동차 인식과 교통 최적화에 대하여 연구 했다. 행인, 특히 학생들의 안전을 확보하는 전제에서 가능한 한 도로의 소통을 유지하는 것이 본 연구의 중점적인 연구 방향이다. 본 연구는 사람, 오토바이, 자전거, 자동차, 버스의 식별문제를 중점적으로 연구할 것이다. 조사와 비교를 통해 본 연구는 YOLO v4 네트워크로 목표물의 위치와 수량을 식별하는 것을 제시한다. YOLO v4는 작은 목표물의 식별 능력이 강하고 정밀도가 높으며 처리속도가 빠르다는 특징을 가지고 있으며, 데이터 수집 대상을 설정하여 이미지 집합을 훈련하고 테스트 한다. 움직이는 영상에서 목표물의 정확도, 실수율과 누락율에 대한 통계를 사용하여, 본 연구에서 훈련된 네트워크는 움직이는 이미지 속의 사람, 오토바이, 자전거, 자동차와 버스를 정확하게 식별 할 수 있다.

소 결핵 진단을 위한 인터페론감마 검사 키트의 성능 비교 평가 (Performance comparison and evaluation of interferon-gamma assay kit for bovine tuberculosis diagnosis)

  • 홍이곤;최우재;노영혜;안선민;김은경;최은희;김단일
    • 한국동물위생학회지
    • /
    • 제43권4호
    • /
    • pp.201-209
    • /
    • 2020
  • In Korea, bovine tuberculosis (bTB) is a representative zoonotic disease that causes considerable economic loss. In determining the positive bTB, the ELISA method for examining the amount of interferon-gamma (IFN-γ) is included in Korea's diagnostic standard method. Recently, commercially available BIONOTE TB-Feron ELISA Plus (TB-Feron Plus) that detects IFN-γ has been introduced. However, since the scientific basis for the performance is limited, we evaluated performance by comparing it with the results of another IFN-γ ELISA assay kit (BOVIGAM®) certified by Office International des Epizooties. In our research, 42 positive blood samples preliminarily tested with a tuberculin skin test and/or BOVIGAM® and 54 negative blood samples collected from three bTB free farms were subjected to IFN-γ assay using the TB-Feron Plus and the BOVIGAM®, respectively. The result shows that the sensitivity, specificity and accuracy were 81.0% (34/42), 100% (54/54), 91.7% (88/96) in TB-Feron Plus kit and 78.6% (33/42), 100% (54/54), 90.6% (87/96) in BOVIGAM® kit, respectively. Moreover, the overall accordance percentage of the two kits was 99.0% (95/96) and there was almost perfect agreement between two assays (Kappa=0.977, P<0.0001). Furthermore, additional studies confirmed that elevated lymphocyte numbers in blood did not interfere with the results of the TB-Feron Plus kit. And, delayed time from sampling to culture decreased the optical density (OD) value. Therefore, we concluded that the TB-Feron Plus kit was not inferior to BOVIGAM® in performance. High lymphocyte numbers in blood did not impact on TB-Feron Plus results, while delayed time before culture interfered with OD value.

텍스트 마이닝과 딥러닝을 활용한 암호화폐 가격 예측 : 한국과 미국시장 비교 (The Prediction of Cryptocurrency on Using Text Mining and Deep Learning Techniques : Comparison of Korean and USA Market)

  • 원종관;홍태호
    • 지식경영연구
    • /
    • 제22권2호
    • /
    • pp.1-17
    • /
    • 2021
  • 본 연구에서는 한국과 미국의 대표적인 거래소인 빗썸과 코인베이스의 비트코인 가격을 ARIMA와 순환 신경망(Recurrent Neural Network)을 이용해 예측하고, 이후 각 국가의 뉴스 기사를 이용해 분리 학습에 기반한 separated RNN 모형을 제안한다. separated RNN 모형은 학습 데이터를 가격의 추세 변화 점을 기준으로 분리해 학습시킨 후, 추세 변화점 별 뉴스 데이터를 활용해 용어 기반 사전을 구축한다. 이후 용어 기반 사전과 평가 데이터 기간의 뉴스 데이터를 이용해 예측할 데이터의 가격 추세 변화 점을 찾아낸 후, 매칭되는 모형을 적용해 예측 결과를 산출한다. 2017년 5월 22일부터 2020년 9월 16일까지의 가격 데이터를 사용해 분석한 결과, 제안된 separated RNN을 이용해 예측한 결과가 한국과 미국의 비트코인 가격 예측 모두에서 순환 신경망(RNN)을 이용해 예측한 결과보다 높은 예측 성과를 보였다. 본 연구는 시계열 예측 기법의 한계를 뉴스 데이터를 이용한 추세 변화 점 탐색을 통해 극복할 수 있고, 성과 향상을 위한 추후 다양한 시계열 예측 기법 및 추세 변화 점 탐색을 위한 다양한 텍스트 마이닝 기법을 적용해볼 필요가 있음을 시사한다.

신경망기법을 활용한 선박 가치평가 모델 개발 (Development of Ship Valuation Model by Neural Network)

  • 김동균;최정석
    • 해양환경안전학회지
    • /
    • 제27권1호
    • /
    • pp.13-21
    • /
    • 2021
  • 본 연구의 목적은 Neural Network Regression 모델을 활용하여 선박의 가치평가 모델을 개발하는 것이다. 가치평가의 대상은 중고 VLCC선이며, 선행연구를 통해 선박의 가치 변화를 유발하는 주요 요인들을 선별하여 변수를 설정하고, 2000년 1월부터 2020년 8월까지의 해당 데이터를 확보하였다. 변수의 안정성을 판단하기 위해 다중 공선성 검사를 수행하여 최종적으로 6개의 독립변수와 1개의 종속변수를 선정하고 연구 구조를 설계하였다. 이를 바탕으로 Linear Regression, Neural Network Regression, Random Forest Algorithm을 활용하여 총 9개의 시뮬레이션 모델을 설계하였다. 또한 각 모델간의 비교검증을 통해 평가결과의 정확성을 제고시켰다. 평가 결과, VLCC실제값과의 비교를 통해 2층으로 구성된 Hidden Layer의 Neural Network Regression 모델이 가장 정확도가 높은 것으로 나타났다. 본 연구의 시사점은 첫째, 기존 정형화된 평가기법에서 벗어나 기계학습기반 모델을 선박가치평가에 적용하였다는 점이다. 둘째, 해운시장 변화요인을 동태적 관점에서 분석하고 예측함으로써 연구결과의 객관성을 제고시켰다고 할 수 있다.