• Title/Summary/Keyword: 과대 분류

Search Result 74, Processing Time 0.028 seconds

불균형의 대용량 범주형 자료에 대한 분할-과대추출 정복 서포트 벡터 머신 (A divide-oversampling and conquer algorithm based support vector machine for massive and highly imbalanced data)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.177-188
    • /
    • 2022
  • 일반적으로 support vector machine (SVM)은 높은 수준의 분류 정확도를 제공함으로써 다양한 분야의 분류분석에서 널리 사용되고 있다. 그러나 SVM은 최적화 계산식이 이차계획법(quadratic programming)으로 공식화되어 많은 계산 비용이 필요하므로 대용량 자료의 분류분석에는 그 사용이 제한된다. 또한 불균형 자료(imbalanced data)의 분류분석에서는 다수집단에 편향된 분류함수를 추정함으로써 대부분의 자료를 다수집단으로 분류하여 소수집단의 분류 정확도를 현저히 감소시키게 된다. 이러한 문제점들을 해결하기 위하여 본 논문에서는 다수집단을 분할(divide)하고, 소수집단을 과대추출(oversampling)하여 여러 분류함수들을 추정하고 이들을 통합(conquer)하는 DOC-SVM 분류기법을 제안한다. 제안한 DOC-SVM은 분할정복 알고리즘을 다수집단에 적용하여 SVM의 계산 효율을 향상시키고, 과대추출 알고리즘을 소수집단에 적용하여 SVM 분류함수의 편향을 줄이게 된다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DOC-SVM의 효율적인 성능과 활용 가능성을 확인하였다.

개정된 사상체질분류검사지(四象體質分類檢査紙)II에 대한 임상적 고찰 (A Study on responses to the questionnaire based on of revised Sasang Constitution Classification II(QSCCII+))

  • 김상복;이준희;박계수;정용재;이수경;송일병
    • 사상체질의학회지
    • /
    • 제13권3호
    • /
    • pp.15-22
    • /
    • 2001
  • Revised QSCCII is made depend on revised soeum scale, revised taeum scale and revised soyang scale, and used in KyungHee University Medical Center. The purpose of this study is to examine validity of revised QSCCII and to analyse the tendency of respondents of revised QSCCII. For this study, the objects are 57 patients who response to QSCCII and revised QSCCII in Oriental Medicine & Western Medicine Cooperative Health Examination Center KyungHee University Medical Center. a systematic analysis has been made. As a results, we have found that revised QSCCII have a validity. there is agreement of Tendency of the respondent of QSCCII with revised QSCCII. we hope that suitable questionnaire will be developed for the research in the future.

  • PDF

데이터 전처리와 앙상블 기법을 통한 불균형 데이터의 분류모형 비교 연구 (A Comparison of Ensemble Methods Combining Resampling Techniques for Class Imbalanced Data)

  • 이희재;이성임
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.357-371
    • /
    • 2014
  • 최근 들어 데이터 마이닝의 분류문제에 있어 목표변수의 불균형 문제가 많은 관심을 받고 있다. 이러한 문제를 해결하기 위해, 이전 연구들은 원 자료에 대하여 데이터 전처리 과정을 실시했는데, 전처리 과정에는 목표변수의 다수계급을 소수계급의 비율에 맞게 조정하는 과소표집법, 소수계급을 복원추출하여 다수계급의 비율에 맞게 조정하는 과대표집법, 소수계급에 K-최근접 이웃 방법 등을 활용하여 과대표집법을 적용 후 다수계급에는 과소표집법을 적용한 하이브리드 기법 등이 있다. 또한 앙상블 기법도 이러한 불균형 데이터의 분류 성능을 높일 수 있다고 알려져 있어, 본 논문에서는 데이터의 전처리 과정과 앙상블 기법을 함께 고려한 여러 모형들을 사용하여, 불균형 자료에 대한 이들모형의 분류성능을 비교평가한다.

가중치 퍼지 분류기를 이용한 사상 체질 분류 (Classification of Sasang Constitutions Using Weighted Fuzzy Classifier)

  • 신상호;범수균;우영운
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.314-316
    • /
    • 2009
  • 본 논문에서는 사상체질분류검사 설문지를 이용하여 사상체질을 진단할 때, 진단의 정확도를 향상시키기 위한 사상체질 분류 함수를 개발하기 위하여 퍼지 분류기를 이용한다. 본 연구에서 사용하는 데이터는 9개 한의과대학의 10개 부속한방병원에서 치료를 받은 환자들 중 각 병원의 사상체질전문의로부터 체질진단을 받고 최소한 4주 이상 사상체질 처방을 사용한 후 주 증상이 전반적으로 호전되어 체질이 확인된 환자 1,914명을 대상으로 하고 있다. 본 연구는 사상체질의학의 광제설을 토대로 환자의 성별을 분리 하였을 뿐만 아니라, 비만도를 추가적으로 분류하였으며, 체형기상, 용모사기, 성질재간, 병증약리 중 체형기상을 토대로 분류하였으며, 사상체질을 판별할 수 있도록 설계되고 구현되었다.

  • PDF

중증도 분류자 직종에 따른 중증도 분류 결과의 차이 비교 (Comparison of KTAS(Korean Triage and Acuity Scale) results by Triage Classifier)

  • 허영진;오미라;김세형;한소현;박윤숙
    • 융합정보논문지
    • /
    • 제10권4호
    • /
    • pp.98-103
    • /
    • 2020
  • 본 연구에서는 KTAS(Korean Triage and Acuity Scale) 결과가 분류를 시행한 주체의 직종에 따른 차이가 있는지를 알아보고자 한다. 2016년 1월 1일부터 2017년 12월 31일까지의 응급의료기관으로 내원한 환자 자료 중, 국가응급진료정보망으로 전송된 자료 총 10,960,359건을 분석하였다. 분류자 직종은 전문의, 전공의, 인턴, 일반의, 간호사, 응급구조사였다. 최초 중증도 분류와 최종 중증도 분류 결과의 일치율은 일반의가 98.9%로 가장 높았고, 인턴이 80.2%로 가장 낮았다. 과대 분류에서는 일반의가 0.6%로 가장 낮았고, 인턴은 16.0%로 가장 높았다. 또한 과소 분류는 전문의와 응급구조사가 0.4%로 가장 낮았고, 인턴이 3.8%로 가장 높았다. 중증도 분류 결과는 직종별 유의미한 차이가 있었다(p<0.001). 중증도 분류는 환자의 예후에 영향을 미치는 요인 중 하나로 직종별, 숙련도에 따라 그 결과가 달라져서는 안 된다. 때문에 정확한 중증도 분류를 위한 분류자의 역량 강화가 필요하다.

형태적 수렴 특성을 이용한 하구 분류 (Classification of Estuaries based on Morphological Convergence)

  • 신현정;류호상;이관홍
    • 한국지형학회지
    • /
    • 제19권3호
    • /
    • pp.1-22
    • /
    • 2012
  • 하구의 분류는 크게 지형경관적 특성에 근거한 정성적인 분류와 수괴의 물리적 특성에 근거한 정량적 분류로 구분될 수 있으나, 전자는 하구의 특성을 정량화하기 어려우며 후자는 자료부족으로 인해 폭넓은 적용이 어렵다. 하구의 형태적 수렴 특성은 자료의 획득이 상대적으로 용이하면서도 하구의 조석전파 특성과 연관시킬 수 있어 하구분류 기준으로 사용하기 적합하다. 본 연구는 국내 19개 하구에 대해 하구의 형태적 수렴특성을 이용하여 하구별 특징을 파악하고 분류를 시도한 것이다. 하구의 수심과 너비자료를 이용하여 수심과 너비의 감소율(${\nu}$)과 무차원화된 하구의 길이($y_0$)를 구하고, 1차원 수심적분 운동방정식과 연속방정식으로부터 유도한 전이함수 ${\xi}({\nu},ky)$${\nu}$$y_0$을 대입하여 하구별 조위/조석 진폭비와 조위/조류 위상차를 도출하였다. 이 결과를 토대로 19개 하구의 특징을 파악하고 3개 그룹을 구분하였다. 국내 19개 하구는 크게 조위 변동이 조류 변동보다 우세한 제1그룹, 하구와 조류 변동이 조위 변동보다 우세한 제2그룹, 그리고 1그룹과 2그룹의 전이 형태를 갖는 제3그룹 하구로 분류된다. 민감도 분석 결과 하구분류 알고리듬은 하구 길이의 변화에 큰 영향을 받는 것으로 나타났다. 하구 길이가 과대 혹은 과소 추정되었을 때 본래의 조위/조류 진폭비는 과소 혹은 과대 추정되며, 본래의 조위/조류 위상차는 과대 혹은 과소 추정된다. 그러므로 형태적 수렴 특성을 이용하여 하구분류를 하고자 할 때는 하구 길이의 적절한 산정이 무엇보다 중요하다. 하구분류 알고리듬은 수심의 변화를 무시하여도 동일한 분류 결과를 주는 것으로 확인되었다. 이는 하구길이의 적절한 산정이 전제될 경우 하구분류 알고리듬이 자료의 제약 없이 대부분의 국내하구에 적용할 수 있음을 의미한다.

작은 데이터에 대한 베이지안망 분류기(BNC)의 베이지안 모델 평균화(BMA) 성능 평가 (Evaluation of Bayesian Model Averaging (BMA) of Bayesian Network Classifiers (BNCs) on Small Datasets)

  • 황규백;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.22-24
    • /
    • 2003
  • 작은 데이터에서 베이지안망 분류기(Bayesian network classifier, BNC)를 학습할 때, 과대적합(overfitting)으로 인한 일반화 성능의 저하가 초래된다 이런 경우, 베이지안 모델 평균화(Bayesian model averaging, BMA)는 모델 자체에 대한 불확실성을 분석 과정에서 고려함으로써, 성능 저하를 피할 수 있는 수단을 제공한다. 본 논문에서는 BNC의 BMA의 작은 데이터에 대한 성능을 평가 및 분석한다. 특히, 노드의 순서에 대한 평균화의 효과가 연구된다. 인공데이터에 대한 실험 결과, 노드의 순서가 BNC의 BMA의 분류 성능에 미치는 영향은 지대하며, 이는 데이터의 크기가 극히 작은 경우의 성능 저하에 직접적인 원인이 된다.

  • PDF

중증도 분류 교육 프로그램이 중증도 분류 정확성에 미치는 효과 -119구급대원을 중심으로- (Effect of a Triage Education Program on Accuracy of Triage -Focused on 119 Emergency Medical Service Team-)

  • 김용석
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.1-7
    • /
    • 2022
  • 이 연구는 119 응급 의료 서비스 팀을 위해 설계된 사전 및 사후 교육 실험을 활용하여 분류 교육 프로그램의 효과를 확인하기 위해 수행되었다. 목적: 이 연구는 분류 교육 프로그램에 참여한 119구급대원이 수행한 분류의 정확성에 대한 분류 교육 프로그램의 효과를 평가하였다. 연구 방법: 본 연구의 대상자는 119구급대원 119명으로, 프리젠테이션으로 구성된 20명의 모의환자가 제시되었다. 자료는 SPSS 21.0을 사용하여 분석하였다. 결과: 119명의 응급의료팀의 분류 정확도가 증가한 것으로 나타났다(p<.001). 그리고 과소 분류는 상당한 감소가 나타났다(p<.001). 또한 과대분류는 감소 되었으나 통계적으로 유의하지 않았다. 결론 : 본 연구에서 얻은 결과는 분류 교육 프로그램이 119구급대원의 다발성 부상 환자 또는 재난 피해자 분류의 정확성을 향상시키는데 효과적임을 보여주었다.

홍수 예.경보시스템 개선을 위한 인공신경망 이론의 적용 (Application of Artificial Neural Networks Technique for the Improvement of Flood Forecasting and Warning System)

  • 박성천;김용구;정천리;진영훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1265-1271
    • /
    • 2009
  • 본 연구에서는 강우의 시 공간적 분포의 불규칙한 변동성을 고려한 강우-유출예측모형을 위해 인공신경망(Artificial Neural Networks: ANNs)의 기법의 일종인 자기조직화(Self Organizing Map: SOM) 이론과 역전파 학습 알고리즘(Back Propagation Algorithm: BPA) 이론을 복합적으로 이용하였다. 기존의 인공신경망 연구에서 야기된 저 갈수기의 유출량에 대한 과대평가, 홍수기의 유출량에 대한 과소평가, 예측값이 연속적으로 선행 유출량을 나타내는 Persistence 현상을 해결하기 위하여 패턴분류 성능을 지닌 SOM 이론을 예측모형의 전처리 과정으로 이용하였다. 먼저, 본 연구에서 제안한 방법은 SOM에 의해 강우-유출 관계를 분류하고, SOM에 의한 분류에 따라 각각의 모형을 구성한다. 개별적으로 구축된 모형은 유출량의 예측을 위해 각각의 양상에 따라 분류된 자료를 이용한다. 결과적으로 본 연구에서 제안한 방법은 과거의 인공신경망의 일반적인 적용에 의한 결과보다 더 나은 예측능력을 보여주었으며, 더불어 유출량의 과소 및 과대추정과 Persistence 현상과 같은 문제점이 나타나지 않았다. 또한 강우량 및 유출량의 범위에 제한을 받지 않는 강우-유출예측 모형의 개발 및 홍수기로부터 갈수기까지의 보다 넓은 범위의 유출량의 예측에 기여할 것으로 기대된다.

  • PDF

Cell Transmission 이론을 이용한 동적통행배정기법 개발에 관한 연구 (A Study on Development of Dynamic Traffic Assignment Technique using the Cell Transmission Theory)

  • 김주영
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 1998년도 Proceedings 제34회 추계 학술발표회
    • /
    • pp.31-40
    • /
    • 1998
  • 본 연구의 목적은 기존의 Cell Transmission(1994, Daganzo) 교통류 이론을 기반으로 동적통행배정 모형을 개발하는 것이다. 이 모형은 동적 O-D 발생모듈, HOV 차선모듈, 분류부 분할모델, 링크비용함수 모듈, 최단경로 탐색 모듈등으로 구성된다. 이 모델에서 적용하는 교통류 모델은 각 링크를 동일한 특성을 가지는 셀로 구분하여 셀내의 진입시간과 진출시간을 계산하여 링크비용을 계산하는데 이것은 비용의 과대·과소 추정을 피할 수 있으며 교통지체 현상을 현실적으로 표현해 줄 수 있는 장점이 있다. 또한 HOV 차선 모듈에 의해 수단별 교통류 진행 및 비용고려가 가능하며 HOV 차선의 평가 및 분석이 가능하다. 기존의 동적통행배정모형은 매 시간대별 출발지에서 균형상태를 추구하는 통행배정기법을 사용하고 있지만 이 모델은 분류되는 노드를 가상의 출발점이라고 가정하여 각 시간대별로 최단경로를 탐색하여 균형상태를 추구해나가는 기법을 적용하고 있다. 각 셀별 차량을 목적지별, 차종별, 대기시간별로 추적하여 진행시키며 분류부에서는 최단경로를 탐색하여 배분된다. 또한 진행하고자 하는 셀의 용량과 현재 셀의 밀도를 고려함으로서 용량제약 하에서의 동적통행배정모형을 적용하고 있다. 이 모형은 고속로의 합류부 및 분류부의 교통특성을 세밀히 분석할 수 있으며, TCS 및 램프미터링과 접목하여 고속도로 운영에 이용될 수 있으며, 고속도로 중·장기적인 계획에 이용될 수 있다.

  • PDF