• 제목/요약/키워드: tree-based classification

검색결과 501건 처리시간 0.035초

토모테라피에서 선량품질보증 분석을 위한 통계적공정관리의 타당성 (Feasibility on Statistical Process Control Analysis of Delivery Quality Assurance in Helical Tomotherapy)

  • 장경환
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제45권6호
    • /
    • pp.491-502
    • /
    • 2022
  • The purpose of this study was to retrospectively investigate the upper and lower control limits of treatment planning parameters using EBT film based delivery quality assurance (DQA) results and to analyze the results of statistical process control (SPC) in helical tomotherapy (HT). A total of 152 patients who passed or failed DQA results were retrospectively included in this study. Prostate (n = 66), rectal (n = 51), and large-field cancer patients, including lymph nodes (n = 35), were randomly selected. The absolute point dose difference (DD) and global gamma passing rate (GPR) were analyzed for all patients. Control charts were used to evaluate the upper and lower control limits (UCL and LCL) for all the assessed treatment planning parameters. Treatment planning parameters such as gantry period, leaf open time (LOT), pitch, field width, actual and planning modulation factor, treatment time, couch speed, and couch travel were analyzed to provide the optimal range using the DQA results. The classification and regression tree (CART) was used to predict the relative importance of variables in the DQA results from various treatment planning parameters. We confirmed that the proportion of patients with an LOT below 100 ms in the failure group was relatively higher than that in the passing group. SPC can detect QA failure prior to over dosimetric QA tolerance levels. The acceptable tolerance range of each planning parameter may assist in the prediction of DQA failures using the SPC tool in the future.

머신러닝을 활용한 대학생 중도탈락 위험군의 예측모델 비교 연구 : N대학 사례를 중심으로 (A Comparative Study of Prediction Models for College Student Dropout Risk Using Machine Learning: Focusing on the case of N university)

  • 김소현;조성현
    • 대한통합의학회지
    • /
    • 제12권2호
    • /
    • pp.155-166
    • /
    • 2024
  • Purpose : This study aims to identify key factors for predicting dropout risk at the university level and to provide a foundation for policy development aimed at dropout prevention. This study explores the optimal machine learning algorithm by comparing the performance of various algorithms using data on college students' dropout risks. Methods : We collected data on factors influencing dropout risk and propensity were collected from N University. The collected data were applied to several machine learning algorithms, including random forest, decision tree, artificial neural network, logistic regression, support vector machine (SVM), k-nearest neighbor (k-NN) classification, and Naive Bayes. The performance of these models was compared and evaluated, with a focus on predictive validity and the identification of significant dropout factors through the information gain index of machine learning. Results : The binary logistic regression analysis showed that the year of the program, department, grades, and year of entry had a statistically significant effect on the dropout risk. The performance of each machine learning algorithm showed that random forest performed the best. The results showed that the relative importance of the predictor variables was highest for department, age, grade, and residence, in the order of whether or not they matched the school location. Conclusion : Machine learning-based prediction of dropout risk focuses on the early identification of students at risk. The types and causes of dropout crises vary significantly among students. It is important to identify the types and causes of dropout crises so that appropriate actions and support can be taken to remove risk factors and increase protective factors. The relative importance of the factors affecting dropout risk found in this study will help guide educational prescriptions for preventing college student dropout.

초분광 영상을 이용한 의사결정 트리 기반 봄감자(Solanum tuberosum)의 염해 판별 (Application of Hyperspectral Imagery to Decision Tree Classifier for Assessment of Spring Potato (Solanum tuberosum) Damage by Salinity and Drought)

  • 강경석;유찬석;장시형;강예성;전새롬;박준우;송혜영;이수환
    • 한국농림기상학회지
    • /
    • 제21권4호
    • /
    • pp.317-326
    • /
    • 2019
  • 본 연구는 초분광 영상을 이용하여 간척지에서 주로 발생하는 염해 및 한해를 봄감자의 주요 생육단계에서 판별할 수 있는지를 검토하는 것이다. 영양생장기(VP), 괴경형성기(RFP) 및 괴경비대기(RGP)에 취득한 초분광 영상 내 봄감자 캐노피 영역의 반사율과 반사율의 불균일성을 최소화하기 위해 밴드 비로 변환하였다. 소형 다중분광 영상센서 개발을 고려하여 FWHM 5 nm의 단일 밴드를 상용화되어있는 밴드패스필터 기준으로 10 nm, 25 nm와 50 nm 평준화한 후 똑같이 밴드 비로 변화하였다. 의사결정트리법을 이용하여 각 FWHM에서 염해 판별에 유의한 단일 밴드 및 밴드 비를 추출하였고 그 분류 정확도는 OA와 KC로 나타내어졌다. 염해, 한해 및 정상 여부를 분류하기 위해 선택된 밴드는 최소 3개에서 최대 13개로 모든 FWHM에서 OA 66.7%와 KC 40.8% 이하의 정확도를 나타내었다. 괴경비대기(RGP)에서만 공통으로 440 nm가 선택되었고 동일 밴드는 아니지만 영양생장기(VP)에는 530 nm 또는 540 nm, 괴경비대기(RGP)에서는 추가로 710 nm 또는 720 nm가 선택되었다. 영양생장기(VP)에 비해 생식생장기(RFP 및 RGP)에 분류 정확도가 높지만 상용화가 용이한 10nm 이상의 FWHM에서 OA 및 KC값이 각각 78.7%, 57.7% 이하로 나타났다. 밴드 비를 이용하여 염해, 한해 및 정상을 분류하기 위해 선택된 밴드 비는 최소 2개에서 최대 6개로 원래 밴드(5 nm FWHM)의 비를 이용할 경우 생육 시기 및 FWHM에 관계없이 OA 및 KC가 95% 이상으로 나타났다. 영양생장기에서 FWHM에 관계없이 790 nm와 800 nm의 비가 선택되었고 동일 밴드는 아니지만 각 생육단계에서 Red, Red-edge 및 NIR 영역에서 유사밴드가 선택되었다. 모든 생육 시기에서 10 nm의 FWHM을 가진 3개 이하의 밴드 비를 이용한다면 OA 91.3%와 KC 85.0% 이상의 분류 정확도로 봄감자의 염해, 한해 및 정상여부판별이 가능할 것으로 판단된다. 이 결과는 넓은 면적에서 염해 및 한해 피해를 받은 작물 필지를 소형 다중 분광 카메라로 판별하여 빠르고 유연하게 제염기술을 투입하거나 그 피해 대책을 위한 정책 활용에 이용될 수 있을 것이다.

머신러닝 기법을 활용한 터널 설계 시 시추공 내 암반분류에 관한 연구 (A study on the rock mass classification in boreholes for a tunnel design using machine learning algorithms)

  • 이제겸;최원혁;김양균;이승원
    • 한국터널지하공간학회 논문집
    • /
    • 제23권6호
    • /
    • pp.469-484
    • /
    • 2021
  • 터널 설계 시 지반조사를 통한 암반분류 결과는 공사기간 및 공사비 산출, 그리고 터널안정성 평가에 지대한 영향을 미친다. 국내에서 지금까지 완공된 3,526개소의 터널들의 설계 및 시공을 통해 관련 기술들은 지속적으로 발전되어 왔지만, 터널 설계 시 암질 및 암반등급을 보다 정확하게 평가하기 위한 방법에 대한 연구는 미미하여 평가자의 경험 및 주관에 따라 결과의 차이가 큰 경우가 적지 않다. 따라서 본 연구에서는 암석샘플에 대한 주관적 평가를 통한 기존의 인력에 의한 암반분류 대신, 최근 지반분야에서도 그 활용도가 급증하고 있는 머신러닝 알고리즘을 이용하여 시추조사에서 획득한 다양한 암석 및 암반정보를 분석하여 보다 신뢰성있는 RMR에 의한 암반분류 모델을 제시하고자 하였다. 국내 13개 터널을 대상으로 11개의 학습 인자(심도, 암종, RQD, 전기비저항, 일축압축강도, 탄성파 P파속도 및 S파 속도, 영률, 단위중량, 포아송비, RMR)를 선정하여 337개의 학습 데이터셋과 60개의 시험 데이터셋을 확보하였으며, 모델의 예측성능을 향상시키기 위해 6개의 머신러닝 알고리즘(DT, SVM, ANN, PCA & ANN, RF, XGBoost)과 각 알고리즘별 다양한 초매개변수(hyperparameter)를 적용하였다. 학습된 모델의 예측성능을 비교한 결과, DT 모델을 제외한 5개의 머신러닝 모델에서 시험데이터에 대한 RMR 평균절대오차 값이 8 미만으로 수렴되었으며, SVM 모델에서 가장 우수한 예측성능을 나타내었다. 본 연구를 통해 암반분류 예측에 대한 머신러닝 기법의 적용 가능성을 확인하였으며, 향후 다양한 데이터를 지속적으로 확보하여 예측모델의 성능을 향상시킨다면 보다 신뢰성 있는 암반 분류에 활용될 수 있을 것으로 기대된다.

소셜미디어 감성분석을 위한 베이지안 속성 선택과 분류에 대한 연구 (Investigating the Performance of Bayesian-based Feature Selection and Classification Approach to Social Media Sentiment Analysis)

  • 강창민;어균선;이건창
    • 경영정보학연구
    • /
    • 제24권1호
    • /
    • pp.1-19
    • /
    • 2022
  • 온라인 사용자들이 소셜 미디어상에 올린 온라인 리뷰 속 숨겨진 감정을 분석하는 감성분석은 소셜미디어의 확산에 힘입어 많은 관심을 받고 있다. 본 연구는 기존 연구들과 차별화된 방법으로 감성분석을 시도하기 위하여 베이지안 네트워크에 기반한 감성 분석 모델을 제안한다. 모델에는 MBFS(Markov Blanket-based Feature Selection)가 속성 선택 기법으로 사용된다. MBFS의 성과를 실증적으로 증명하기 위하여 소셜미디어인 Yelp의 리뷰 데이터를 활용하였다. 벤치마킹 속성 선택 기법으로는 상관관계기반 속성 선택, 정보획득 속성 선택, 획득비율 속성 선택을 사용하였다. 한편, 해당 속성선택방법을 토대로 4개의 머신러닝 알고리즘을 이용하여 분류성과를 비교하였다. 나아가 MBFS로 선택된 속성들 간 인과관계를 확인하고자 베이지안 네트워크를 통해 What-if 분석을 실시하였다. 본 연구에서 택한 머신러닝 분류기는 베이지안 네트워크 기반의 TAN (Tree Augmented Naive Bayes), NB (Naive Bayes), S-Spouses(Sons & Spouses), A-markov (Augmented Markov Blanket)이다. 성과분석 결과 본 연구에서 제안한 MBFS 방법이 정확도, 정밀도, F1점수 측면에서 벤치마킹 방법보다 더 우수한 성과를 나타내었다.

데이터마이닝 기법을 활용한 대학수학능력시험 영어영역 정답률 예측 및 주요 요인 분석 (Prediction of Correct Answer Rate and Identification of Significant Factors for CSAT English Test Based on Data Mining Techniques)

  • 박희진;장경애;이윤호;김우제;강필성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권11호
    • /
    • pp.509-520
    • /
    • 2015
  • 대학수학능력시험(수능)은 고등학교 3년간의 학업 성취도를 측정하는 대표적인 평가 도구로서 대한민국 대학 입시에 있어 매우 중요한 역할을 하는 시험이다. 응시생들의 학업 성취도를 효과적으로 평가하기 위해서는 수능의 난이도가 적절하게 조절되어야 하나 지금까지는 수능 난이도의 편차가 매우 크게 나타나 매 입시연도마다 여러 가지 문제점을 야기해왔다. 본 연구에서는 전문가의 판단에 의존한 기존 방식에서 벗어나 지금까지 시행된 모의고사 및 실제 시험을 통해 축적된 자료를 바탕으로 데이터마이닝 기법을 적용하여 영어영역 문제의 난이도를 예측하는 모델을 구축하고 난이도 예측에 영향을 미치는 요소를 판별하고자 한다. 이를 위해 각 문항의 특성을 판별할 수 있는 여러 지표와 함께 지문, 문제, 답안 등에 나타난 단어들의 특징을 토픽 모델링(topic modeling) 기법을 이용하여 정량화하고 이를 바탕으로 선형회귀분석 및 의사결정나무 기법을 이용하여 각 문항의 난이도를 예측하는 모델을 구축하였다. 구축된 예측 모델을 실제 문제에 적용한 결과 난이도의 상/하 구분에 대한 예측 정확도는 90% 수준으로 나타났으며, 실제 정답률 대비 오차 비율은 약 16% 이내인 것으로 나타났다. 또한 배점 및 문제 유형이 문제의 난이도에 큰 영향을 미치며 지문이 특정 주제에 관련된 경우에도 난이도에 영향을 미치는 것을 확인하였다. 본 연구에서 제시된 방법론을 이용하여 영어영역 각 문제들에 대한 기대 정답률의 범위를 추정할 수 있으며 이를 종합하여 영어영역 전체 문제에 대한 정답률 예측을 통해 적절한 난이도의 문제를 출제하는 데 기여할 수 있을 것으로 기대한다.

제주 올레길 생태문화자원 경관생태학적 해석기법 연구 (Interpretation Method of Eco-Cultural Resources from the Perspective of Landscape Ecology in Jeju Olle Trail)

  • 허명진;한봉호;박석철
    • 한국조경학회지
    • /
    • 제49권2호
    • /
    • pp.128-140
    • /
    • 2021
  • 본 연구는 도보관광의 대표적 대상인 제주 올레길의 유형별 대표자원을 대상으로 Landscape Ecology 이론을 적용하여 생태문화적 특성을 파악하였고, 올레길 자원의 경관생태학적 해석 기법을 정립하였다. 제주 올레길 유형분류는 올레길 주변 대표경관, 주요 토지이용, 식생현황을 중심으로 비오톱유형을 조사하여 12개 유형으로 구분하였다. 제주 올레길 도보 관광자원 유형분류는 생태관광 자원분류 유형을 토대로 자연자원 7개 중분류 유형, 인문자원 7개 중분류 유형으로 구분하였고, 각 자원을 경관생태학 구성 체계와 동일하게 Geotope, Biotope, Anthropotope으로 특성화하여 유형별 특성을 파악하였다. Geotope 자원은 해안 및 해변, 바위, 암반, 폭포, 지질 및 주상절리, 오름 및 분화구, 수자원, 지형경관 조망점 등이 해당되어 시각적 경관특성, Biotope 자원은 대경목 및 보호수, 곶자왈, 숲길 및 식생군락지, 생물서식지, 식생경관 조망점 등이 해당되어 생태특성, Anthropotope 자원은 해녀 및 전통문화, 포구 및 등대, 체험시설, 사찰 및 교회, 군사 및 봉수시설, 기타 역사·문화시설, 문화경관 조망점이 해당되어 지역문화 특성이 강하였다. 제주 올레길 유형별 대표자원은 제주에서만 볼 수 있는 해안, 오름, 곶자왈, 밭과 밭담, 제주가옥과 돌담이고, 제주 올레길의 생태문화를 알아보기 위해 올레길 유형을 대표하는 자원들의 구성요소와 다양한 기능들을 경관생태학적으로 해석하였다. 제주 해안의 생태문화적 특성을 살펴보면 해안은 검은 현무암 암반, 해안가 식생, 해안초지, 해안암반 식생, 겨울철새, 제주해녀 등이 있다. 오름은 독특한 화산지형으로 원형과 타원형의 산체, 오름 식생, 분화구 습지, 오름 지명 유래 및 전설, 설문대할망 설화, 말 방목 문화, 군사 목적의 사용, 민간신앙의 대상, 정상에서 조망경관 등이 있다. 곶자왈은 바위 요철 지형, 독특한 미기후 형성, 곶자왈 식생, 지명 유래, 과거 숯을 구웠던 문화, 기이한 형상의 나무와 덩굴식생이 특징이다. 밭담은 밭담구조 및 형태, 밭 재배 농작물, 밭담 서식생물, 제주 농업문화, 밭담경관 등이 있다. 마을은 현무암으로 쌓은 돌담과 지붕구조, 마을 어귀 정자목, 가옥내부 마당과 텃밭, 지역민들의 삶의 모습, 골목길 경관 등이 있다. 이런 자원들은 인간의 오랜 삶과 함께 서서히 변해왔고, 지금은 제주에서만 경험할 수 있는 독특한 경관이 되었다. 자원을 통합적으로 해석하여 특화된 콘텐츠를 제공함으로써 올레를 걷는 도보 관광객들은 자원들의 스토리를 알아가면서 깊이 있게 체험할 수 있고, 올레길의 지속가능한 이용 및 이용객 만족도를 높일 수 있을 것이다.

한라산 어리목, 영실, 돈내코지역의 식물군집구조 (The Structure of Plant Community on Orimok, Yongsil and Donnaeko Area in Mt. Halla)

  • 이경재;류창희;최송현
    • 한국환경생태학회지
    • /
    • 제6권1호
    • /
    • pp.25-43
    • /
    • 1992
  • 한라산 어리목, 영실, 돈내코지역 삼림의 식물군집구조분석을 위하여 71개소에 조사구(1개 조사구당 500$m^2$ 면적)를 설정하고 식생조사를 실시하여 얻은 자료에 대하여 TWINSPAN에 의한 classification 및 ordination의 한 종류인 DCA기법을 적용하여 분석하였다. 현존식생의 비율은 개서어나무 및 서어나무군집이 전체면적의 53.7%, 물창나무-졸참나무군집 25.8%, 소나무군집 8.3%, 구상난무군집 4.5%이고, 이상의 군집들이 전체의 92.2%이었다. 녹지자연도 등급 1~7까지는 존재하지 않았고, 등급 8이 전체면적의 64.5%, 극상림인 등급 9가 28.6%. 등급 10이 6.9%이었다. TWINSPAN과 DCA기법에 의해 7개의 군집으로 분리되었으며 나뉘어진 군집은 개서어나무군집, 개서어나무-졸참나무군집, 소나무-개서어나무군집, 소나무-서어나무군집, 서어나무군집, 서어나무-굴거리나무-사스레피나무군집, 소나무군집이었다. 종에 대한 두 기법분석에 의해 추정된 천이계열은 어리목과 영실지역에서는 소나무, 팥배나무$\longrightarrow$졸참나무, 솔비나무$\longrightarrow$개서어나무로, 돈내코지역은 소나무$\longrightarrow$서어나무로 천이가 진행될 것으로 추정된다. 환경인자인 토양양료와 DCA의 score에는 상관성이 인정되지 않았다.

  • PDF

평창 두타산 산림식생의 군집유형과 입지환경요인의 상관관계 (Relationships between Community Unit and Environment Factor in Forest Vegetation of Mt. Dutasan, Pyeongchang-gun)

  • 이정은;신재권;김동갑;윤충원
    • 한국산림과학회지
    • /
    • 제106권3호
    • /
    • pp.275-287
    • /
    • 2017
  • 본 연구는 두타산 일대 산림식생구조를 밝히고, 식생유형분류와 입지환경인자와의 상관관계 파악을 목적으로 수행되었다. 2016년 6월부터 10월까지 Z-M학파의 식물사회학적인 방법에 의해 식생조사를 수행하여 총 46개소의 식생자료를 획득하였고, 이 자료를 토대로 식생분류를 실시하였다. 그 결과, 최상위 수준에서 신갈나무군락군으로 분류되었으며, 신갈나무군락군은 철쭉군락과 거제수나무군락의 2개 군락으로 분류되었다. 철쭉군락은 동자꽃군과 철쭉전형군 2개의 군으로 세분되었고 동자꽃군은 박새소군과 동자꽃전형소군 2개의 소군으로 세분되었다. 거제수나무군락은 들메나무군과 박달나무군 2개 군으로 세분되었다. 들메나무군은 병꽃나무소군과 승마소군 2개 소군으로 세분되었다. 두타산 일대 산림식생은 총 6개의 식생단위, 14개의 종군단위, 2쌍의 대별종군으로 분류되었다. 수관층위구조의 분석결과, 식생단위별로 임관의 계층이 서로 겹치지 않는 단조로운 구조인 박새소군(식생단위 1), 동자꽃전형소군(식생단위 2), 병꽃나무소군(식생단위 4)과 겹치는 복잡한 구조인 철쭉전형군(식생단위 3) 승마소군(식생단위 5), 박달나무군(식생단위 6)이 나타났다. 승마소군(식생단위 5)의 수직적 계층구조가 가장 발달하였으며, 박달나무군(식생단위 6)은 초본층 식피율이 가장 낮았다. 일치법에 의한 식생단위와 환경요인과의 상관관계를 보면, 해발 1,100 m, 사면 중부, 경사 $20^{\circ}$, 암석노출도 20%, 교목층 DBH 30 cm를 기준으로 철쭉군락(식생단위 1~3)과 거제수나무군락(식생단위 4~6)이 분류되었다. CCA 분석 결과 철쭉군락(식생단위 1~3)은 해발, 지형과 정의 상관관계, 거제수나무군락(식생단위 4~6)은 부의 상관관계 분포경향이 나타났다.

계방산 가문비나무 및 전나무 임분의 산림식생유형분류와 정량적 분석 (Forest Vegetation Classification and Quantitative Analysis of Picea jezoensis and Abies hollophylla stand in Mt. Gyebang)

  • 고승연;한상학;이원희;한심희;신학섭;윤충원
    • 한국환경생태학회지
    • /
    • 제28권2호
    • /
    • pp.182-196
    • /
    • 2014
  • 본 연구는 계방산 가문비나무 및 전나무 임분의 산림식생유형분류와 정량적 분석을 위하여 Z-M 식물사회학적 방법으로 식생구조의 유형분류를 실시한 결과, 군락단위에서 가문비나무군락, 전나무군락으로 분류되었으며 가문비나무군락은 군단위에서 흰인가목군과 부게꽃나무군으로 세분되었으며, 전나무군락은 복장나무군과 생강나무군으로 세분되었다. 분류된 식생단위를 기준으로 중요치를 산출한 결과, 가문비나무는 식생단위 1과 2의 교목층에서 각각 30.73%, 20.25%로 비교적 높게 나타나 당분간 가문비나무의 우점이 계속될 것이라 판단되었다. 또한 종다양도를 분석한 결과 식생단위 4의 종다양도 지수는 0.6976으로 가장 낮았으며, 식생단위 2의 종다양도 지수는 1.1256으로 가장 높게 나타났다. 군락간의 유사도는 식생단위 1과 4, 2와 4가 각각 0.2880과 0.3626으로 낮게 나타났으며 식생단위 1과 2, 3과 4의 군락유사성은 각각 0.5411과 0.5041로 나타나, 군락 간 구성종의 차이가 크지 않은 군락으로 판단되었다. 종간연관에 대한 Chi-square matrix와 성좌표를 각각 분석한 결과, 크게 2개의 유형으로 나뉘어졌는데 I유형의 식물 종들은 대부분 식물사회학적으로 분류된 가문비나무군락에서 주로 출현하는 식별종과 표징종이었으며, II유형의 식물종은 전나무군락에서 주로 출현하는 식물종으로, 비교적 습한 곳에 나타나는 종들로 나뉘어졌다. 이러한 결과는 각 수종들이 선호하는 생육환경이 비슷한 종들끼리는 정의 상관이 인정되고, 선호하는 환경이 다른 종들끼리는 부의 상관을 보이는 것으로 판단된다.