• Title/Summary/Keyword: 의사결정나무회귀분석

Search Result 124, Processing Time 0.025 seconds

회귀분석 및 의사결정나무 분석을 통한 R&D 연구비 추정에 관한 연구 (A Study on Estimation of R&D Research Funds by Linear Regression and Decision Tree Analysis)

  • 김동근;천영돈;김성규;이윤빈;황지호;김용수
    • 산업경영시스템학회지
    • /
    • 제35권4호
    • /
    • pp.73-82
    • /
    • 2012
  • Currently, R&D investment of government is increased dramatically. However, the budget of the government is different depending on the size of ministry and priorities, and then it is difficult to obtain consensus on the budget. They did not establish decision support systems to evaluate and execute R&D budget. In this paper, we analyze factors affecting research funds by linear regression and decision tree analysis in order to increase investment efficiency in national research project. Moreover, we suggested strategies that budget is estimated reasonably.

CART 분석을 이용한 지하철 소음모형 개발 및 특성 연구 (The Development of Models and the Characteristics for Subway Noise Using the Classification and Regression Trees)

  • 김태호;이재명;원제무;송인석
    • 한국철도학회논문집
    • /
    • 제10권5호
    • /
    • pp.480-486
    • /
    • 2007
  • 대도시에서 지하철은 많은 도시민들에게 필요한 대중교통수단이다. 그러나 이용수요가 증가함에 따라 환경에 관련된 많은 문제가 발생하였다. 본 연구는 최근 사회적 관심사가 되어 있는 지하철 차내소음 문제를 연구대상으로 선정하였다. 지하철 5호선의 기하구조 및 운영요인을 수집하고, CART분석을 통해 소음자료 특성을 반영한 소음 영향모형을 개발하였다. 모형개발결과 지하철 기하구조 및 운영적 측면의 유형별로 소음에 미치는 영향들에 차이가 있는 것으로 나타났다.

융복합 기반의 지역간 흡연율의 변이 분석 (Convergence-based analysis on geographical variations of the smoking rates)

  • 임지혜;강성홍
    • 디지털융복합연구
    • /
    • 제13권8호
    • /
    • pp.375-385
    • /
    • 2015
  • 본 연구의 목적은 흡연율의 지역간 변이 정도와 흡연율에 영향을 미치는 요인을 살펴보는 데 있다. 분석을 위해 2009-2011년 질병관리본부의 지역사회건강조사 자료와 국민건강보험공단의 자료를 사용하였다. 흡연율에 영향을 미치는 요인을 파악하기 위해 상관분석, 다중회귀분석을 이용하였으며, 지역간 변이 분석을 위해 의사결정나무 모형을 이용하였다. 연구결과, 지역간 흡연율의 변이요인은 고위험음주율, 고혈압관리교육 이수율, 금연캠페인 경험율, 스트레스 인지율, 고혈압 유병률, 건강보험료, 당뇨병 유병률, 비만율, 근력운동 실천율로 나타났다. 융복합 기반으로 지역별 흡연율의 변이를 파악하는 것은 흡연율을 감소시키기 위한 지역별 맞춤형 보건프로그램을 수행하는데 매우 중요하다. 향후 흡연율이 높은 지역의 원인과 대상에 맞는 구체적인 관리방안을 모색하는 노력이 필요할 것이다. 본 연구의 결과는 효과적인 흡연관리사업 방안을 도출하는 데 필요한 기초자료로 의미있게 활용될 수 있으리라 여겨진다.

PGA 투어의 골프 스코어 예측 및 분석 (Prediction of golf scores on the PGA tour using statistical models)

  • 임정은;임영인;송종우
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.41-55
    • /
    • 2017
  • 최근 골프는 많은 사람들의 취미 생활로서 자리를 잡아가고 있으며 골프와 관련된 연구도 다양하게 이루어지고 있다. 본 연구에서는 데이터 마이닝 기법을 사용하여 PGA 투어에 참여하는 선수들의 평균스코어를 예측하고 스코어에 유의한 영향을 미치는 변수들을 제시하고자 한다. 그리고 추가적으로 4개의 PGA 투어 플레이오프에 대해 상위 10명, 상위 25명의 선수들을 예측하는 것을 목표로 한다. 우리는 다양한 선형/비선형 회귀분석 방법을 이용하여 평균스코어를 예측하는데, 선형회귀분석 방법으로는 단계적 선택법, 모든 가능한 회귀모형, 라소(LASSO), 능형회귀, 주성분회귀분석을 사용하였으며 비선형회귀분석 방법으로는 트리(CART), 배깅, 그래디언트 부스팅, 신경망 모형, 랜덤 포레스트, 최근접이웃방법(KNN)을 사용하였다. 대부분의 모형에서 공통적으로 선택된 변수들을 살펴보면 페어웨이의 단단함와 그린의 풀의 높이, 평균최대풍속이 높을수록 선수들의 평균스코어는 높아지며 반대로 한 번에 퍼팅을 성공시키는 횟수와 그린적중률 실패 후 버디나 이글로 점수를 만드는 scrambling 변수들, 그리고 공을 멀리 보낼 수 있는 능력을 나타내는 longest drive는 그 값이 높아짐에 따라 선수들의 평균스코어가 낮아지는 경향이 있음을 알 수 있었다. 11가지 모형 모두 테스트 데이터인 2015년 경기 결과를 예측하는데 낮은 오류율을 보였으나 배깅과 랜덤 포레스트의 예측률이 가장 좋았으며 두 모형 모두 상위 10명과 상위 25명의 랭킹을 예측할 때 상당히 높은 적중률을 보였다.

초음파 측정에 의한 한우의 도체육량 예측 (Prediction of Carcass Yield by Ultrasound in Hanwoo)

  • 이용준;전기준;최성복;석홍기;김석중;이성기;송영한
    • Journal of Animal Science and Technology
    • /
    • 제45권2호
    • /
    • pp.335-342
    • /
    • 2003
  • 본 시험은 초음파를 이용한 한우의 도체육량등급 예측율을 향상시키기 위하여 24개월령 거세한우 573두를 대상으로 출하직전에 체중측정과 함께 실시간 초음파 진단기를 이용하여 도체형질을 측정하였다. 초음파 측정치와 도체 실측치와의 비교분석에서 도출된 다양한 육량예측 기법을 이용하여 도체육량등급을 예측하였고, 그 결과를 요약하면 다음과 같다. 등지방 두께와 배최장근 단면적의 도체 실측치와 초음파 측정치간의 차이는 각각 0.6$\pm$1.65mm와 0.7$\pm$5.56cm2로 나타났다. 등지방 두께 및 배최장근 단면적의 초음파 측정치와 도체 실측치간의 상관계수는 각각 0.86 및 0.82로 높게 나타났다(p<0.001). 도체육량등급 예측율은 육량지수 산식, 등지방 보정식, 중회귀 분석 및 의사결정나무 분석에서 각각 80.3%, 81.3%, 80.1% 및 81.8%를 보여, 의사결정나무 분석이 예측율과 활용성이 가장 높은 것으로 나타났다.

웰니스 지역사회 중심의 고혈압 치료율 관리 방안에 관한 연구 : 광주광역시 중심으로 (The Study on Hypertension Cure Rate Management Centering around Wellness Local Community : With GwangJu as a Central Figure)

  • 양유정;박종호
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권8호
    • /
    • pp.351-361
    • /
    • 2021
  • 본 연구는 웰니스 지역사회 중심의 고혈압 치료율 관리 방안을 마련하기 위해 지역회건강조사를 이용하여 광주광역시의 고혈압 치료 요인을 파악하고, 고혈압 치료율 관리 방안을 수립하고자 시행하였다. 본 연구를 위해 2017년부터 2019년까지의 질병관리청의 지역사회건강조사 자료 총 685,820건 중 광주광역시 조사자료 13,714건을 추출하였다. 조사자료 중 30세 이상 고혈압 진단 경험이 있는 자 2,941건을 최종 연구대상자로 선정하여 SAS 9.4, SAS Enterprise Miner 15.1을 사용하여 분석하였다. 분석 결과로는 고혈압 진단 경험자의 사회경제적 특성에 따른 광주광역시 고혈압 진단 치료율 차이는 성별, 연령, 결혼 유무, 교육수준, 경제활동 여부, 월 가구소득으로 나타났고, 건강행태 특성에 따른 고혈압 치료율 차이는 현재흡연, 월간음주, 고위험음주, 아침식사, 양호한 건강수준 인지, 당뇨 동반 및 당뇨 치료, 연간 미충족 의료, 연간 보건기관 이용 여부에 통계적으로 유의한 차이가 있는 것으로 나타났다. 고혈압 치료에 영향을 미치는 요인을 파악하기 위해 로지스틱 회귀 분석과 대화식 의사결정나무 분석을 실시한 결과 동일에게 나타난 요인은 연령, 결혼유무, 당뇨 동반 및 당뇨 치료여부, 연간 미충족 의료여부로 나타났다. 본 연구의 결과로 광주광역시는 낮은 연령층에게 고혈압 치료의 중요성을 인지시키고, 합병증 질환이 발생되지 않도록 효율적인 대책 마련과 함께 보건 교육학적인 노력이 필요할 것으로 사료된다.

위계적 선형모형을 이용한 강의평가 결정요인 분석 (Determinants of student course evaluation using hierarchical linear model)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1285-1296
    • /
    • 2013
  • 강의평가 결과에 영향을 미치는 특성변수로는 교과목 수준의 다양한 강좌특성 변수들과 수강생 수준의 다양한 인적특성 변수들이 있다. 특정 수강생은 다수의 교과목을 이수하기 때문에 다수의 교과목들은 동일한 수강생 안에 속하게 됨으로써 공유되는 특성이 있게 된다. 즉 강의평가 결과는 교과목 수준의 강좌특성 (1-수준)과 수강생 수준의 인적특성 (2-수준)에 의해 영향을 받는 다층구조 (multilevel)를 가지게 되며, 위계적 자료 특성을 가지는 복수의 분석단위의 구조가 된다. 따라서 전통적인 회귀분석에서와 같이 개별 교과목들이 독립이라는 가정을 할 수 없게 된다. 본 논문에서는 강의평가결과에 영향을 미치는 다층구조의 특성을 가진 변수들의 영향력을 보다 타당하게 분석하기 위한 방법으로 위계선형모형 (HLM; hierarchical linear model)을 이용하였다. 분석결과는 다음과 같다. 먼저 교과목 수준의 특성변수들 중에 강좌규모, 개설학년, 담당교수의 전임여부, 해당 교과목의 총 평균평점, 원어강좌 여부가 통계적으로 유의하게 강의평가 결과에 영향을 미친 것으로 나타났다. 또한 수강생 수준의 인적특성 변수들 중에는 성별, 학과계열, 대입당시 전형방법, 평균평점 등이 유의하게 강의평가 결과에 영향을 미친 것으로 나타났다.

복합만성질환 입원환자의 중증도 보정 사망비에 대한 융복합 연구 (A Convergence Study in the Severity-adjusted Mortality Ratio on inpatients with multiple chronic conditions)

  • 서영숙;강성홍
    • 디지털융복합연구
    • /
    • 제13권12호
    • /
    • pp.245-257
    • /
    • 2015
  • 본 연구는 복합만성질환 입원환자를 대상으로 중증도 보정 사망 예측모형을 개발하고, 중증도 보정 사망비의 변이 요인을 규명하여 변이를 줄일 수 있는 방안을 제시하고자 하였다. 이를 위해 퇴원손상심층조사 자료 2008년부터 2010년까지 자료를 수집하고 주진단이 만성질환이면서 주진단을 포함하여 2개 이상의 만성질환을 보유한 30세 이상의 복합만성질환 입원환자 110,700건을 최종 연구대상으로 선정하였다. 예측 모형 개발 시 데이터마이닝 기법(로지스틱회귀분석, 의사결정나무, 신경망 기법)을 적용하였다. 본 연구에서는 Elixhauser comorbidity index 동반상병 보정지수를 이용하여 의사결정나무분석으로 복합만성질환 입원환자의 중증도 보정 사망 예측모형을 개발하였다. 복합만성질환 입원환자의 의료기관 중증도 보정 사망비(HSMR)를 산출 한 결과 진료비 지불방법별, 병상규모별, 의료기관소재지별로 통계적으로 유의한 차이가 있는 것으로 나타났다. 상기 분석결과를 바탕으로 국가적 차원에서 복합만성질환 입원환자의 사망비를 효율적으로 관리하여 의료의 질 향상과 증가하는 의료비 부담 감소를 위해 지속적인 관심과 노력을 기울여야 할 것이다.

Prediction of drowning person's route using machine learning for meteorological information of maritime observation buoy

  • Han, Jung-Wook;Moon, Ho-Seok
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.1-12
    • /
    • 2022
  • 해양조난사고 발생 시 해상 익수자의 안전과 생명 보장을 위해 구조자산을 활용한 신속한 탐색 및 구조작전은 매우 중요하다. 본 연구는 해양관측부이에서 수집되는 기상정보에 다중선형회귀분석, 의사결정나무, 서포트벡터머신, 벡터자기회귀, 순환신경망의 LSTM을 활용하여 울릉도 북서해역의 표층해류를 분석하고 유향과 유속에 대한 각각의 예측모형을 구축하여 예측된 유향과 유속정보를 통해 해상 익수자의 이동경로를 예측하는 모형들을 제안한다. 본 연구에서 적용한 다양한 기계학습 모형을 MAE와 RMSE의 성능 평가척도로 비교해 볼 때 LSTM이 가장 우수한 성능을 보였다. 또한, 익수자 이동지점과 예측모형의 예측지점 간 거리 차이에 있어서도 LSTM이 다른 모형들에 비해 탁월한 성능을 나타내었다.

한국관광 실태조사 빅 데이터 분석을 통한 관광산업 활성화 방안 연구 (A Study on the Revitalization of Tourism Industry through Big Data Analysis)

  • 이정미;류미나;임규건
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.149-169
    • /
    • 2018
  • 본 연구에서는 한국문화관광연구원에서 조사된 "2013년~2015년 외래 관광객 실태조사"의 약 36,000개 데이터에 대한 빅 데이터 분석을 통해 관광산업 활성화 방안을 도출해 보고자 한다. 이를 위해서 외래 관광객들의 '전반적 만족도', '재방문 의사', '추천의사' 변수에 가장 많은 영향을 끼치는 요인을 분석하고 해당 요인들의 각각에 대한 영향력에 대해 파악 하였다. 본 연구에서는 SPSS IBM Modeler 16.0의 의사결정나무(C5.0, CART, CHAID, QUEST), 인공신경망, 로지스틱 회귀분석의 데이터마이닝 기법을 이용하여 종속변수에 가장 큰 영향을 미치는 상위 변수 7개씩을 각각 도출하였고, 추가적으로 각 독립변수들의 영향력을 심도 있게 파악하기 위하여 R프로그래밍을 활용하여 SPSS IBM Modeler 16.0을 통해 도출된 각 독립변수들의 영향력을 파악하였다. 데이터 분석 결과 '전반적 만족도'에 가장 영향을 미치는 상위 변수 7개는 관광지매력도, 음식만족도, 숙박만족도, 교통수단만족도, 안내서비스만족도, 방문관광지수, 국가로 나타났으며 가장 큰 영향력을 미친 변수는 음식만족도와 관광지매력도로 분석되었다. '재방문 의사'에 가장 영향을 미치는 상위 변수 7개로는 국가, 여행 동기, 활동, 음식만족도, 제일 좋았던 활동, 관광안내서비스만족도, 관광지매력도로 나타났으며 그중 가장 큰 영향력을 미친 변수는 음식만족도와 여행 동기로 분석되었다. 마지막으로 '추천의사'에 영향을 미치는 상위 변수 7개로는 국가, 관광지매력도, 방문관광지수, 음식만족도, 활동, 관광안내서비스만족도, 비용으로 나타났으며 가장 큰 영향력을 미친 변수는 국가, 관광지매력도, 음식만족도로 분석되었다. 따라서 세 변수에 공통적으로 영향을 끼치는 요인은 음식만족도, 관광지매력도로 분석되었으며 해당 요인들이 공통적으로 한국여행에 대한 전반적 만족도와 재방문 의사, 추천의사에 미치는 영향이 크다는 것을 확인할 수 있었다. 본 연구는 외래 관광객들의 한국관광에 대한 활성화 방안을 "외래 관광객 실태조사" 빅 데이터 분석을 통해 규명함으로써 한국 관광 데이터 분석의 활용과 관광 정책 수립의 기초자료로 활용될 수 있을 것으로 기대되며 향후 기업 및 국가차원에서 한국 관광발전에 기여할 수 있는 활성화 방안을 마련하는 자료로 사용될 수 있을 것으로 기대한다.