• 제목/요약/키워드: 의사결정나무알고리즘

검색결과 106건 처리시간 0.025초

청각장애인의 취업결정요인 분석 연구 -데이터마이닝 기법(Exhaustive CHAID)의 적용 (Analyzing vocational outcomes of people with hearing impairments : A data mining approach)

  • 신현욱
    • 디지털융복합연구
    • /
    • 제13권11호
    • /
    • pp.449-459
    • /
    • 2015
  • 본 연구의 목적은 청각장애인의 취업결정요인을 데이터마이닝 기법을 적용하여 분석 제공함으로서, 장애인의 취업 성공률을 높임과 동시에 직업재활 개입의 효율성을 극대화할 수 있는 방안을 제시하는데 있다. 자료 분석을 위해 2013년 장애인고용패널조사의 제6차년도 자료를 이용하여, 전체 패널 데이터 중 청각장애인이면서 전체연령 20세 이상 65세 미만의 422명을 의사결정나무 기법의 하나인 Exhaustive CHAID 알고리즘을 적용하여 분석하였다. 본 연구를 통해서 얻어진 주요한 사실의 하나는 국민기초생활수급여부, 일상생활 도움필요 여부, 그리고 자격증 고용서비스 요인간의 상호작용(interaction)에 관한 패턴 분석이 청각장애인의 취업 예측에 주요한 역할을 할 수 있다는 것으로, 향후 직업재활 개입의 효과성을 높이기 위해 효과적인 취업결정요인, 즉 높은 학력 수준, 자격증 보유, 높은 일상생활 독립성을 가지고 있는 장애인을 적극적으로 발굴하여 집중적인 재활 서비스를 제공할 필요가 있을 것으로 사료된다.

토지 보상비 추정 모델 개발 - 건설CALS데이터와 공공데이터 중심으로 (Development of Land Compensation Cost Estimation Model : The Use of the Construction CALS Data and Linked Open Data)

  • 이상규;김진욱;서명배
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.375-378
    • /
    • 2020
  • 본 연구는 토지 보상비의 추정 모델 개발을 위해서 건설 CALS (Continuous Acquisition & Life-cycle Support) 시스템의 내부데이터와 개별공시지가 및 표준지 공시지가 등의 외부데이터, 그리고 개발된 추정 모델의 고도화를 위한 개별공시가 데이터를 기반으로 생성된 데이터를 활용하였다. 이렇게 수집된 3가지 유형의 데이터를 분석하기 위해서 기존 선형 모델 또는 의사결정나무 (Tree) 기반의 모델상 과적합 오류를 제거할 경우 매우 유용한 알고리즘으로 Decision Tree 기반의 Xgboost 알고리즘을 데이터 분석 방법론으로 토지 보상비 추정 모델 개발에 활용하였다. Xgboost 알고리즘의 고도화를 위해 하이퍼파라미터 튜닝을 적용한 결과, 실제 보상비와 개발된 보상비 추정 모델의 MAPE(Mean Absolute Percentage Error) 범위는 19.5%로 확인하였다.

  • PDF

Decision Tree를 이용한 효과적인 유방암 진단 (Effective Diagnostic Method Of Breast Cancer Data Using Decision Tree)

  • 정용규;이승호;성호중
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.57-62
    • /
    • 2010
  • 최근 의료분야에서는 대규모의 데이터를 빠르게 검색 및 추출이 가능하게 의사결정트리 기법에 대한 연구들이 진행되고 있다. 현재 CART, C4.5, CHAID 등 여러 기법이 개발되었는데, 이러한 클레시파이 기법들은 몇몇 의사결정 나무 알고리즘이 이진분리로 분류를 하는데, 나머지 데이터의 결과가 손실될 우려가 있다. 그중 C4.5는 엔트로피의 측정값에 높고 낮음으로 트리 모양을 구성해 가는 방식이고, CART 알고리즘은 엔트로피 매트릭스를 사용하여 범주형 자료나 연속형 자료에 적용할수가 있다. 이에 본 논문에서는 클래시파이 기법 중 C4.5와 CART를 유방암 환자 데이터에 대해 적용하여 실험하여, 그 결과 분석을 통한 성능 평가를 수행하였다. 실험에서는 교차검증을 통해 그 결과에 대한 정확성을 측정하였다.

중학생을 위한 의사결정나무 알고리즘 교육을 제공하는 메타버스 기반 게임 콘텐츠 개발 (Development of a Game Content Based on Metaverse Providing Decision Tree Algorithm Education for Middle School Students)

  • 현수빈;김유진;박찬정
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.106-117
    • /
    • 2022
  • 2021년에는 고등학교 교육과정에서 인공지능기초 과목이 도입되었다. 과거 교육에 ICT 접목 시 발생했던 원리 보다 활용 중심 교육의 문제가 인공지능 교육의 도입에도 되풀이될까 우려하는 의견이 다수 존재한다. 기존의 인공지능 교육 플랫폼은 대부분 인공지능의 활용에만 초점을 두고 있다. 중학생의 인공지능 교육을 위해 인공지능이 결과를 도출하는 과정에 관한 학습과 인공지능 알고리즘의 원리 학습에 어려움이 있다. 최근 메타버스의 교육적 적용이 화두가 되면서, 학생들의 몰입감과 흥미를 유발해 학습성취도 향상에 도움을 주려는 연구들이 시작되었다. 본 연구는 중학교 인공지능 교육에서 활용될 수 있는 교육 콘텐츠로 메타버스를 활용한 의사결정나무 알고리즘에 관한 교육 게임 콘텐츠를 개발하였다. 게임을 교육에 접목함으로써 학생들의 인공지능에 대해 흥미와 몰입감을 높이고 교육 효과를 높이고자 하였다. 본 연구에서는 개발한 게임 콘텐츠에 관하여 예비 교원들을 대상으로 교육 효과성, 난이도, 흥미 정도를 조사·분석하였고, 이를 바탕으로 향후 원리 중심의 인공지능 교육 방법에 관하여 제언하였다.

상완동맥 색조 도플러 초음파 영상에서 FCM과 퍼지 의사 결정 트리를 이용한 혈류 속도 추출 (Extraction of Blood Velocity Using FCM and Fuzzy Decision Trees in Doppler Ultrasound Images of Brachial Artery)

  • 김광백;정영진;남윤만;이재열
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.19-22
    • /
    • 2019
  • 상완동맥은 어깨에서부터 팔꿈치까지 내려오는 상완골의 내측부에 존재하며 혈압을 측정할 때 사용되는 혈관이다. 이 혈관은 골절로 인해 찢어지거나, 또는 혈액순환에 문제가 생겨 혈관이 막히는 경우가 발생한다. 이러한 경우 혈관의 상태를 확인하기 위하여 색조 도플러 초음파 검사를 사용하지만, 사용자에 따라 영상을 통한 판단 기준이 다르다는 문제점이 발생한다. 따라서 본 논문에서는 FCM과 Fuzzy Decision Tree를 이용한 영상 처리를 통해 일관성 있는 판단기준을 세우기 위한 혈류의 속도를 제안한다. 색조 도플러 초음파 영상에서의 상완 동맥을 추출하여 기울기를 이용한 FCM 알고리즘을 통해 소속도를 추출한 뒤 퍼지 룰에 적용하여 의사 결정 트리로 등급을 분류하고 결과적으로 혈류 속도를 추출한다. 색조 도플러 초음파 영상에서 환자의 개인 정보를 보호하기 위해 개인 정보 영역을 제거하여 ROI 영역을 추출하고 ROI 영역을 이진화를 통하여 상완동맥이 있는 영역을 추출한다. 이진화 된 ROI 영역에서 혈관 영상의 혈류 방향으로의 무게중심을 설정하고 각각의 픽셀과 무게중심 선과의 거리를 이용하여 소속도를 추출한 후 FCM을 사용하여 최적의 기울기를 선정한다. FCM을 통해 추출한 최종 소속도를 이용하여 퍼지 룰에 적용한 뒤 계산된 T-norm과 소속도의 분산을 이용하여 의사 결정 트리를 형성 트리의 단말 노드들은 각 픽셀을 분류한다. 분류되어진 데이터들의 노드별 소속도 평균을 구한 뒤 디퍼지화를 통해 COG(Center of Gravity)를 계산한다. 마지막으로 그 값을 이용하여 혈류 속도에 영향을 미치는 정도를 계산한 뒤 최종 혈류의 속도를 제안한다.

  • PDF

미국 인구통계 데이터를 이용한 분산형 데이터마이닝 시스템 성능평가 (The evaluation of Distributed Data Mining System using USA census Database)

  • 김충곤;우정근;김성국;백성욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.191-194
    • /
    • 2007
  • 본 논문에서는 분산형 환경에 적합한 새로운 의사결정나무 알고리즘을 제안하고 그 실용성을 확인하기 위해 분산형 데이터마이닝 시스템을 구현하였다. 그리고 본 논문에서 구현한 시스템을 평가하기 위해 데이터의 신뢰성이 높은 방대한 양의 미국의 인구통계 데이터(Census bureau database)를 사용하였다. 본 논문에서 구현한 시스템을 이용하여 신뢰성을 테스트하였고 그 결과가 다른 시스템의 알고리즘과 유사한 신뢰성을 나타내었다.

  • PDF

의사결정트리 기법을 이용한 파프리카용 스마트팜 전문가 시스템 (Smart Farm Expert System for Paprika using Decision Tree Technique)

  • 정혜선;이인용;임중선
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.373-376
    • /
    • 2018
  • 기존의 파프리카 스마트팜 시스템의 경우 여러 센서 값을 기준 값에 추종하도록 설정 되어 있기 때문에 다른 외란의 값이 들어오면 시스템이 최적의 판단을 하지 못하는 경우가 많아 파프리카 생장에 유해한 경우가 발생한다. 이를 의사결정 나무 기법을 활용하여 파프리카 스마트팜용 전문가 시스템을 설계하여 주변 환경에 따라 달라지는 요소들에 의해 생성되는 데이터를 사용하여 농민의 경험치와 유사한 의사결정 구조를 가진 제어 알고리즘을 구축한다. 현재의 스마트팜 제어시스템의 경우 농민이 설정해둔 기준 값에 센서 값들을 추종하도록 시스템화 되어 있기 때문에 주변 환경의 외란에 대한 사용자의 개입이 필수적이다. 파프리카 스마트팜 장비를 제어하기 전 여러 환경 요소 중 가장 영향력을 미치는 것을 선정한 후 농민들의 경험치와 표준 의사결정 기준이 반영된 복합 환경제어를 위한 전문가 시스템을 모델링하였다. 설계된 모델은 내외부 환경 데이터에 의해 학습된 의사결정트리 기반의 파프리카용 전문가시스템으로 서, 사용자의 간섭을 최소화한 제어기를 설계할 수 있도록 지원한다. 이번 연구를 통해 여러 데이터를 복합 시키면서 각 환경 요소들이 상호관계를 갖고 있으며, 나아가 여러 주변 환경 요소들이 생장에 영향을 미치고 있기에 전문가용 파프리카 스마트팜을 만들 때 표준이 될 수 있는 제어 알고리즘이 될 것으로 기대한다.

  • PDF

데이터 마이닝을 이용한 고혈압환자의 당뇨질환 동반에 관한 데이터 질 관리 알고리즘 개발 (Developing data quality management algorithm for Hypertension Patients accompanied with Diabetes Mellitus By Data Mining)

  • 황규연;이은숙;김고원;홍성옥;박정선;곽미숙;이예진;임채혁;박태현;박종호;강성홍
    • 디지털융복합연구
    • /
    • 제14권7호
    • /
    • pp.309-319
    • /
    • 2016
  • 보건의료데이터의 질적 수준을 향상시키기 위해서는 데이터 질 관리 알고리즘을 개발할 필요성이 있다. 이에 본 연구에서는 질환의 유병률, 입원율이 높은 고혈압 환자의 당뇨질환 동반에 관련된 데이터 질 관리 알고리즘을 개발하고자 하였다. 이를 위해 2011년, 2012년 퇴원손상심층조사 자료 중 고혈압 환자 61,199건을 추출하여 분석대상으로 하였다. 데이터 마이닝의 대화식 의사결정나무 방법과 Outlier Detection 방법론을 통해 데이터 질 관리 알고리즘 개발한 결과 고혈압 환자가 당뇨병을 동반상병으로 가지는데 영향을 미치는 요인으로는 성별, 연령, 당뇨병성 사구체 장애, 당뇨병성 망막병증, 당병성 다발성 신경병증 등이 있었다. 의사결정나무 결과에 따라 당뇨병을 동반상병으로 가질 확률 값이 80% 이상이거나, 20% 이하인 집단을 Outlier(극단치)로 정의하고, 고혈압 환자의 당뇨 동반에 대한 극단치를 가지는 6개 집단을 발견하였다. 이와 같이 Outlier(극단치) 집단에 포함되는 실제 데이터를 확인하여 데이터의 질적 수준을 향상 시킬 필요가 있다.

국민건강영양조사를 활용한 대사증후군 유병 예측모형 개발을 위한 융복합 연구: 데이터마이닝을 활용하여 (Development of Prediction Model for Prevalence of Metabolic Syndrome Using Data Mining: Korea National Health and Nutrition Examination Study)

  • 김한결;최근호;임성원;이현실
    • 디지털융복합연구
    • /
    • 제14권2호
    • /
    • pp.325-332
    • /
    • 2016
  • 이 연구의 목적은 국민건강영양조사 2012년 자료 중 40세 이상 성인의 대사증후군 유병 여부를 예측에 영향을 미치는 변수를 확인하고 이를 예측하는 모형 개발하는데 있다. 선행연구를 통해 모델 생성에 필요한 투입변수를 선정하였다. 연구결과 투입변수 중 사회경제적 요인이 상위 순위에 해당하였으며, 건강행위 요인의 경우 하위 순위로 나타났다. 또한, 최종 예측모형은 의사결정나무 (Decision Tree)일 경우 90. 32%의 가장 높은 예측력을 나타내고 있었다. 이 연구의 결과는 다음과 같은 시사점을 나타낸다. 먼저, 대사증후군에 대한 예방 및 관리에 있어 건강행위에 대한 접근과 함께 사회경제적 요인에 대한 접근도 병행을 고려해야 한다. 또한, 의사결정나무 알고리즘의 경우 결과해석의 용이성이 있어 보건의료분야에서 많이 사용되며, 선행연구의 결과와 마찬가지로 높은 예측정확도를 나타내고 있다.

국민건강보험 청구자료 기반의 결핵환자 분류 고도화 모형 개발 (Development of Advanced TB Case Classification Model Using NHI Claims Data)

  • 박일수;김유미;최연희;김성수;김은주;원시연;강성홍
    • 디지털융복합연구
    • /
    • 제11권9호
    • /
    • pp.289-299
    • /
    • 2013
  • 본 연구의 목적은 현재 질병관리본부에서 사용하고 있는 건강보험 청구자료 기반의 결핵환자 분류기준을 고도화하여 보다 효과적인 결핵환자감시체계의 토대를 제공하기 위해 수행되었다. 이를 위해 건강보험심사평가원의 2009년 1년간 결핵상병으로 청구된 81,199명 중 10%인 8,118명을 표본추출한 후 실제 결핵환자인지에 대해서 의무기록 조사를 실시하여 조사가 완료되고, 국민건강보험공단 건강보험청구 자료와 매칭이 완료된 7,132명을 최종 분석대상자로 하였다. 결핵환자분류를 위한 모형을 개발하여 평가한 결과 결핵과 관련된 임상전문가 의견과 통계적 분류 알고리즘이 종합적으로 고려된 의사결정나무모형이 가장 우수한 모형으로 평가되었다. 의사결정나무 모형에 따른 결핵분류모형의 주요 독립변수는 연령, 최초 청구시점의 결핵약제 종류수, 최초 청구시점의 이용 의료기관 유형, 최초 청구시점의 청구결핵검사 종류, 2008년 결핵약 투약일수, 최초 청구시점 결핵약제 투약일수, 최초 청구시점 결핵상병 종류로 나타났다. 이 모형의 향상도는 최고 11.8이였으며, 개발된 모형에서 분류된 1~5유형까지 적용하여 청구된 자료 중 결핵이 아님을 예측할 경우, 민감도는 90.6%, 양성예측도는 96.1%, 정분류율은 87.6%로 나타나, 현재 질병관리본부에서 사용하는 청구2회 이상, 약제 2제 이상 모형(민감도 82.6%, 양성예측도 95%, 정분류율 80%)보다 우수한 모형인 것으로 나타났다.