• 제목/요약/키워드: Predicted power

검색결과 1,293건 처리시간 0.021초

SVM과 meta-learning algorithm을 이용한 고지혈증 유병 예측모형 개발과 활용 (Development and application of prediction model of hyperlipidemia using SVM and meta-learning algorithm)

  • 이슬기;신택수
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.111-124
    • /
    • 2018
  • 본 연구는 만성질환 중의 하나인 고지혈증 유병을 예측하는 분류모형을 개발하고자 한다. 이를 위해 SVM과 meta-learning 알고리즘을 이용하여 성과를 비교하였다. 또한 각 알고리즘에서 성과를 향상시키기 위해 변수선정 방법을 통해 유의한 변수만을 선정하여 투입하여 분석하였고 이 결과 역시 각각 성과를 비교하였다. 본 연구목적을 달성하기 위해 한국의료패널 2012년 자료를 이용하였고, 변수 선정을 위해 세 가지 방법을 사용하였다. 먼저 단계적 회귀분석(stepwise regression)을 실시하였다. 둘째, 의사결정나무(decision tree) 알고리즘을 사용하였다. 마지막으로 유전자 알고리즘을 사용하여 변수를 선정하였다. 한편, 이렇게 선정된 변수를 기준으로 SVM, meta-learning 알고리즘 등을 이용하여 고지혈증 환자분류 예측모형을 비교하였고, TP rate, precision 등을 사용하여 분류 성과를 비교분석하였다. 이에 대한 분석결과는 다음과 같다. 첫째, 모든 변수를 투입하여 분류한 결과 SVM의 정확도는 88.4%, 인공신경망의 정확도는 86.7%로 SVM의 정확도가 좀 더 높았다. 둘째, stepwise를 통해 선정된 변수만을 투입하여 분류한 결과 전체 변수를 투입하였을 때보다 각각 정확도가 약간 높았다. 셋째, 의사결정나무에 의해 선정된 변수 3개만을 투입하였을 때 인공신경망의 정확도가 SVM보다 높았다. 유전자 알고리즘을 통해 선정된 변수를 투입하여 분류한 결과 SVM은 88.5%, 인공신경망은 87.9%의 분류 정확도를 보여 주었다. 마지막으로, 본 연구에서 제안하는 meta-learning 알고리즘인 스태킹(stacking)을 적용한 결과로서, SVM과 MLP의 예측결과를 메타 분류기인 SVM의 입력변수로 사용하여 예측한 결과, 고지혈증 분류 정확도가 meta-learning 알고리즘 중에서는 가장 높은 것으로 나타났다.

사상체질분류검사지(四象體質分類檢査紙)(QSCC)II에 대(對)한 타당화(妥當化) 연구(硏究) -각(各) 체질집단(體質集團)의 군집별(群集別) Profile 분석(分析)을 중심(中心)으로- (The Validation Study of the Questionnaire for Sasang Constitution Classification (the 2nd edition revised in 1995) - In the field of profile analysis)

  • 이정찬;고병희;송일병
    • 사상체질의학회지
    • /
    • 제8권1호
    • /
    • pp.247-294
    • /
    • 1996
  • 본 논문은 사상채질분류검사지의 표준화 연구와 공동작업으로 행해진 연구로써 최근에 들어 다각도로 행해지고 있는 사상체질분류 객관화 연구의 한 방면이라고 하겠다. 본 논문의 주된 내용은 진단정확률의 확인을 통하여 새로 개발된 검사지의 타당도를 검증해 보고 프로파일 분석이라고 하는 통계분석상의 기법을 활용해서 설문지에 대한 적응도가 다소 떨어지는 집단들을 추출해내고 그들의 특성을 분석연구하자는 것이다. 연구에 사용된 검사지는 기본의 1992년판 검사지를 의학, 문학, 철학 및 심리화분야등 각 방면에서 폭넓은 검토를 거쳐 개정한 것이다. 본 연구의 대상이 되는 집단은 1995년 8월 7일부터 동년 9월 6일까지 경희의료원 동서종합건진센터 및 경희의료원 한방병원의 사상의학과에서 수진하여 전문의의 사상체질변증과정을 거친 외래환자들의 집단과 체질변증 과정이 없이 개방적으로 자료를 모집하되 연령별, 성별, 학력별로 나누어 고르게 분포하도록 한 일반인들의 집단으로 집단내 인원수는 각각 총 274명과 1092명이었다. 이들로부터 채집된 자료중 환자집단의 자료를 가지고 진단정확률을 조사하고, 일반인군 자료의 표준화에서 얻어진 규준(norms)을 환자군의 사상척도점수에 적용하여 T점수를 구하고 다변량군집분석을 시행하여 집단별 특성을 프로파일 그래프로 작성하여 파악해 보는 작업을 거쳐 다음과 같은 결론을 얻었다. 1. 예언집단과 실제 집단간의 비교로 나타나는 진단정확률은 기존의 QSCC에 비하여 대폭 향상된 70.08%로 나타나 검사지의 타당도가 입증되었다. 2. 각 체질집단의 전체 프로파일 특성비교에서 각 체질별로 해당척도에 대한 반응은 모든 척도에서 일정하게 상승되어 체질변증의 측면에서 긍정적인 양상을 보였다. 3. 자기표현의 정도를 중심으로 관찰해 본 전체 프로파일의 분석에서는 소양집단이 가장 뚜렷한 선명성을 보였고 소음집단이 가장 취약하였으며 태음집단은 이중적 속성을 나타냈다. 4. 각 체질별 세 군의 하위집단중에서 소위 이탈집단이라고 할 수 있는 부류의 집단은 나머지 두 집단과 프로파일의 특성에 있어서 확연히 구분되는 양상을 보였는 바 그 내용은 다음과 같다. 가. 소양인의 이탈집단은 소양집단의 일반적 속성과 달리 현저하게 소극적인 양상을 보였으며 소음척도에서 비교적 높은 반응을 보였다. 나. 태음인의 이탈집단은 점수분포가 매우 낮은 소극적 양상을 보였으며 태음집단의 특성인 태양-태음 동반상승과는 반대로 태양척도에서 점수가 급락하는 현상을 나타냈다. 다. 소음인의 이탈집단은 소양집단의 프로파일 형태와 유사한 특성을 보여 소음집단 특유의 소극적이고 표현에 취약한 특성이 대부분 희석된 것으로 나타났다. 이상의 결과로 보아 제작된 검사지의 타당도가 입증되었으며 본 연구의 과정에서 실시한 체질별 이탈집단의 프로파일 분석을 통해 몇가지 방향에서 그들의 특성을 파악할 수 있었다. 이 결과는 추후에 본 검사지의 개선에 하나의 자료로 이용될 수 있을 것으로 기대하며 검사지의 발전을 위해서는 이탈집단과 대조집단의 특성차이에 대한 좀 더 심층적인 연구가 지속되어져야 할 것으로 사료된다.

  • PDF

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.