• 제목/요약/키워드: K-best algorithm

검색결과 1,029건 처리시간 0.029초

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

빅데이터 기반 추천시스템 구현을 위한 다중 프로파일 앙상블 기법 (A Multimodal Profile Ensemble Approach to Development of Recommender Systems Using Big Data)

  • 김민정;조윤호
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.93-110
    • /
    • 2015
  • 기존의 협업필터링 추천시스템 연구는 상품에 대한 고객의 평점(rating)이나 구매 여부 데이터로부터 하나의 프로파일을 생성하고 이를 기반으로 추천 성능을 향상시킬 수 있는 새로운 알고리즘을 개발하는 위주로 진행되어 왔다. 그러나 빅데이터 환경이 도래하면서 기업이 수집할 수 있는 고객 데이터가 풍부해지고 다양해짐에 따라, 보다 정확하게 고객의 선호도나 행태를 파악하는 것이 가능하게 되었고 이러한 데이터, 즉 퍼스널 빅데이터(personal big data)를 추천시스템에 활용하는 연구의 필요성이 대두되고 있다. 본 연구에서는 마케팅의 시장세분화 이론에 근거하여 퍼스널 빅데이터로부터 고객의 선호도나 행태를 다양한 관점에서 표현할 수 있는 5종의 다중 프로파일(multimodal profile)을 개발하고, 이를 활용하여 협업필터링 추천시스템의 성능을 개선하고자 한다. 제안하는 5종의 다중 프로파일은 프로파일 통합 유사도, 개별 프로파일 유사도 평균, 개별 프로파일 유사도 가중 평균이라는 세 가지 앙상블 기법을 통해 협업필터링의 이웃(neighborhood) 탐색과정에 적용된다. 실제 퍼스널 빅데이터에 본 연구에서 제안하는 방법론을 적용한 결과, 단일 프로파일을 사용하는 협업필터링 알고리즘보다 추천 성능이 상당히 개선되었으며 앙상블 방법 중에서는 개별 프로파일 유사도 가중 평균 기법이 가장 높은 추천 성능을 보여주었다. 본 연구는 빅데이터 환경에서 추천시스템을 개발하고자 할 때, 어떠한 성격의 데이터로부터 고객의 특성을 규명하는 프로파일을 만들고 이를 어떻게 결합하여 사용하는 것이 효과적인 지 처음으로 제안하였다는 점에서 그 의의가 있다.

사례기반추론을 이용한 사무지식 추천시스템 (A Study on the Design of Case-based Reasoning Office Knowledge Recommender System for Office Professionals)

  • 김명옥;나정아
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.131-146
    • /
    • 2011
  • 오늘의 글로벌 네트워크 비즈니스 환경에서 비서직 종사자들에게 신속 정확한 정보수집 능력과 올바른 판단력은 그 어느 때보다 필요한 역량으로 중시되고 있다. 비서직 업무 수행에 필요한 대부분의 지식은 체험지 혹은 경험지이기 때문에 비서가 주어진 문제를 해결하기 위해서 과거의 비슷한 사례를 참고하는 방법은 매우 타당한 것이며, 경험이나 선례를 적용함으로서 실패할 요인을 줄이고 문제 해결의 질을 높이는 동시에 시간을 단축시킬 수 있다. 본 연구에서는 비서 업무 수행 시 특정 문제 해결에 필요한 정보를 사례기반 추론에 근거하여 현재 문제와 가장 유사한 과거의 사례를 추천하는 시스템(COKRS : Case-based reasoning Office Knowledge Recommender System, 이하 COKRS)을 설계하고 프로토타입을 구축함을 목적으로 한다. 본 연구 결과인 COKRS는 비서직에서 뿐만 아니라 일반 사무영역에서의 지식관리 목적으로도 확대 이용 될 수 있을 것이다.

임신과 수유기 우울증의 치료 전략 (Treatment Strategies for Depression during Pregnancy and Lactation)

  • 이소영;정한용
    • 생물정신의학
    • /
    • 제14권2호
    • /
    • pp.91-98
    • /
    • 2007
  • 임신 및 수유기 동안의 우울증의 치료에 관한 연구 실적을 고려했을 때 일반적인 우울증과는 구분하여 치료계획을 수립하는 것이 필요하다. 이에 저자들은 체계적인 검색을 통해 광범위하게 조사를 하였으나, 임신과 수유기 우울증 환자의 약물치료에 대한 근거는 아직까지 전체적으로 부족한 것으로 생각된다. 임신과 수유기 우울증의 치료는 그 시점과 개개인의 상황에 따라 최선의 의사결정을 해야 한다. 의사 결정은 위험과 이득에 관한 평가에 기초해서 이루어져야 하는데, 여기에는 약물치료의 위험과 우울증의 위험, 약물의 위험과 대체 치료의 위험, 그리고 정신치료의 효과가 지연되었을 때의 위험과 산모의 안전에 대한 위험 등을 모두 저울질 해보는 것이 포함된다. 또한 임신과 우울증 그리고 치료의 이득과 위험에 대해 산모와 보호자에게 충분히 상담을 해주고 동의를 구한 후에 치료가 이루어져야 한다. 증상을 조기에 발견하여 치료하는 것이 중요하고, 일단 치료가 시작되면 출산 후까지 지속적으로 재발 예방을 해야 한다. 각 치료법은 우울증의 정도에 따라 선택하는 것이 바람직한데, 경도에서 중등도 우울증의 경우 정신사회적 치료법과 더불어 광선치료와 같은 비약물학적 치료를 먼저 제공하고, 중등도에서 심한 정도의 우울증이나 재발 위험이 높은 우울증의 경우 정신사회적 치료와 약물치료를 함께 실시하도록 한다. 또한 자살의 위험성이 있는 우울증이거나 약물을 잘 견딜 수 없는 경우라면 전기충격요법을 활용할 수 있다. 약물을 선택할 때에는 정보에 기초하여 약을 선택하는 것이 바람직하고 용량도 치료 반응을 얻을 수 있는 가능한 최소한의 용량을 선택하도록 하며, 시기에 따라 약물의 용량을 조절해야 한다. 지난 10여 년간 선택적 세로토닌 재흡수 차단제의 임신과 수유기 동안의 안전성에 관한 연구 결과들이 발표되고 있고, 일차 치료제로써 선택되어지고 있다. 하지만 일반적으로 비교적 최근에 출시된 항우울제들은 임신이나 주산기 동안에 산모나 태아에게 미치는 영향에 대해 연구가 상대적으로 덜 이루어졌기 때문에 아직까지는 덜 권장되고 있다. 결론적으로, 임상의들은 임신과 수유기 동안의 우울증 치료 전략을 현재까지 수행된 연구 근거의 양과 수준을 감안하여 받아들여야 하고, 아직까지 명백한 결론을 이끌어 내기에는 부족하기 때문에 향후 관련 분야의 연구 결과들에 대해 예의 주시하여야 한다.

  • PDF

모나코 치료계획 시스템에서 단계적 최적화 조건 실현의 유용성 (The Availability of the step optimization in Monaco Planning system)

  • 김대섭
    • 대한방사선치료학회지
    • /
    • 제26권2호
    • /
    • pp.207-216
    • /
    • 2014
  • 목 적 : 모나코 치료계획 시스템은 몬테카를로 알고리즘을 기반으로 선량을 구현하는 대표적인 시스템이다. 모나코 치료계획 시스템에서 치료계획 완성 후, 같은 조건으로 최적화를 재 실시하여 처음과는 다른 치료계획이 만들어질 때 본 연구는 이러한 차이를 줄이는 방법을 제시하고자 한다. 대상 및 방법 : 모나코 치료계획 시스템은 세기변조방사선치료나 용적변조방사선치료를 위한 역 선량계산을 실시할 때, 두 단계를 거쳐 최적화를 실시한다. 본 연구는 우선 최적화 두 단계를 모두 실시하여 선량으로 완성된 치료계획을, 최적화 조건을 바꾸지 않고 일반적인 1단계부터 2단계까지 순차적 최적화를 실시하였다. 이때 2단계에선 펜슬 빔과 몬테카를로 알고리즘을 각각 적용하여 실험을 실시하였다. 두 가지 알고리즘의 치료계획 모두 처음 완성된 치료계획과 최적화를 재 실시한 치료계획을 비교하고 선량 측정기를 이용하여 치료선량을 평가하였다. 두 번째는 초기 완성된 치료계획에 대하여 최적화를 재 실시할 때 단계적으로 실시하여 치료계획을 완성하고 선량을 측정하였다. 결 과 : 초기 완성된 치료계획에서 동일한 조건으로 일반적인 최적화를 다시 실시한 결과는 동일하지 않았다. 치료계획시스템의 비교에서 보면 유사한 선량-용적 히스토그람은 유사한 경향을 나타내지만 최고선량, 선량 균질도 및 제한 선량 등은 최적화 조건을 만족 시키지 못하는 다른 값을 보였다. 또한 선량측정비교에서도 20%이상 다르게 나타냈다. 또한 선량 알고리즘이 달라져도 다른 측정 값이 나왔다. 반면, 단계적 최적화를 실시 할 경우에는, 초기 치료계획과 비교하였을 때 종양 및 정상 장기의 선량 분포가 5% 이하의 차이를 보였다. 결 론 : 치료계획의 최적화 과정은 수 많은 시행 착오를 수행하며 궁극적인 해를 찾아가는 과정이다. 이때 초기 치료계획의 완성만을 신뢰하며 최적화를 실시하면 또 다른 치료계획이 만들어 질 수 있다. 유사한 경향을 보이긴 하지만, 반드시 최적화 조건을 만족한다고 볼 수 없기 때문에, 최적화 과정을 재 실시할 경우에는 반드시 단계적인 최적화 과정을 통하여 선량분포를 확인하면서 순차적으로 최적화 조건을 적용해야 할 것이다.

이단계 군집분석에 의한 농촌관광 편의시설 유형별 소비자 선호 결정요인 (Determinants of Consumer Preference by type of Accommodation: Two Step Cluster Analysis)

  • 박덕병;윤유식;이민수
    • 마케팅과학연구
    • /
    • 제17권3호
    • /
    • pp.1-19
    • /
    • 2007
  • 본 연구에서는 농촌관광 방문객에게 제공되는 편의시설을 유형화하고 어떤 특징을 가진 방문객이 어떤 편의시설을 선호하는지를 규명하기 위한 방법과 그 분석결과를 제시하였다. 이를 위하여 우선 2단계 군집분석법을 사용하여 농촌관광 편의시설을 유형화하였다. 그 다음으로 군집분석에 사용되는 변인이 범주형 변인이 있을 경우 전통적인 군집분석 방법을 적용할 수 없기 때문에 2단계 군집분석을 하였다. 본 연구는 2단계 군집분석법이 범주형 변인으로 측정된 농촌관광의 편의시설을 유형화하는 데 매우 유용하다는 것을 보여 주고 있다. 다중로짓 모형을 사용하여 특정 편의시설 유형을 선호할 확률에 영향을 미치는 농촌관광 방문자의 사회인구학적 특성과 여행특성을 규명하였다. 즉, 다중로짓 모형을 통해 참조항(일반농가형)으로 설정된 편의시설 유형에 비해 특정 편의시설을 선호할 확률에 영향을 미치는 소비자의 특성을 규명할 수 있다는 것이 본 연구의 특징이다.

  • PDF

확장된 사용자 유사도를 이용한 CF-기반 건강기능식품 추천 시스템 (A CF-based Health Functional Recommender System using Extended User Similarity Measure)

  • 홍세인;정의주;김재경
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.1-17
    • /
    • 2023
  • 정보통신기술의 발전과 디지털 기기의 대중화로 인해, 온라인 시장의 규모가 커지고 있다. 그 결과 고객들은 상품을 선택하는데 많은 시간과 비용이 소요되는 정보 과부하(Information Overload) 문제에 직면하고 있다. 따라서 고객이 선호할만한 상품을 추천해 주는 추천 시스템은 필수적인 도구가 되었으며 협업 필터링(Collaborative Filtering) 기법은 가장 널리 쓰이는 추천 방법이다. 전통적인 추천 시스템은 평점과 같은 정량적인 데이터만을 사용하기 때문에 추천의 정확도는 높지 않다. 이와 같은 문제를 해결하기 위해 요즘에는 사용자 리뷰와 같은 정성적 데이터를 반영하는 연구가 활발히 진행되고 있다. 협업 필터링의 일반적인 절차는 사용자-상품 행렬 생성, 이웃 집단 탐색, 추천 목록 생성 3단계로 구성되며 코사인 같은 사용자 유사도를 사용하여 목표 고객의 이웃을 탐색하며, 추천 상품 목록을 생성한다. 본 연구에서는 이웃 집단 탐색 및 추천 목록 생성 단계에서 사용하는 사용자 간의 유사도를 기존의 사용자 평점을 이용한 유사도에 고객의 리뷰 데이터를 사용하는 확장된 사용자 유사도를 제시한다. 리뷰를 정량화 하기 위해 본 연구에서는 텍스트 마이닝을 활용한다. 즉, 리뷰 데이터에 TF-IDF, Word2Vec, 그리고 Doc2Vec 기법을 사용하여 두 사용자 간의 리뷰 유사도를 구한 후 사용자 평점을 사용한 유사도와 리뷰 유사도를 결합한 확장된 유사도를 생성하는 것이다. 이를 검증하기 위해 전자상거래 사이트인 Amazon의 'Health and Personal Care'의 사용자 평점과 리뷰 데이터를 사용하였다. 실험 결과, 사용자 간 유사도를 산출할 때 기존의 평점에 기반한 유사도만을 사용하는 것보다, 사용자 리뷰의 유사도를 추가로 반영한 확장된 유사도를 사용하면 추천의 정확도가 높아진다는 것을 확인했다. 또한, 여러 텍스트 마이닝 기법 중에서 TF-IDF 기법을 사용한 확장된 유사도를 이웃 집단 탐색 및 추천 목록 생성단계에서 사용할 때의 성능이 가장 좋게 나타났다.

영산강 하구의 방류와 강우의 규모 및 빈도 상관성 분석 (Relationships on Magnitude and Frequency of Freshwater Discharge and Rainfall in the Altered Yeongsan Estuary)

  • 류호상;이관홍
    • 한국해양학회지:바다
    • /
    • 제16권4호
    • /
    • pp.223-237
    • /
    • 2011
  • 하구둑으로 인해 담수의 공급이 간헐적으로 발생하는 영산강 하구에서는 담수의 방류가 하구의 유동패턴, 염분농도의 변이, 영양염 공급 등 하구환경과 생태계 반응을 주도하는 요인이다. 담수의 방류는 유역의 강우조건에 영향을 받으므로 담수의 방류시기 및 규모를 파악하기 위해서는 담수방류를 유발하는 강우조건과 강우-방류간 상관관계에 대한 이해가 필요하다. 또한 담수방류가 하구에 미치는 영향을 평가하기 위해서는 방류의 규모와 더불어 빈도에 대한 고려가 필수적이다. 이 연구는 영산강 하구역의 담수방류를 예측하고 평가하는 도구로서 영산강 하구둑의 담수 방류자료를 대상으로 강우에 보다 직접적으로 반응하는 극치방류의 확률분포함수를 파악하고 극치방류를 유발하는 강우조건을 판별하여 극치방류를 유발하는 강우와 극치방류 간의 빈도-규모 관계식을 도출하는 데 목적을 두었다. 13.7년(1997.1.1-2010.8.31)간의 일방류량 자료에 대하여 일연속방류를 분석의 기본단위인 방류이벤트로 정의하되 4일 이상의 일연속방류의 경우는 방류패턴에 토대를 둔 이벤트 분리 알고리듬을 적용하여 개별 이벤트를 식별하였다. 총 529건의 방류 이벤트에 대하여 14년간의 연 최고치 중 최솟값에 해당하는 133,656,000 $m^3$을 기준으로 극치방류이벤트를 선별하고 부분시계열 빈도분석법을 적용하여 극치방류의 확률분포함수가 Weibull(k=1.4)함수를 따름을 확인하였다. 극치방류를 기준으로 대비되는 강우 l일전 3일합 강우량이며 최솟값은 50.98 mm인 것으로 나타났다. 이 기준에 따라 추출된 방류유발기능 강우군은 총 102건으로 극치방류이벤트의 수보다 많았다. 정준판별분석을 통해 3일합 강우량 이외에 관리수위대비(-1.35 m EL.) 하구호 수위가 방류유발 강우를 규정하는 중요한 요소라는 점과 방류유발가능 강우군을 선별하는 임계값을 104mm로 재조정할 경우 3일합 강우량만으로 방류유발 강우를 규정할 수 있음을 확인하였다. 극치방류 유발 강우만을 대상으로 강우-방류 관계식을 수립한 결과 3일합-강우량($\overline{r_{3day}}$), 3일합-강우량 재현주기($T_{r3}$), 방류량(Discharge, D), 방류량 재현주기($T_d$)의 관계는 $D=1.111{\times}10^8+1.677{\times}10^6{\overline{r_{3day}}$, (${\overline{r_{3day}}{\geqq}104$), $T_d=1.326T^{0.683}_{r3}$, $T_d=0.117{\exp}[0.0155{\overline{r_{3day}}]$로 나타났다. 100년 주기 3일합 강우(357mm)에 의해 유발되는 방류량은 영산강 하구둑 방류량의 재현주기는 30.8년 정도이며 그 양은 $7.0979{\times}10^8m^3$이다. 담수방류의 재현주기 및 재현주기에 기초한 강우-방류 관계식은 영산강 하구역을 비롯하여 인위적으로 담수의 방류가 조절되는 하구역에서 담수의 영향을 평가하고 예측하는 데 기여할 수 있을 것이다.

트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법의 성능분석 (Performance analysis of Frequent Itemset Mining Technique based on Transaction Weight Constraints)

  • 윤은일;편광범
    • 인터넷정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.67-74
    • /
    • 2015
  • 최근, 아이템들의 가치를 고려한 빈발 아이템셋 마이닝 방법은 데이터 마이닝 분야에서 가장 중요한 이슈 중 하나로 활발히 연구되어왔다. 아이템들의 가치를 고려한 마이닝 기법들은 적용 방법에 따라 크게 가중화 빈발 아이템셋 마이닝, 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝, 유틸리티 아이템셋 마이닝으로 구분된다. 본 논문에서는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝들에 대해 실증적인 분석을 수행한다. 일반적으로 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법들은 데이터베이스 내 아이템들의 가치를 고려함으로써 트랜잭션 가중치를 계산한다. 또한, 그 기법들은 계산된 각 트랜잭션의 가중치를 바탕으로 가중화 빈발 아이템셋들을 마이닝 한다. 트랜잭션 가중치는 트랜잭션 내에 높은 가치의 아이템이 많이 포함 될수록 높은 값으로 나타나기 때문에 우리는 각 트랜잭션의 가중치의 분석을 통해 그 가치를 파악할 수 있다. 우리는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법 중에서 가장 유명한 알고리즘인 WIS와 WIT-FWIs, IT-FWIs-MODIFY, WIT-FWIs-DIFF의 장 단점을 분석하고 각각의 성능을 비교한다. WIS는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝의 개념과 그 기법이 처음 제안된 알고리즘이며, 전통적인 빈발 아이템셋 마이닝 기법인 Apriori를 기반으로 하고 있다. 또 다른 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 방법인 WIT-FWIs와 WIT-FWIs-MODIFY, WIT-FWIs-DIFF는 가중화된 빈발 아이템셋 마이닝을 더 효율적으로 수행하기 위해 격자구조(Lattice) 형태의 특별한 저장구조인 WIT-tree를 이용한다. WIT-tree의 각 노드에는 아이템셋 정보와 아이템셋이 포함된 트랜잭션의 ID들이 저장되며, 이 구조를 사용함으로써 아이템셋 마이닝 과정에서 발생되는 다수의 데이터베이스 스캔 과정이 감소된다. 특히, 전통적인 알고리즘들이 수많은 데이터베이스 스캔을 수행하는 반면에, 이 알고리즘들은 WIT-tree를 이용해 데이터베이스를 오직 한번만 읽음으로써 마이닝과정에서 발생 가능한 오버헤드 문제를 해결한다. 또한, 공통적으로 길이 N의 두 아이템셋을 이용해 길이 N+1의 새로운 아이템셋을 생성한다. 먼저, WIT-FWIs는 각 아이템셋이 동시에 발생되는 트랜잭션들의 정보를 활용하는 것이 특징이다. WIT-FWIs-MODIFY는 조합되는 아이템셋의 정보를 이용해 빈도수 계산에 필요한 연산을 줄인 알고리즘이다. WIT-FWIs-DIFF는 두 아이템셋 중 하나만 발생한 트랜잭션의 정보를 이용한다. 우리는 다양한 실험환경에서 각 알고리즘의 성능을 비교분석하기 위해 각 트랜잭션의 형태가 유사한 dense 데이터와 각 트랜잭션의 구성이 서로 다른 sparse 데이터를 이용해 마이닝 시간과 최대 메모리 사용량을 평가한다. 또한, 각 알고리즘의 안정성을 평가하기 위한 확장성 테스트를 수행한다. 결과적으로, dense 데이터에서는 WIT-FWIs와 WIT-FWIs-MODIFY가 다른 알고리즘들보다 좋은 성능을 보이고 sparse 데이터에서는 WIT-FWI-DIFF가 가장 좋은 효율성을 갖는다. WIS는 더 많은 연산을 수행하는 알고리즘을 기반으로 했기 때문에 평균적으로 가장 낮은 성능을 보인다.