• 제목/요약/키워드: Prediction approach

검색결과 2,092건 처리시간 0.029초

Maxent 모델을 이용한 반달가슴곰의 서식지 분포변화 예측 (Habitat Distribution Change Prediction of Asiatic Black Bears (Ursus thibetanus) Using Maxent Modeling Approach)

  • 김태근;양두하;조영호;송교홍;오장근
    • 생태와환경
    • /
    • 제49권3호
    • /
    • pp.197-207
    • /
    • 2016
  • 본 연구는 국립공원을 포함한 국내 보호지역에서 반달가슴곰 (Ursus thibetanus)을 효과적으로 보전하고, 종 복원을 성공하기 위해서 종의 재도입에 적합한 지역을 객관적으로 평가하기 위한 기초자료를 제공하는 데 그 목적이 있다. 이를 위해서 Maxent 모델과 기후, 지형, 그리고 도로 및 토지이용과 관련된 환경 변수를 이용하여 반달가슴곰의 출현 기록이 있는 동아시아, 동남아시아, 그리고 인도를 대상으로 잠재 서식지를 예측하고, 이와 관련된 기후 및 환경 변수의 영향을 평가하였다. 또한 미래 기후변화에 따라서 반달가슴곰에게 적합한 서식 범위의 면적과 지리적인 변화를 분석하였다. 생물보전을 위해서 야생생물의 서식지분포연구에 널리 활용되고 있는 Maxent 모델의 판별정확도를 나타내는 AUC 값이 0.893 (sd=0.121)으로 산출되었다. 이는 반달가슴곰의 잠재 서식지를 예측하고 미래 기후변화에 따른 서식지 변화특성을 평가하는 데 유용하였다. IUCN에서 평가한 반달가슴곰의 분포지도와 비교해서, 현존 지역 (Extant)은 Maxent 모델로 예측된 서식 확률이 국가별 지역적으로 다양하고, 멸종 지역 (Extinct)은 상대적으로 낮았다. 이는 반달가슴곰이 서식하는 환경 특성의 차이가 지역적으로 반영된 결과라 할 수 있다. 반달가슴곰의 잠재 서식지 분포에 영향을 주는 환경은 기후, 지형 그리고 인위적 요소인 도로로부터의 거리와 같은 요소보다 토지피복 유형의 영향이 가장 높았는데, 특히 낙엽활엽수림지역이 더욱 선호될 것으로 예측되었다. 또한 기온의 연간범위보다 연평균강수량과 건조시기의 강수량의 영향이 더욱 클 것으로 예측되었고 도로로부터 거리가 멀어질수록 서식가능성이 높은 것으로 나타났다. 이는 반달가슴곰은 먹이자원뿐만 아니라 인간의 간섭이 없는 보다 안정된 지역을 선호할 것으로 추측된다. 미래 기후변화에 따라서 서식적합지역은 점차 확장할 것으로 전망되었고, 남한에서는 전남, 전북 그리고 강원도지역이, 일본에서는 Kyushu, Chugoku, Shikoku, Chubu, Kanto 그리고 Tohoku의 접경 지역이, 중국에서는 Jiangxi, Zhejiang 그리고 Fujian의 접경 지역이 향후 아시아지역에서 반달가슴곰이 서식할 수 있는 핵심지역이 될 것으로 예상된다. 본 연구는 반달가슴곰의 서식지 보전과 효율적인 관리, 인위적으로 도입된 개체의 방사지점 선정, 향후 서식 범위의 확장에 따른 보호지역 설정 그리고 인간과 충돌지역의 관리에 대한 기초자료로서 활용될 것으로 기대된다.

공간분포모델을 활용한 사료작물 이탈리안 라이그라스(Lolium multiflorum L.)의 재배적지 변동예측연구 (A Study on the Prediction of Suitability Change of Forage Crop Italian Ryegrass (Lolium multiflorum L.) using Spatial Distribution Model)

  • 김현애;현신우;김광수
    • 한국농림기상학회지
    • /
    • 제16권2호
    • /
    • pp.103-113
    • /
    • 2014
  • 우리나라에서의 사료작물 생산면적이 제한적이기 때문에 미래의 기후조건에서 최적 재배 가능 지역을 중심으로 이탈리안 라이그라스와 같은 사료작물의 생산체계를 설계하는 것이 필요하다. 특히, 한반도를 대상으로 이탈리안 라이그라스의 재배 가능지역을 파악하는 것이 미래를 대비한 정책 결정에 도움을 줄 수 있다. 이번 연구에서는 기후자료를 기반으로 작물의 재배적합도를 예측하는 EcoCrop 모델을 사용하여 현재(1950~2000), 2020년대(2010~2039), 2050년대(2040~2069), 2080년대(2070~2099)의 이탈리안 라이그라스의 재배 가능지역을 분석하였다. 또한, 전구 기후모델인 CCCMA, CSIRO, UKMO-HadCM3, UKMO-HadGEM1, 그리고 NCAR 모델 등으로부터 얻어진 규모축소 기후자료를 활용한 앙상블 예측기법을 재배적합도 예측에 적용하여 미래 기후변화 조건에서의 불확실도를 낮추는 것을 시도하였다. 2050년대까지 이탈리안 라이그라스의 재배적합도는 남한과 북한 모두 크게 상승할 것으로 예측되었다. 예를 들어, 현재 기후조건에서 충청북도와 강원도에서 평균적인 재배적합도가 76.75와 44.77으로 낮게 예측되었지만 2020년대에 각각 16.2% 및 46.1% 증가하여 2080년대에는 모든 행정구역에서 평균적인 재배적합도가 90이상으로 나타날 것으로 예측되었다. 반면, 2080년대에 16개의 시 도 중 11개의 지역에서 재배적합도가 감소할 것으로 예측되었다. 북한의 경우 현재 기후조건에서 평균적인 재배적합도는 28.40으로 평균적인 재배적합도가 낮았다. 그러나 기후변화가 진행되면서 재배적합도가 크게 증가하여 2080년대에는 14개 행정구역 중 10곳에서 평균적인 재배적합도가 80 이상일 것으로 예측되었다. 특히 나선, 신의주 및 개성 인근 지역의 재배적합도가 크게 증가할 것으로 예측되어 이를 중심으로 수출을 위한 사료 생산단지 및 축산단지 조성이 가능할 것으로 예상되었다. 현재, 내한성 향상을 중심으로 이탈리안 라이그라스의 새로운 품종들이 개발 및 보급되고 있어 이러한 신품종을 대상으로 한 이모작 가능지를 구분하기 위해 품종별로 최적화된 모수를 활용한 재배적합도 예측지도를 작성연구가 연구가 필요할 것으로 사료되었다.

휴리스틱 함수를 이용한 feature selection에 관한 연구 (Research about feature selection that use heuristic function)

  • 홍석미;정경숙;정태충
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.281-286
    • /
    • 2003
  • 실생활에서 해결하고자 하는 문제에 대해 수많은 feature들이 수집되어지나 그 feature들을 모두 문제 해결에 활용하는 것은 어렵다. 모든 feature들에 대한 정확한 자료의 수집이 어려우며 관련된 feature들을 모두 학습에 이용할 경우 복잡한 학습 모델이 생성되어지며 좋은 수행 결과도 얻을 수 없다. 또한 수집된 자료들 간에는 상호 관계나 계층적 관계가 존재하는데, 경험적 지식이나 통계적 방법을 이용하여 feature들간의 관계를 분석함으로써 feature의 수를 줄일 수 있다. 휴리스틱 기법은 반복적인 시행 착오와 경험을 통한 학습으로써 미래가 불확실하고 완전한 정보를 갖고 있지 못할 때, 인간의 사고 기능을 통하여 기억이나 경험을 살려, 스스로 해결방안을 모색하면서 점차로 해에 접근해 가는 방법이다. 전문가들은 경험에 의한 의견 수렴 과정을 거쳐 해당 문제 영역에 접근 가능하며, 이러한 특성을 학습에 사용될 feature의 수를 줄이는데 활용할 수 있다. 전문가들은 원시 자료들을 이용하여 새로운 feature들을 생성할 수 있다 새로이 산출된 feature들과 원시 데이터 내의 feature들을 혼합하여 학습 모델 생성에 이용한다. 본 논문에서는 휴리스틱 함수를 이용하여 학습에 사용될 feature의 수를 줄이고, 추출된 feature들을 신경망의 입력값으로 사용하는 기계 학습 모델을 제시한다. 모델의 성능 평가를 위해 프로야구 경기의 승패 예측 문제를 이용하였다. 실험 결과는 신경 회로망과 휴리스틱 모델을 단독으로 사용했을 때 보다 두 기법을 혼합한 모델이 신경 회로망의 복잡성을 감소시킬 뿐 아니라 분류(classification)의 정확성이 향상되었다.아니라 Hep G2 세포에서도 명백히 단백질의 발현을 관찰할 수 있었다. 또한, Hep G2와 COS세포 모두에서 endogenous RXR의 발현이 일어남을 확인하였고 RXR expression plasmid를 transfection시켰을 때 두 세포 모두에서 단백질의 발현이 현저하게 증가되었다. Constitutive Androstane Receptor (CAR)에 의한 CYP2B의 PBRU 활성효과를 다르게 분화된 세포에서 차이가 일어나는지를 비교하기 위하여 CAR에 의해 매개되는 PBRU의 transactivation효과를 Hep G2와 COS세포에서 조사하였다. Hep G2 세포에서는 transfection된 CAR의 발현에 의해 firefly luciferase 보고단백질의 활성이 약 12배 증가하였다. CAR 발현유전자를 15 ng transfection하였을 때 주어진 보고유전자의 양에 대하여 최대반응을 나타내었고 CYP2B1PBRU가 제거된 CYP2C1 promotor/firefly luciferase를 보고유전자로 사용하였을 때는 CAR에 의한 luciferase의 활성이 나타나지 않았다. Hep G2와는 달리, COS세포에서는 transfection된 CAR의 발현이 PBRU에 의한 firefly luciferase보고단백질의 발현에 영향을 주지 못하였다. 이러한 결과들은 분화된 세포의 종류에 따라서 constitutive androstane receptor의 CYP2BPBRU 활성효과가 다르게 나타날 수 있음을 제시할 뿐만 아니라, 간세포에서 Phenobarbital에 의한 PBRU의 활성유도에 영향을 주는 endogenous 매개 인자들 중 CAR와 RXR과는 다

과학 영재 학생들의 사고양식에 따른 지구시스템에 대한 인지 특성 (The Recognition Characteristics of Science Gifted Students on the Earth System based on their Thinking Style)

  • 이효녕;김승환
    • 과학교육연구지
    • /
    • 제33권1호
    • /
    • pp.12-30
    • /
    • 2009
  • 이 연구의 목적은 과학 영재 학생들의 사고 양식에 따른 지구시스템에 대한 인지 특성을 분석하는 것이다. 연구 대상은 광역시 소재 대학 부설 과학영재교육원에 재학 중인 24명이다. 연구 방법은 먼저 과학 영재 학생들을 대상으로 Sternberg의 정신자치제 이론에 근거로 사고양식 측정 검사를 실시한 후, 그 유형에 따라 Type I(입법적, 사법적, 전체적, 진보적)과 Type II(행정적, 지엽적, 보수적)집단으로 구분하였다. 그 후 각 집단에 대해 설문지 3종(A, B, C형), 단어 연상, 그림 분석, 개념 지도, 숨겨진 차원파악하기 (hidden dimension inventory), 자료해석 및 그 결과에 대한 심층 면담을 실시하였다. 과학 영재 학생들의 사고양식 유형은 입법적, 사법적, 무정부적, 전체적, 외부적, 그리고 진보적 사고 양식의 특성을 나타내어 새로운 과제를 선호하며, 창의적인 방식으로 문제를 해결하려는 경향을 보여주었다. 사고 유형에 따른 지구시스템에 대한 인지 특성에 대한 연구 결과는 다음과 같다. 첫째, '시스템 이해'에서 Type I, II 집단의 양적 측정치는 비슷하였으나, 세부적으로 살펴보면 상당한 차이가 존재한다. 둘째, '시스템 내 관계 파악'은 사고양식 유형과 상당히 밀접한 관계를 가지고 있으며, Type I집단이 보다 다각적, 역동적, 순환적으로 접근하여 보다 유리하다. 셋째, '시스템 일반화'에서 시스템에 대한 단순 해석 능력은 두 집단 모두 비슷하나, 숨겨진 차원 요소를 가미하여 추정할 경우 일반화 경향이 Type I집단이 우수하다. 하지만 시스템 예측 측면에서는 집단에 관계없이 미약하다. 이러한 결과를 볼 때 시스템 학습 프로그램 개발과 적용에 있어 다양한 대상에 대한 구체적인 개발 전략이 요구되며, 이를 통한 시스템 인지와 관련된 여러 분야에서의 활용성과 기대 효과가 클 것이라 생각된다.

  • PDF

동아시아 사막 면적의 경년변화분석 (A Long-term Variability of the Extent of East Asian Desert)

  • 한현경;이은경;손상훈;최성원;이경상;서민지;진동현;김홍희;권채영;이다래;한경수
    • 대한원격탐사학회지
    • /
    • 제34권6_1호
    • /
    • pp.869-877
    • /
    • 2018
  • 사막면적은 매년 증가하는 추세이며, 이에 따라 막대한 사회적 피해 비용을 발생시키고 있다. 이러한 사막은 광범위하게 분포하고 사람의 접근이 어려워 인공위성을 이용한 모니터링이 많이 이루어지고 있지만 인공위성의 센서에 따라 산출되는 사막 면적 비교 연구는 미비한 편이다. 센서의 선택에 따라 산출되는 사막 면적은 상이할 수 있고 이에 따라 기후 예측이나 사막화 방지대책 등에 영향을 미칠 수 있어 센서별로 산출되는 사막면적 자료의 특성을 인지하는 것은 중요하다. 본 연구에서는 Moderate Resolution Imaging Spectroradiometer(MODIS)와 Vegetation을 이용해 2001-2013년 동북아시아 지역의 사막 면적을 산출하고 비교 분석하였다. 분석결과, MODIS에서 산출한 사막 면적은 비교적 과소 탐지하는 경향과 $20,911km^2/year$로 감소하는 추세를 보였고 Vegetation에서 산출한 사막 면적은 $3,020km^2/year$로 증가하는 추세를 보였다. 또한 실측자료 확보가 힘든 사막지역에서 인공위성을 이용해 산출된 사막 면적의 간접검증을 위해 사막 면적 변화에 영향을 받는 황사 발생빈도와 상관관계 분석을 실시하였다. 그 결과, MODIS는 R=0.2071로 비교적 낮은 상관관계가 나타났고 Vegetation은 R=0.4837로 비교적 높은 상관관계가 나타났다. 이는 Vegetation이 동북아시아 사막 영역에서 보다 정확한 사막 면적 산출을 수행한 것으로 사료된다.

산림생태계 보호구역에서 외래식물 분포 예측을 위한 최적 모형의 선발 (Selection of Optimal Models for Predicting the Distribution of Invasive Alien Plants Species (IAPS) in Forest Genetic Resource Reserves)

  • 임치홍;정성희;정수영;김남신;조용찬
    • 한국환경생태학회지
    • /
    • 제34권6호
    • /
    • pp.589-600
    • /
    • 2020
  • 효과적인 보호구역의 보전 관리를 위해서는 외래종의 정착 모니터링 및 확산 위험에 대한 저감 노력이 수반되어야 한다. 본 연구는 울진에 위치한 산림유전자원보호구역(2,274ha)에서 조사된 외래식물 분포 정보를 대상으로 활용도가 높은 세가지 종분포모형(Bioclim, GLM, MaxEnt)을 활용하여 외래식물의 잠재출현지역을 모의하였고, 모의 결과를 비교하여 지역적 지리 및 생태 관리 특성이 반영된 현실성 및 적합성 높은 종분포모형을 선발하였다. 분석에서 예측된 외래식물의 출현지역은 실제 분포와 같이 도로 같은 선형 경관 요소를 따라 분포하는 경향이었으며, 일부 벌채지가 포함되었다. 본 연구에서 적용한 각 모형의 예측력과 정확도를 통계적으로 비교한 결과, GLM과 MaxEnt 모형은 대체로 높은 예측력과 정확도를 보였지만, Bioclim 모형은 낮았다. Bioclim은 가장 넓은 면적을 출현예상지역으로 계산하였고, GLM, 그리고 MaxEnt 순으로 면적이 작았다. 모의 결과의 현상학적 검토에서는 GLM과 Bioclim 모형은 표본 수에 따라 예측력이 크게 영향을 받는 것으로 나타났고, 표본 수와 관계없이 가장 일관성 높은 모형은 MaxEnt로 평가되었다. 종합적으로, 본 연구에 사용된 모형 중 외래식물 분포 예측을 위한 최적 모형은 MaxEnt 모형인 것으로 판단되었다. 본 연구에서 제시한 정밀 생물종 분포 자료 기반의 모델 선발 접근 방식은 산림생태계 보호구역의 보전 관리 및 지역 특성이 반영된 현실적이고 정교한 모델 발굴 연구에 도움이 될 것이다.

준분포형 모형을 이용한 농업용 저수지가 안성천 유역의 유출모의에 미치는 영향 평가 (Impact Assessment of Agricultural Reservoir on Streamflow Simulation Using Semi-distributed Hydrologic Model)

  • 김보경;김병식;권현한
    • 대한토목학회논문집
    • /
    • 제29권1B호
    • /
    • pp.11-22
    • /
    • 2009
  • 장기유출 해석은 저수지와 댐의 용량 결정, 가뭄대책 수립, 하천유지유량 결정 등의 이수계획과 용수공급을 위한 댐 및 저수지의 물 관리, 수리권의 허가 및 조정, 용수 분쟁 조정 등의 하천 물 관리 실무와 하천, 호소의 수질예측 등에도 필수적이다. 이를 위해 수문학자들은 수자원관리를 목적으로 강우-유출 모형을 가장 널리 이용하고 있으나 실제 유역 내에 위치하고 있는 댐과 저수지 등과 같은 인위적 저류시설물에 대한 고려가 미흡한 실정이다. 각 저류시설물의 수용 및 방류 능력은 국부적으로는 저수지 하류에, 광역적으로는 유역 전체에 상당한 영향을 미칠 수 있으며 이러한 관점에서 볼 때 강우-유출 모형을 이용하여 유출해석 시 유역 내 포함된 저수지나 댐과 같은 시설물을 고려하여 모형을 구성하는 것이 타당하다. 본 연구에서는 과거 집중호우 등으로 홍수피해를 경험한 바가 있으며 농업용 저수지가 다수 위치한 안성천 유역을 대상으로 농업용 저수지가 유출해석에 미치는 영향을 분석하였다. 이를 위해 본 연구에서는 현재 홍수조절 능력에 대한 논란이 일고 있는 안성천 유역의 농업용 저수지를 고려하여 준 분포형 강우-유출 모형인 SLURP 모형을 구성하고 농업용 저수지의 저류 효과에 따른 하류 지역에 대한 영향성을 검토하였으며, 유출해석 시 모형 내 저수지 반영 여부에 따른 차이에 대하여 비교 분석하였다. 모형 내 저수지를 고려하여 모의한 결과, 강우가 집중되지 않는 봄과 가을철에는 저류효과가 있는 것으로 나타났으나 강우가 매우 집중되는 시기에는 하류로의 유출이 더 크게 모의되어 저수지를 고려하지 않은 경우와 차이를 보였으며, 유황분석을 통해 저수지 유무에 따른 유량변동이 풍수량(95일)과 갈수량(355일)에서 특히 크게 분석되는 결과를 확인 할 수 있었다. 단, 본 연구에서 분석하고자 하는 기흥, 이동, 고삼과 금광 저수지의 자료는 안성천홍수예보시스템 개선(건설교통부, 2007b)에서 조사된 내용에 의거하여 각 저수지별 최대방류량을 입력 자료로 활용하였으므로 실제 저수지 운영에 따른 유출과 유황변동과는 차이가 있을 수 있음을 미리 밝히는 바이다.

웹기반 지능형 기술가치평가 시스템에 관한 연구 (A Study on Web-based Technology Valuation System)

  • 성태응;전승표;김상국;박현우
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.23-46
    • /
    • 2017
  • 2000년대 이전부터 북미 유럽의 선진국을 중심으로 특정 기업이나 사업(프로젝트)에 관한 가치를 평가하는 사례는 있어 왔으나, 개별 기술(특허)의 경제적 가치를 산정하는 체계나 방법론은 국내를 중심으로 최근 들어 활성화되어 왔다. 이러한 기술가치평가 분야는 기술이전(거래), 현물출자, 사업타당성 분석, 투자유치, 세무/소송 등의 다양한 용도로 활용되고 있다. 물론 기술보증기금의 KTRS, 발명진흥회의 SMART 3.1과 같이, 평가대상기술에 대한 기술력(등급) 평가 혹은 특허등급평가를 정성적으로 수행하는 온라인 시스템은 존재해 왔으나, 대상기술의 정량적인 가치금액까지 산출해 주는 웹기반 지능형 기술가치평가 시스템은 한국과학기술정보연구원(KISTI)에 의해 유일하게 개발 및 공식 오픈되어 확산 활용되고 있다. 본 고에서는 KISTI에서 개발 운영중인 웹기반 'STAR-Value' 시스템을 중심으로, 탑재된 방법론 및 평가모델의 유형, 이를 지원하는 참조정보 및 데이터베이스(D/B)가 어떻게 연계 활용되는지를 소개한다. 특히 미래에 발생할 경제적 수익을 추정하여 현재가치화하는 소득접근법 기반의 대표 모델인 현금흐름할인(DCF) 모델과 특정 로열티율을 기반으로 로열티수입료의 현재가치를 기술료 대가로 산정하는 로열티절감모델을 포함한 6개 모델, 그리고 관련 지원정보(기술수명, 기업(업종)재무정보, 할인율, 산업기술요소 등)의 데이터 기반 연계 방식에 대해 살펴본다. STAR-Value 시스템은 평가대상기술에 대한 국제특허분류(IPC) 혹은 한국표준산업분류(KSIC) 등의 분류 정보로부터 기술순환주기(TCT) 지수, 유사업종(혹은 유사기업)의 매출액 성장률 및 수익성 데이터, 업종별 가중평균자본비용(WACC) 및 산업기술요소 지수 등 메타데이터값을 자동적으로 불러오고 여기에 조정요인을 반영하여 기술가치의 산출결과가 높은 신뢰성 및 객관성을 가지도록 한다. 나아가 대상기술의 잠재적 시장규모와 해당 사업화주체의 시장점유율에 대한 정보까지 보유 재무데이터 기반으로 참조값을 제시하거나 기존에 완료된 평가사례 축적 기반으로 업종별 유사 기술의 가치범위값을 제시해 준다면, 본 시스템이 보다 지능형으로 지원 모듈을 연계 활용하고 실시간으로 손쉽게 고(高)정확도의 기술가치범위를 제시해 줄 수 있을 것으로 기대된다. 본 고에서는 웹기반 STAR-Value 시스템이 참조데이터 기반으로 지능형 연계를 수행하도록 해주는 모형선택 가이드라인 지원기능, 기술가치범위 추론 지원기능, 유사기업 선정 기반의 시장점유율 산정 지원기능의 내부 로직 구성을 설명한다. 상기 지원기능을 통해 비전문가(또는 초보자) 수준에서 최적의 평가모형 선택, 기술가치 범위 추론, 유사기업 선택 및 시장점유율 산정에 대한 정보지원이 데이터 사이언스 및 기계학습 기반으로 수행될 수 있다. 본 연구는 기술가치평가 분야의 이론적 타당성을 평가실무에서 활용할 수 있는 평가모델 및 지원정보를 실제 탑재한 웹기반 시스템의 소개에 의미가 있으며, 추가적으로 보다 객관적이고 손쉬운 지능형 지원시스템의 활용성을 높임으로써, 앞으로 기술사업화의 제 분야에서 다양하게 활용할 수 있을 것으로 기대된다.

평점과 리뷰 텍스트 감성분석을 결합한 추천시스템 향상 방안 연구 (How to improve the accuracy of recommendation systems: Combining ratings and review texts sentiment scores)

  • 현지연;유상이;이상용
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.219-239
    • /
    • 2019
  • 개인에게 맞춤형 서비스를 제공하는 것이 중요해지면서 개인화 추천 시스템 관련 연구들이 끊임없이 이루어지고 있다. 추천 시스템 중 협업 필터링은 학계 및 산업계에서 가장 많이 사용되고 있다. 다만 사용자들의 평점 혹은 사용 여부와 같은 정량적인 정보에 국한하여 추천이 이루어져 정확도가 떨어진다는 문제가 제기되고 있다. 이와 같은 문제를 해결하기 위해 현재까지 많은 연구에서 정량적 정보 외에 다른 정보들을 활용하여 추천 시스템의 성능을 개선하려는 시도가 활발하게 이루어지고 있다. 리뷰를 이용한 감성 분석이 대표적이지만, 기존의 연구에서는 감성 분석의 결과를 추천 시스템에 직접적으로 반영하지 못한다는 한계가 있다. 이에 본 연구는 리뷰에 나타난 감성을 수치화하여 평점에 반영하는 것을 목표로 한다. 즉, 사용자가 직접 작성한 리뷰를 감성 수치화하여 정량적인 정보로 변환해 추천 시스템에 직접 반영할 수 있는 새로운 알고리즘을 제안한다. 이를 위해서는 정성적인 정보인 사용자들의 리뷰를 정량화 시켜야 하므로, 본 연구에서는 텍스트 마이닝의 감성 분석 기법을 통해 감성 수치를 산출하였다. 데이터는 영화 리뷰를 대상으로 하여 도메인 맞춤형 감성 사전을 구축하고, 이를 기반으로 리뷰의 감성점수를 산출한다. 본 논문에서 사용자 리뷰의 감성 수치를 반영한 협업 필터링이 평점만을 고려하는 전통적인 방식의 협업 필터링과 비교하여 우수한 정확도를 나타내는 것을 확인하였다. 이후 제안된 모델이 더 개선된 방식이라고 할 근거를 확보하기 위해 paired t-test 검증을 시도했고, 제안된 모델이 더 우수하다는 결론을 도출하였다. 본 연구에서는 평점만으로 사용자의 감성을 판단한 기존의 선행연구들이 가지는 한계를 극복하고자 리뷰를 수치화하여 기존의 평점 시스템보다 사용자의 의견을 더 정교하게 추천 시스템에 반영시켜 정확도를 향상시켰다. 이를 기반으로 추가적으로 다양한 분석을 시행한다면 추천의 정확도가 더 높아질 것으로 기대된다.

M&W 파동 패턴과 유전자 알고리즘을 이용한 주식 매매 시스템 개발 (Development of a Stock Trading System Using M & W Wave Patterns and Genetic Algorithms)

  • 양훈석;김선웅;최흥식
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.63-83
    • /
    • 2019
  • 투자자들은 기업의 내재가치 분석, 기술적 보조지표 분석 등 복잡한 분석보다 차트(chart)에 나타난 그래프(graph)의 모양으로 매매 시점을 찾는 직관적인 방법을 더 선호하는 편이다. 하지만 패턴(pattern) 분석 기법은 IT 구현의 난이도 때문에 사용자들의 요구에 비해 전산화가 덜 된 분야로 여겨진다. 최근에는 인공지능(artificial intelligence, AI) 분야에서 신경망을 비롯한 다양한 기계학습(machine learning) 기법을 사용하여 주가의 패턴을 연구하는 사례가 많아졌다. 특히 IT 기술의 발전으로 방대한 차트 데이터를 분석하여 주가 예측력이 높은 패턴을 발굴하는 것이 예전보다 쉬워졌다. 지금까지의 성과로 볼 때 가격의 단기 예측력은 높아졌지만, 장기 예측력은 한계가 있어서 장기 투자보다 단타 매매에서 활용되는 수준이다. 이외에 과거 기술력으로 인식하지 못했던 패턴을 기계적으로 정확하게 찾아내는 데 초점을 맞춘 연구도 있지만 찾아진 패턴이 매매에 적합한지 아닌지는 별개의 문제이기 때문에 실용적인 부분에서 취약할 수 있다. 본 연구는 주가 예측력이 있는 패턴을 찾으려는 기존 연구 방법과 달리 패턴들을 먼저 정의해 놓고 확률기반으로 선택해서 매매하는 방법을 제안한다. 5개의 전환점으로 정의한 Merrill(1980)의 M&W 파동 패턴은 32가지의 패턴으로 시장 국면 대부분을 설명할 수 있다. 전환점만으로 패턴을 분류하기 때문에 패턴 인식의 정확도를 높이기 위해 드는 비용을 줄일 수 있다. 32개 패턴으로 만들 수 있는 조합의 수는 전수 테스트가 불가능한 수준이다. 그래서 최적화 문제와 관련한 연구들에서 가장 많이 사용되고 있는 인공지능 알고리즘(algorithm) 중 하나인 유전자 알고리즘(genetic algorithm, GA)을 이용하였다. 그리고 미래의 주가가 과거를 반영한다 해도 같게 움직이지 않기 때문에 전진 분석(walk-forward analysis, WFA)방법을 적용하여 과최적화(overfitting)의 실수를 줄이도록 하였다. 20종목씩 6개의 포트폴리오(portfolio)를 구성하여 테스트해 본 결과에 따르면 패턴 매매에서 가격 변동성이 어느 정도 수반되어야 하며 패턴이 진행 중일 때보다 패턴이 완성된 후에 진입, 청산하는 것이 효과적임을 확인하였다.