• 제목/요약/키워드: 정보 시스템 개발

검색결과 18,912건 처리시간 0.062초

최근 2년간(2009-2010) 우리나라 병원성 대장균 식중독 역학조사 보고서 분석 (An Analysis of Epidemiological Investigation Reports Regarding to Pathogenic E. coli Outbreaks in Korea from 2009 to 2010)

  • 이종경;박인희;윤기선;김현정;조준일;이순호;황인균
    • 한국식품위생안전성학회지
    • /
    • 제27권4호
    • /
    • pp.366-374
    • /
    • 2012
  • 최근 2010년 우리나라 통계에서 가장 문제가 되고 있는 최다 발생 식중독으로 노로바이러스 식중독이 31건, 1994명 환자, 병원성 대장균이 28건, 1926명의 환자가 발생하였다. 세균성 식중독인 병원성 대장균의 특성을 살펴보기 위하여 본 연구에서는 우리나라에서 2009년, 2010년 작성된 병원성대장균 역학조사 보고서에 수록된 68건의 병원성 대장균 식중독의 정보를 수집, 리뷰, 분석하여 우리나라 병원성 대장균의 특성을 파악하고자 하였다. 병원성 대장균 식중독은 급식(64.8%) 및 외식(25.5%)에서 발생률이 약 90%에 해당하였다. 우리나라 발생 병원성 대장균 식중독 원인균의 대부분은 EPEC가 44.7%과 ETEC가 34.2%를 차지하여 이들이 전체의 78.9% 가량 대다수를 차지하였고 EAEC와 EHEC는 각각 10.5와 9.2%에 해당하였다. 전체 68건 사례 중에서 이들이 단일균으로 규명된 것이 모두 59건, 두 가지 타입이 혼재된 건이 8건, 그리고 최종 균의 타입이 동정되지 못한 건수가 1건 있어 오염경로 추적의 어려움을 알 수 있었다. 섭취인구에 따라 다양한 질병 발생률을 보여 평균적으로 $33.6{\pm}30.5%$의 발생률을 나타냈고 주 증상은 설사, 복통, 구토, 발열이 대부분이었다. 식품에서 병원성 대장균이 검출된 사례는 두건으로 햄버거를 섭취한 경우 냉동햄버거 패티에서 병원성 대장균이 검출된 사례와 급식에서 오징어야채무침에서 검출된 건수가 있어서 식품에서 검출률이 낮았지만 쇠고기와 수산물 혹은 야채류에서 관리가 필요함을 알 수 있었다. 식품에서 병원성 대장균 검출이 어렵게 되는 원인으로 분석된 것은 식중독 발생에서 신고까지 지연 (7일 이상 소요된 건수가 14.6-18.5%), 원인 식품 수거 어려움 (음식점에서 식중독 때 섭취 식품 수거율 17.6%)과 같이 제도적 부분에서 개선이 필요하며 이들 주요 애로 사항이외에도 역학 조사반의 어려움으로는 발생기관과 환자의 비협조 및 환자들 샘플채취 미흡, 대조군 확보의 어려움, 유전자 분석의 보완과 같은 부분으로 나타났다. 결론적으로 우리나라 병원성 대장균 식중독은 서구국가와 같이 EHEC과 같은 부분이 아니라 급식 및 외식시설에서 EPEC, ETEC가 주요 원인균인 만큼 향후 대응도 원인균 유입경로 추적 및 분석기술 개발, 역학조사의 제도적 보완과 범 정부부처간의 시스템적인 지원이 필요하다.

유아의 소프트웨어 교육 관련 국내 최근 연구의 경향 분석 (An Analysis of Research Trends Related to Software Education for Young Children in Korea)

  • 천희영;박소연;성지현
    • 한국보육학회지
    • /
    • 제19권2호
    • /
    • pp.177-196
    • /
    • 2019
  • 본 연구는 2016년부터 3년간 발표된 유아 소프트웨어 교육 관련 국내 최근 연구들의 경향을 게재 경향과 연구방법의 측면에서 분석하는데 연구의 목적을 두었다. 분석대상은 한국학술지인용색인과 국가학술연구정보 공유 시스템에서 검색된 유아의 소프트웨어 교육 관련 연구 26편이었다. 발표된 연구의 게재 경향은 발표 연도, 발표 형식, 학문 분야의 범주에 따라 살펴보았다. 연구방법 측면에서는 연구의 주제 특성과 연구방법 유형, 그리고 연구변인의 특성을 분석하였다. 연구의 결과를 연구의 게재 경향 측면에서 살펴본 바, 2016년부터 최근 3년간 발표된 연구 편수는 연도별로 점차 증가하며, 학술지 논문 형태로 대다수가 발표된 것으로 나타났다. 전체 분석대상의 61.5%(16편)가 유아교육 및 아동학 관련 학문 분야에서 발표된 논문이었다. 연구방법 측면에서는 먼저, 연구의 주제와 연구대상 관련하여 유아 소프트웨어 교육 프로그램 개발 연구, 또는 만4세와 만5세를 대상으로 효과 검증을 한 연구가 다수를 차지하는 것으로 밝혀졌다. 연구방법으로는 실험연구와 문헌연구방법 (각 8회), 조사연구(7회)의 순으로 많이 적용된 것으로 나타났다. 연구변인의 특성으로서 많이 다루어진 측정변인은 유아의 인지적 특성 변인으로 나타났다. 연구에 적용된 프로그램의 특성과 관련하여, 첫째, 프로그래밍 도구 환경을 중심으로 분류한 결과 가장 많은 6편의 연구가 피지컬 컴퓨팅 환경의 프로그램을 사용하였으며, 연구에 사용된 프로그래밍 도구 로봇 중에서는 Albert가 가장 많이 사용된 것으로 나타났다. 프로그램의 적용 기간은 5주~48주로 차이가 있었다. 분석대상 연구들에서 컴퓨팅 사고력은 소프트웨어 교육에 의해 향상되는 문제해결 능력으로 개념화된 경우가 가장 많았으며, 그 하위요인별 개별도구로써 측정되었음을 알 수 있었다. 본 연구의 결과 유아의 소프트웨어 교육 관련 연구가 최근 증가하는 경향을 보이지만 연구 편수의 축적과 연구방법 측면에서 개선이 필요하다는 것을 확인할 수 있었다.

해역별 최적 해빈 안정화 공법 선정 Platform 개발을 위한 기초연구-맹방해변 이송모드별 년 표사수지를 중심으로 (Preliminary Study on the Development of a Platform for the Selection of Optimal Beach Stabilization Measures against the Beach Erosion - Centering on the Yearly Sediment Budget of Mang-Bang Beach)

  • 조용준;김인호
    • 한국해안·해양공학회논문집
    • /
    • 제31권1호
    • /
    • pp.28-39
    • /
    • 2019
  • 해빈 안정화를 위한 구조물 설계 시 주 표사이송 모드와 모드별 년 표사 이송량에 관한 정보는 상당한 공학적 가치를 지닌다. 이러한 시각에서 본고에서는 현재 상당한 침식이 진행되고 있는 맹방해변의 년 표사 이송량을 산출하였다. 횡단표사의 경우 Bagnold(1963)의 에너지 모형을 확장한 Bailard(1981)의 모형을 활용하였으며, 연안 표사량은 각 해안에서 가용한 파랑에너지 유입률에 의해 결과 되는 것으로 해석하였다. Bailard(1981)의 횡단표사모형 적용에 필요한 유속 적률은 먼저 맹방해변에서 관측된 파랑자료로부터 출현 가능한 총 71개의 파랑주기 복합사상을 선정하고, 선정된 복합사상을 대상으로 수행된 맹방해변에서의 비선형 천수과정 수치모의 결과로부터 산출하였다. 이 과정에서 파랑모형으로는 주파수 영역 Boussinesq Eq.(Frelich and Guza, 1984)을 활용하였으며, 모의결과 Bailard(1981)의 연구와는 달리 유속 적률과 Irribaren NO. 간에 존재하는 뚜렷한 상관관계를 확인할 수 있었다. 산출 결과 맹방해변 평균 방위 ${\beta}=41.6^{\circ}$의 경우 북서진하는 연안표사가 우월하며 그 양은 년 $125,000m^3/m$에 달하였다. 북서진하는 연안표사와 남동진하는 연안표사가 균형을 이루는 null point는 ${\beta}=47^{\circ}$에 위치하며, 횡단표사의 경우 4월부터 10월 중순까지는 연안방향으로의 퇴적이 점진적으로 진행되나 10월 말과 삼월에 단발적으로 발생하는 고파랑에 의해 침식되는 것으로 판단된다. 또한 맹방해변의 연안표사 장미도(littoral drift rose)를 산출하였으며, 그 결과 맹방해변의 방위가 일시적으로 null point의 방위보다 큰 경우 남동진하는 연안표사가 우월하며, 방위가 일시적으로 null point의 방위보다 작은 경우 북서진하는 연안표사가 우월한 경향을 확인하였으며, 이는 맹방해변은 일시적으로 침식되더라도 스스로 복원할 수 있는 능력을 지닌 안정적인 해변임을 의미한다.

벼 유전자원의 아밀로스 및 단백질 성분 함량 분포에 관한 자원정보 구축 (Construction of Database System on Amylose and Protein Contents Distribution in Rice Germplasm Based on NIRS Data)

  • 오세종;최유미;이명철;이수경;윤혜명;;채병수
    • 한국자원식물학회지
    • /
    • 제32권2호
    • /
    • pp.124-143
    • /
    • 2019
  • 본 연구는 선행연구에서 개발된 근적외선 분광법(NIRS) 예측모델을 활용하여 농업유전자원센터에서 보존 중인 국내외 벼유전자원의 아밀로스 및 단백질 함량 자료를 통계 처리하여 자원 분포를 파악하기 위한 데이터베이스를 구축하고자 하였다. 예측모델의 $R^2$ 값은 아밀로스 분석결과 0.970이었고, 단백질은 0.983이었다. 미지시료 측정 시 정확도를 평가하기 위해 외부검정과정을 거친 결과 $R^2$ 값은 아밀로스 분석결과 0.962였고, 단백질은 0.986이었다. 벼 자원을 재래종, 육성품종, 잡초형, 육성계통으로 나누어 NIRS를 이용하여 성분 분석한 후 함량분포를 확인하였다. 찰벼 평균 아밀로스는 재래종, 육성품종, 잡초형에서 동일하게 8.7%였고, 육성계통은 10.3%였다. 메벼 평균 아밀로스는 재래종 22.3%, 육성품종 22.7%, 잡초형 23.6%, 육성계통 24.2%였다. 전체 벼 자원 중 아밀로스 함량 9%이하 waxy type은 5.0%, low amylose는 5.5%, middle amylose는 20.5%, high amylose는 69.0%를 차지하였다. 단백질 분석 결과 평균함량은 재래종 8.2%, 육성품종 8.0%, 잡초형 7.9%, 육성계통 7.9%였다. 찰벼의 다양성지수 평균은 0.62, 메벼는 0.80이었고, 단백질 다양성지수는 평균 0.51이었다. 임의의 함량구간 내 자원비율은 정규분포의 표준화과정을 통해 확인하였다. 임의 구간에 대한 자원분포비율 산출 결과는, 재래종 아밀로스 6.4-8.7% 구간의 자원비율은 0.45였고, 22.3-26.1% 구간은 0.40, 단백질 7.3-8.2% 구간은 0.26이었다. 육성품종 아밀로스 8.7-9.4% 구간의 자원비율은 0.19였고, 20.1-22.7% 구간은 0.32, 단백질 6.1-8.3% 구간은 0.51이었다. 잡초형 아밀로스 6.6-9.7% 구간은 0.67이었고, 23.6-24.8% 구간은 0.19, 단백질 7.0-7.9% 구간은 0.33이었다. 육성계통 아밀로스 10.0-12.0% 구간의 자원비율은 0.47이었고, 24.2-28.0% 구간은 0.40, 단백질 7.0-7.9% 구간은 0.26이었다. 어떤임의 구간을 지정하여도 자원의 비율을 쉽게 구할 수 있으며, NIRS 분석과 통계분석과정을 통해 얻어진 자원별, 성분함량별 특성 자료는 효율적인 자원관리를 위한 데이터베이스 시스템 구축을 위한 기초 자료로 활용될 수 있을 것으로 판단된다.

만성질환 유병상태에 따른 노인 방문건강관리 서비스 만족도 영향요인 연구 (Factors Influencing Satisfaction on Home Visiting Health Care Service of the Elderly based on the degree of chronic diseases)

  • 서다람;손창우
    • 한국노년학
    • /
    • 제41권2호
    • /
    • pp.271-284
    • /
    • 2021
  • 이 연구는 한국형 커뮤니티 케어의 기초가 되는 서울시 찾아가는 동주민센터 방문건강관리 사업을 중심으로, 만성질환 유병상태에 따른 노인 방문건강관리 서비스 만족도 영향요인을 도출하고, 향후 효과적인 커뮤니티 케어 모형 개발을 위한 기초자료로 활용되고자 수행되었다. 이 연구는 찾아가는 동주민센터 3단계('17년 7월 ~ '18년 6월) 및 4단계('18년 7월 ~ '19년 6월)에 참여한 만 65세, 만 70세 노인을 모집단으로 하여, 자치구별 비례할당 방식으로 추출한 2,200명(3단계 24개구 1,100명, 4단계 25개구 1,100명)을 대상으로 가구방문 면접 조사를 실시하였다. 이후 불성실 응답 180건을 제외한 2,020명을 최종 분석대상에 포함하였다. 만성질환 유병상태를 기준으로 하위집단을 나누었고, 방문건강관리 서비스 만족도 영향요인을 도출하기 위하여 로지스틱 회귀분석을 실시하였다. 연구결과, 만성질환이 없는 노인들은 건강교육 및 상담 서비스를, 만성질환을 1개 가지고 있는 단일 만성질환 노인은 지역사회자원 연계서비스를, 만성질환을 2개 이상 가지고 있는 복합 만성질환 노인은 자신의 건강상태평가 및 지역사회자원 연계서비스를 제공받은 경우 서비스 만족도가 통계적으로 유의하게 높아지는 것을 확인하였다. 한편, 만성질환 유병상태와 상관없이 노인이 인식하고 있는 서비스 제공시간은 방문건강관리 서비스 만족도를 높이는 요인이었으며, 설명 이해도는 단일, 복합 만성질환자 모두에게 만족도를 높이는 요인이었다. 지역사회를 중심으로 한 방문건강관리 서비스는 현재 추진되고 있는 커뮤니티 케어의 핵심 요소이므로 향후 커뮤니티 케어의 지속성과 효과성을 증대하기 위하여, 노인의 만성질환 유병상태에 따른 지역사회 중심의 맞춤형 건강관리서비스가 제공되어야 하겠다. 다만, 보다 효과적인 서비스 제공을 위하여, 첫째, 국민건강보험공단이 보유하고 있는 대상자의 건강정보를 지자체로 공유하는 연계시스템 구축과 둘째, 방문건강관리 서비스의 질향상을 위한 방문간호사 역량강화 교육이 병행될 필요가 있다. 이 연구의 결과와 제언이 향후 커뮤니티케어의 성공적 정착을 위한 기초자료로 활용되기를 기대한다.

소규모 환경영향평가 제도개선을 통한 지자체 환경영향평가 효과성 증진방안 (Effectiveness Enhancement Measures for Local Government Environmental Impact Assessment (EIA) by Improving Small-scale EIA Institution)

  • 이종욱;조경두
    • 환경영향평가
    • /
    • 제32권1호
    • /
    • pp.15-28
    • /
    • 2023
  • 우리나라 소규모 환경영향평가의 대상사업 범위는 사업 유형 및 용도지역 구분에 따라 계획면적이 5,000~60,000m2 이상으로 규정되어 있지만, 지자체 환경영향평가 대상의 하한은 이보다 상단에 위치하므로 중복 범위가 존재한다. 이는 2016년 11월 일부 개정된 「환경영향평가법 시행령」에 소규모 환경영향평가 대상사업으로 도로사업과 지구단위계획이 포함되면서 확대된 사안으로, 기존에 지자체 환경영향평가 대상이었던 사업까지도 지역 차원의 의견수렴과 검토 절차 없이 소규모 환경영향평가만으로 협의가 완료되고 있는 현행 협의 제도는 논의가 필요하다. 지자체 환경영향평가 대상사업에 해당하였으나 소규모 환경영향평가로 협의 완료된 개발사업은 소수이므로 중요성이 작아 보일 수 있으나, 지방 정부가 지자체 환경영향평가 대상사업을 추가하고자 하더라도 소규모 환경영향평가로 인해 실행할 수 없는 상황이 조성되므로 주목할 필요가 있다. 본 연구는 지자체 환경영향평가의 효과성을 증진시키기 위한 제도개선 방안으로 다음을 제시하였다. 첫째, 소규모 환경영향평가 협의 과정에 지역의 구체적 환경특성과 지리 여건이 반영된 검토 의견이 제시될 수 있도록 제도적 장치를 보완하는 방안이다. 둘째, 「환경영향평가법」 제42조 1항의 지자체 환경영향평가 예외 조문에 대한 일부 개정을 통해, 대상사업 범위 중복구간의 사업들이 지자체 환경영향평가 대상으로 우선 협의되도록 하는 방안이다. 셋째, 규모가 작더라도 지역의 특수성을 반영하여 지자체 환경영향평가 수행이 꼭 필요하다고 판단되는 대상사업들을 조례에 포함하는 방안이다. 난개발과 보전 필요지역 훼손 방지라는 소규모 환경영향평가의 긍정적 기능이 있다 하더라도, 지자체 내 다수 사업이 지역으로부터의 검토 없이 협의되는 상황을 개선하기 위한 노력이 필요하다.

경영분석지표와 의사결정나무기법을 이용한 유상증자 예측모형 개발 (Development of Predictive Models for Rights Issues Using Financial Analysis Indices and Decision Tree Technique)

  • 김명균;조윤호
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.59-77
    • /
    • 2012
  • 기업의 성장성, 수익성, 안정성, 활동성, 생산성 등에 대한 다양한 분석이 은행, 신용평가기관, 투자자 등 많은 이해관계자에 의해 실시되고 있고, 이에 대한 다양한 경영분석 지표들 또한 정기적으로 발표되고 있다. 본 연구에서는 이러한 경영분석 지표를 이용하여 어떤 기업이 가까운 미래에 유상증자를 실시하는지를 데이터마이닝을 통해 예측하고자 한다. 본 연구를 통해 어떠한 지표가 유상증자 여부를 예측하는데 도움이 되는가를 살펴 볼 것이며, 그 지표들을 이용하여 예측할 경우 그 예측의 정확도가 어느 정도인지를 분석하고자 한다. 특히 1997년 IMF 금융위기 전후로 유상증자를 결정하는 변수들이 변화하는지, 그리고 예측의 정확성에 분명한 차이가 존재하는지 분석한다. 또한 유상증자 실시 시기를 경영분석 지표 발표 후 1년 내, 1~2년 내, 2~3년 내로 나누어 예측 시기에 따라 예측의 정확성과 결정 변수들의 차이가 존재하는지도 분석한다. 658개의 유가증권상장법인의 경영분석 데이터를 이용하여 실증 분석한 결과, IMF 이후의 유상증자 예측모형이 IMF 이전의 예측모형에 비해 예측 정확도가 높았고, 학습용 데이터의 예측 정확도와 검증용 데이터의 예측 정확도 차이도 IMF 이후가 낮게 나타났다. 이러한 결과는 IMF 이후 재무자료의 정확도가 높아졌고, 기업에게 유상증자의 목적이 더욱 명확해졌다고 해석될 수 있다. 또한 예측기간이 단기인 경우 경영분석 지표 중 안전성에 관련된 지표들의 중요성이 부각되었고, 장기인 경우에는 수익성과 안전성뿐만 아니라 활동성과 생산성 관련지표도 유상증자를 예측하는 데 중요한 것으로 파악되었다. 그리고 모든 예측모형에서 산업코드가 유상증자를 예측하는 중요변수로 포함되었는데 이는 산업별로 서로 다른 유상증자 유형이 존재한다는 점을 시사한다. 본 연구는 투자자나 재무담당자가 유상증자 여부를 장단기 시점에서 예측하고자 할 때 어떠한 경영분석지표를 고려하여 분석하는 것이 바람직한지에 대한 지침을 제공하는데 그 의의가 있다.

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.

온라인 리뷰 분석을 통한 상품 평가 기준 추출: LDA 및 k-최근접 이웃 접근법을 활용하여 (Product Evaluation Criteria Extraction through Online Review Analysis: Using LDA and k-Nearest Neighbor Approach)

  • 이지현;정상형;김준호;민은주;여운영;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.97-117
    • /
    • 2020
  • 상품 평가 기준은 상품에 대한 속성, 가치 등을 표현한 지표로써 사용자나 기업이 상품을 측정하고 파악할 수 있게 한다. 기업이 자사 제품에 대한 객관적인 평가와 비교를 수행하기 위해서는 적절한 기준을 선정하는 것이 필수적이다. 이때, 평가 기준은 소비자들이 제품을 실제로 구매 및 사용 후 평가할 때 고려하는 제품의 특징을 반영하여야 한다. 그러나 기존에 사용되던 평가 기준은 제품마다 상이한 소비자의 의견을 반영하지 못하고 있다. 기존 연구에서는 소비자 의견이 반영된 온라인 리뷰를 통해 상품의 특징, 주제를 추출하고 이를 평가기준으로 사용했다. 하지만 여전히 상품과 연관성이 낮은 평가 기준이 추출되거나 부적절한 단어가 정제되지 않는 한계가 있다. 본 연구에서는 이를 극복하기 위해 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 기법으로 리뷰로부터 평가 기준 후보군을 추출하고 이를 k-최근접 이웃 접근법(k-Nearest Neighbor Approach, k-NN)을 이용해 정제하는 모델을 개발하고 검증했다. 제시하는 방법은 준비 단계와 추출 단계로 이루어진다. 준비 단계에서는 워드임베딩(Word Embedding) 모델과 평가 기준 후보군을 정제하기 위한 k-NN 분류기를 생성한다. 추출 단계에서는 k-NN 분류기와 언급 비율을 이용해 평가 기준 후보군을 정제하고 최종 결과를 도출한다. 제안 모델의 성능 평가를 위해 명사 빈도 추출 모델, LDA 빈도 추출 모델, 실제 전자상거래 사이트가 제공하는 평가 기준을 세 비교 모델로 선정했다. 세 모델과의 비교를 위해 설문을 진행하고 점수화하여 결과를 검정했다. 30번의 검정 결과 26번의 결과에서 제안 모델이 우수함을 확인했다. 본 연구의 제안 모델은 전자상거래 사이트에서 리뷰 특성을 반영한 상품군 별 차원을 도출하는데 활용될 수 있고 이를 기초로 인사이트 발굴을 위한 리뷰 분석 및 활용에 크게 기여할 것이다.

XGBoost를 활용한 리스크패리티 자산배분 모형에 관한 연구 (A Study on Risk Parity Asset Allocation Model with XGBoos)

  • 김영훈;최흥식;김선웅
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.135-149
    • /
    • 2020
  • 인공지능을 기반으로 한 다양한 연구들이 현대사회에 많은 변화를 불러일으키고 있다. 금융시장 역시 예외는 아니다. 로보어드바이저 개발이 활발하게 진행되고 있으며 전통적 방식의 단점을 보완하고 사람이 분석하기 어려운 부분을 대체하고 있다. 로보어드바이저는 인공지능 알고리즘으로 자동화된 투자 결정을 내려 다양한 자산배분 모형과 함께 활용되고 있다. 자산배분 모형 중 리스크패리티는 대표적인 위험 기반 자산배분 모형의 하나로 큰 자산을 운용하는 데 있어 안정성을 나타내고 현업에서 역시 널리 쓰이고 있다. 그리고 XGBoost 모형은 병렬화된 트리 부스팅 기법으로 제한된 메모리 환경에서도 수십억 가지의 예제로 확장이 가능할 뿐만 아니라 기존의 부스팅에 비해 학습속도가 매우 빨라 많은 분야에서 널리 활용되고 있다. 이에 본 연구에서 리스크패리티와 XGBoost를 장점을 결합한 모형을 제안하고자 한다. 기존에 널리 사용되는 최적화 자산배분 모형은 과거 데이터를 기반으로 투자 비중을 추정하기 때문에 과거와 실투자 기간 사이의 추정 오차가 발생하게 된다. 최적화 자산배분 모형은 추정 오차로 인해 포트폴리오 성과에서 악영향을 받게 된다. 본 연구는 XGBoost를 통해 실투자 기간의 변동성을 예측하여 최적화 자산배분 모형의 추정 오차를 줄여 모형의 안정성과 포트폴리오 성과를 개선하고자 한다. 본 연구에서 제시한 모형의 실증 검증을 위해 한국 주식시장의 10개 업종 지수 데이터를 활용하여 2003년부터 2019년까지 총 17년간 주가 자료를 활용하였으며 in-sample 1,000개, out-of-sample 20개씩 Moving-window 방식으로 예측 결과값을 누적하여 총 154회의 리밸런싱이 이루어진 백테스팅 결과를 도출하였다. 본 연구에서 제안한 자산배분 모형은 기계학습을 사용하지 않은 기존의 리스크패리티와 비교하였을 때 누적수익률 및 추정 오차에서 모두 개선된 성과를 보여주었다. 총 누적수익률은 45.748%로 리스크패리티 대비 약 5% 높은 결과를 보였고 추정오차 역시 10개 업종 중 9개에서 감소한 결과를 보였다. 실험 결과를 통해 최적화 자산배분 모형의 추정 오차를 감소시킴으로써 포트폴리오 성과를 개선하였다. 포트폴리오의 추정 오차를 줄이기 위해 모수 추정 방법에 관한 다양한 연구 사례들이 존재한다. 본 연구는 추정 오차를 줄이기 위한 새로운 추정방법으로 기계학습을 제시하여 최근 빠른 속도로 발전하는 금융시장에 맞는 진보된 인공지능형 자산배분 모형을 제시한 점에서 의의가 있다.