• 제목/요약/키워드: Intelligence Management System

검색결과 1,018건 처리시간 0.031초

다양한 다분류 SVM을 적용한 기업채권평가 (Corporate Bond Rating Using Various Multiclass Support Vector Machines)

  • 안현철;김경재
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.157-178
    • /
    • 2009
  • Corporate credit rating is a very important factor in the market for corporate debt. Information concerning corporate operations is often disseminated to market participants through the changes in credit ratings that are published by professional rating agencies, such as Standard and Poor's (S&P) and Moody's Investor Service. Since these agencies generally require a large fee for the service, and the periodically provided ratings sometimes do not reflect the default risk of the company at the time, it may be advantageous for bond-market participants to be able to classify credit ratings before the agencies actually publish them. As a result, it is very important for companies (especially, financial companies) to develop a proper model of credit rating. From a technical perspective, the credit rating constitutes a typical, multiclass, classification problem because rating agencies generally have ten or more categories of ratings. For example, S&P's ratings range from AAA for the highest-quality bonds to D for the lowest-quality bonds. The professional rating agencies emphasize the importance of analysts' subjective judgments in the determination of credit ratings. However, in practice, a mathematical model that uses the financial variables of companies plays an important role in determining credit ratings, since it is convenient to apply and cost efficient. These financial variables include the ratios that represent a company's leverage status, liquidity status, and profitability status. Several statistical and artificial intelligence (AI) techniques have been applied as tools for predicting credit ratings. Among them, artificial neural networks are most prevalent in the area of finance because of their broad applicability to many business problems and their preeminent ability to adapt. However, artificial neural networks also have many defects, including the difficulty in determining the values of the control parameters and the number of processing elements in the layer as well as the risk of over-fitting. Of late, because of their robustness and high accuracy, support vector machines (SVMs) have become popular as a solution for problems with generating accurate prediction. An SVM's solution may be globally optimal because SVMs seek to minimize structural risk. On the other hand, artificial neural network models may tend to find locally optimal solutions because they seek to minimize empirical risk. In addition, no parameters need to be tuned in SVMs, barring the upper bound for non-separable cases in linear SVMs. Since SVMs were originally devised for binary classification, however they are not intrinsically geared for multiclass classifications as in credit ratings. Thus, researchers have tried to extend the original SVM to multiclass classification. Hitherto, a variety of techniques to extend standard SVMs to multiclass SVMs (MSVMs) has been proposed in the literature Only a few types of MSVM are, however, tested using prior studies that apply MSVMs to credit ratings studies. In this study, we examined six different techniques of MSVMs: (1) One-Against-One, (2) One-Against-AIL (3) DAGSVM, (4) ECOC, (5) Method of Weston and Watkins, and (6) Method of Crammer and Singer. In addition, we examined the prediction accuracy of some modified version of conventional MSVM techniques. To find the most appropriate technique of MSVMs for corporate bond rating, we applied all the techniques of MSVMs to a real-world case of credit rating in Korea. The best application is in corporate bond rating, which is the most frequently studied area of credit rating for specific debt issues or other financial obligations. For our study the research data were collected from National Information and Credit Evaluation, Inc., a major bond-rating company in Korea. The data set is comprised of the bond-ratings for the year 2002 and various financial variables for 1,295 companies from the manufacturing industry in Korea. We compared the results of these techniques with one another, and with those of traditional methods for credit ratings, such as multiple discriminant analysis (MDA), multinomial logistic regression (MLOGIT), and artificial neural networks (ANNs). As a result, we found that DAGSVM with an ordered list was the best approach for the prediction of bond rating. In addition, we found that the modified version of ECOC approach can yield higher prediction accuracy for the cases showing clear patterns.

쿠폰 다운로드를 기준으로 하는 온라인 광고비 모델의 설계 및 분석 (Design and Analysis of Online Advertising Expenditure Model based on Coupon Download)

  • 전정호;이경전
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.1-19
    • /
    • 2010
  • 기존의 인터넷 광고비 모델에는 CPM (Cost Per Mile), CPC (Cost Per Click), CPS (Cost Per Sales) 등이 존재하며, 특히 CPC 모델은 광고주와 미디어에게 모두 합리적이라는 평가를 받으며, 인터넷 광고 시장에서 높은 비중을 차지하고 있다. 그러나 CPC 모델 또한, 경쟁 사업자에 의한 과도한 광고비 부과나 부정한 광고 수익 등을 목적으로 하는 부정 행위가 발생할 수 있고, 사용자의 전환 의도 없는 광고물 클릭으로 인해 광고주에게 부당한 광고비가 부과될 수 있는 것이 사실이다. 이에 본 연구에서는 새로운 광고비 모델인 'CPCD' (Cost Per Coupon Download) 모델을 제안한다. CPCD 모델은 사용자가 단순히 광고물을 클릭하는 행동을 넘어 광고주가 제공하는 쿠폰을 다운로드 받았을 때 광고비가 부과되는 모델로서, CPC 모델과 CPS 모델의 중간 개념이라고 할 수 있다. 본 연구에서는 CPCD 모델의 설계 및 분석을 위하여 발생 가능한 시나리오를 제시하고, 프로세스 분석 및 관련 이슈에 대한 검토를 수행한다. 그리고 CPCD 모델에 참여하는 각 사업 참여자들에 대한 분석을 수행하고, 비용 시뮬레이션을 통해 CPC 모델과 CPCD 모델을 비교함으로써, CPCD 모델에 참여하는 광고주의 사업 참여 조건을 밝히며, 마지막으로 유비쿼터스 환경에서 CPCD 모델의 적용 가능성에 대하여 고찰한다.

개인화 전시 서비스 구현을 위한 지능형 관객 감정 판단 모형 (The Intelligent Determination Model of Audience Emotion for Implementing Personalized Exhibition)

  • 정민규;김재경
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.39-57
    • /
    • 2012
  • 최근 기존 전시 공간 내에 유비쿼터스 환경이 구축되면서, 관객과의 상호작용을 통해 전시 효과를 배가할 수 있는 인터랙티브 전시에 많은 사람들의 관심이 집중되고 있다. 이러한 인터랙티브 전시가 보다 고도화되기 위해서는 전시물에 대한 다양한 관객 반응을 측정하고, 이를 통해 대상 관객이 어떤 감정을 느끼는지 예측할 수 있는 적절한 의사결정지원 모형이 요구된다. 이러한 배경에서 본 연구는 인터랙티브 전시 공간 내에서 수집 가능한 다양한 관객 반응 중 얼굴표정의 변화를 이용하여, 관객의 감정을 추론, 판단하는 지능형 모형을 제시한다. 본 연구에서 제시하는 모형은 무자극 상태의 관객의 표정과 자극이 주어졌을 때 관객의 표정이 어떻게 변화하는지 변화량을 측정하여, 이를 기반으로 인공신경망 기법을 이용해 해당 관객의 감정을 판단하는 모형이다. 이 때, 제안모형의 감정 분류체계로는 간결하면서도 실무에 적용이 용이하여 그간 기존 문헌에서 널리 활용되어 온 매력-각성(Valence-Arousal) 모형을 사용한다. 제안모형의 유용성을 검증하기 위해, 본 연구에서는 2011 서울 DMC 컬쳐 오픈 행사에 참여하여, 일반인을 대상으로 얼굴 표정 변화 데이터를 수집하고, 이들이 느끼는 감정 상태를 설문조사하였다. 그리고 나서, 이 자료들을 대상으로 본 연구에서 제안하는 모형을 적용해 보고, 제안모형이 비교모형으로 설정된 통계기반 예측모형에 비해 더 우수한 성과를 보이는지 확인해 보았다. 실험 결과, 본 연구에서 제시하는 모형이 비교 모형인 중회귀분석 모형보다 더 우수한 결과를 제공함을 확인할 수 있었다. 본 연구를 통하여 구축된 관객 감정 판단 모형을 실제 전시장에서 활용한다면 전시물을 관람하는 관객의 반응에 따라 시의적절하면서도 효과적인 대응이 가능하기 때문에, 관객의 몰입과 만족을 보다 증대시킬 수 있을 것으로 기대된다.

지식 간 상호참조적 네비게이션이 가능한 온톨로지 기반 프로세스 중심 지식지도 (Ontology-Based Process-Oriented Knowledge Map Enabling Referential Navigation between Knowledge)

  • 유기동
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.61-83
    • /
    • 2012
  • 지식지도는 관련된 지식의 현황을 네트워크 형식으로 보여주는 일종의 도식으로, 지식 간의 상호참조적 네비게이션 관계를 기초로 하는 지식 분류 및 저장 체계 역할을 한다. 이러한 이유로 인하여 지식 및 이들 지식이 또 다른 지식과 갖는 관계를 네트워크 형식으로 형식적이고 객관적으로 묘사하기 위한 온톨로지 기반 지식지도의 필요성이 대두되어왔다. 본 논문은 지식 간의 상호참조적 네비게이션이 가능한 온톨로지 기반 지식지도를 구현하기 위한 방법론을 제시한다. 제시된 방법론에 의해 구현되는 온톨로지 기반 지식지도는 지식 간의 상호참조적 네비게이션을 가능하게 할 뿐만 아니라 이러한 지식 간 네트워크 관계에 의해 추가적인 지식 간의 관계를 추론할 수 있다. 제시된 개념의 타당성을 검증하기 위하여 두 가지의 실제 비즈니스 프로세스를 기반으로 지식지도를 구현하였고, 구현된 지식지도에 나타나는 지식 간 네트워크 구성의 유효성을 검토하였다.

미국 프로농구(NBA)의 플레이오프 진출에 영향을 미치는 주요 변수 예측: 3점과 턴오버 속성을 중심으로 (Prediction of Key Variables Affecting NBA Playoffs Advancement: Focusing on 3 Points and Turnover Features)

  • 안세환;김영민
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.263-286
    • /
    • 2022
  • 본 연구는 웹 크롤링을 이용하여 1990년부터 2022년까지 총 32개년에 해당하는 NBA 통계 정보를 획득하고, 탐색적 데이터 분석을 통해 관심 변수를 관찰하고 관련된 파생변수를 생성한다. 입력 데이터에 대한 정제 과정을 거쳐 무의미한 변수들을 제거하고, 남은 변수에 대한 상관관계 분석, t 검정 및 분산분석을 수행하였다. 관심 변수에 대해 플레이오프 진출/미진출 그룹 간 평균의 차이를 검정하였고, 이를 보완하기 위해 순위를 기준으로 하는 3개 집단(상위/중위/하위) 간 평균 차이를 재확인하였다. 입력 데이터 중 올해 시즌 데이터만을 테스트 세트로 활용하였고, 모델 훈련을 위해서는 훈련 세트와 검증 세트를 분할하여 5-fold 교차검증을 수행하였다. 교차검증 결과와 시험 세트를 이용한 최종 분석 결과를 비교하여 성능 지표에서 차이가 없음을 확인함으로써 과적합 문제를 해결하였다. 원시 데이터의 품질 수준이 높고, 통계적 가정을 만족하기 때문에 적은 수준의 데이터 세트임에도 불구하고 대부분 모델에서 좋은 결과를 나타냈다. 본 연구는 단순히 머신러닝을 이용하여 NBA의 경기 결과를 예측하거나 플레이오프 진출 여부만을 분류하는 것에서 그치지 않고, 입력 특성의 중요도를 파악하여 높은 중요도를 갖는 주요 변수에 본 연구의 관심 대상 변수가 포함되는지를 확인하였다. Shap value의 시각화를 통해 특성 중요도의 결과만으로 해석할 수 없었던 한계를 극복하고, 변수의 진입/제거 과정에서 중요도 산출에 일관성이 부족하다는 점을 보완할 수 있었다. 본 연구에서 관심 대상으로 분류했던 3점 및 실책과 관련된 다수의 변수가 미국 프로농구에서의 플레이오프 진출에 영향을 미치는 주요 변수에 포함되는 것으로 나타났다. 본 연구는 기존의 스포츠 데이터 분석 분야에서 다루었던 경기 결과, 플레이오프 및 우승 예측 등의 주제를 포함하고 분석을 위해 여러 머신러닝 모델을 비교 분석했다는 점에서 유사성이 있지만, 사전에 관심 속성을 설정하고, 이를 통계적으로 검증함으로써 머신러닝 분석 결과와 비교하였다는 측면에서 차이가 있다. 또한 XAI 모델 중 하나인 SHAP를 이용하여 설명 가능한 시각화 결과를 제시함으로써 기존 연구와 차별화하였다.

전시장 참관객의 계획되지 않은 방문행동에 있어서 부스추천시스템의 영향에 대한 연구 (A Study on the Effect of Booth Recommendation System on Exhibition Visitors Unplanned Visit Behavior)

  • 정남호;김재경
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.175-191
    • /
    • 2011
  • 국가신성장동력으로MICE(Meeting, Incentive travel, Convention, Exhibition) 산업이각광받으면서국내전시산업에 대한 관심이 드높아 지고 있다. 이에 따라 국내 전시산업(domestic exhibition industry)도 미국이나 유럽과 같이 전시성과를 향상시키기 위한 다양한 연구가 진행 중이다. 그 중에서도 전시환경이나 전시기법 등에 따라 관람효과가 다르기 때문에 지능형 정보기술을 이용하여 전시장에 방문한 참관객의 참관패턴을 분석하여 참관객을 이해하고 더 나아가 참여업체 간의 연관관계 도출 및 전시회의 성과를 높이고자 하는 연구들이 진행되고 있다. 그런데, 이러한 기존의 부스추천시스템과 관련된 연구를 살펴보면 시스템적인 관점에서 추천의 정확성만을 논하고 있을 뿐 추천을 통한 참관객의 행동이나 인식의 변화에 대해서는 충분히 논의하고 있지 못하다. 부스추천시스템(Booth Recommendation System)은 참관객의 부스방문 정보를 바탕으로 참관객에게 적절한 부스를 추천하기 때문에 참관객은 사전에 계획하지 않은 전시장을 방문하게 될 수 있다. 이 때 참관객은 계획하지 않은 방문행동을 통해서 만족할 수도 있지만 추천과 정이 번거롭다거나 자유롭게 참관을 하는데 방해가 된다고 생각할 수 있다. 이 경우 참관객의 자유로운 관람보다 오히려 더 좋지 않은 성과를 낼 수 있다. 따라서 부스 추천시스템을 전시장에 적용하기 위해서는 시스템의 성과에 미치는 영향요인이 무엇인지 전반적으로 검토하고, 부스추천시스템이 참관객의 계획되지 않은 방문행동에 미치는 영향에 대해 면밀히 검토해야 한다. 이에 본 연구에서는 부스추천시스템의 성과에 영향을 미치는 요인이 무엇인지 이론과 기존문헌을 통해 살펴보고자 하였다. 또한, 참관객의 지각된 부스추천시스템의 성과가 참관객의 계획되지 않은 행동에 대한 만족도와 부스추천시스템의 재사용의도에 어떤 영향을 미치는지 살펴보고자 하였다. 이러한 연구목적을 달성하기 위한 이론적 프레임워크로 본 연구는 계획되지 않은 행동이론(Unplanned Behavior Theory)을 도입하였다. 계획되지 않은 행동(unplanned behavior)이란 "소비자들이 사전에 계획하지 되지 않은 채 실행된 어떤 행동"으로 정의할 수 있다. 소비자들의 계획되지 않은 행동은 그 동안 마케팅 등 다양한 분야에서 연구되어 왔다. 특히, 마케팅에서는 계획되지 않은 행동 중 계획되지 않은 구매(unplanned purchasing)에 많은 관심을 두어 왔는데 이 개념은 종종 충동적 구매(impulsive purchasing)와 혼동되어 사용되곤 하였다. 그런데, 충동적 구매가 갑자기 무엇인가 구매를 해야하는 강하고 지속적인 충동(urge)이라고 본다면 계획되지 않은 구매는 구매의사결정의 시점이 상점에 들어가기 전이 아닌 상점 내에서 수행된다는 점이 다르다. 즉, 모든 충동적 구매는 비계획적이나, 모든 계획되지 않은 구매가 충동적인 구매는 아니다. 그런데, 왜 소비자들은 계획되지 않은 행동을 하는가? 이에 대해서는 학자들에 따라 여러 가지 의견이 있으나 소비자가 사전에 철저한 계획을 수립하지 않고 따라서 중간에 계획을 변화시킬만한 유연성(flexibility)이 있기 때문이라는 점에 일관된 의견을 보인다. 즉, 계획되지 않은 행동을 하는데 많은 비용이 소요된다면 소비자들은 사전에 수립한 계획을 변경하기 어렵게 될 것이기 때문이다. 본 연구에서 살펴보고자 하는 전시장 역시 참관객들은 방문하기 전에 전시장이 어떤 프로그램으로 구성되어 있는지 살펴보고, 어떤 부스를 방문할지를 사전에 계획하게 된다. 그 이유는 참관객들이 전시장 방문에 투입할 수 있는 시간은 한정되어 있는 반면에 전시회는 대규모의 다양한 부스로 운영되기 때문에 참관객들이 모든 부스를 참관한다는 것이 현실적으로 불가능하기 때문이다. 따라서 본 연구에서 제시하는 부스추천시스템이 참관객이 선호할 만한 부스를 추천하게 되면 참관객은 자신의 계획을 변화시켜서 부스추천시스템이 추천한 부스를 방문하게 된다. 이러한 방문행동은 소비자가 상점을 방문하거나, 관광객이 관광지에서 계획하지 않은 행동을 하는 것과 유사한 측면에서 이해가 가능하며 특히 최근 여행소비자들이 정보기기의 영향으로 계획되지 않은 행동을 하는 경우가 부쩍 증가한 추세와 동일한 맥락에서 이해가 가능하다. 이에 다음과 같은 연구모형을 설정하였다. 이 연구모형은 참관객이 지각한 부스추천시스템의 성과(performance)를 매개변수로 하고 있는데 이 성과에 영향을 미치는 요인으로 부스추천시스템에 대한 신뢰(trust), 전시장 참관객의 지식수준 (knowledge level), 부스 추천시스템의 기대된 개인화 (expected personalization) 그리고 부스추천시스템의 자유위협(threat to freedom)을 영향요인으로 파악하였다. 또한, 지각된 부스추천시스템 성과와 계획되지 않은 행동에 대한 참관객의 만족도와 향후 부스추천시스템의 재사용의도간의 인과관계도 파악하고자 하였다. 이 때 부스추천시스템에대한신뢰는권한(competence), 자선(benevolence), 그리고진실(integrity)의2차요인(2nd order factor)으로구성하고, 나머지 요인들은 1차 요인으로 구성하였다. 이를 검증하기 위해 2011 DMC Culture Open 행사에서 부스추천시스템을 테스트하기 위하여 시스템을 개발하고, 101명의 참관객을 대상으로 실증조사를 하여 분석하였다. 분석결과 첫째, 부스추천시스템에 있어서 참관객의 신뢰가 가장 중요한 요소이며 실제 해당 부스추천시스템을 이용한 참관객들은 신뢰를 통해 부스추천시스템이 성과 있다고 인식하였다. 둘째, 참관객의 지식수준 역시 부스추천시스템의 성과에 유의한 영향을 미쳤는데 이는 추천의 성과가 전시장에 대한 사전적 이해가 필요함을 의미한다. 즉, 전시장에 대한 이해가 높은 참관객이 부스추천시스템의 유용성을 더 잘 파악하는 것으로 나타났다. 셋째, 기대된 개인화 수준은 성과에 유의한 영향을 미치지 못했는데 이는 기존 연구와 다른 결과로 본 연구에 사용된 부스추천시스템이 충분히 개인화 서비스를 제공하지 못했기 때문이라고 판단된다. 넷째, 부스추천시스템의 추천정보는 개인의 자유를 위협하거나 제한한다고 느끼지 않음으로 충분히 유용한 가치를 갖는다고 할 수 있다. 끝으로 부스정보시스템의 높은 성과는 참관객들의 계획되지 않은 행동에 대한 높은 만족도와 향후에도 부스추천시스템을 재사용할 의도를 만드는 것으로 나타났다. 이와 같이 본 연구는 부스추천시스템이 야기하는 참관객의 계획되지 않은 부스방문행동에 미치는 영향력을 분석하기 위해 계획되지 않은 행동이론을 중심으로 실증자료를 이용하여 분석하고, 이를 통해 향후 부스추천시스템의 구축 및 설계에 유용한 시사점을 도출할 수 있었다. 향후에는 보다 정교한 설문구성과 측정대상을 이용하여 추가적인 검토가 필요할 것으로 기대된다.

모바일 위치기반서비스(LBS) 관련한 새로운 견해: 서비스사용으로 이끄는 요인들과 사생활염려의 모순 (New Insights on Mobile Location-based Services(LBS): Leading Factors to the Use of Services and Privacy Paradox)

  • 천은영;박용태
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.33-56
    • /
    • 2017
  • 위치기반서비스는 이동기기의 위치정보를 바탕으로 한 향상된 서비스로 최근 스마트폰을 활용한 모바일 응용프로그램에서 부각되고 있다. 하지만 이와 관련한 기술 및 서비스 개발에 비해 위치기반서비스의 사용의도에 관한 실증연구는 아직까지 부족하다. 또한 선행연구들은 어느 한 요인을 중심으로 단편적으로 수행되었으며 사용의도와의 직접적인 영향 관계에 대해 제시하지 못한 한계점을 가지고 있다. 이에 본 연구는 빠른 성장이 기대되는 위치기반서비스 시장에서 위치기반서비스 사용자의 위치기반서비스 수용의도 및 사용에 영향을 미치는 요인들에 관한 모델을 제시하였고 330명을 대상으로 하여 설문조사를 실시하여 이를 조사하였다. 자료를 분석한 결과 서비스 맞춤화, 서비스 품질과 개인적 혁신성은 위치기반서비스의 사용의도에 긍정적인 영향을 미치며 사용의도는 실제사용에 긍정적인 영향을 미치는 것으로 나타났다. 하지만 위치기반서비스의 맥락 하에 서비스 맞춤화와 개인적 혁신성은 사생활보호염려에 영향을 미치지 않으며 사생활보호염려는 위치기반서비스 사용의도에도 영향을 주지 않는 것으로 나타났다. 실제로 위치기반서비스에서 사용자에게 요구되는 정보는 위치에 관한 정보로 금융거래에 관련한 정보에 비해 민감하지 않기 때문에 이러한 결과가 나왔다고 추측할 수 있으면 위치기반서비스 사용자들은 전자상거래와 같은 정보시스템 사용자들에 비해 사생활보호에 대해서 예민하게 받아들이기 보다는 위치기반서비스 사용의 이점을 더 중시한다고 이해할 수 있다. 위치기반서비스의 맞춤화가 사용자의 사용의도에 긍정적인 영향을 미친다는 실증적 결과는 인공지능 등의 기술을 활용하여 사용자의 위치기반 서비스 사용 패턴을 분석함으로써 사용자의 정보수요 특성을 효과적으로 충족시켜줄 수 있는 맞춤화된 서비스의 제공으로 사용자의 사용의도를 강화시킬 수 있음을 시사하고 있다. 본 연구는 모바일 위치기반서비스 사용자의 사용의도와 실제사용에 미치는 요인들을 새롭게 다면적인 측면에서 실증적으로 조사하여 위치기반서비스와 관련하여 새로운 쟁점을 제시했으며 위치기반서비스 사용자의 사용의도와 실제사용에 대한 이해의 폭을 넓혔다는 점에서 의의가 있다. 또한 본 연구의 결과는 위치기반서비스 시장의 성장과 사용자들에 대한 효과적 대응 전략을 수립하는데 도움이 될 것으로 기대된다.

전문성 이식을 통한 딥러닝 기반 전문 이미지 해석 방법론 (Deep Learning-based Professional Image Interpretation Using Expertise Transplant)

  • 김태진;김남규
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.79-104
    • /
    • 2020
  • 최근 텍스트와 이미지 딥러닝 기술의 괄목할만한 발전에 힘입어, 두 분야의 접점에 해당하는 이미지 캡셔닝에 대한 관심이 급증하고 있다. 이미지 캡셔닝은 주어진 이미지에 대한 캡션을 자동으로 생성하는 기술로, 이미지 이해와 텍스트 생성을 동시에 다룬다. 다양한 활용 가능성 덕분에 인공지능의 핵심 연구 분야 중 하나로 자리매김하고 있으며, 성능을 다양한 측면에서 향상시키고자 하는 시도가 꾸준히 이루어지고 있다. 하지만 이처럼 이미지 캡셔닝의 성능을 고도화하기 위한 최근의 많은 노력에도 불구하고, 이미지를 일반인이 아닌 분야별 전문가의 시각에서 해석하기 위한 연구는 찾아보기 어렵다. 동일한 이미지에 대해서도 이미지를 접한 사람의 전문 분야에 따라 관심을 갖고 주목하는 부분이 상이할 뿐 아니라, 전문성의 수준에 따라 이를 해석하고 표현하는 방식도 다르다. 이에 본 연구에서는 전문가의 전문성을 활용하여 이미지에 대해 해당 분야에 특화된 캡션을 생성하기 위한 방안을 제안한다. 구체적으로 제안 방법론은 방대한 양의 일반 데이터에 대해 사전 학습을 수행한 후, 소량의 전문 데이터에 대한 전이 학습을 통해 해당 분야의 전문성을 이식한다. 또한 본 연구에서는 이 과정에서 발생하게 되는 관찰간 간섭 문제를 해결하기 위해 '특성 독립 전이 학습' 방안을 제안한다. 제안 방법론의 실현 가능성을 파악하기 위해 MSCOCO의 이미지-캡션 데이터 셋을 활용하여 사전 학습을 수행하고, 미술 치료사의 자문을 토대로 생성한 '이미지-전문 캡션' 데이터를 활용하여 전문성을 이식하는 실험을 수행하였다. 실험 결과 일반 데이터에 대한 학습을 통해 생성된 캡션은 전문적 해석과 무관한 내용을 다수 포함하는 것과 달리, 제안 방법론에 따라 생성된 캡션은 이식된 전문성 관점에서의 캡션을 생성함을 확인하였다. 본 연구는 전문 이미지 해석이라는 새로운 연구 목표를 제안하였고, 이를 위해 전이 학습의 새로운 활용 방안과 특정 도메인에 특화된 캡션을 생성하는 방법을 제시하였다.

소비자 감성 기반 뷰티 경험 패턴 맵 개발: 화장품을 중심으로 (Development of Beauty Experience Pattern Map Based on Consumer Emotions: Focusing on Cosmetics)

  • 서봉군;김건우;박도형
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.179-196
    • /
    • 2019
  • 최근의 '똑똑한 소비자(Smart Consumer)'라 불리는 소비자가 많아지고 있는데, 이들은 제조사나 광고를 통해 전달되는 정보에 의존하지 않고, 기존 사용자나 전문가들의 후기, 여러 과학 지식을 획득하여 제품에 대한 이해를 높이고, 본인 스스로가 직접 판단하여 구매하고 있다. 특히나 화장품 분야는 인체 유해성과 같은 부정적인 요소에 대한 민감도가 높고, 자신의 고유한 피부 특성과의 조화도 고려되어야 하기 때문에, 전문적인 지식과 타인의 경험, 본인의 과거 경험 등을 종합적으로 생각하여 구매 의사결정을 내려야 하고, 이에 대해서 적극적인 소비자가 많아지고 있다. 이러한 움직임은 '셀프 뷰티' 와 같은 '셀프' 문화의 열풍과 함께, 문화 현상인 '그루밍족'의 등장, 사회적 트렌드인 'K-뷰티' 와도 동행한다고 할 수 있다. 맞춤형 화장품에 대한 관심의 급부상도 이러한 현상 중 하나라 볼 수 있다. 소비자들의 맞춤형 화장품의 니즈를 충족시키기 위해, 화장품 제조사나 관련 기업들은 ICT기술과의 융합을 통하여 프리미엄 서비스를 중심으로 소비자의 니즈에 대응하고 있다. 그러나 기업 및 시장 현황이 맞춤형 화장품을 향해 진화하고 있지만, 소비자의 피부 상태, 추구하는 감성, 실제 제품이나 서비스까지 소비자 경험을 전체적으로 완전하게 다루는 지능형 데이터 플랫폼은 부재한다. 본 연구에서는 소비자 경험에 대한 지능형 데이터 플랫폼 구축을 위한 첫 단계로 소비자 언어 기반의 화장품 감성 분석을 수행하였다. 소비자들 개인의 선호나 취향이 분명한 앰플/세럼 카테고리를 중심으로 매출 순위 1위에서 99위까지의 99개 제품을 선정하여, 블로그와 트위터 등의 SNS 상에 언급되는 후기 내에 화장품 경험에 대한 소비자 감성을 수집하였다. 총 357개의 감성 형용사를 수집하였고, 고객 여정 워크샵을 통해 유사 감성을 합치고, 중복 감성을 통합하는 작업을 수행하였으며, 최종 76개 형용사를 구축했다. 구축한 형용사에 대한 SOM 분석을 통해 화장품에 대한 소비자 감성에 대한 클러스터링을 실시했다. 분석 결과, 총 8개의 클러스터를 도출했고, 클러스터 별 각 노드의 벡터 값을 기준으로 소비자 감성 Top 10을 도출했다. 소비자 감성을 기준으로 클러스터별 소비자 감성에 서로 다른 특징이 발견됐으며, 소비자에 따라 다른 소비자의 감성을 선호, 기존과는 다른 소비자 감성을 고려한 추천 및 분류 체계가 필요함을 확인했다. 연구 결과를 통해 감성 분석의 활용 도메인이 화장품만이 아닌 다양한 영역으로 확장될 수 있음 확인했으며, 감성 분석을 통한 소비자 인사이트를 도출할 수 있다는 점을 시사했다. 또한, 본 연구에서 활용한 디자인 씽킹(Design Thinking)의 방법론의 적용하여 화장품 특화된 감성 사전을 과학적인 프로세스로 구축했으며, 화장품에 대한 소비자의 인지 및 심리에 대한 이해를 도울 수 있을 것으로 기대한다.

Support Vector Regression을 이용한 GARCH 모형의 추정과 투자전략의 성과분석 (Estimation of GARCH Models and Performance Analysis of Volatility Trading System using Support Vector Regression)

  • 김선웅;최흥식
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.107-122
    • /
    • 2017
  • 주식시장의 주가 수익률에 나타나는 변동성은 투자 위험의 척도로서 재무관리의 이론적 모형에서뿐만 아니라 포트폴리오 최적화, 증권의 가격 평가 및 위험관리 등 투자 실무 영역에서도 매우 중요한 역할을 하고 있다. 변동성은 주가 수익률이 평균을 중심으로 얼마나 큰 폭의 움직임을 보이는가를 판단하는 지표로서 보통 수익률의 표준편차로 측정한다. 관찰 가능한 표준편차는 과거의 주가 움직임에서 측정되는 역사적 변동성(historical volatility)이다. 역사적 변동성이 미래의 주가 수익률의 변동성을 예측하려면 변동성이 시간 불변적(time-invariant)이어야 한다. 그러나 대부분의 변동성 연구들은 변동성이 시간 가변적(time-variant)임을 보여주고 있다. 이에 따라 시간 가변적 변동성을 예측하기 위한 여러 계량 모형들이 제안되었다. Engle(1982)은 변동성의 시간 가변적 특성을 잘 반영하는 변동성 모형인 Autoregressive Conditional Heteroscedasticity(ARCH)를 제안하였으며, Bollerslev(1986) 등은 일반화된 ARCH(GARCH) 모형으로 발전시켰다. GARCH 모형의 실증 분석 연구들은 실제 증권 수익률에 나타나는 두터운 꼬리 분포 특성과 변동성의 군집현상(clustering)을 잘 설명하고 있다. 일반적으로 GARCH 모형의 모수는 가우스분포로부터 추출된 자료에서 최적의 성과를 보이는 로그우도함수에 대한 최우도추정법에 의하여 추정되고 있다. 그러나 1987년 소위 블랙먼데이 이후 주식 시장은 점점 더 복잡해지고 시장 변수들이 많은 잡음(noise)을 띠게 됨에 따라 변수의 분포에 대한 엄격한 가정을 요구하는 최우도추정법의 대안으로 인공지능모형에 대한 관심이 커지고 있다. 본 연구에서는 주식 시장의 주가 수익률에 나타나는 변동성의 예측 모형인 GARCH 모형의 모수추정방법으로 지능형 시스템인 Support Vector Regression 방법을 제안한다. SVR은 Vapnik에 의해 제안된 Support Vector Machines와 같은 원리를 회귀분석으로 확장한 모형으로서 Vapnik의 e-insensitive loss function을 이용하여 비선형 회귀식의 추정이 가능해졌다. SVM을 이용한 회귀식 SVR은 두터운 꼬리 분포를 보이는 주식시장의 변동성과 같은 관찰치에서도 우수한 추정 성능을 보인다. 2차 손실함수를 사용하는 기존의 최소자승법은 부최적해로서 추정 오차가 확대될 수 있다. Vapnik의 손실함수에서는 입실론 범위내의 예측 오차는 무시하고 큰 예측 오차만 손실로 처리하기 때문에 구조적 위험의 최소화를 추구하게 된다. 금융 시계열 자료를 분석한 많은 연구들은 SVR의 우수성을 보여주고 있다. 본 연구에서는 주가 변동성의 분석 대상으로서 KOSPI 200 주가지수를 사용한다. KOSPI 200 주가지수는 한국거래소에 상장된 우량주 중 거래가 활발하고 업종을 대표하는 200 종목으로 구성된 업종 대표주들의 포트폴리오이다. 분석 기간은 2010년부터 2015년까지의 6년 동안이며, 거래일의 일별 주가지수 종가 자료를 사용하였고 수익률 계산은 주가지수의 로그 차분값으로 정의하였다. KOSPI 200 주가지수의 일별 수익률 자료의 실증분석을 통해 기존의 Maximum Likelihood Estimation 방법과 본 논문이 제안하는 지능형 변동성 예측 모형의 예측성과를 비교하였다. 주가지수 수익률의 일별 자료 중 학습구간에서 대칭 GARCH 모형과 E-GARCH, GJR-GARCH와 같은 비대칭 GARCH 모형에 대하여 모수를 추정하고, 검증 구간 데이터에서 변동성 예측의 성과를 비교하였다. 전체 분석기간 1,487일 중 학습 기간은 1,187일, 검증 기간은 300일 이다. MLE 추정 방법의 실증분석 결과는 기존의 많은 연구들과 비슷한 결과를 보여주고 있다. 잔차의 분포는 정규분포보다는 Student t분포의 경우 더 우수한 모형 추정 성과를 보여주고 있어, 주가 수익률의 비정규성이 잘 반영되고 있다고 할 수 있다. MSE 기준으로, SVR 추정의 변동성 예측에서는 polynomial 커널함수를 제외하고 linear, radial 커널함수에서 MLE 보다 우수한 예측 성과를 보여주었다. DA 지표에서는 radial 커널함수를 사용한 SVR 기반의 지능형 GARCH 모형이 가장 우수한 변동성의 변화 방향에 대한 방향성 예측력을 보여주었다. 추정된 지능형 변동성 모형을 이용하여 예측된 주식 시장의 변동성 정보가 경제적 의미를 갖는지를 검토하기 위하여 지능형 변동성 거래 전략을 도출하였다. 지능형 변동성 거래 전략 IVTS의 진입규칙은 내일의 변동성이 증가할 것으로 예측되면 변동성을 매수하고 반대로 변동성의 감소가 예상되면 변동성을 매도하는 전략이다. 만약 변동성의 변화 방향이 전일과 동일하다면 기존의 변동성 매수/매도 포지션을 유지한다. 전체적으로 SVR 기반의 GARCH 모형의 투자 성과가 MLE 기반의 GARCH 모형의 투자 성과보다 높게 나타나고 있다. E-GARCH, GJR-GARCH 모형의 경우는 MLE 기반의 GARCH 모형을 이용한 IVTS 전략은 손실이 나지만 SVR 기반의 GARCH 모형을 이용한 IVTS 전략은 수익으로 나타나고 있다. SVR 커널함수에서는 선형 커널함수가 더 좋은 투자 성과를 보여주고 있다. 선형 커널함수의 경우 투자 수익률이 +526.4%를 기록하고 있다. SVR 기반의 GARCH 모형을 이용하는 IVTS 전략의 경우 승률도 51.88%부터 59.7% 사이로 높게 나타나고 있다. 옵션을 이용하는 변동성 매도전략은 방향성 거래전략과 달리 하락할 것으로 예측된 변동성의 예측 방향이 틀려 변동성이 소폭 상승하거나 변동성이 하락하지 않고 제자리에 있더라도 옵션의 시간가치 요인 때문에 전체적으로 수익이 실현될 수도 있다. 정확한 변동성의 예측은 자산의 가격 결정뿐만 아니라 실제 투자에서도 높은 수익률을 얻을 수 있기 때문에 다양한 형태의 인공신경망을 활용하여 더 나은 예측성과를 보이는 변동성 예측 모형을 개발한다면 주식시장의 투자자들에게 좋은 투자 정보를 제공하게 될 것이다.