• 제목/요약/키워드: Mathematical problem

검색결과 3,794건 처리시간 0.025초

다양한 다분류 SVM을 적용한 기업채권평가 (Corporate Bond Rating Using Various Multiclass Support Vector Machines)

  • 안현철;김경재
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.157-178
    • /
    • 2009
  • Corporate credit rating is a very important factor in the market for corporate debt. Information concerning corporate operations is often disseminated to market participants through the changes in credit ratings that are published by professional rating agencies, such as Standard and Poor's (S&P) and Moody's Investor Service. Since these agencies generally require a large fee for the service, and the periodically provided ratings sometimes do not reflect the default risk of the company at the time, it may be advantageous for bond-market participants to be able to classify credit ratings before the agencies actually publish them. As a result, it is very important for companies (especially, financial companies) to develop a proper model of credit rating. From a technical perspective, the credit rating constitutes a typical, multiclass, classification problem because rating agencies generally have ten or more categories of ratings. For example, S&P's ratings range from AAA for the highest-quality bonds to D for the lowest-quality bonds. The professional rating agencies emphasize the importance of analysts' subjective judgments in the determination of credit ratings. However, in practice, a mathematical model that uses the financial variables of companies plays an important role in determining credit ratings, since it is convenient to apply and cost efficient. These financial variables include the ratios that represent a company's leverage status, liquidity status, and profitability status. Several statistical and artificial intelligence (AI) techniques have been applied as tools for predicting credit ratings. Among them, artificial neural networks are most prevalent in the area of finance because of their broad applicability to many business problems and their preeminent ability to adapt. However, artificial neural networks also have many defects, including the difficulty in determining the values of the control parameters and the number of processing elements in the layer as well as the risk of over-fitting. Of late, because of their robustness and high accuracy, support vector machines (SVMs) have become popular as a solution for problems with generating accurate prediction. An SVM's solution may be globally optimal because SVMs seek to minimize structural risk. On the other hand, artificial neural network models may tend to find locally optimal solutions because they seek to minimize empirical risk. In addition, no parameters need to be tuned in SVMs, barring the upper bound for non-separable cases in linear SVMs. Since SVMs were originally devised for binary classification, however they are not intrinsically geared for multiclass classifications as in credit ratings. Thus, researchers have tried to extend the original SVM to multiclass classification. Hitherto, a variety of techniques to extend standard SVMs to multiclass SVMs (MSVMs) has been proposed in the literature Only a few types of MSVM are, however, tested using prior studies that apply MSVMs to credit ratings studies. In this study, we examined six different techniques of MSVMs: (1) One-Against-One, (2) One-Against-AIL (3) DAGSVM, (4) ECOC, (5) Method of Weston and Watkins, and (6) Method of Crammer and Singer. In addition, we examined the prediction accuracy of some modified version of conventional MSVM techniques. To find the most appropriate technique of MSVMs for corporate bond rating, we applied all the techniques of MSVMs to a real-world case of credit rating in Korea. The best application is in corporate bond rating, which is the most frequently studied area of credit rating for specific debt issues or other financial obligations. For our study the research data were collected from National Information and Credit Evaluation, Inc., a major bond-rating company in Korea. The data set is comprised of the bond-ratings for the year 2002 and various financial variables for 1,295 companies from the manufacturing industry in Korea. We compared the results of these techniques with one another, and with those of traditional methods for credit ratings, such as multiple discriminant analysis (MDA), multinomial logistic regression (MLOGIT), and artificial neural networks (ANNs). As a result, we found that DAGSVM with an ordered list was the best approach for the prediction of bond rating. In addition, we found that the modified version of ECOC approach can yield higher prediction accuracy for the cases showing clear patterns.

초.중.고등학교 확률과 통계 단원에 나타난 표본개념에 대한 분석 (Features of sample concepts in the probability and statistics chapters of Korean mathematics textbooks of grades 1-12)

  • 이영하;신수영
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제21권4호
    • /
    • pp.327-344
    • /
    • 2011
  • 본 연구는 고등학교 수학교과에서 배우는 모평균의 신뢰구간 구하기와 같은 통계적 추론 능력을 기르기 위한 방안의 첫 단계연구이다. 통계적 추론과정을 비판적으로 분석하여 신뢰할만한 추론방법으로 이를 인정할 수 있는 표본개념의 형성을 위해, 연구자들은 우연과 필연, 귀납과 연역, 가능성원리, 통계량의 변이성, 통계적 모형 등의 하위 개념들이 형성되어야 한다고 보았다. 그리고 초중등 통계단원의 전 과정에서 이들 개념의 체계적인 발달을 도모해야 한다는 전제 아래, 초 중 고등학교 통계단원을 분석해 본 결과는 아래와 같았다. 첫째, 문제해결 방법 선택의 지도와 관련하여, 통계적 방법을 선택할 문제 상황으로서, 우연적 상황을 필연적 상황과 구분하기위한 설명이 있는 교과서가 초등학교에는 없고, 중등 수준에서도 매우 드물었다. 둘째 표본의 모집단 관련 의미를 이해시키려는 단계적 준비가 미흡하다고 할 수 있다. 전체와 부분의 모집단과 표본 구분이 고등학교에서 비로소 공식화되고 있으며, 초 중학교에서 사용되는 표본자료는 그것으로부터 얻어지는 계산적 결과에만 초점이 맞추어짐으로서, 학년이 올라감에 따라 모집단을 향한 귀납적 추론의 신뢰성에 대한 비판적 사고의 깊이가 더해지는 모습을 찾아보기 어려웠다. 셋째, 무작위 추출이 갖는 대표성의 의미에 대한 설명보다는 무작위 활동 자체에 대한 설명이 중심이 됨으로서 무작위 추출의 확률적 의미, 즉 무작위 표본을 통해 구해질 통계량의 표집분포에서의 (상속된) 무작위성을 위한 담보로서의 목적에 대한 설명이 없다는 점이다. 넷째 통계적 추론을 수학(연역)적 추론과 구분해 주는 설명이 없을 뿐 아니라, 학습자의 논리성 발달 수준에 맞게 변화하는 가능성원리에 대한 설명, 적용 등을 전혀 찾기 어렵다는 점이다. 다섯째 통계량의 우연변이성과 그에 따른 표집분포의 존재에 대한 이해를 추구하는 설명을 찾기 어렵다는 점이다. 표집분포를 수학적으로 구하는 것은 매우 어려운 과정이지만, 그것의 존재를 인식하느냐 못하느냐는 통계적 추론 자체의 이해 가능성을 달리하는 중요한 문제이기 때문이다.

  • PDF

창의적 융합교육을 위한 무게중심 프로그램 개발과 적용사례 연구 (A Study on the Effects of Creative STEAM System Given by Center of Gravity Experiment)

  • 김수금;유시규;김선배
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제24권3호
    • /
    • pp.333-357
    • /
    • 2014
  • 본 연구에서 제시하는 무게중심 확인실험 프로그램개발은 2013년 '동국대학교 과학영재교육원'에서 융합형 영재프로그램으로 개발되어 초등 영재학생 10개 집단 120명과 중등수학영재학생 24명을 대상으로 진행되었다. 무게중심 확인실험은 한국 과학창의재단에서 제시하는 융합형인재교육(STEAM) 학습준거 틀에서 수행된 3단계 과정을 이행하여 창의적 융합교육의 효과를 극대화하였다. 본 연구가 갖는 3가지 특징은 다음과 같다. 첫째, 연구에서 새롭게 개발된 무게중심 확인실험은 수학과 물리가 융합된 교육방식이다. 둘째, 실험에 사용되는 모형은 학생들의 능동적 활동으로 창의적인 모형 설계가 가능하다. 셋째, 무게중심 확인실험 프로그램은 학습 능력에 따라 수준별 수업으로서 전환이 가능하다. 위에서 제시한 특성들을 바탕으로 무게중심 확인실험을 통하여 창의적 융합교육의 효과를 극대화시킨다. 설문조사 결과는 주어진 지식을 단순 암기하는 학습에서 벗어나 실험에 필요한 배경지식 이해, 실험 설계, 실험 과정, 실험 결과의 단계를 거쳐 학습된다. 설문조사와 학생들의 실험 후 토의 결과, 현재 수학 또는 과학 교육과정이 제시하는 무게중심 학습과 비교하여, 새롭게 개발된 융합형 프로그램이 교육의 효과가 뛰어남을 보여 준다. 본 연구는 수학이 다른 교과영역과 융합되는 새로운 융합형 교육방식을 제시한다. 특히 무게중심을 찾고 이를 확인하는 새로운 형태를 제시한다. 결론적으로 교수자와 학습자가 모두 만족할 수 있는 새로운 무게중심 교육의 틀을 제시한다.

  • PDF

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.