• 제목/요약/키워드: Parameter learning

검색결과 667건 처리시간 0.028초

다분류 SVM을 이용한 DEA기반 벤처기업 효율성등급 예측모형 (The Prediction of DEA based Efficiency Rating for Venture Business Using Multi-class SVM)

  • 박지영;홍태호
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.139-155
    • /
    • 2009
  • For the last few decades, many studies have tried to explore and unveil venture companies' success factors and unique features in order to identify the sources of such companies' competitive advantages over their rivals. Such venture companies have shown tendency to give high returns for investors generally making the best use of information technology. For this reason, many venture companies are keen on attracting avid investors' attention. Investors generally make their investment decisions by carefully examining the evaluation criteria of the alternatives. To them, credit rating information provided by international rating agencies, such as Standard and Poor's, Moody's and Fitch is crucial source as to such pivotal concerns as companies stability, growth, and risk status. But these types of information are generated only for the companies issuing corporate bonds, not venture companies. Therefore, this study proposes a method for evaluating venture businesses by presenting our recent empirical results using financial data of Korean venture companies listed on KOSDAQ in Korea exchange. In addition, this paper used multi-class SVM for the prediction of DEA-based efficiency rating for venture businesses, which was derived from our proposed method. Our approach sheds light on ways to locate efficient companies generating high level of profits. Above all, in determining effective ways to evaluate a venture firm's efficiency, it is important to understand the major contributing factors of such efficiency. Therefore, this paper is constructed on the basis of following two ideas to classify which companies are more efficient venture companies: i) making DEA based multi-class rating for sample companies and ii) developing multi-class SVM-based efficiency prediction model for classifying all companies. First, the Data Envelopment Analysis(DEA) is a non-parametric multiple input-output efficiency technique that measures the relative efficiency of decision making units(DMUs) using a linear programming based model. It is non-parametric because it requires no assumption on the shape or parameters of the underlying production function. DEA has been already widely applied for evaluating the relative efficiency of DMUs. Recently, a number of DEA based studies have evaluated the efficiency of various types of companies, such as internet companies and venture companies. It has been also applied to corporate credit ratings. In this study we utilized DEA for sorting venture companies by efficiency based ratings. The Support Vector Machine(SVM), on the other hand, is a popular technique for solving data classification problems. In this paper, we employed SVM to classify the efficiency ratings in IT venture companies according to the results of DEA. The SVM method was first developed by Vapnik (1995). As one of many machine learning techniques, SVM is based on a statistical theory. Thus far, the method has shown good performances especially in generalizing capacity in classification tasks, resulting in numerous applications in many areas of business, SVM is basically the algorithm that finds the maximum margin hyperplane, which is the maximum separation between classes. According to this method, support vectors are the closest to the maximum margin hyperplane. If it is impossible to classify, we can use the kernel function. In the case of nonlinear class boundaries, we can transform the inputs into a high-dimensional feature space, This is the original input space and is mapped into a high-dimensional dot-product space. Many studies applied SVM to the prediction of bankruptcy, the forecast a financial time series, and the problem of estimating credit rating, In this study we employed SVM for developing data mining-based efficiency prediction model. We used the Gaussian radial function as a kernel function of SVM. In multi-class SVM, we adopted one-against-one approach between binary classification method and two all-together methods, proposed by Weston and Watkins(1999) and Crammer and Singer(2000), respectively. In this research, we used corporate information of 154 companies listed on KOSDAQ market in Korea exchange. We obtained companies' financial information of 2005 from the KIS(Korea Information Service, Inc.). Using this data, we made multi-class rating with DEA efficiency and built multi-class prediction model based data mining. Among three manners of multi-classification, the hit ratio of the Weston and Watkins method is the best in the test data set. In multi classification problems as efficiency ratings of venture business, it is very useful for investors to know the class with errors, one class difference, when it is difficult to find out the accurate class in the actual market. So we presented accuracy results within 1-class errors, and the Weston and Watkins method showed 85.7% accuracy in our test samples. We conclude that the DEA based multi-class approach in venture business generates more information than the binary classification problem, notwithstanding its efficiency level. We believe this model can help investors in decision making as it provides a reliably tool to evaluate venture companies in the financial domain. For the future research, we perceive the need to enhance such areas as the variable selection process, the parameter selection of kernel function, the generalization, and the sample size of multi-class.

추천 시스템의 성능 안정성을 위한 예측적 군집화 기반 협업 필터링 기법 (Predictive Clustering-based Collaborative Filtering Technique for Performance-Stability of Recommendation System)

  • 이오준;유은순
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.119-142
    • /
    • 2015
  • 사용자의 취향과 선호도를 고려하여 정보를 제공하는 추천 시스템의 중요성이 높아졌다. 이를 위해 다양한 기법들이 제안되었는데, 비교적 도메인의 제약이 적은 협업 필터링이 널리 사용되고 있다. 협업 필터링의 한 종류인 모델 기반 협업 필터링은 기계학습이나 데이터 마이닝 모델을 협업 필터링에 접목한 방법이다. 이는 희박성 문제와 확장성 문제 등의 협업 필터링의 근본적인 한계를 개선하지만, 모델 생성 비용이 높고 성능/확장성 트레이드오프가 발생한다는 한계점을 갖는다. 성능/확장성 트레이드오프는 희박성 문제의 일종인 적용범위 감소 문제를 발생시킨다. 또한, 높은 모델 생성 비용은 도메인 환경 변화의 누적으로 인한 성능 불안정의 원인이 된다. 본 연구에서는 이 문제를 해결하기 위해, 군집화 기반 협업 필터링에 마르코프 전이확률모델과 퍼지 군집화의 개념을 접목하여, 적용범위 감소 문제와 성능 불안정성 문제를 해결한 예측적 군집화 기반 협업 필터링 기법을 제안한다. 이 기법은 첫째, 사용자 기호(Preference)의 변화를 추적하여 정적인 모델과 동적인 사용자간의 괴리 해소를 통해 성능 불안정 문제를 개선한다. 둘째, 전이확률과 군집 소속 확률에 기반한 적용범위 확장으로 적용범위 감소 문제를 개선한다. 제안하는 기법의 검증은 각각 성능 불안정성 문제와 확장성/성능 트레이드오프 문제에 대한 강건성(robustness)시험을 통해 이뤄졌다. 제안하는 기법은 기존 기법들에 비해 성능의 향상 폭은 미미하다. 또한 데이터의 변동 정도를 나타내는 지표인 표준 편차의 측면에서도 의미 있는 개선을 보이지 못하였다. 하지만, 성능의 변동 폭을 나타내는 범위의 측면에서는 기존 기법들에 비해 개선을 보였다. 첫 번째 실험에서는 모델 생성 전후의 성능 변동폭에서 51.31%의 개선을, 두 번째 실험에서는 군집 수 변화에 따른 성능 변동폭에서 36.05%의 개선을 보였다. 이는 제안하는 기법이 성능의 향상을 보여주지는 못하지만, 성능 안정성의 측면에서는 기존의 기법들을 개선하고 있음을 의미한다.

다중모형조합기법을 이용한 상품추천시스템 (Product Recommender Systems using Multi-Model Ensemble Techniques)

  • 이연정;김경재
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.39-54
    • /
    • 2013
  • 전자상거래의 폭발적 증가는 소비자에게 더 유리한 많은 구매 선택의 기회를 제공한다. 이러한 상황에서 자신의 구매의사결정에 대한 확신이 부족한 소비자들은 의사결정 절차를 간소화하고 효과적인 의사결정을 위해 추천을 받아들인다. 온라인 상점의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 그러나 사용자의 기호를 제대로 반영하지 못하는 추천시스템은 사용자의 실망과 시간낭비를 발생시킨다. 본 연구에서는 정확한 사용자의 기호 반영을 통한 추천기법의 정교화를 위해 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 본 연구에서 제안하는 모형은 크게 두 개의 단계로 이루어져 있으며, 첫 번째 단계에서는 상품군 별 우량고객 선정 규칙을 도출하기 위해서 로지스틱 회귀분석 모형, 의사결정나무 모형, 인공신경망 모형을 구축한 후 다중모형조합기법인 Bagging과 Bumping의 개념을 이용하여 세 가지 모형의 결과를 조합한다. 두 번째 단계에서는 상품군 별 연관관계에 관한 규칙을 추출하기 위하여 장바구니분석을 활용한다. 상기의 두 단계를 통하여 상품군 별로 구매가능성이 높은 우량고객을 선정하여 그 고객에게 관심을 가질만한 같은 상품군 또는 다른 상품군 내의 다른 상품을 추천하게 된다. 제안하는 상품추천시스템은 실제 운영 중인 온라인 상점인 'I아트샵'의 데이터를 이용하여 프로토타입을 구축하였고 실제 소비자에 대한 적용가능성을 확인하였다. 제안하는 모형의 유용성을 검증하기 위하여 제안 상품추천시스템의 추천과 임의 추천을 통한 추천의 결과를 사용자에게 제시하고 제안된 추천에 대한 만족도를 조사한 후 대응표본 T검정을 수행하였으며, 그 결과 사용자의 만족도를 유의하게 향상시키는 것으로 나타났다.

시계열 자료의 예측을 위한 자료 기반 신경망 모델에 관한 연구: 한강대교 수위예측 적용 (A Study on the Data Driven Neural Network Model for the Prediction of Time Series Data: Application of Water Surface Elevation Forecasting in Hangang River Bridge)

  • 유형주;이승오;최서혜;박문형
    • 한국방재안전학회논문집
    • /
    • 제12권2호
    • /
    • pp.73-82
    • /
    • 2019
  • 최근 이상기후로 인한 집중호우에 따른 하천변 사회기반시설의 침수피해가 증가하고 있으며, 침수 가능성 여부에 대한 신속한 예 경보가 필요한 실정이다. 일반적인 홍수 예 경보는 하천수위를 이용하고 있으며, 수치모형을 이용하여 하천수위를 예측하는 연구가 대부분이었다. 그러나 수치모형을 이용한 하천수위 예측은 결과가 정확한 반면 수치모의 시간이 오래 소요된다는 한계점이 있어 최근에는 인공신경망 등을 적용한 자료기반의 수위예측 모형이 많이 이용되고 있다. 하지만 기존의 인공신경망을 활용한 수위예측 연구는 시간적 매개변수를 고려하지 못하였다는 한계점이 존재한다. 본 연구에서는 시간적 매개변수(Time delay= 2시간)를 고려한 NARX 신경망 모형을 사용하여 한강대교의 수위를 예측하였다. 또한 NARX 모형의 적합성을 판단하기 위하여 인공신경망(ANN) 모형과, 순환신경망(RNN)모형의 결과와 비교하였다. 2009년에서 2018년까지 10년간의 수문자료를 이용하여 70%를 학습시키고 검정과 평가에 15%를 사용하여 2018년의 한강대교 3시간 후 수위를 예측한 결과 평균제곱근오차(RMSE)의 경우 ANN, RNN, NARX model이 각각 0.20 m, 0.11 m, 0.09 m, 평균절대오차(MAE)의 경우, 각각 0.12 m, 0.06 m, 0.05 m, 첨두수위 오차(Peak Error)는 각각 1.56 m, 0.55 m, 0.10 m로 나타났다. 연구 대상지역에 대한 시간적 매개변수를 고려한 예측 결과의 오차분석을 통하여 NARX 신경망 모형을 사용하는 것이 수위예측 모형 구축이 가장 적합한 것으로 나타났다. 이는 NARX 신경망 모형이 과거의 입력자료를 고려함으로써 시계열 자료의 변동 추세도 학습 할 수 있으며, 또한 모형 내 활성함수를 쌍곡선탄젠트(Hyperbolic tangent) 및 Rectified Linear Unit(ReLU) 함수를 사용하여 고수위 예측 시에도 정확한 예측 값을 도출할 수 있기 때문이다. 그러나 NARX 신경망 모형은 시퀀스 길이가 길어짐에 따라 기울기 소실문제(Vanishing gradient)가 발생하는 한계점이 있어 향후에는 이를 보완한 LSTM(Long Short Term Model)모형을 이용하여 수위예측의 정확도를 검토하고자 한다.

일주기 리듬과 일주기 유형이 경두개 직류전기자극에 의한 뇌기능 변화에 미치는 영향 탐색 (The impact of functional brain change by transcranial direct current stimulation effects concerning circadian rhythm and chronotype)

  • 정다운;유수민;이현수;한상훈
    • 인지과학
    • /
    • 제33권1호
    • /
    • pp.51-75
    • /
    • 2022
  • 경두개 직류전기자극(transcranial Direct Current Stimulation; tDCS)은 지각, 인지, 운동 등의 뇌기능 향상 및 발달 효과가 입증되며, 다양한 분야에서 활용 및 응용되는 비침습적 뇌자극술이다. tDCS 효과는 뇌의 해부학적 구조, 뇌의 노화 정도 등의 뇌신경활성화 특징에 따라 다르게 나타난다는 연구결과들이 보고되고 있다. 일주기 리듬(circadian rhythm)은 대략 하루 주기의 수면과 각성의 생리적 변화패턴을 의미하며 뇌신경활성화 상태는 일주기 리듬에 따라 다르게 나타난다. 일주기 유형(chronotype)은 하루 중에 발현되는 각성도의 크기에 따라 아침의 각성도가 큰 유형은 아침형으로 저녁의 각성도가 큰 유형은 저녁형으로 나누어진다. 본 연구는 일주기 리듬에 의해 변하는 뇌기능 특징이 tDCS 효과에 미치는 영향을 알아보고자 한다. 총 20명의 건강한 성인 대상으로 실험을 진행하였고, 참가자들은 일주기 유형을 분류하기 위해 아침형-저녁형 설문지에 의해 주간형(아침형, 중간형)과 야간형(저녁형)으로 분류했다. 본 실험은 Zoom 프로그램을 이용하여 참가자와 실험자가 온라인으로 만나서 실험을 진행했다. 실험이 확정된 참가자는 실험자로부터 뇌파 기기, 뇌파 데이터를 획득하는 앱이 있는 핸드폰, 핸드폰 거치대, 뇌자극 기기의 사용방법에 대한 설명을 듣고 기기를 테스트해보고 기기를 전달받았다. 기기사용의 어려움을 가진 2명의 참가자는 대면 실험을 진행하여, 실험자가 기기작동을 하여 실험에 참여했다. 일주기 리듬의 상태에 따른 뇌자극 효과를 알아보기 위해 1주일 간격으로 아침과 저녁에 실험했으며, tDCS 자극 전과 후의 신경활성화 반응의 차이를 뇌파를 이용하여 측정하였다. 뇌자극에 의한 뇌기능 변화를 확인하기 위해 자극 전의 뇌파와 자극 후 뇌파가 다른 패턴을 보이며 분류가 잘되는 지를 예측 정확도로 분석했으며, 뇌기능 특징 변화가 일주기 리듬과 일주기 유형에 따라 다르게 나타나는지 확인하기 위해 각 조건의 분류조건(아침/저녁, 주간형/야간형)에서 추출된 주요 EEG 특성을 비교했다. 54개의 뇌파 특성값을 추출하여 SVM(Support Vector Machine) 기계학습 알고리즘으로 분류 모델을 구축하였고, 구축된 모델을 Leave-One-Out 교차검증(Leave-One-Out Cross-Validation)을 사용하여 자극 전과 후의 뇌파 반응을 예측하는지 평가하였고, 분류예측모델의 주요 예측 인자를 확인하는 주요 특성 분석을 진행하였다. 아침과 저녁의 tDCS에 따른 뇌파 특징을 분류하는 예측 정확도는 모두 98%로 나타났으며, 주간형의 아침 자극 조건과 저녁 자극 조건의 예측 정확도는 92%와 96%이며, 야간형의 아침자극 조건과 저녁 자극 조건의 예측 정확도는 모두 94%로 나타났다. 아침 자극 전과 후의 뇌파를 분류하는 상위 3개의 주요 EEG 특성결과는 주간형과 야간형에 따라 다르게 나타났다. 주간형은 좌측 측두 두정엽과 전전두엽의 뇌파 특성값이 나타났으며, 야간형은 측두 두정엽의 뇌파 특성값들만 나타났다. 저녁 자극전과 후의 뇌파를 분류하는 상위 3개의 주요 EEG 특성 결과 또한 주간형과 야간형에 따라 다르게 나타났다. 주간형은 우측 측두 두정엽과 좌측 전두엽의 뇌파 특성값이 나타났으며, 야간형은 측두 두정엽과 전두엽의 뇌파 특성값이 나타났다. 이와 같은 연구결과는 일주기 리듬과 유형에 따라 아침과 저녁의 뇌기능 특징이 다르게 나타나서 뇌자극 효과가 다르게 나타날 수 있음을 확인한 결과이다. 본 연구의 결과는 효과적인 뇌자극을 위해 개인의 뇌신경 활성화 상태 및 특징에 따라서 뇌자극 프로토콜을 조정할 필요성을 제시한다는 데에 의의를 찾을 수 있다.

매장 문화재 공간 분포 결정을 위한 지하투과레이더 영상 분석 자동화 기법 탐색 (Automated Analyses of Ground-Penetrating Radar Images to Determine Spatial Distribution of Buried Cultural Heritage)

  • 권문희;김승섭
    • 자원환경지질
    • /
    • 제55권5호
    • /
    • pp.551-561
    • /
    • 2022
  • 지구물리탐사기법은 매장 문화재 조사에 필요한 높은 해상도의 지하 구조 영상 생성과 매장 유구의 정확한 위치 결정하는 데 매우 유용하다. 이 연구에서는 경주 신라왕경 중심방의 고해상도 지하투과레이더 영상에서 유구의 규칙적인 배열이나 선형 구조를 자동적으로 구분하기 위하여 영상처리 기법인 영상 특징 추출과 영상분할 기법을 적용하였다. 영상 특징 추출의 대상은 유구의 원형 적심과 선형의 도로 및 담장으로 캐니 윤곽선 검출(Canny edge detection)과 허프 변환(Hough Transform) 알고리듬을 적용하였다. 캐니 윤곽선 검출 알고리듬으로 검출된 윤곽선 이미지에 허프 변환을 적용하여 유구의 위치를 탐사 영상에서 자동 결정하고자 하였으나, 탐사 지역별로 매개변수를 달리해서 적용해야 한다는 제약이 있었다. 영상 분할 기법의 경우 연결요소 분석 알고리듬과 QGIS에서 제공하는 Orfeo Toolbox (OTB)를 이용한 객체기반 영상분석을 적용하였다. 연결 요소 분석 결과에서, 유구에 의한 신호들이 연결된 요소들로 효과적으로 인식되었지만 하나의 유구가 여러 요소로 분할되어 인식되는 경우도 발생함을 확인하였다. 객체기반 영상분석에서는 평균이동(Large-Scale Mean-Shift, LSMS) 영상 분할을 적용하여 각 분할 영역에 대한 화소 정보가 포함된 벡터 레이어를 우선 생성하였고, 유구를 포함하는 영역과 포함하지 않는 영역을 선별하여 훈련 모델을 생성하였다. 이 훈련모델에 기반한 랜덤포레스트 분류기를 이용해 LSMS 영상분할 벡터 레이어에서 유구를 포함하는 영역과 그렇지 않은 영역이 자동 분류 될 수 있음을 확인하였다. 이러한 자동 분류방법을 매장 문화재 지하투과레이더 영상에 적용한다면 유구 발굴 계획에 활용가능한 일관성 있는 결과를 얻을 것으로 기대한다.

WUDAPT 절차를 활용한 창원시의 국지기후대 제작과 필터링 반경에 따른 비교 연구 (A Comparative Study on Mapping and Filtering Radii of Local Climate Zone in Changwon city using WUDAPT Protocol)

  • 김태경;박경훈;송봉근;김성현;정다은;박건웅
    • 한국지리정보학회지
    • /
    • 제27권2호
    • /
    • pp.78-95
    • /
    • 2024
  • 기후변화와 도시 문제를 고려해 다양한 영역에 걸친 환경계획의 수립과 비교를 위해서는 일관된 기준으로 분류된 지역 규모 수준의 공간자료 구축이 중요하다. 본 연구는 World Urban Database and Access Portal Tools(WUDAPT)에서 제시한 절차를 사용하여 기후 및 환경 연구가 활발히 이루어지고 있는 창원시의 Local Climate Zone(LCZ)를 분류하였다. 또한, 동질적인 기후 특성을 가진 지역일지라도 일부 격자가 다른 기후 특성으로 분류되는 파편화 문제를 개선하기 위해 필터링 기법을 적용하고 필터링 반경에 따른 LCZ 분류 특성을 비교하였다. 위성영상과 지상참조자료, 감독분류 머신러닝 기법인 Random Forest를 활용하여 필터링하지 않은 분류지도와 필터링 반경이 1, 2, 3인 분류지도를 제작하여 정확도를 비교하였다. 또한, 도시지역의 건물 유형에 따른 LCZ 분류특성을 비교하기 위해 GIS를 활용한 분류방법론에서 사용되는 도시형태지수를 제작하여 선행 연구에서 제시한 범위와 비교하였다. 그 결과, 전체 정확도는 필터링 반경이 1일 때 가장 높은 값을 보였다. 도시형태지수를 비교하였을 때 LCZ 유형별 차이는 적었고 대부분 선행연구의 범위를 만족하는 것을 확인하였다. 그러나 연구 결과를 통해 건물의 높이 정보를 반영하지 못하는 한계를 확인하였고, 이를 보완할 수 있는 데이터를 추가하여 분류한다면 더 높은 정확도의 결과물을 획득할 수 있을 것이라 판단된다. 연구 결과는 국내 도시기후 관련 환경 연구분야의 기초 공간자료 제작하기 위한 참고자료로 활용될 수 있을 것이다.