• 제목/요약/키워드: Features selection technique

검색결과 117건 처리시간 0.019초

다분류 SVM을 이용한 DEA기반 벤처기업 효율성등급 예측모형 (The Prediction of DEA based Efficiency Rating for Venture Business Using Multi-class SVM)

  • 박지영;홍태호
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.139-155
    • /
    • 2009
  • For the last few decades, many studies have tried to explore and unveil venture companies' success factors and unique features in order to identify the sources of such companies' competitive advantages over their rivals. Such venture companies have shown tendency to give high returns for investors generally making the best use of information technology. For this reason, many venture companies are keen on attracting avid investors' attention. Investors generally make their investment decisions by carefully examining the evaluation criteria of the alternatives. To them, credit rating information provided by international rating agencies, such as Standard and Poor's, Moody's and Fitch is crucial source as to such pivotal concerns as companies stability, growth, and risk status. But these types of information are generated only for the companies issuing corporate bonds, not venture companies. Therefore, this study proposes a method for evaluating venture businesses by presenting our recent empirical results using financial data of Korean venture companies listed on KOSDAQ in Korea exchange. In addition, this paper used multi-class SVM for the prediction of DEA-based efficiency rating for venture businesses, which was derived from our proposed method. Our approach sheds light on ways to locate efficient companies generating high level of profits. Above all, in determining effective ways to evaluate a venture firm's efficiency, it is important to understand the major contributing factors of such efficiency. Therefore, this paper is constructed on the basis of following two ideas to classify which companies are more efficient venture companies: i) making DEA based multi-class rating for sample companies and ii) developing multi-class SVM-based efficiency prediction model for classifying all companies. First, the Data Envelopment Analysis(DEA) is a non-parametric multiple input-output efficiency technique that measures the relative efficiency of decision making units(DMUs) using a linear programming based model. It is non-parametric because it requires no assumption on the shape or parameters of the underlying production function. DEA has been already widely applied for evaluating the relative efficiency of DMUs. Recently, a number of DEA based studies have evaluated the efficiency of various types of companies, such as internet companies and venture companies. It has been also applied to corporate credit ratings. In this study we utilized DEA for sorting venture companies by efficiency based ratings. The Support Vector Machine(SVM), on the other hand, is a popular technique for solving data classification problems. In this paper, we employed SVM to classify the efficiency ratings in IT venture companies according to the results of DEA. The SVM method was first developed by Vapnik (1995). As one of many machine learning techniques, SVM is based on a statistical theory. Thus far, the method has shown good performances especially in generalizing capacity in classification tasks, resulting in numerous applications in many areas of business, SVM is basically the algorithm that finds the maximum margin hyperplane, which is the maximum separation between classes. According to this method, support vectors are the closest to the maximum margin hyperplane. If it is impossible to classify, we can use the kernel function. In the case of nonlinear class boundaries, we can transform the inputs into a high-dimensional feature space, This is the original input space and is mapped into a high-dimensional dot-product space. Many studies applied SVM to the prediction of bankruptcy, the forecast a financial time series, and the problem of estimating credit rating, In this study we employed SVM for developing data mining-based efficiency prediction model. We used the Gaussian radial function as a kernel function of SVM. In multi-class SVM, we adopted one-against-one approach between binary classification method and two all-together methods, proposed by Weston and Watkins(1999) and Crammer and Singer(2000), respectively. In this research, we used corporate information of 154 companies listed on KOSDAQ market in Korea exchange. We obtained companies' financial information of 2005 from the KIS(Korea Information Service, Inc.). Using this data, we made multi-class rating with DEA efficiency and built multi-class prediction model based data mining. Among three manners of multi-classification, the hit ratio of the Weston and Watkins method is the best in the test data set. In multi classification problems as efficiency ratings of venture business, it is very useful for investors to know the class with errors, one class difference, when it is difficult to find out the accurate class in the actual market. So we presented accuracy results within 1-class errors, and the Weston and Watkins method showed 85.7% accuracy in our test samples. We conclude that the DEA based multi-class approach in venture business generates more information than the binary classification problem, notwithstanding its efficiency level. We believe this model can help investors in decision making as it provides a reliably tool to evaluate venture companies in the financial domain. For the future research, we perceive the need to enhance such areas as the variable selection process, the parameter selection of kernel function, the generalization, and the sample size of multi-class.

수중의 비소 종 분리 분석 (Speciation Analysis of Arsenic Species in Surface Water)

  • 정관조;김덕찬
    • 대한환경공학회지
    • /
    • 제30권6호
    • /
    • pp.621-627
    • /
    • 2008
  • 본 연구에서는 물속 As(III)와 As(V)의 종 규명분석에 필요한 HPLC와 DRC-ICP-MS의 최적조건을 설정하고, 이를 이용하여 한강 팔당수계 10개 지류 천으로부터 채취한 시료중의 As(III)와 As(V)를 분석 검토하였다. 종 분리를 위한 HPLC의 이동상으로는 10 mM ammonium nitrate와 10 mM ammonium phosphate monobasic을 사용하였으며, flushing solvent로는 5% v/v 메탄올을 사용하였다. 검출기는 DRC-ICP-MS를, 반응기체는 산소를 사용하였다. 최적 분석조건을 설정하기 위하여 이동상의 pH, 유량 및 시료 주입량과 DRC의 산소 유량을 달리하여 검토한 결과, 이동상의 pH는 9.4, 유량은 1.5 mL/min, 시료 주입량은 100 $\mu$L, 산소의 유량은 0.5 mL/min이었을 때 가장 좋은 분석조건으로 나타났다. 검정곡선은 As(III)와 As(V)에 대해 모두 r$^2$ = 0.998 이상의 선형성을 나타냈으며, As(III)의 검출한계는 0.10 $\mu$g/L, 정확도(RSD)는 4.3%, 회수율은 95.2%, As(V)의 검출한계는 0.08 $\mu$g/L, 정확도(RSD)는 3.6%, 회수율은 96.4%로 나타났다. 분석시간은 4분이었다. 설정된 파라미터를 적용하여 한강 팔당수계 유입 10개 지류 천에서 채수한 시료를 분석한 결과, As(III)는 0.10$\sim$0.22 $\mu$g/L, As(V)는 0.44$\sim$1.19 $\mu$g/L의 범위로 나타났으며, 총 비소의 93.5%가 As(V)의 형태인 것을 확인할 수 있었다.

위성영상의 형태추출을 통한 지도화 : 고빈도 공간필터 사용을 중심으로 (The Line Feature Extraction for Automatic Cartography Using High Frequency Filters in Remote Sensing : A Case Study of Chinju City)

  • 정인철
    • 한국지역지리학회지
    • /
    • 제2권2호
    • /
    • pp.183-196
    • /
    • 1996
  • 지도의 형태는 전통적으로 항공사진이나 위성사진을 이용한 수작업에 의해 추출되어 왔으나, 최근의 원격탐사 기술의 발달은 지도의 형태추출에 새로운 혁신을 가져다 주었다. 공간필터기법을 이용하면 지도형태 추출의 자동화가 가능한데, 특히 선의 추출을 고빈도필터를 이용하여 가능하다. 본 연구에서는 먼저 필터와 지도화의 관계에 대해 이론적으로 고찰한 다음 지도의 선형화와 관련하여 유용하다고 알려진 필터들을 소개하였다. 그리고 이 필터들을 진주시의 SPOT Panchromatic 영상에 적용하였다. 적용한 결과 본고에서 소개한 필터적용 영상이 전반적으로 초기영상보다 개선되어 선형화작업에 매우 유용함을 확인하였다. 특히 초기영상이 포함된 필터영상들의 해석이 용이하였고 선형화가 명확하였다. 그러나 문헌에서 유용성이 인정된 필터라도 일부 필터는 진주시의 경우 선형화작업이 전혀 불가능하였다.

  • PDF

GIS를 이용한 상수도(上水道) 계획(計劃) 의사결정(意思決定) 지원(支援)시스템 연구(硏究) (Decision Making Support System for Water Supply Facilities Planning using Geographic Information System)

  • 하성룡;김주환
    • 대한공간정보학회지
    • /
    • 제3권2호
    • /
    • pp.101-113
    • /
    • 1995
  • 상수도 계획 시 계획에 필요한 지형 및 공간특성이 갖는 정보들의 상호 유기적인 결합과 분석의 활용 가치를 증대시키기 위하여 보다 체계적이고 합리적인 정보관리체계가 필요하며 이러한 문제해결을 위한 데이타베이스 관리시스템(Data Base Management System : DBMS) 및 의사결정 지원시스템의 구축이 불가피하다. 또한 관로상의 수리학적 특성에 관련된 통과경로는 대상경로가 갖는 지리적 특성에 큰 영향을 받으므로 수리학적 안정성과 용수공급 대상지역까지 도수 및 송수가 원활히 이루어질 수 있도록 보다 경제적인 노선의 선정방법이 요구된다. 따라서 본 연구에서는 상수도의 신규개발이나 기존시설 확장 시, 계획의 적정성이나 경제성 등을 고려하여 각종기술 및 사회적 경제적 요인을 종합적으로 분석하고 그 결과를 토대로 보다 합리적이고 효율적인 계획 대안을 제공할 수 있는 의사결정 지원시스템을 도입한 상수도 계획기법을 개발하고자 하였다. 특히 상수도 관로계획 수립은 대상지역의 지형 및 토지이용특성에 따른 영향이 지배적인 인자이며 이를 해결하기 위한 방만으로 지리정보시스템(Geographic Information System ; GIS)을 이용하여 시스템을 구성하였다. 용수공급계통계획의 주된 요인인 지형적 공간적 특성을 GIS가 지니는 각종 분석기능과 관로 수리해석 프로그램 SAPID, 경제분석 프로그램인 ECOVEL을 개발하여 결합하고, 지형적인 공간특성정보를 데이터베이스화함으로써 관로의 적정노선을 보다 합리적으로 선정할 수 있는 의사결정 지원시스템을 개발하였으며 개발시스템의 현장 적용성 평가를 실시하여 그 가능성을 검토하였다.

  • PDF

'숙천제아도(宿踐諸衙圖)'를 통해 본 조선시대 중앙관아의 공간구조와 조경기법 (A Study on the Spatial Structure and landscape techniques of the Central Government Office(中央官衙) reviewed through the 'Sukchunjeado(宿踐諸衙圖)')

  • 신상섭;김현욱;박영관
    • 헤리티지:역사와 과학
    • /
    • 제47권3호
    • /
    • pp.42-59
    • /
    • 2014
  • 조선시대 후기 고위관료였던 한필교(1807~1878)의 화첩 "숙천제아도(宿踐諸衙圖)"를 통해본 중앙관아의 공간구조와 조경기법에 관한 연구결과는 다음과 같다. '사방전도묘법(四方顚倒描法)'으로 그려진 "숙천제아도"는 조선시대 중앙 및 지방관아의 공간구조와 문화경관 특성을 파악할 수 있는 독보적 실증사료로서 가치를 지닌다. 조선의 정궁(경복궁) 광화문 밖 육조(六曹)거리에 자리 잡은 중앙관아는 장방형 부지에 중심시설(당상대청)과 부속 건물이 서열에 따라 상 하 또는 좌 우로 분산되는 구조인데, 주 건물은 남향으로 배치되었으며, 행정편의와 환경성, 그리고 유교적 규범성의 실천 등 위계적 토지이용 체계를 반영하고 있다. 관리들의 직무공간인 당상대청과 향청 등 주요건물은 너른 네모꼴 앞마당을 두어 실용성 위주의 중정(中庭)을 구축하였고, 중심건물(당상대청)은 연못과 정자 등 의미경관을 반영한 후원을 가꾸었다. 특히, 토지이용에 있어서 적극적 공간과 소극적 공간이 교차 반복<동(動)과 정(靜), 채(棟)와 마당(庭), 정(庭)과 원(園)>되는 중용적 사유체계를 보여준다. 중앙관아조경의 특징은 실용적 성격의 앞마당과 경관적 측면이 강조된 뒤뜰을 연계시킨 외부공간의 확장성(前庭+棟+後園), 그리고 환경쾌적성, 경관성, 상징성, 방화용수 목적 등이 복합적으로 고려된 수경시설(方池)의 도입을 들 수 있다. 또한 휴양과 심신수양을 도모하기 위한 정자의 도입 및 후원의 발달, 정심수(庭心樹 : 연, 버드나무, 소나무, 느티나무 등)로서의 의미부여와 제한적인 식물도입, 그리고 심미성, 관념성, 실용적 가치 등을 중시한 환경설계기법이 추출된다. 이러한 중앙관아의 조경기법은 우리나라 궁궐, 사찰, 서원, 상류주택 등 전통공간에서 유사하게 추출되는 보편성이자 특수성이라 하겠다.

원형 자동문합기를 이용한 체외문합을 시행한 복강경 보조 위전절제술: 한 술자에 의한 연속적인 48명 환자의 수술성적분석 (Laparoscopic Assisted Total Gastrectomy (LATG) with Extracorporeal Anastomosis and using Circular Stapler for Middle or Upper Early Gastric Carcinoma: Reviews of Single Surgeon's Experience of 48 Consecutive Patients)

  • 정오;김병식;육정환;오성태;임정택;김갑중;최지은;박건춘
    • Journal of Gastric Cancer
    • /
    • 제8권1호
    • /
    • pp.27-34
    • /
    • 2008
  • 목적: 복강경 보조 위전절제술은 기술적 어려움과 환자수가 많지 않음으로 인하여 복강경 보조 위원위부 절제술에 비하여 연구가 많지 않은 상황이다. 따라서 저자들은 본원에서 시행한 복강경 보조 위전절제술의 수술성적과 수술후 경과 및 합병증 발생 예측인자와 복강경 보조 위전절제술의 학습곡선에 관하여 분석하였다. 대상 및 방법: 2005년 1월부터 2007년 9월까지 술 전 검사상 위의 중 상부에 위치한 조기위암(cT1N0)을 진단받고 한 술자에 의해 복강경 보조 위전절제술을 시행 받은 연속적인 48명의 환자를 대상으로 의무기록을 바탕을 후향적으로 분석하였다. 결과: 수술 중 합병증이나 개복수술로의 전환은 없었고 평균 수술시간은 $212{\pm}67$분이었다. 평균 적출 림프절 개수는 $29{\pm}10$개였고 모든 환자에서 안전한 종양 경계 면이 확보되었다. 수술 후 가스배출, 식이시작, 퇴원시기는 각각 평균 2.98일, 3.67일, 7.08일이었다. 외과적 합병증은 5명(10.4%)에서 발생하였고 모두 보전적 치료로 호전되었다. 단변량 및 다변량 분석에서 합병증 발생에 영향을 주는 유일한 인자는 체질량지순(P=0.035, HR=2.462)였으며 수술 시간을 기준으로 한 학습곡선 분석에서 20예가 학습곡선인 것으로 나타났다. 결론: 복강경 보조 위전절제술은 위의 중 상부에 위치한 조기위암에 대한 적절한 술식이며 수술성적과 수술 후 경과가 양호하다. 그러나 학습곡선을 단축하기 위해서는 복강경 보조 위원위부절제술의 충분한 경험이 필요하며, 특히 초기경험에서는 수술 후 합병증을 줄이기 위하여 환자 선택에 있어서 체질량지수를 고려하는 게 도움이 될 것으로 생각된다.

  • PDF

비정형 정보와 CNN 기법을 활용한 이진 분류 모델의 고객 행태 예측: 전자상거래 사례를 중심으로 (Customer Behavior Prediction of Binary Classification Model Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront)

  • 김승수;김종우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.221-241
    • /
    • 2018
  • 최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 연구에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 '이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델'을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 '이종 정보 결합'과 '비정형 정보의 벡터 전환', 그리고 '다층 퍼셉트론 설계'로 하는 3개의 내부 아키텍처를 정의하고 각 아키텍처 단위로 구성되는 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고 그 성능을 평가해보고자 한다. 고객 행태 예측을 위한 목표 변수는 전자상거래 기업에서 중요하게 관리하고 있는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제로 정의한다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve Bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도와 F1 Measure가 높게 평가되었다. 또 NBC, SVM, ANN에서 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법의 특징 추출 알고리즘이 VOC에 사용된 단어들의 분포와 위치 정보를 해석하여 문장의 의미를 파악하는데 효과적이라는 점을 실증적으로 확인하였다는데 그 의미가 있다고 할 수 있겠다. 이를 통해서 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.