• 제목/요약/키워드: model tree technique

검색결과 199건 처리시간 0.036초

대화식 데이터 마이닝 기법을 활용한 자동차 보험사의 인입 콜량 예측 사례 (A Case Study on Forecasting Inbound Calls of Motor Insurance Company Using Interactive Data Mining Technique)

  • 백웅;김남규
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.99-120
    • /
    • 2010
  • 최근 고객들의 비대면 접점 서비스 이용도가 높아짐에 따라, 비대면 채널은 다양한 데이터의 분석을 통해 고객 만족도를 향상시킬 수 있는 유용한 창구로 인식되고 있다. 이러한 비대면 채널의 대표적 영역으로 콜센터를 들 수 있으며, 콜센터 운영에서 고객 만족도에 가장 큰 영향을 미치는 요소는 상담 인력의 규모인 것으로 알려져 있다. 즉, 일정수준 이상의 고객 만족도를 유지하기 위해서는 충분한 상담 인력을 확보하는 것이 관건이지만, 불필요하게 많은 인력을 확보하는 것은 인건비 측면에서 비용의 낭비를 초래할 수 있다. 따라서 부족하지도 않고 넘치지도 않을 정도의 적정 인력을 산출하는 능력은 콜센터 운영의 핵심 경쟁력으로 인식되고 있으며, 최근 콜센터에서는 적정 인력의 규모를 예측하기 위해 WFM(Work Force Management) 업무 전담 부서를 설치하고 콜량을 정확하게 예측하기 위한 노력을 기울이고 있다. 콜량 예측을 위해 현업에서 주로 사용되는 방법은 담당자의 직관에 의존하는 방법으로, 일정기간의 콜량 평균을 담당자가 주관적 판단에 의해 보정함으로써 이루어진다. 하지만 이러한 방식은 담당자의 주관적 성향에 크게 좌우된다는 한계를 갖고 있어서, 최근에는 다양한 예측 모형을 시스템화한 WFMS(Workforce Management System) 패키지가 널리 활용되고 있다. 하지만 이 시스템은 초기 도입 시 매우 고가의 구축비용이 발생하며, 신규 요인 발굴 시 이를 즉각적으로 시스템에 반영하기 어렵다는 한계점을 갖고 있다. 이를 극복하기 위해 본 연구에서는 데이터 마이닝의 대화식 의사결정나무 기법을 이용함으로써, 객관적이면서도 업무 배경 지식을 충분히 활용할 수 있는 예측 모형을 수립하고자 한다. 또한, 본 연구에서 수립한 모형의 정확성 평가를 위해, 국내 최대 규모의 한 자동차 보험사 콜센터의 4년 8개월 간의 실 데이터를 사용한 실험을 수행하고 그 결과를 제시하였다. 실험에서는 기존의 WFMS와 본 연구에서 제안하는 두 가지 모형인 대화식 의사결정나무 기반의 예측 모형, 일반 의사결정나무 기반의 예측 모형의 세 가지 모형에 대해, 다양한 오차 허용범위 하에서의 사고콜 및 고장콜에 대한 예측 적중률을 평가하였다.

IPTV의 VOD 어노테이션을 위한 반자동 온톨로지 모델링 (Semi-automatic Ontology Modeling for VOD Annotation for IPTV)

  • 최정화;허길;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권7호
    • /
    • pp.548-557
    • /
    • 2010
  • 본 연구는 IPTV의 지능형 검색을 가능하게 하는 VOD 어노테이션을 위해 효율적인 반자동 온톨로지 모델링 기법을 제안한다. 제안하는 방법은 워드넷(WordNet)으로 부터 특정 도메인(또는 장르)을 대표하는 콘텐츠에 관련된 키워드의 상 하위어와 동의어에 해당하는 부분 트리를 추출하고, 워드넷에 없는 외래어, 한자어 등은 확장하여 콘텐츠 온톨로지를 구축한다. 이 온톨로지는 보편적 계층구조와 특정 계층구조를 생성한다. 전자는 콘텐츠와 관련 키워드를 제약 기술(description)을 포함하는 클래스로 정의한 어휘의 의미 모델이다. 후자는 생성된 모델에 함의관계(subsumption) 추론 기술을 적용하여 키워드를 관련있는 콘텐츠로 추론한 모델이다. 어노테이션은 이 온톨로지를 기반으로 VOD에 콘텐츠와 장르의 메타데이터를 의미 기반으로 생성한다. 보편적 계층구조는 서비스 도메인에 독립적으로 재사용이 가능하며, 특정 계층구조는 서비스 목적에 맞는 완전하고 함축적인 모델을 생성한다. 제안하는 방법은 서비스 도메인에 상관없이 적용 가능한 알고리즘이며, 2,400건의 테스트 데이터로 어노테이션 결과를 평가하여 82%의 정확도를 보였다.

Prediction of Length of ICU Stay Using Data-mining Techniques: an Example of Old Critically Ill Postoperative Gastric Cancer Patients

  • Zhang, Xiao-Chun;Zhang, Zhi-Dan;Huang, De-Sheng
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제13권1호
    • /
    • pp.97-101
    • /
    • 2012
  • Objective: With the background of aging population in China and advances in clinical medicine, the amount of operations on old patients increases correspondingly, which imposes increasing challenges to critical care medicine and geriatrics. The study was designed to describe information on the length of ICU stay from a single institution experience of old critically ill gastric cancer patients after surgery and the framework of incorporating data-mining techniques into the prediction. Methods: A retrospective design was adopted to collect the consecutive data about patients aged 60 or over with a gastric cancer diagnosis after surgery in an adult intensive care unit in a medical university hospital in Shenyang, China, from January 2010 to March 2011. Characteristics of patients and the length their ICU stay were gathered for analysis by univariate and multivariate Cox regression to examine the relationship with potential candidate factors. A regression tree was constructed to predict the length of ICU stay and explore the important indicators. Results: Multivariate Cox analysis found that shock and nutrition support need were statistically significant risk factors for prolonged length of ICU stay. Altogether, eight variables entered the regression model, including age, APACHE II score, SOFA score, shock, respiratory system dysfunction, circulation system dysfunction, diabetes and nutrition support need. The regression tree indicated comorbidity of two or more kinds of shock as the most important factor for prolonged length of ICU stay in the studied sample. Conclusions: Comorbidity of two or more kinds of shock is the most important factor of length of ICU stay in the studied sample. Since there are differences of ICU patient characteristics between wards and hospitals, consideration of the data-mining technique should be given by the intensivists as a length of ICU stay prediction tool.

항공사진의 식생 판독에 의한 재해 예측 기법 (The Technique of Landslide Hazard Prediction Using Vegetation Interpretation of Aerial Photo)

  • 강인준;곽재하;정재형
    • 한국측량학회지
    • /
    • 제11권1호
    • /
    • pp.29-35
    • /
    • 1993
  • 잔디, 관목, 나무 등의 식생은 사면의 침식양 조절 및 사면안정을 위해 오래전부터 사용되어 왔으나 전통적인 사면안정해석의 경우 사면에 있는 식생의 영향을 고려하지 않아 상대적으로 얕은 토층에 숲이 형성되어 있을 때 그 해석에 있어 많은 오차가 발생되었다. 따라서 사면안정해석에 식생의 영향은 중요한 요소가 되었다. 그러나, 여러 식생이 사면안정에 미치는 영향은 사면안정의 해석에 있어 중요한 요소이나 그 영향을 안정해석에서 양적으로 나타내기에는 많은 어려움이 있고 복잡하다. 본 연구에서는 부산직할시 금정구 금성동에서 발생된 산사태지역을 모델지역으로 선정하여 항공사진 판독과 지형도에서 추출한 DTM 데이타를 이용하여 경사도를 분석하고 현장조사를 통하여 식생의 흉고직경-수령, 수고-수령의 관계를 조사비교한 결과 경사도가 약 $27^\circ$인 지역에서 인위적 식재를 하였을경우 약 20년 후 산사태가 발생함을 알 수 있었으며 식목과 그 관리에 있어 방재효과를 고려하여야 함을 알 수 있었다.

  • PDF

트리 구조를 이용한 수식 인식 연구 (A Study on Equation Recognition Using Tree Structure)

  • 박병준;김현식;김완태
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권4호
    • /
    • pp.340-345
    • /
    • 2018
  • 수식은 일반 문장에 비해 복잡한 구조와 다양한 문자와 기호가 사용되어 단순한 키보드 입력만으로는 모든 문자 집합을 입력할 수 없어 한글이나 워드 같은 문서편집기 내에서도 자체적으로 구현된 수식 편집기를 사용하고 있다. 수식을 올바르게 표현하기 위해 구문을 해석할 수 있는 의미가 될 수 있는 사전 학습 정보가 필요하다. 문자가 입력되더라도 크기와 위치 서로간의 관계에 따라 다른 수식으로 표현될 수 있기 때문이다. 즉 표현될 위치와 크기 등 문자와 기호들 간의 상호관계를 고려하여 수식의 형태를 트리 모델로 표현한다. 문자인식 응용의 한 분야로 문자나 기호(부호)를 인식하는 기술을 이미 널리 알려졌지만, 수식을 입력과 해석하는 방법은 일반적인 텍스트에 비해 복잡한 분석 과정이 필요하다. 본 논문에서는 수식의 문자를 인식하고 표현되는 위치와 크기의 결정을 빠르게 해석하는 수식 인식기를 구현하였다.

정보관리실(情報管理室) 경영(經營)에서의 의사결정지원(意思決定支援) 시스템에 관한 연구(硏究) (A Study on the Decision-Making Support System in Information Management)

  • 이우범
    • 정보관리연구
    • /
    • 제19권1호
    • /
    • pp.1-29
    • /
    • 1988
  • 본연구(本硏究)는 정보(情報)의 누증(累增)과 사회구조(社會構造)의 다양화(多樣化)로 효율적(效率的)인 정보(情報)의 입수(入手), 처리(處理), 적합(適合)한 정보(情報)의 경제적(經濟的)인 선택(選擇) 등의 직면한 문제를 해결하기 위하여 도움을 줄 수 있는 의사결정지원(意思決定支援)시스템을 주로 다루었다. 의사결정이론(意思決定理論)의 분석(分析)과 그 논의점(論議點) 등을 분석(分析)하여 발전추세(發展趨勢) 점검해 보았고, 실제 의사결정(意思決定)을 지원할 수 있는 지원(支援)시스템을 개발하기 위하여 의사결정(意思決定)의 모델링의 이론(理論)을 조사해서 정보관리(情報管理) 의사결정(意思決定)시스템 개념의 모델을 제시했다. 결론적(結論的)으로 의사결정(意思決定) 구조분석기술(構造分析技術)은 '확율이론(確率理論)과 여러 상황(狀況)의 기회(機會)노드를 연결해서 불확실(不確實)한 상황(狀況)에서 합리적인 의사결정을 수행하기 위한 것이므로 정보가치(情報價値)의 금전적(金錢的)인 기대(期待)값과 기대이윤가치(期待利潤價値)를 산출(算出)하여 정보관리실(情報管理室) 운영(運營)에 필요한 다양한 결정을 유도해낼 수 있을 것이다.

  • PDF

동적신뢰도 평가모델의 연구 (A Study on A Dynamic Reliability Analysis Model)

  • 제무성
    • 한국신뢰성학회:학술대회논문집
    • /
    • 한국신뢰성학회 2000년도 춘계학술대회 발표논문집
    • /
    • pp.239-246
    • /
    • 2000
  • 이 논문은 중대사고가 발생하였을때 운전원에 의하여 사고관리 방안을 수행하는 경우 그 실현성(Feasibility)을, 평가하는데 사용할 수 있는 새로운 시간의존적 신뢰도 분석방법을 제시하였다. 이 방법은 성능요구 (Performance Requirement)와 성능성취 (Performance Achievement)의 상관관계의 개념을 이용하는 신뢰도물리(Reliability Physics)와 모든 시간의존적 사고경위를 도출하는 동적사건수목 생성방법에 기초하고있다. 신뢰도물리는 성능요구변수와 성능성취변수의 비교를 이용한 신뢰도분석방법인 반면 동적사건수목 생성방법은 바람직한 해를 얻을 때까지 모든 가능한 사고경위를 도출해 내는 방법이다. 이 방법론을 정전사고시 참조원전의 공동에 비상화재시스템을 이용하여 물을 공급하는 공동범람사고관리 방안에 적용시켰다. Latin Hypercube Sampling 방법은 성능요구변수의 불확실성을 평가하는데 사용되었다. 제시된 방법론은 사고시 필요한 운전원의 방안수행 성공가능성을 평가하는데 사용될 수 있을 뿐만 아니라 궁극적으로 사고관리 절차서 개발에 도움이 될 수 있음을 보여주었다.

  • PDF

Stacking Ensemble Learning을 활용한 블록 탑재 시수 예측 (A Study on the Work-time Estimation for Block Erections Using Stacking Ensemble Learning)

  • 권혁천;유원선
    • 대한조선학회논문집
    • /
    • 제56권6호
    • /
    • pp.488-496
    • /
    • 2019
  • The estimation of block erection work time at a dock is one of the important factors when establishing or managing the total shipbuilding schedule. In order to predict the work time, it is a natural approach that the existing block erection data would be used to solve the problem. Generally the work time per unit is the product of coefficient value, quantity, and product value. Previously, the work time per unit is determined statistically by unit load data. However, we estimate the work time per unit through work time coefficient value from series ships using machine learning. In machine learning, the outcome depends mainly on how the training data is organized. Therefore, in this study, we use 'Feature Engineering' to determine which one should be used as features, and to check their influence on the result. In order to get the coefficient value of each block, we try to solve this problem through the Ensemble learning methods which is actively used nowadays. Among the many techniques of Ensemble learning, the final model is constructed by Stacking Ensemble techniques, consisting of the existing Ensemble models (Decision Tree, Random Forest, Gradient Boost, Square Loss Gradient Boost, XG Boost), and the accuracy is maximized by selecting three candidates among all models. Finally, the results of this study are verified by the predicted total work time for one ship among the same series.

데이터마이닝을 활용한 한국프로야구 승패예측모형 수립에 관한 연구 (Using Data Mining Techniques to Predict Win-Loss in Korean Professional Baseball Games)

  • 오윤학;김한;윤재섭;이종석
    • 대한산업공학회지
    • /
    • 제40권1호
    • /
    • pp.8-17
    • /
    • 2014
  • In this research, we employed various data mining techniques to build predictive models for win-loss prediction in Korean professional baseball games. The historical data containing information about players and teams was obtained from the official materials that are provided by the KBO website. Using the collected raw data, we additionally prepared two more types of dataset, which are in ratio and binary format respectively. Dividing away-team's records by the records of the corresponding home-team generated the ratio dataset, while the binary dataset was obtained by comparing the record values. We applied seven classification techniques to three (raw, ratio, and binary) datasets. The employed data mining techniques are decision tree, random forest, logistic regression, neural network, support vector machine, linear discriminant analysis, and quadratic discriminant analysis. Among 21(= 3 datasets${\times}$7 techniques) prediction scenarios, the most accurate model was obtained from the random forest technique based on the binary dataset, which prediction accuracy was 84.14%. It was also observed that using the ratio and the binary dataset helped to build better prediction models than using the raw data. From the capability of variable selection in decision tree, random forest, and stepwise logistic regression, we found that annual salary, earned run, strikeout, pitcher's winning percentage, and four balls are important winning factors of a game. This research is distinct from existing studies in that we used three different types of data and various data mining techniques for win-loss prediction in Korean professional baseball games.

1대1 요구사항 모델링을 통한 테스트 케이스 자동 생성 (Automatic Test Case Generation Through 1-to-1 Requirement Modeling)

  • 오정섭;최경희;정기현
    • 정보처리학회논문지D
    • /
    • 제17D권1호
    • /
    • pp.41-52
    • /
    • 2010
  • 생성된 테스트 케이스와 요구사항과의 연관관계가 중요하지만, 모델을 이용한 테스트 케이스 자동생성에서는 모델이 요구사항과 m:n의 관계를 맺기 때문에 테스트 케이스와 요구사항과의 관계도 매우 복잡해진다. 본 논문에서는 1:1 모델링 도구인 REED(REquirement EDitor)를 이용하여 테스트 케이스를 생성하는 방법에 대하여 기술한다. 테스트 케이스는 커버리지 타겟 생성, IORT(Input Output Relation Tree) 생성, 테스트 케이스 생성의 3단계를 거치며, 모든 단계는 자동으로 진행된다. 생성된 테스트 케이스는 하나의 요구사항에서 생성될 수 있으며 실제 시스템에 적용한 결과, 온도조절장치 경우는 5,566개, 버스카드 단말기의 경우는 3,757개, 굴착기 제어기는 4,611개의 테스트 케이스가 생성되었다.