• 제목/요약/키워드: data mining processes

검색결과 140건 처리시간 0.024초

복잡한 예측문제에 대한 이차학습방법 : Video-On-Demand에 대한 사례연구 (Second-Order Learning for Complex Forecasting Tasks: Case Study of Video-On-Demand)

  • 김형관;주종형
    • 지능정보연구
    • /
    • 제3권1호
    • /
    • pp.31-45
    • /
    • 1997
  • To date, research on data mining has focused primarily on individual techniques to su, pp.rt knowledge discovery. However, the integration of elementary learning techniques offers a promising strategy for challenging a, pp.ications such as forecasting nonlinear processes. This paper explores the utility of an integrated a, pp.oach which utilizes a second-order learning process. The a, pp.oach is compared against individual techniques relating to a neural network, case based reasoning, and induction. In the interest of concreteness, the concepts are presented through a case study involving the prediction of network traffic for video-on-demand.

  • PDF

예외업무 관리를 위한 비즈니스 프로세스 저장소의 활용 (Business Process Repository for Exception Handling in BPM)

  • 최덕원;신진규;진중현
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.265-270
    • /
    • 2006
  • In an organization where major business operations are geared by business process management system(BPMS), routine tasks are processed according to the predefined business processes. However, most business operations are subject to some sort of exceptions, and the exceptional situations require update of the existing business process model, or a new business process model has to be defined to handle the exceptions. This paper proposes a system architecture that deploys business process repository as the media for storage and retrieval of the various business process models developed for exception handling. Well defined situation variables and decision variables play the key role for efficient storage and retrieval of the business process models developed for exception handling. The data mining technique C5.0 was used to build the optimum path for the process repository search tree.

  • PDF

차세대 USN기반의 스마트 플랜트안전 프레임워크 개발 (SPSF : Smart Plant Safety Framework based on Reliable-Secure USN)

  • 정지은;송병훈;이형수
    • 정보통신설비학회논문지
    • /
    • 제9권3호
    • /
    • pp.102-106
    • /
    • 2010
  • Recently process industries from oil and gas procedures and mining companies to manufactures of chemicals, foods, and beverages has been exploring the USN (Ubiquitous Sensor Networks) technology to improve safety of production processes. However, to apply the USN technology in the large-scale plant industry, reliability and security issues are not fully addressed yet, and the absence of the industrial sensor networking standard causes a compatibility problem with legacy equipment and systems. Although this situation, process industry such as energy plants are looking for the secure wireless plant solution to provide detailed, accurate safety monitoring from previously hard-reach, unaccordable area. In this paper, SPSF (Smart Plant Safety Framework based on Reliable-Secure USN) is suggested to fulfill the requirements of high-risk industrial environments for highly secure, reliable data collection and plant monitoring that is resistant to interference. The SPSF consists of three main layers: 1) Smart Safety Sensing Layer, 2) Smart Safety Network Layers, 3) Plant Network System Layer.

  • PDF

B2B 전자조달시스템의 핵심성공요인(CSF) 도출을 위한 실증분석 (An Empirical Study on the Critical Success Factors of Business to Business e-Procurement System)

  • 이상진;신승만
    • 무역상무연구
    • /
    • 제47권
    • /
    • pp.239-260
    • /
    • 2010
  • The purpose of this study would like to investigate the critical success factors of the e-procurement which means on-line purchase of goods and services for organizations. This action represents one of the largest expense items in a firm's cost structure. In order to draw CSFs of e-procurement system, we have surveyed questionnaire to the related firms. The basic variables used in this survey are taken from many precedent researches in relation to the e-procurement. On the other hand, the research data is collected from companies which had used the MRO e-marketplace. Through factor analysis of those data, four-factor resulted as follows: (1) factor one suggests the rationalization of the firm's management of its suppliers; (2) factor two calls for redesigning affected business processes and influencing end-user/employee procurement-related behaviors; (3) factor three refers to carefully orchestrating an e-procurement technology planning process with one's suppliers and using intelligence in designing the software and mining the data it produces; and (4) factor four relates to selecting an e-procurement solution and/or simultaneously participating in a number of electronic environments supporting e-procurement. In conclusion, these four factors are regarded as critical success factors for the application of e-procurement system and then suppliers should take care the effective planning of e-procurement structure.

  • PDF

스냅샷을 가지는 다중 레벨 공간 DBMS를 기반으로 하는 센서 미들웨어 구조 설계 (Design of Sensor Middleware Architecture on Multi Level Spatial DBMS with Snapshot)

  • 오은석;김호석;김재홍;배해영
    • 한국공간정보시스템학회 논문지
    • /
    • 제8권1호
    • /
    • pp.1-16
    • /
    • 2006
  • 최근 들어, 사용자가 주변 환경 및 요구 정보의 변화를 의식하지 않고 작업 환경과 수행하는 일에 집중하도록 배려하는 인간 중심 컴퓨팅 환경에 대한 연구 개발이 활발히 진행되고 있다. 그러나 이러한 컴퓨팅 환경에서 미들웨어는 사용자에게 RFID센서로부터 들어오는 대량의 정보에 대한 처리 부하를 줄이기 위하여 분석이 끝난 스트림 데이터를 삭제한다. 따라서 사용자의 데이터 웨어하우징이나 데이터마이닝에 필요한 확률, 통계 정보에 대한 요청, 또는 반복적이면서 동일한 데이터에 대한 요청을 처리할 수 없다는 문제점을 가진다. 본 논문에서는 기존의 미들웨어에서 문제가 되었던 과거 스트림 데이터 재사용 문제를 해결하기 위해, 사용자가 빈번하게 요구하는 데이터들을 스냅샷을 가지는 다중 레벨 공간 DBMS에서 관리하는 센서미들웨어 구조를 설계하였다. 본 시스템은 사용자가 요구하는 데이터 마이닝이나 데이터 웨어하우징과 같은 과거 스트림 정보를 사용한 서비스 요청을 위해, 미들웨어에서 필터링된 과거 스트림 데이터를 디스크 데이터베이스에서 관리한다. 그리고 디스크 데이터베이스에 저장된 스트림 데이터 중에서 사용자에 대한 높은 재사용 빈도를 가지는 데이터들을 스냅샷의 형태로 메모리 데이터베이스에 저장하고 이를 관리한다. 또한, 본 시스템은 메모리 데이터베이스에 저장된 스냅샷 데이터의 높은 데이터 재사용성과 신속한 서비스를 유지하기 위해서 주기적인 메모리 데이터베이스 관리 정책을 수행한다. 본 논문은 기존의 미들웨어에서의 스트림 데이터에 대한 반복적인 요청, 또는 과거 스트림 데이터를 이용한 정책 결정 서비스 요청에 대한 서비스를 제공할 수 없는 문제들을 해결하였다. 그리고 메모리에 저장된 데이터에 대한 높은 데이터 재사용성을 유지함으로서 사용자에게 지속적으로 다양하고 신속한 데이터 서비스를 제공한다.

  • PDF

데이터마이닝 기법을 이용한 PCB 제조라인의 불량 혐의 공정 및 설비 분석 (Fault-Causing Process and Equipment Analysis of PCB Manufacturing Lines Using Data Mining Techniques)

  • 심현식;김창욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권2호
    • /
    • pp.65-70
    • /
    • 2015
  • PCB(Printed Circuit Board) 제조공정에서의 수율은 제품의 원가와 품질을 결정하는 중요한 관리 요인이다. PCB 제조공정은 일반적으로 많은 단계의 미세공정을 거쳐서 제품인 칩(Chip)이 생산되기 때문에 높은 수율을 보장하기가 현실적으로 어렵다. 제품의 수율을 향상시키기 위해서는 저수율의 원인이 되는 불량요인을 분석하고, 불량요인에 영향을 미치는 중요공정 및 설비를 찾아서 관리해야 한다. 본 연구는 로지스틱 회귀분석 및 변수선택법을 이용하여 혐의공정 및 설비를 찾는 방법을 제안하였다. 데이터는 실제 현장의 로트 데이터를 사용하였고, 각 로트는 진행한 설비 및 불량유형별 불량수를 갖고 있다. 또한 분석 결과는 실제 현장 확인을 통하여 수율에 미치는 영향을 확인하였다.

The diagnosis of Plasma Through RGB Data Using Rough Set Theory

  • Lim, Woo-Yup;Park, Soo-Kyong;Hong, Sang-Jeen
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2009년도 제38회 동계학술대회 초록집
    • /
    • pp.413-413
    • /
    • 2010
  • In semiconductor manufacturing field, all equipments have various sensors to diagnosis the situations of processes. For increasing the accuracy of diagnosis, hundreds of sensors are emplyed. As sensors provide millions of data, the process diagnosis from them are unrealistic. Besides, in some cases, the results from some data which have same conditions are different. We want to find some information, such as data and knowledge, from the data. Nowadays, fault detection and classification (FDC) has been concerned to increasing the yield. Certain faults and no-faults can be classified by various FDC tools. The uncertainty in semiconductor manufacturing, no-faulty in faulty and faulty in no-faulty, has been caused the productivity to decreased. From the uncertainty, the rough set theory is a viable approach for extraction of meaningful knowledge and making predictions. Reduction of data sets, finding hidden data patterns, and generation of decision rules contrasts other approaches such as regression analysis and neural networks. In this research, a RGB sensor was used for diagnosis plasma instead of optical emission spectroscopy (OES). RGB data has just three variables (red, green and blue), while OES data has thousands of variables. RGB data, however, is difficult to analyze by human's eyes. Same outputs in a variable show different outcomes. In other words, RGB data includes the uncertainty. In this research, by rough set theory, decision rules were generated. In decision rules, we could find the hidden data patterns from the uncertainty. RGB sensor can diagnosis the change of plasma condition as over 90% accuracy by the rough set theory. Although we only present a preliminary research result, in this paper, we will continuously develop uncertainty problem solving data mining algorithm for the application of semiconductor process diagnosis.

  • PDF

Identifying literature-based significant genes and discovering novel drug indications on PPI network

  • Park, Minseok;Jang, Giup;Lee, Taekeon;Yoon, Youngmi
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권3호
    • /
    • pp.131-138
    • /
    • 2017
  • New drug development is time-consuming and costly. Hence, it is necessary to repurpose old drugs for finding new indication. We suggest the way that repurposing old drug using massive literature data and biological network. We supposed a disease-drug relationship can be available if signal pathways of the relationship include significant genes identified in literature data. This research is composed of three steps-identifying significant gene using co-occurrence in literature; analyzing the shortest path on biological network; and scoring a relationship with comparison between the significant genes and the shortest paths. Based on literatures, we identify significant genes based on the co-occurrence frequency between a gene and disease. With the network that include weight as possibility of interaction between genes, we use shortest paths on the network as signal pathways. We perform comparing genes that identified as significant gene and included on signal pathways, calculating the scores and then identifying the candidate drugs. With this processes, we show the drugs having new possibility of drug repurposing and the use of our method as the new method of drug repurposing.

국내 사용 후 화학촉매제품의 재자원화 현황 및 향후 방향 (Status and Strategy on Recycling of Domestic Used Chemical Catalysts)

  • 김영춘;강홍윤
    • 자원리싸이클링
    • /
    • 제26권3호
    • /
    • pp.3-16
    • /
    • 2017
  • 화학촉매제품은 석유화학공정, 대기오염방지시설, 자동차 배기가스 정화 장치 등 다양한 분야에 적용되고 있다. 국내외 화학촉매 시장은 매년 증가하고 있는 추세이며, 그에 따라 발생되는 폐촉매량도 증가하고 있다. 탈황 폐촉매, 자동차 폐촉매 등 대부분의 사용 후 화학촉매제품은 유가금속을 함유하고 있어 경제적 가치와 자원 확보 측면에서 매우 중요한 순환자원이다. 이에 일부 도시광산업체를 통해 유가금속을 회수하는 재자원화 공정이 상용화 되어 있고, 사용 후 SCR 탈질 촉매제품은 일부 재제조를 통해 자원순환되고 있다. 이에 본 논문에서는 사용 후 화학촉매제품의 재자원화 산업 지원 정책 수립의 기초자료로 활용이 가능하도록 주요촉매제품별 국내 발생량 및 재자원화 현황을 조사 분석하였으며, 사용 후 화학촉매제품의 자원순환 활성화를 위한 발전과제를 제시하였다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.