• 제목/요약/키워드: On-Line Mining

검색결과 129건 처리시간 0.027초

RFID 데이터 스트림에서 이동궤적 패턴의 탐사 (Mining Frequent Trajectory Patterns in RFID Data Streams)

  • 서성보;이용미;이준욱;남광우;류근호;박진수
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권1호
    • /
    • pp.127-136
    • /
    • 2009
  • 이 논문은 RFID 데이터 스트림의 변화 특성을 고려하면서 단일 패스로 이동궤적 패턴을 실시간 추출하는 새로운 기법을 제안한다. RFID, 센서와 무선 네트워크 기술의 발달로 인해 현실 세계에서 실시간으로 데이터를 수집하고 유용한 패턴을 탐사하는 연구에 많은 관심이 집중되고 있다. 스트림 데이터에서 순차 패턴 또는 이동궤적 패턴을 탐사하는 기존의 연구 기법들은 반복적으로 데이터베이스 또는 트리를 탐색하는 고비용 문제점과 시간의 변화에 따르는 동적 특성을 실시간으로 패턴에 반영하지 못하는 단점이 있다. 제안하는 기법은 시간에 따라 RFID 데이터 스트림의 변화를 정확히 반영하기 위해 시간진화 그래프를 이용하여 이진 시간관계 테이블에 빈발한 2-길이 항목간 정보를 유지한다. 또한 다중 패스의 문제점을 해결하기 위해 t 시점에 이진 시간관계 테이블을 이용하여 k-길이의 후보 이동궤적 패턴을 추론하고, t+1 시점에서 후보 패턴을 검증하는 과정을 통해 k-길이 이동궤적 패턴을 단일 패스로 추출한다. 실험결과 제안하는 기법은 기존의 Apriori-계열 기법들과 비교하여 약 7% 정도 후보 패턴의 비율이 적게 생성되어 시간 및 공간 복잡도 측면에서 우수한 성능을 보였다.

  • PDF

전자메일 분류를 위한 나이브 베이지안 학습과 중심점 기반 분류의 성능 비교 (Performance Comparison of Naive Bayesian Learning and Centroid-Based Classification for e-Mail Classification)

  • 김국표;권영식
    • 산업공학
    • /
    • 제18권1호
    • /
    • pp.10-21
    • /
    • 2005
  • With the increasing proliferation of World Wide Web, electronic mail systems have become very widely used communication tools. Researches on e-mail classification have been very important in that e-mail classification system is a major engine for e-mail response management systems which mine unstructured e-mail messages and automatically categorize them. In this research we compare the performance of Naive Bayesian learning and Centroid-Based Classification using the different data set of an on-line shopping mall and a credit card company. We analyze which method performs better under which conditions. We compared classification accuracy of them which depends on structure and size of train set and increasing numbers of class. The experimental results indicate that Naive Bayesian learning performs better, while Centroid-Based Classification is more robust in terms of classification accuracy.

전자메일 자동관리 시스템을 위한 전자메일 분류기의 개발 (Development of e-Mail Classifiers for e-Mail Response Management Systems)

  • 김국표;권영식
    • 한국IT서비스학회지
    • /
    • 제2권2호
    • /
    • pp.87-95
    • /
    • 2003
  • With the increasing proliferation of World Wide Web, electronic mail systems have become very widely used communication tools. Researches on e-mail classification have been very important in that e-mail classification system is a major engine for e-mail response management systems which mine unstructured e-mail messages and automatically categorize them. in this research we develop e-mail classifiers for e-mail Response Management Systems (ERMS) using naive bayesian learning and centroid-based classification. We analyze which method performs better under which conditions, comparing classification accuracies which may depend on the structure, the size of training data set and number of classes, using the different data set of an on-line shopping mall and a credit card company. The developed e-mail classifiers have been successfully implemented in practice. The experimental results show that naive bayesian learning performs better, while centroid-based classification is more robust in terms of classification accuracy.

e-CRM에서 개인화 향상을 위한 의사결정나무 사용에 관한 연구 (Study on the Application of Decision Trees for Personalization based on e-CRM)

  • 양정희;한서정
    • 대한안전경영과학회지
    • /
    • 제5권3호
    • /
    • pp.107-119
    • /
    • 2003
  • Expectation and interest about e-CRM are rising for more efficient customer management in on-line including electronic commerce. The decision-making tree can be used usefully as the data mining technology for e-CRM. In this paper, the representative decision making techniques, CART, C4.5, CHAID analyzed the differences in personalization point of view with actuality customer data through an experiment. With these analysis data, it is proposed a new decision-making tree system that has big advantage in personalization techniques. Through new system, it can get following advantage. First, it can form superior model more qualitatively in personalization by adding individual's weight value. Second it can supply information personalized more to customer. Third, it can have high position about customer's loyalty than other site of similar types of business. Fourth, it can reduce expense that cost marketing and decision-making. Fifth, it becomes possible that know that customer through smooth communication with customer who use personalized service wants and make from goods or service's quality to more worth thing.

텍스트 마이닝 기법을 활용한 SNS 상에서 우울감을 언급한 도시공원 이용자의 이용행태 분석 (Analysis of Use Behavior of Urban Park Users Expressing Depression on Social Media Using Text Mining Technique)

  • 오지연;남성우;이상훈
    • 한국콘텐츠학회논문지
    • /
    • 제22권6호
    • /
    • pp.319-328
    • /
    • 2022
  • 본 연구는 COVID-19 대유행에 의한 우울감과 공원 이용행태의 관계를 온라인상에 게시된 공원 이용에 대한 게시물을 이용하여 분석하고자 하였다. COVID-19 방역이 활발해진 기간 동안 네이버와 다음의 블로그 및 카페에서 '공원'과 '우울'을 포함한 텍스트 데이터를 수집하여 텍스트 마이닝(Text Mining)과 소셜 네트워크(Social Network)분석을 하였다. 연구결과, 우울감을 언급한 공원 이용자는 '보다', '산책/걷다', '먹다'의 이용행태를 주로 보였고, 소통 행태인 '보다'를 중심으로 다른 이용행태들이 연결되는 것으로 나타났다. CONCOR 분석 결과, 소통 행태 및 동적 행태의 군집의 경우, 단일 행태 유형으로 군집이 형성되어, 우울감을 언급한 이용자는 공원을 소통활동과 신체활동을 위한 공간으로 인식하는 경향이 나타났다. COVID-19의 대유행으로 소통활동과 신체활동의 결핍이 증가되었고 공원에서 이를 해소하려는 것으로 해석되었다. 또한 우울감의 발생으로 상대적으로 소극적인 이용행태가 주요한 이용행태로 나타났다. 본 연구결과는 도시민에게 효과적인 공원의 조성 및 관리 계획에 유용할 것으로 판단되었다. 후속 연구에서 COVID-19 대유행과 우울감의 유무를 연계한 공원 이용자의 이용행태 분석이 필요한 것으로 판단되었다.

철도 물류기지 구축을 통한 남북철도 활성화 방안 연구 - 동해선을 중심으로 - (A Study on the Revitalization Strategy for Inter-Korean Railway by Building the Railway Logistics Depot - Focused on the Donghae Line -)

  • 김영민;조지현
    • 유통과학연구
    • /
    • 제8권2호
    • /
    • pp.5-12
    • /
    • 2010
  • 우리나라의 철도운송 분담율은 매년 6%를 유지하고 있으나 철도물류에 대한 지속적인 투자 및 물류 합리화 여부에 따라 철도물류는 상반된 결과를 가져올 것이다. 철도물류의 발전에 크게 기여할 것으로 예상되는 남북철도 뿐만 아니라 철도물류에 대한 연구가 상당히 미흡한 상황에서 철도 물류기지의 수요예측, 규모를 예측하고, 물류기지를 통한 남북철도 활성화 방안을 연구하고자 하였다. 철도 물류기지를 통한 남북철도의 활성화 방안으로서 첫째, 물류기지에서 취급하는 석탄 수요자와의 파트너쉽을 강화하여야 하며, 둘째, 강릉에서 제진까지 동해 북부선의 건설이 필요할 뿐만 아니라 노후화된 북측 선로의 유지보수에 필요한 재정적 지원이 이루어져야 한다. 셋째, 장·단거리 운송 및 대형 화주에 대한 철도운임을 탄력적으로 적용할 필요가 있으며, 넷째, 해외 광산개발 참여 등을 통하여 철도 운송권을 확보하여야 하고, 다섯째, 양회사와 같은 소형 화주를 지속적으로 발굴하여야 한다.

  • PDF

Effect of the lateral earth pressure coefficient on settlements during mechanized tunneling

  • Golpasand, Mohammad-Reza B.;Do, Ngoc Anh;Dias, Daniel;Nikudel, Mohammad-Reza
    • Geomechanics and Engineering
    • /
    • 제16권6호
    • /
    • pp.643-654
    • /
    • 2018
  • Tunnel excavation leads to a disturbance on the initial stress balance of surrounding soils, which causes convergences around the tunnel and settlements at the ground surface. Considering the effective impact of settlements on the structures at the surface, it is necessary to estimate them, especially in urban areas. In the present study, ground settlements due to the excavation of East-West Line 7 of the Tehran Metro (EWL7) and the Abuzar tunnels are evaluated and the effect of the lateral earth pressure coefficient ($K_0$) on their extension is investigated. The excavation of the tunnels was performed by TBMs (Tunnel Boring Machines). The coefficient of lateral earth pressure ($K_0$) is one of the most important geotechnical parameters for tunnel design and is greatly influenced by the geological characteristics of the surrounding soil mass along the tunnel route. The real (in-situ) settlements of the ground surface were measured experimentally using leveling methods along the studied tunnels and the results were compared with evaluated settlements obtained from both semi-empirical and numerical methods (using the finite difference software FLAC3D). The comparisons permitted to show that the adopted numerical models can effectively be used to predict settlements induced by a tunnel excavation. Then a numerical parametric study was conducted to show the influence of the $K_0$ values on the ground settlements. Numerical investigations also showed that the shapes of settlement trough of the studied tunnels, in a transverse section, are not similar because of their different diameters and depths of the tunnels.

온라인 마케팅 전략을 위한 SNS와 Web기반 BDAS(Big data Data Analysis Scheme) 설계 (An SNS and Web based BDAS design for On-Line Marketing Strategy)

  • 정이나;이병관;박석규
    • 한국정보통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.141-148
    • /
    • 2015
  • 본 논문은 SNS와 Web에서 실시간으로 공유되는 정보를 추출하고, 추출한 데이터를 신속하게 분석하여 고객이 무엇을 원하는 지를 분석해서 온라인 마케팅 전략을 효율적으로 만드는 SNS와 Web기반 BDAS(Big data Data Analysis Scheme)을 제안한다. 제안하는 BDAS는 첫째, SNS와 Web에서 공유되는 데이터를 수집하고, 둘째, 수집된 데이터의 의미를 긍정과 부정으로 분석하여 그 결과를 시각화하여 제공한다. 그 결과, BDAS는 공유되는 SNS와 Web 데이터에 대한 의미를 판단하는데 있어서 평균 90%의 정확성을 보장한다. 따라서 본 논문에서 제안하는 BDAS를 이용하여 소비자의 성향을 정확하게 판단할 수 있으므로 온라인 마케팅에 보다 효율적으로 활용할 수 있을 것이다.

Experimental and numerical simulating of the crack separation on the tensile strength of concrete

  • Sarfarazi, Vahab;Haeri, Hadi;Shemirani, Alireza Bagher;Zhu, Zheming;Marji, Mohammad Fatehi
    • Structural Engineering and Mechanics
    • /
    • 제66권5호
    • /
    • pp.569-582
    • /
    • 2018
  • Effects of crack separation, bridge area, on the tensile behaviour of concrete are studied experimentally and numerically through the Brazilian tensile test. The physical data obtained from the Brazilian tests are used to calibrate the two-dimensional particle flow code based on discrete element method (DEM). Then some specially designed Brazilian disc specimens containing two parallel cracks are used to perform the physical tests in the laboratory and numerically simulated to make the suitable numerical models to be tested. The experimental and numerical results of the Brazilian disc specimens are compared to conclude the validity and applicability of these models used in this research. Validation of the simulated models can be easily checked with the results of Brazilian tests performed on non-persistent cracked physical models. The Brazilian discs used in this work have a diameter of 54 mm and contain two parallel centred cracks ($90^{\circ}$ to the horizontal) loaded indirectly under the compressive line loading. The lengths of cracks are considered as; 10 mm, 20 mm, 30 mm and 40 mm, respectively. The visually observed failure process gained through numerical Brazilian tests are found to be very similar to those obtained through the experimental tests. The fracture patterns demonstrated by DEM simulations are mostly affected by the crack separation but the tensile strength of bridge area is related to the fracture pattern and failure mechanism of the testing samples. It has also been shown that when the crack lengths are less than 30 mm, the tensile cracks may initiate from the cracks tips and propagate parallel to loading direction till coalesce with the other cracks tips while when the cracks lengths are more than 30 mm, these tensile cracks may propagate through the intact concrete itself rather than that of the bridge area.

실시간 연관규칙 탐사를 위한 능동적 후보항목 관리 모델 (An Active Candidate Set Management Model for Realtime Association Rule Discovery)

  • 신예호;류근호
    • 정보처리학회논문지D
    • /
    • 제9D권2호
    • /
    • pp.215-226
    • /
    • 2002
  • 미디어의 발달과 생활 패턴의 변화를 토대로 새롭게 나타나고 있는 다양한 판매 패턴들을 분석하는데 있어 단일한 분석 방법을 적용하는 것은 효과적이지 못하다. 특히 신선 식품이나 기념일 주변에서 집중적인 매출이 발생하는 품목들은 제한된 시간 내에 판매를 최대로 해야 하는 시간적 제약을 갖는다. 그러나 기존의 연관규칙 탐사 기법은 대규모 거래 데이터베이스로부터 반복적 스캔 연산을 통해 연관규칙 탐사를 수행하기 때문에 제한된 시간안에서 빈번히 필요로 하는 패턴을 분석하기에는 비효율적이기 때문이다. 따라서 이 논문에서는 시간 제약을 갖는 특수한 판매 패턴에 대한 실시간 연관규칙 탐사가 가능하도록 하기 위해 트리거와 저장 프로시져를 이용한 점진적 후보항목 관리 모델을 제안한다. 아울러 이 논문에서는 제안 모델의 구현 및 실험을 통해 그 성능 특성의 분석도 수행한다. 특히 이 논문에서 제안하는 방법은 이중 해쉬 기법을 이용함으로써 연산의 성능을 향상시킨다.