• 제목/요약/키워드: Data Mining Algorithm

검색결과 750건 처리시간 0.025초

Wireless Network Health Information Retrieval Method Based on Data Mining Algorithm

  • Xiaoguang Guo
    • Journal of Information Processing Systems
    • /
    • 제19권2호
    • /
    • pp.211-218
    • /
    • 2023
  • In order to improve the low accuracy of traditional wireless network health information retrieval methods, a wireless network health information retrieval method is designed based on data mining algorithm. The invalid health information stored in wireless network is filtered by data mapping, and the health information is clustered by data mining algorithm. On this basis, the high-frequency words of health information are classified to realize wireless network health information retrieval. The experimental results show that exactitude of design way is significantly higher than that of the traditional method, which can solve the problem of low accuracy of the traditional wireless network health information retrieval method.

후보 2-항목집합의 개수를 최소화한 연관규칙 탐사 알고리즘 (An Algorithm for Mining Association Rules by Minimizing the Number of Candidate 2-Itemset)

  • 황종원;강맹규
    • 산업경영시스템학회지
    • /
    • 제21권48호
    • /
    • pp.53-63
    • /
    • 1998
  • Mining for association rules between items in a large database of sales transaction has been described as an important data mining problem. The mining of association rules can be mapped into the problem of discovering large itemsets. In this paper we present an efficient algorithm for mining association rules by minimizing the total numbers of candidate 2-itemset, │C$_2$│. More the total numbers of candidate 2-itemset, less the time of executing the algorithm for mining association rules. The total performance of algorithm depends on the time of finding large 2-itemsets. Hence, minimizing the total numbers of candidate 2-itemset is very important. We have performed extensive experiments and compared the performance of our algorithm with the DHP algorithm, the best existing algorithm.

  • PDF

대용량 공간 데이터로 부터 빈발 패턴 마이닝 (Mining Frequent Pattern from Large Spatial Data)

  • 이동규;이경민;정석호;이성호;류근호
    • 한국공간정보시스템학회 논문지
    • /
    • 제12권1호
    • /
    • pp.49-56
    • /
    • 2010
  • 공간 및 비 공간 데이터에서 알지 못했던 패턴을 탐사하는 빈발 패턴 탐사 기법은 마이닝 분야에서 가장 핵심적인 부분으로 많은 연구가 활발히 진행되고 있다. 기존의 자료구조들은 트리 구조 및 배열 구조로써 밀집 또는 희소 빈발 패턴에서 성능 저하를 보인다. 대용량의 공간 데이터는 밀집 및 희소 빈발 패턴을 둘 다 가지므로 단일 알고리즘으로 빠르게 탐사 하는 것은 중요하다. 본 논문에서는 단일 알고리즘을 사용하면서도 밀집 및 희소 빈발 패턴 모두에 대해 빠르게 빈발 패턴을 마이닝할 수 있는 압축된 패트리샤 빈발 패턴 트리라는 새로운 자료구조와 이를 사용한 빈발 패턴 마이닝 알고리즘을 제안한다. 실험 평가는 제안한 알고리즘이 대용량 희소 및 밀집 빈발 데이터에서 기존의 FP-Growth 알고리즘 보다 약 10배 정도 빠르게 빈발 패턴을 탐사하는 것을 보인다.

웹 사용 마이닝에서의 데이터 수집 전략과 그 응용에 관한 연구 (Research on Data Acquisition Strategy and Its Application in Web Usage Mining)

  • 염종림;정석태
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권3호
    • /
    • pp.231-241
    • /
    • 2019
  • 웹 사용 마이닝 (WUM)은 웹 마이닝과 데이터 마이닝 기술의 응용 중의 하나다. 웹 마이닝 기술은 사용자가 웹 사이트에 액세스 할 때 웹 사용자가 생성 한 웹 서버 로그 데이터를 사용하여 사용자의 액세스 패턴을 식별하고 분석하는데 사용된다. 따라서 우선 데이터 마이닝 기술을 적용하여 웹 로그에서 사용자 액세스 패턴을 발견하기 전에 합리적인 방법으로 데이터를 수집해야 한다. 데이터 수집의 중요한 일은 사용자의 웹 사이트 방문 과정에서 사용자의 자세한 클릭 동작을 효율적으로 얻는 것이다. 이 논문은 주로 데이터 수집 전략 및 필드 추출 알고리즘과 같은 웹 사용 마이닝 데이터 프로세스의 첫 단계 이전의 데이터 수집 단계에 중점을 둔다. 필드 추출 알고리즘은 로그 파일에서 필드를 분리하는 프로세스를 수행하며 대용량의 사용자 데이터에 대한 실제 응용에도 사용된다.

Short-term Electric Load Forecasting Using Data Mining Technique

  • Kim, Cheol-Hong;Koo, Bon-Gil;Park, June-Ho
    • Journal of Electrical Engineering and Technology
    • /
    • 제7권6호
    • /
    • pp.807-813
    • /
    • 2012
  • In this paper, we introduce data mining techniques for short-term load forecasting (STLF). First, we use the K-mean algorithm to classify historical load data by season into four patterns. Second, we use the k-NN algorithm to divide the classified data into four patterns for Mondays, other weekdays, Saturdays, and Sundays. The classified data are used to develop a time series forecasting model. We then forecast the hourly load on weekdays and weekends, excluding special holidays. The historical load data are used as inputs for load forecasting. We compare our results with the KEPCO hourly record for 2008 and conclude that our approach is effective.

상품간 연관 규칙의 효율적 탐색 방법에 관한 연구 : 인터넷 쇼핑몰을 중심으로 (A Fast Algorithm for Mining Association Rules in Web Log Data)

  • 오은정;오상봉
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2003년도 추계공동학술대회
    • /
    • pp.621-626
    • /
    • 2003
  • Mining association rules in web log files can be divided into two steps: 1) discovering frequent item sets in web data; 2) extracting association rules from the frequent item sets found in the previous step. This paper suggests an algorithm for finding frequent item sets efficiently The essence of the proposed algorithm is to transform transaction data files into matrix format. Our experimental results show that the suggested algorithm outperforms the Apriori algorithm, which is widely used to discover frequent item sets, in terms of scan frequency and execution time.

  • PDF

중요지지도를 고려한 연관규칙 탐사 알고리즘 (Algorithm mining Association Rules by considering Weight Support)

  • 김근형;황병웅;김민철
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.545-552
    • /
    • 2004
  • 데이터마이닝 기법중의 하나인 연관규칙 탐사는 데이터베이스상에서 빈번하게 나타나는 데이터들 중 서로 연관성이 강한 데이터들을 탐색대상으로 한다. 그러나. 빈번하게 나타나지 않는 희소한 데이터들이라 할 지라도 가중치가 높은 중요한 데이터이면서 서로 연관성이 강할 경우 비즈니스정보로서 중요한 가치가 있다. 본 논문에서는 데이터베이스 상에서 희소하게 나타나지만 중요한 의미를 갖고 또한 서로 연관성이 높은 데이터들을 탐사할 수 있는 연관규칙 탐사 알고리즘을 제안한다. 제안한 알고리즘의 성능을 시뮬레이션을 통하여 평가한 결과 희소하면서도 중요한 데이터를 사이의 연간규칙을 효율적으로 탐사함을 알 수 없었다

데이터 마이닝을 위한 이동 에이전트의 효율적인 이주 전략 (An Efficient Migration Strategy of Mobile Agents for Data Mining)

  • 권혁찬;유우종;김흥환;유관종
    • 한국정보처리학회논문지
    • /
    • 제7권5호
    • /
    • pp.1511-1519
    • /
    • 2000
  • 본 논문에서는 데이터 마이닝 (data mining)을 위한 이동 에이전트의 효율적인 이주 전략 알고리즘을 제시한다. 제시한 알고리즘의 목적은 최소의 네트워크 소요시간을 갖도록 이동 에이전트의 이주 계획을 세우는 것이다. 본 논문의 이주 간략 일고리즘을 검증하고 평가하기 우해 데이터 마이닝을 수행하기 위한 세 가지 패러다임-RPC(Remote Procodure Call),이 등 에지전트, locker 패턴이 적용된 이동 에이전트에 대한 수행 평가 모델을 제시하였으며, 시뮬레이션을 수행하여 알고리즘을 평가하였다.

  • PDF

ID3를 활용한 데이터 마이닝 (Data Mining using ID3)

  • 석현태
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.38-41
    • /
    • 2003
  • 현재 전세계적으로 데이터마이닝을 위해 많은 종류의 알고리즘이 사용되고 있으나 사용되는 알고리즘의 정확한 이해 없이는 데이터마이닝 결과를 올바르게 해석할 수 없다. 이러한 측면에서 중요한 의사 결정목 생성 알고리즘의 하나인 ID3의 원리를 다루었고, 이를 실세계에서 가장 널리 사용되고 있는 관계형 데이터베이스에 성공적으로 적용하기 위한 훈련 예의 생성 방법 및 연속치를 취급하는 방법을 제시한다.

  • PDF

Sequential Pattern Mining for Intrusion Detection System with Feature Selection on Big Data

  • Fidalcastro, A;Baburaj, E
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권10호
    • /
    • pp.5023-5038
    • /
    • 2017
  • Big data is an emerging technology which deals with wide range of data sets with sizes beyond the ability to work with software tools which is commonly used for processing of data. When we consider a huge network, we have to process a large amount of network information generated, which consists of both normal and abnormal activity logs in large volume of multi-dimensional data. Intrusion Detection System (IDS) is required to monitor the network and to detect the malicious nodes and activities in the network. Massive amount of data makes it difficult to detect threats and attacks. Sequential Pattern mining may be used to identify the patterns of malicious activities which have been an emerging popular trend due to the consideration of quantities, profits and time orders of item. Here we propose a sequential pattern mining algorithm with fuzzy logic feature selection and fuzzy weighted support for huge volumes of network logs to be implemented in Apache Hadoop YARN, which solves the problem of speed and time constraints. Fuzzy logic feature selection selects important features from the feature set. Fuzzy weighted supports provide weights to the inputs and avoid multiple scans. In our simulation we use the attack log from NS-2 MANET environment and compare the proposed algorithm with the state-of-the-art sequential Pattern Mining algorithm, SPADE and Support Vector Machine with Hadoop environment.