• 제목/요약/키워드: 연관 규칙 알고리즘

검색결과 200건 처리시간 0.023초

매개 변수를 이용한 의사결정나무 생성에 관한 연구 (A study on decision tree creation using intervening variable)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.671-678
    • /
    • 2011
  • 데이터마이닝은 방대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 기법으로서 의사결정나무, 연관 규칙, 군집분석, 신경망 분석 등의 기법이 있으며, 이중 의사결정나무 알고리즘은 의사결정 규칙을 도표화하여 관심대상이 되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 방법으로서 고객세분화, 고객 분류, 문제 예측 등의 여러 분야에서 유용하게 활용되고 있다. 일반적으로 의사결정나무의 모형 생성 시, 모형 생성의 기준 및 입력 변수의 수에 따라 복잡한 모형이 생성되기도 하며 특히 입력 변수의 수가 많을 경우 종종 모형 생성 및 해석에 있어 어려움을 격기도 한다. 이에 본 논문에서는 의사결정나무 생성 시, 입력 변수에 대한 매개 관계를 파악하여 나무 생성에 불필요한 입력 변수를 제거하는 방법을 제시하고 그 효율성을 파악하기 위하여 실제 자료에 적용하고자 한다.

연관 규칙을 이용한 네트워크 기반 침입 탐지 패턴생성 기술 (Pattern Generation Technique for Network-based Intrusion Detection using Association Rules)

  • 소진;이상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.619-621
    • /
    • 2002
  • 네트워크 기반 컴퓨터 시스템은 현대사회에 있어서 매우 중요한 역할을 담당하고 있기 때문에 이들은 정보 범죄들로부터 안정적이면서 효율적인 환경을 제공하는 것은 매우 중요한 일이다. 현재의 침입탐지 시스템은 네트워크 상에서 지속적으로 처리되는 대량의 패킷에 대하여 탐지속도가 떨어지고, 새로운 침입유형에 대한 대응방법이나 인지능력에도 한계가 있기 때문이다. 따라서 다양한 트래픽 속에서 탐지율을 높이고 탐지속도를 개선하기 위한 방안이 필요하다. 본 논문에서는 침입탐지 능력을 개선하기 위해 먼저, 광범위한 침입항목들에 대한 탐지 적용기술을 학습하고, 데이터 마이닝 기법을 이용하여 침입패턴 인식능력 및 새로운 패턴을 생성하는 적용기술을 제안하고자 한다. 침입 패턴생성을 위해 각 네트워크에 돌아다니는 관련된 패킷 정보와 호스트 세션에 기록되어진 자료를 필터링하고, 각종 로그 화일을 추출하는 프로그램들을 활용하여 침입과 일반적인 행동들을 분류하여 규칙들을 생성하였다. 마이닝 기법으로는 학습된 항목들에 대한 연관 규칙을 찾기 위한 연역적 알고리즘을 이용하였다. 또한, 추출 분석된 자료는 리눅스기반의 환경 하에서 다양하게 모아진 네트워크 로그파일들을 본 논문에서 제안한 방법에 따라 적용한 결과이다.

  • PDF

다차원 순차패턴 마이닝을 위한 효율적 알고리즘 (An Efficient Algorithm for Multi-dimensional Sequential Pattern Mining)

  • 이순신;김은주;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.214-216
    • /
    • 2004
  • 순차패턴 마이닝은 데이터들 속에서 어떤 순차 관계가 들어 있는 패턴을 찾는 것이다. 순차 패턴은 다양한 분야에서 중요하게 쓰인다. 예를 들어, 소비자가 구입한 물품들 간의 순차적인 관계성은 다음에 구입할 물건을 예측하는데 쓰일 수 있다. 또한 방문 웹 페이지의 순차 패턴은 사용자가 방문하고자 하는 다음 페이지를 예측하는데 중요할 수 있다. 본 논문에서는 다차원 순차패턴을 마이닝하는 새로운 효율적인 알고리즘의 구현에 대해 설명한다 다차원 순차 패턴 마이닝은 속성-값(attribute-value) 기술을 포함하는 순차 패턴의 연관 규칙을 찾는 것이다. 다음의 두 가지의 현존하는 효율적 알고리즘을 융합하였다. 순차패턴 마이닝을 위한 PrefixSpan 알고리즘과 비 순차패턴 마이닝을 위한 StarCubing 알고리즘. 새로운 알고리즘은 다차원 데이터를 마이닝 하는 StarCubing알고리즘의 효율성을 이용하므로 다차원 순차 데이터를 마이닝 하는데 효율적일 것이다. 실험결과는 제안한 알고리즘이 특히 작은 최소지지도와 작은 cardinality에서 Seq-Dim과 Dim-Seq 같은 현존하는 알고리즘보다 나은 성능임을 보여준다.

  • PDF

지능형 에이전트의 환경 적응성 및 확장성에 대한 연구 (The study on environmental adaptation and expansion of the intelligent agent)

  • 백혜정;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.136-138
    • /
    • 2003
  • 로봇이나 가상 캐릭터와 같은 지능형 에이전트가 자율적으로 살아가기 위해서는 주어진 환경을 인식하고, 그에 맞는 최적의 행동을 선택하는 능력을 가지고 있어야 한다. 본 논문은 이러한 지능형 에이전트를 구현하기 위하여, 외부 환경에 적응하면서 최적의 행동을 배우고 선택하는 방법을 연구하였다. 본 논문에서 제안한 방식은 강화 학습을 이용한 행동기반 학습 방법과 기호 학습을 이용한 인지 학습 방법을 통합한 방식으로 다음과 같은 특징을 가진다. 첫째, 외부 환경의 적응성을 수행하기 위하여 강화 학습을 이용하였으며. 이는 지능형 에이전트가 변화하는 환경에 대한 유연성을 가지도록 하였다. 둘째. 경험들에서 귀납적 기계학습과 연관 규칙을 이용하여 규칙을 추출하여 에이전트의 목적에 맞는 환경 요인을 학습함으로 주어진 환경에서 보다 빠르게, 확장된 환경에서 보다 효율적으로 행동을 선택을 하도록 하였다. 제안한 통합방식은 기존의 강화 학습만을 고려한 학습 알고리즘에 비하여 학습 속도를 향상 시킬수 있으며, 기호 학습만을 고려한 학습 알고리즘에 비하여 환경에 유연성을 가지고 행동을 적용할 수 있는 장점을 가진다.

  • PDF

데이터마이닝을 활용한 성공적 노후 예측 키워드 분석 (An Analysis on the Predictor Keyword of Successful Aging: Focused on Data Mining)

  • 홍서연
    • 한국콘텐츠학회논문지
    • /
    • 제20권3호
    • /
    • pp.223-234
    • /
    • 2020
  • 본 연구는 Hong(2019)의 연구에서 도출된 한국 노인의 성공적인 노후에 영향을 주는 예측 키워드 32개를 중심으로 데이터마이닝의 Apriori 알고리즘을 활용하여 연관관계 규칙을 분석하였다. 그리고 한국 노인의 성공적 노후에 영향을 주는 예측변수들의 규칙 및 패턴을 파악하기 위한 지표로 지지도, 신뢰도, 향상도를 활용하였다. 본 연구의 분석은 R version 3. 5. 1 프로그램으로 분석을 실시하였으며, arulesViz 패기지와 visNetwork 패키지로 시각화하였다. 연구결과 한국 노인들의 성공적인 노후와 연관성이 높은 예측변수는 '취미', '봉사', '준비', '운동'으로 나타났다. 그리고 한국 노인의 성공적 노후를 고려할 때 가장 우선적으로 고려해야 할 변수는 '취미' 이며 그 다음 '봉사', 준비', 운동'의 순으로 고려해야 한다는 결과를 얻었다.

데이터 베이스 특성에 따른 효율적인 데이터 마이닝 알고리즘 (An Efficient Data Mining Algorithm based on the Database Characteristics)

  • 박지현;고찬
    • Journal of the Korean Society for Industrial and Applied Mathematics
    • /
    • 제10권1호
    • /
    • pp.107-119
    • /
    • 2006
  • 인터넷과 웹 기술 발전에 따라 데이터베이스에 축적되는 자료의 양이 급속히 늘어나고 있다. 데이터베이스의 응용 범위가 확대되고 대용량 데이터베이스로부터 유용한 지식을 발견하고자 하는 데이터 마이닝(Data Mining) 기술에 대한 연구가 활발하게 진행되고 있다. 기존의 알고리즘들은 대부분 후보 항목 집합들을 줄임과 동시에 데이터베이스의 크기를 줄이는 방법으로 발전해 오고 있다. 그러나 후보 항목집합들을 줄이는 노력이나 데이터베이스의 크기를 줄이는 방법들이 빈발 항목집합들을 생성하는 전 과정에서 필요로 하지는 않는다. 그러한 방법들이 어느 과정에서는 시간을 줄이는데 효과가 있지만 다른 과정에서는 오히려 그러한 방법들을 적용하는데 더 많은 시간이 소요되기 때문이다. 본 논문에서는 트랜잭션들의 길이가 짧거나 데이터베이스를 이루는 항목들의 수가 비교적 적은 트랜잭션 데이터베이스에서 해슁 기법을 사용하여 데이터베이스를 한 번 스캔하고 동시에 각 트랜잭션에서 발생 가능한 모든 부분집합들을 해쉬 테이블에 저장함으로써 최소 지지도에 영향을 받지 않고 기존의 알고리즘보다 더 짧은 시간에 빈발항목집합을 발견할 수 있는 효과적인 연관 규칙 탐사 알고리즘을 제안하고 실험하였다.

  • PDF

웹로그를 활용한 고속 하이브리드 해외여행 상품 추천시스템 (Rapid Hybrid Recommender System with Web Log for Outbound Leisure Products)

  • 이규식;윤지원
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권12호
    • /
    • pp.646-653
    • /
    • 2016
  • 해외여행시장은 매년 가파르게 성장하고 있는 산업중 하나이며 2016년 11조의 시장을 형성하고 있다. 거대한 시장형성과는 달리 해외여행상품 추천에 대한 국내연구는 전무한 상태이다. 많은 상품 추천 방법들이(협업적 필터링, 내용기반 필터링) 기존 구매 내역을 대상으로 하거나 혹은 상품의 유사성을 이용한 연구들이 주를 이루고 있다. 이러한 연구들은 연산할 데이터의 양이 많아질 경우 속도의 저하와 데이터가 충분히 확보되지 못한 상황 하에서는 좋은 성능을 보여주지 못하고 있다. 해외 여행상품의 특성상 1-2년에 한번정도의 구매패턴과 상품들의 가격대가 상대적으로 높으며, 동일 상품의 구매가 거의 없는 특징이 있기 때문에 일반적인 상품추천 시스템의 고객 프로파일링 방법으로는 적용에 한계가 있다. 이에 웹사용성(Web Usage Mining)을 통한 고객 프로파일링 기법, 데이터의 희소성 문제를 해결하기 위한 연관규칙 알고리즘과 규칙 기반 알고리즘을 결합하여 고속의 상품 추천시스템 방법을 제안한다. 본 논문에서는 연관규칙 방법에서 가장 많이 사용되어지는 Apriori 방법, 규칙기반 방법(Rule Base) 과 실제 여행사의 웹로그를 사용하여 46%라는 높은 추천 성능의 결과를 검증하였으며, 상품의 개수와 고객의 수가 상품추천 처리 속도에 영향을 주지 않으며, 실제 커머셜한 환경 하에서도 1초이내에 상품을 추천해줄 수 있는 결과를 보여준다.

퍼지-뉴럴 네트워크 구조의 최적 동정 (Optimial Identification of Fuzzy-Neural Networks Structure)

  • 윤기찬;박춘성;안태천;오성권
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 춘계학술대회 학술발표 논문집
    • /
    • pp.99-102
    • /
    • 1998
  • 본 논문에서는 복잡하고 비선형적인 시스템의 최적 모델링을 우해서 지능형 퍼지-뉴럴네트워크의 최적 모델 구축을 위한 방법을 제안한다. 기본 모델은 퍼지 추론 시스템의 언어적인 규칙생성의 장점과 뉴럴 네트워크의 학습기능을 결합한 FNNs 모델을 사용한다. FNNs 모델의 퍼지 추론부는 간략추론이 사용되고, 학습은 요류 역전파 알고리즘을 사용하여 다른 모델들에 비해 학습속도가 빠르고 수렴능력이 우수하다. 그러나 기본 모델은 주어진 시스템에 대하여 퍼지 공간을 균등하게 분할하여 퍼지 소속을 정의한다. 이것은 비선형 시스템의 모델링에 있어어서 성능을 저하시켜 최적의 모델을 얻기가 어렵다. 논문에서는 주어진 데이터의 특성을 부여한 공간을 설정하기 위하여 클러스터링 알고리즘을 사용한다. 클러스터링 알고리즘은 주어진 시스템에 대하여 상호 연관성이 있는 데이터들끼리 특성을 나누어 몇 개의 클래스를 이룬다. 클러스터링 알고리즘을 사용하여 초기 FNNs 모델의 퍼지 공간을 나누고 소속함수를 정의한다. 또한, 최적화 기법중의 하나로 자연선택과 자연계의 유전자 메카니즘에 바탕을 둔 탐색 알고리즘인 유전자 알고리즘을 사용하여 주\ulcorner 진 모델에 대하여 최적화를 수행한다. 또한 본 연구에서는 학습 및 테스트 데이터의 성능 결과의 상호 균형을 얻기 위한 하중값을 가긴 성능지수가 제시된다.

  • PDF

Bit-map 방식에 의한 설계규칙 검사 (A Design Rule checker Based on Bit-Mapping)

  • 어길수;김경태;경종민
    • 대한전자공학회논문지
    • /
    • 제22권2호
    • /
    • pp.36-43
    • /
    • 1985
  • NMOS IC layout에서 직사각형 도형의 갯수에 비례하는 검사시간을 소모하는 설제규칙 검사의 알고리즘의 제안되고 그것에 의한 program이 개발 되었다. 일반적인 설계규칙 검사 algorithm의 시간소모는 0(nlogn) 혹은 0(n**1 . 2)에 비례하는데 반하여 (n은 직사각형 도형의 갯수) 이 논문에서는 pattern의 DF(direct format) data와 bit-map plane을 연관 지음으로써 0(n)에 비례하는 시간소모를 달성 할 수 있었다.

  • PDF

MMDB를 이용한 전자상거래 상품추천 시스템 (Recommendation System for E-Commerce using MMDB)

  • 김용기;이경희;한정혜;이충세
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.466-468
    • /
    • 2001
  • 전자상점에서 이루어지는 고객의 구매패턴이 온라인 상에서 데이터베이스화되어, 이를 통하여 고객의 취향에 맞는 상품을 제공할 수 있는 많은 알고리즘이 연구되고 있다. 이러한 알고리즘은 전자상점에서 고객의 개별특성을 고려한 상품을 제공하기 위하여, 고객정보 데이터베이스와 거래정의 데이터베이스로부터 연관규칙 등을 추출하여 사용한다. 그러나 시간의 흐름에 민감한 계절상품이나 특선상품과 같이 전자상점의 거래량에 크게 직결될 수 있는 것 등에도 같은 알고리즘을 적용한다면 추천성공률이 떨어질 것이다. 따라서 본 논문에서는 시간의 영향을 많이 받는 상품추천을 위하여, 최근 전자상점 추천시스템으로 효과적인 아이템 기반 협력알고리즘에 지수적 가중치를 적용하여 추천하는 알고리즘을 제안한다. 또한 이러한 추천시스템이 대용량의 고객데이터와 상품데이터에 대한 연산을 수행하고 다수의 고객에게 실시간으로 서비스를 제공하여야 하므로 MMDB를 활용한다.

  • PDF