• 제목/요약/키워드: 규칙 탐사

검색결과 192건 처리시간 0.032초

데이터마이닝에서 수량연관규칙 탐사방법

  • 박원환
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.91-96
    • /
    • 2003
  • 연관규칙은 데이터베이스에 잠재되어 있는 유용한 정보를 탐사하는 방법으로 데이터마이닝의 한 분야이다. 이는 항목의 발생유무만을 고려하는 이진연관규칙에 대한 연구가 주였으나, 최근에는 항목의 수량까지 고려하는 수량연관규칙 탐사가 소개되고 있다. 수량연관규칙은 수량속성 항목을 임의의 방법으로 여러 개의 소구간 항목으로 분할한 후, 각각을 이진항목으로 취급하여 연관규칙을 탐사하는 방법이다. 본 논문에서는 분할된 여러 소구간 분할항목들 중에서 필요 소구간 항목만을 선택적으로 탐사하는 방법을 제안한다. 제안방법은 블린항목제약식을 사용하여 수량항목의 탐사범위를 제한함으로써 모든 분할을 탐사하지 않고 필요 소구간만을 탐사하기 때문에 탐사시간을 단축할 수 있다.

  • PDF

데이터의 상대 지지도를 이용한 다단계 연관 규칙 탐사 기법 (Discovery of Multiple-Level Association Rules using Relative Support of Data)

  • 하단심;황부현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.195-197
    • /
    • 2000
  • 데이더는 다양한 빈도 형태와 속성을 가지고 있으며 데이터의 연관 규칙 탐사 시 이러한 데이터의 빈도수를 고려할 수 있는 방법이 필요하다. 그러나 기존의 연관 규칙 탐사 알고리즘은 지지도와 신뢰도만을 가지고 데이터의 연관성을 발견하며 데이터들의 발생 빈도는 고려하지 않는다. 본 논문에서는 하위 단계의 데이터나 동일한 단계지만 상대적으로 발생 빈도가 적은 데이터들의 연관 규칙을 탐사할 수 있는 방법을 제안한다. 제안하는 방법은 데이터의 상대 지지도를 이용한 다단계 연관 규칙 탐사 기법을 수행함으로써 데이터의 발생 빈도를 고려한 연관 규칙을 탐사할 수 있다. 그리고 탐사된 연관 규칙은 마케팅 분야 등의 여러 응용에서 유용하게 이용될 수 있다.

  • PDF

SQL을 이용한 연관 규칙 탐사 시스템 (An Association Rules Mining System based-on SQL)

  • 전수정;김영지;우용태
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.89-94
    • /
    • 2000
  • 본 논문에서는 연관 규칙 탐사 시스템을 설계하고 구현하였다. 본 시스템은 관계형 데이터베이스의 표준 질의어를 이용하여 사용자가 제시한 질의 조건을 만족하는 항목집합에 대해 다양한 형태의 연관규칙을 탐사하기 위한 시스템이다. 질의처리 모듈에서는 사용자가 제시한 조건을 만족하는 질의를 동적으로 구성하여, 연관 규칙 탐사를 위해 사용되는 대상 트랜잭션 데이타베이스의 범위를 조절할 수 있다. 연관 규칙을 발견하기 위한 후보 항목집합을 생성하기 위해 연관 규칙 탐사 알고리즘을 사용하였다. 연관 규칙 알고리즘에서는 한 트랜잭션 데이타에 대해 생성될 수 있는 후보 항목집합을 배열을 이용하여 처리하는 효율적인 방법을 제안하였다.

  • PDF

시간지원 데에터베이스에서의 시간 연관규칙 탐사 시스템의 설계 (Design of a Temporal Association Rule Mining System in Temporal Databases)

  • 이강태;정동원;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.229-231
    • /
    • 1998
  • 시간지원 데이터베이스내에는 다양한 유형의 시간 정보가 내포되어 있다. 이 논문은 다양한 시간 정보를 기반으로 하는 시간 연관규칙 탐사에 관한연구이다. 기존의 연관규칙 탐사에 관한 연구는 현실세계에 존재하는 사건을 탐사 대상으로 하면서도 시간 개념을 지니지 않은 형태의 데이터 집합을 대상으로 하고 있다. 그리고 단순히 단일 시점의 트랜잭션 시간마을 고려하여 순차패턴을 추출해내는 연구가 진행되었다. 이러한 연구는 시간 데이터의 시간 간격 특성과 시간 위상 특성을 간과하게 된다. 또한 시간 종속적인 데이터에 관한 정보의 탐사 시에는 한계점을 지니게 된다. 따라서 이 논문에서는 시간 간격과 시간 위상을 지니는 시간지원 데이터베이스로부터 추출될 수 있는 시간 정보 유형을 제시하고 이에 기반한 다양한 유형의 연관규칙을 제시한다. 또한 시간 연관규칙을 정의하고 이를 탐사하는 과정을 설명하며 궁극적으로 시간지원 데이터베이스에서의 시간 연관규칙 탐사 시스템을 소개한다.

설문 데이터를 위한 다차원 연관 규칙 마이닝 (Multi-Dimensional Association Rule Mining in Survey Data)

  • 이정수;김교정
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2003년도 춘계학술대회
    • /
    • pp.395-399
    • /
    • 2003
  • 본 논문에서는 인문 사회과학 분야의 방대한 설문 데이터를 처리하기 위해 기존의 설문 항목들간의 평면적 관계에만 국한 되었던 연구에 대해 설문데이터 다차원 연관규칙 마이닝 시스템을 설계하고 데이터 간의 연관규칙을 탐사한다. 즉, 직관적으로 분류될 수 있는 기준에 따라 클러스터링을 실행하여 데이터를 분류한 후 각 클러스터로부터 다차원 연관 규칙을 탐사하는 시스템을 제안함으로써 보다 강력한 연관규칙을 탐사한다.

  • PDF

주가 예측을 위한 규칙 탐사 및 매칭 (Rule Discovery and Matching for Forecasting Stock Prices)

  • 하유민;김상욱;원정임;박상현;윤지희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권3호
    • /
    • pp.179-192
    • /
    • 2007
  • 본 논문에서는 주식 데이타베이스로부터 과거 주가 변화 패턴에 대한 규칙을 탐사함으로써 투자자에게 주식 투자 유형을 추천해 주는 방안에 관하여 논의한다. 먼저, 본 논문에서는 주식 투자 유형의 추천을 위한 새로운 규칙 모델을 정의한다. 제안된 모델에서는 빈번하게 발생하는 주가 변화 패턴의 이후의 주가 변화 경향이 투자자의 투자 조건과 매치하는 경우, 이 종목에 대한 투자 유형을 추천하도록 하는 방식을 사용한다. 이때, 빈번하게 발생하는 패턴을 규칙의 헤드로 간주하며, 이후의 주가 변화 경향을 규칙의 바디로 간주한다. 본 연구에서는 규칙 헤드는 투자자의 특성에 별다른 영향을 받지 않는 반면, 규칙 바디에 대한 조건은 투자자마다 다르다는 점에 착안하여 규칙 탐사 과정에서 전체 규칙이 아닌 규칙 헤드들만을 탐사하여 저장해 두는 새로운 방식을 제안한다. 이 결과, 투자자 별로 달라질 수 있는 규칙 바디에 대한 조건을 유연하게 정의하는 것을 허용하며, 규칙의 수를 줄임으로써 전체 규칙 탐사 성능을 개선할 수 있다. 효율적인 규칙 탐사와 매칭을 위하여 빈번 패턴들을 효과적으로 탐사하는 방법, 빈번 패턴 베이스를 구축하는 방법, 그리고 이들을 인덱싱 하는 방법을 제안한다. 또한, 투자자의 질의가 발생하는 경우, 빈번 패턴 베이스로부터 이와 매치되는 규칙을 발견하고, 이 결과를 이용하여 투자자에게 투자 유형을 추천해 주는 방법을 제안한다. 실제 주식 데이타를 이용한 다양한 실험을 통하여 제안된 기법의 우수성을 규명한다.

항목 계층 구조에 기반한 빈발 항목 집합 나열 방법 (Item Hierarchy based Frequent Itemset Ordering Method)

  • 김준우;강현경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2013년도 춘계 종합학술대회 논문집
    • /
    • pp.301-302
    • /
    • 2013
  • 연관 규칙 탐사는 이산적인 항목들을 포함하는 트랜잭션 데이터에 존재하는 항목 간 동시 발생 관계를 찾아내는 데 그 목적을 두고 있다. 연관 규칙은 {전항}${\rightarrow}${후항}의 형태를 갖고, 전, 후항은 모두 사전에 정의된 지지도 하한을 만족하는 빈발 항목 집합으로 구성된다. 연관 규칙 탐사에서 문제가 되는 것은 일반적으로 탐사되는 빈발 항목 집합의 개수가 많아지면서 규칙의 개수도 많아지고, 이들 사이에 중복성이 존재한다는 점이다. 따라서 단순히 지지도나 신뢰도 순으로 빈발 항목 집합이나 규칙을 나열하기보다는 항목들의 연관성을 고려하는 것이 분석자에게 보다 도움이 될 수 있다. 본 논문에서는 이를 위하여 연관 규칙 탐사와 함께 계층 군집 분석을 실시하여 항목들 간 연관성을 정리하고, 이를 토대로 빈발 항목 집합들을 나열하는 방법을 제안하고자 한다.

  • PDF

상대 지지도를 이용한 의미 있는 희소 항목에 대한 연관 규칙 탐사 기법 (Mining Association Rules on Significant Rare Data using Relative Support)

  • 하단심;황부현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.577-586
    • /
    • 2001
  • 최근의 데이타베이스 연구 분야에서는 대규모의 데이타베이스에 저장된 데이타를 분석하여 데이타베이스에 존재하지만 쉽게 드러나지 않는 암시적인 지식을 탐사하는 기술인 데이타마이닝이 각광받 고 있다. 본 논문에서는 이러한 데이타 마이닝의 기법 중의 하나인 연관 규칙 탐사 기법온 연구하며 비록 데이타베이스에서 희소하게 나타나는 데이타이지만 임의의 데이타와 높온 비율로 동시에 나타나는 의미 있는 희소 데이타를 고려한 연관 규칙 탐사 기법을 제안한다. 또한 이러한 희소 항목의 탐사에 대하여 기 존의 연판 규칙 탐사 알고리즘과 제안한 알고리즘의 성능을 비교하여 평가한다.

  • PDF

대화형 환경에서 효율적인 연관 규칙 알고리즘 (Efficient Algorithms for Mining Association Rules Under the Interactive Environments)

  • 이재문
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.339-346
    • /
    • 2001
  • 대화형 환경에서 연관 규칙 탐사 문제는 동일한 데이터베이스에서 다른 최소 지지도로 반복적으로 연관 규칙을 탐사하는 것이다. 이 문제는 반복적으로 연관 규칙을 탐사한다는 사실만 기존의 연관 규칙 탐사와 다를 뿐 기존의 연관 규칙 탐사에서 발생하는 모든 문제를 포함한다. 본 논문은 전 단계에 계산된 후보 항목집합에 대한 정보를 이용함으로써 성능 향상을 가져오는 효율적인 알고리즘을 제안한다. 제안된 알고리즘은 대화형 환경에서 기존의 알고리즘과 수행 시간 측면에서 비교되었다. 성능 비교의 결과로부터 제안하는 알고리즘이 기존의 방법보다 약 10~30% 정도의 상대적 성능 향상 효과가 있음을 알 수 있었다.

  • PDF

다차원 스트림 데이터의 연관 규칙 탐사 기법 (Mining Association Rules in Multidimensional Stream Data)

  • 김대인;박준;김홍기;황부현
    • 정보처리학회논문지D
    • /
    • 제13D권6호
    • /
    • pp.765-774
    • /
    • 2006
  • 연관 규칙 탐사는 데이터베이스를 분석하여 잠재되어 있는 지식을 발견하기 위한 기법으로 스트림 데이터 시스템에서 연관 규칙 탐사에 대한 연구가 활발하게 진행되고 있다. 그러나 대부분의 연구들은 센서에서 수집되는 단일 스트림 데이터에 관한 것이며 다차원 스트림 데이터간의 연관 정보는 간과하고 있다. 본 논문에서는 다차원 스트림 데이터간의 연관 규칙을 탐사할 수 있는 AR-MS 방법을 제안한다. AR-MS 방법은 한 번의 데이터 스캔으로 연관 규칙 탐사에 필요한 요약 정보를 구축함으로써 스트림 데이터의 특성을 반영하며, 자주 발생하지는 않지만 특정 이벤트와 빈번하게 발생하는 의미 있는 희소 항목 집합에 대한 연관 규칙을 탐사할 수 있다. 또한 AR-MS 방법은 구축된 요약 정보를 사용하여 다차원 스트림 데이터간의 최대 빈발 항목 집합에 대한 연관 규칙도 탐사한다. 그리고 다양한 실험을 통하여 제안하는 방법이 기존의 방법들에 비하여 우수함을 확인하였다.