• 제목/요약/키워드: 연관성규칙발견

검색결과 62건 처리시간 0.02초

개인화에서 사용자 프로파일 구축을 위한 효과적인 규칙확인 방법 (Efficient Rule Validation Methods for User Profiling in Personalization)

  • 손준원;배기성;석민수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.557-560
    • /
    • 2004
  • 추천 시스템에서부터 1:1 마케팅에 이르는 전자 상거래의 다양한 응용 영역에서, 개별 사용자로부터 개인화된 사용자 프로파일을 구축하는 것은 매우 중요하다. 이러한 프로파일들은 사용자들의 구매 행위와 같은 개인별 행동들을 설명해주며, 특히 다양한 데이터 마이닝(Data Mining) 기술들을 이용해 사용자의 거래 기록으로부터 학습된 규칙들을 발견해낼 수 있다. 발견된 규칙들 중에는 거짓이거나 연관 없거나 또는 하찮은 것들도 존재하기 때문에, 가장 중요한 문제 가운데 하나는 발견된 규칙들을 처리후-분석을 어떻게 수행하느냐이다. 예를 들어, 발견된 규칙을 사용자 프로파일에 적합한 것인지를 확인할 때 좋은 규칙과 나쁜 규칙을 어떻게 판명하는가 하는 문제이다. 이 논문에서는 규칙을 확인하는 과정에서 객관적 척도를 이용하는 방법을 제안하였다.

  • PDF

연관성규칙 발견을 위한 데이터마이닝 알고리즘 설계 (An Efficient Data Mining Algorithm For An Association Rule Discovery)

  • 이해각
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.587-591
    • /
    • 2004
  • 수많은 데이터로부터 우리가 이용할 수 있는 의미 있는 연관성 규칙을 찾는 것은 대단히 중요하다. 연관성 규칙은 데이터베이스의 각 트랜잭션을 분석하여 이에 대한 각종 측정치를 수집하여 이루어지는데 대단히 많은 시간과 노력을 요한다. 본 논문에서는 통계적 추론을 이용하여 탐색도중 주어진 조건을 만족하는 항목에 대하여 의사결정을 내려 탐색시간은 단축할 수 있는 알고리즘을 제안한다. 또한 추론에 따른 오류발생을 최소화 할 수 있는 기법을 제시한다.

  • PDF

적응형 웹 사이트 구축을 위한 연관규칙 알고리즘 개발과 적용 (Development and Application of An Adaptive Web Site Construction Algorithm)

  • 최윤희;전우천
    • 정보처리학회논문지D
    • /
    • 제16D권3호
    • /
    • pp.423-432
    • /
    • 2009
  • 컴퓨터의 보급과 인터넷의 발달로 인해 데이터의 유통은 증가하고 있으나 전통적인 방법으로는 가치 있고 의미 있는 정보를 획득하는 것은 어렵다. 또한, 정보화 사회에서의 많은 정보 중에서 자신에게 알맞은 정보를 탐사하는 데이터 마이닝의 필요성이 대두되고 있다. 또한 사용자들의 편리한 인터넷 항해를 돕고 적절한 정보를 제공할 수 있는 적응형 웹 사이트에 관한 연구도 필요하다. 본 연구의 목적은 사용자들에게 연관성이 있는 웹 페이지를 연결해 주는 적응형 웹 사이트 구축을 위해 웹 로그 분석을 통한 웹 사이트 사용자들의 행동 패턴을 발견하는 연관규칙 알고리즘의 개발에 있다. 데이터 마이닝의 기법 중에서 연관규칙은 웹 사이트에 접속하는 사용자들의 행동을 파악하는데 효과적이다. 본 논문에서는 웹 사용 마이닝을 이용하여 웹 서버의 로그 데이터를 분석하여 트랜잭션을 구성하고, 사용자들의 행동 패턴을 발견하기 위한 의미 있는 문서만을 추출하여 추출된 문서를 대상으로 발견한 빈발 항목으로 연결리스트를 구성하며, 빈발 패턴을 찾아 웹 페이지에 적용하는 일련의 알고리즘을 제안한다. 제안한 알고리즘의 특징은 첫째, 빈발패턴 발견을 위해 생성하는 연결리스트 이외에는 마이닝 과정에서 다른 중간생성물이 필요하지 않으므로 공간 사용면에 있어 효율적이다. 둘째, 기존의 연관규칙 알고리즘에 비해 데이터 베이스의 스캔 횟수를 줄이고, 시간복잡도를 개선하였다.

올바른 연관성 규칙 생성을 위한 의사결정과정의 제안 (Decision process for right association rule generation)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권2호
    • /
    • pp.263-270
    • /
    • 2010
  • 데이터마이닝은 방대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 체계적이고도 자동적으로 찾아내는 기법이다. 데이터마이닝의 중요한 목표 중의 하나는 여러 변수들 간의 관계를 발견하고 결정하는 것이다. 연관성 규칙은 항목 집합으로 표현된 트랜잭션에서 각 항목간의 연관성을 반영하는 규칙으로서, 항목 집합간의 관계를 지지도, 신뢰도, 순수 신뢰도 등과 같은 흥미도 측도에 의해 명확히 수치화함으로써 두 개 이상의 항목집합간의 관련성을 표시해주기 때문에 현업에서 많이 활용되고 있다. 본 논문에서는 기존에 많이 활용되고 있는 흥미도 측도인 신뢰도와 순수 신뢰도의 문제점을 보완하여 연관성 규칙을 올바르게 생성하기 위한 새로운 의사결정과정을 제안하고자 한다. 본 논문에서 제안하는 의사결정과정은 특히 스트리밍 데이터베이스에서의 연관성 규칙을 탐색하는 데 효율적이다.

테이블 형식의 데이터베이스에 대한 규칙의 효율적 발견 (An Efficient Discovery of Rules for Database Table)

  • 석현태
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 춘계종합학술대회논문집
    • /
    • pp.155-159
    • /
    • 2003
  • 데이터마이닝 작업의 대표적 방법 중의 하나인 의사결정목의 자료 단편화 및 소집단 자료에 대한 경시성 문제를 보완할 수 있는 방법으로 연관규칙 알고리즘을 활용한 기술적 규칙집합을 찾는 방법을 기술한다. 이를 위해 연관규칙 발견 알고리즘의 원리를 다루고 이를 테이블 형태의 데이터베이스에 효율적으로 적용하는 방법을 기술한다. 아울러 이러한 방법은 원 연관규칙 알고리즘을 이용할 때보다 효율적 작업이 가능함을 실험 데이터에 대한 분석을 통해 살펴보았다.

  • PDF

인과적 연관성 규칙 평가 기준의 제안 (Proposition of causal association rule thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1189-1197
    • /
    • 2013
  • 연관성 규칙 마이닝은 지지도, 신뢰도, 향상도 등의 흥미도 측도를 기반으로 하여 대용량 데이터베이스를 구성하고 있는 항목들 간의 관련성을 찾아내는 기법이다. 이 기법은 기업의 의사결정 문제, 유통업에서의 교차판매, 고객관리 등 현업에서 많이 활용되고는 있으나, 이러한 기본적인 연관성 평가기준만으로는 두 항목 간의 인과관계를 설명할 수 없다. 본 논문에서는 이러한 문제를 해결하기 위해 인과적 연관성 규칙을 제안하는 동시에, 고려하는 평가 기준들이 흥미도 측도의 조건을 충족하는지의 여부를 점검하였다. 본 논문에서 제안한 인과적 향상도는 세 가지 조건 모두를 만족하는 것으로 입증되었다. 인과적 지지도와 인과적 신뢰도는 동시 발생 확률의 값에 따라 단조 증가하는 조건과 각 항목의 주변 확률의 값에 따라 단조 감소하는 조건은 만족하였다. 반면에 두 항목이 독립이면 연관성 평가기준의 값이 1이 되는 조건에 대해서는 기존의 지지도와 신뢰도와 같이 이 조건이 충족되지 않았다. 또한 예제를 통해 기존의 연관성 평가 기준과 인과적 연관성 평가 기준을 비교해 본 결과, 기존의 평가측도인 지지도와 신뢰도를 기준으로 연관성 규칙 생성 여부를 판단했을 때 탈락되는 규칙도 인과적 평가 기준인 인과적 지지도와 인과적 신뢰도를 이용하여 판단하게 되면 연관성 규칙으로 채택할 수 있다는 사실을 발견하였다.

상품군 연관망 기반의 상품가치 평가모형 (Product Value Evaluation Models based on Itemset Association Chain)

  • 장용식
    • 지능정보연구
    • /
    • 제16권2호
    • /
    • pp.1-17
    • /
    • 2010
  • 연관분석에 의한 연관규칙은 상품 간 연관성을 나타내고 있으며, 교차판매와 상품진열 등의 마케팅 전략에 활용되고 있다. 그러나, 교차판매 효과를 반영하는 더 실질적인 상품가치를 평가한다면, 상품구색과 이윤극대화 등의 기업 의사결정에 더 유용하게 활용될 수 있을 것이다. 본 연구는 단일상품 간의 연관망과 상품군 간의 연관망 기반에서 상품의 순수가치, 이득가치, 손실가치로 구성되는 유효가치를 바탕으로 상품의 가치를 평가하는 수학적 모형을 제시하고, 두 모형에 대해 각각 예시를 통한 평가과정을 기술하였다. 이 경우, 상품군은 단일상품을 포함하기 때문에 상품군 간 연관망 기반에서의 상품가치 평가모형은 단일상품 기반의 평가모형을 포함하고 있다. 모형의 실질적인 유용성을 보이기 위하여, 국내 한 온라인 쇼핑몰의 과거 1년 간 의류 관련 거래데이터 표본을 이용하여 상품분류군 간의 연관규칙을 발견하고 상품분류별 유효가치를 평가하는 실험을 하였다. 표본은 총 106개 상품분류와 48,044건의 거래 데이터로 이루어져 있다. 먼저, SPSS Clementine 12.0을 이용하여 상품분류군 간 18개의 연관규칙을 발견하였다. 한편, 순수가치와 연관규칙을 바탕으로 이득가치, 손실가치를 계산하고 유효가치를 평가하는 JAVA 어플리케이션을 구현하였다. 유효가치 평가의 실험결과, 순수가치보다 큰 유효가치를 갖는 상품분류가 있는 반면, 순수가치 보다 작은 유효가치를 갖는 상품분류를 확인하였다. 본 연구는 상품 연관망에서 일차적인 관계만을 고려한 유효가치를 평가하였다. 향후, 다단계 연관성의 교차판매 효과를 반영하는 고차적인 평가모형 연구는 보다 효과적인 유효가치 평가를 가능케할 것이다.

퍼지 연관규칙을 이용한 지능적 질의해석 (Intelligent Query Analysis using Fuzzy Association Rule)

  • 김미혜
    • 한국산학기술학회논문지
    • /
    • 제11권6호
    • /
    • pp.2214-2218
    • /
    • 2010
  • 대용량 데이터에서 의미있고 유용한 지식을 추출하는 기법 중의 하나인 연관규칙은 데이터베이스에 존재하는 속성들 사이에 유사성 또는 패턴을 기술하여 사용자에게 데이터에 관한 유용한 정보를 줄 수 있다. 기존에 연구되어 온 연관규칙은 이진(boolean) 데이터베이스에 존재하는 유무에 대한 규칙으로 발견하는 것에 대해서 주로 연구되어왔다. 본 논문에서는 정량적 속성의 데이터를 기호적 속성 값으로 바꾼 후 연관규칙을 추출함으로써, 퍼지개념을 사용한 퍼지 연관규칙을 이용한 지능적 질의 처리 시스템을 제안하고자 한다.

향상도 영향 감소화에 의한 연관성 순위결정함수 (Association rule ranking function by decreased lift influence)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.397-405
    • /
    • 2010
  • 데이터 마이닝은 대규모의 데이터베이스에 내재되어 있는 유용한 정보를 찾아내는 과정이며, 중요한 목표 중의 하나는 여러 변수들 간의 관계를 발견하고 결정하는 것이다. 이를 위해 필요한 기법인 연관성 규칙 마이닝은 각 항목들 간의 관련성을 찾아내는 데 활용되며, 지지도, 신뢰도, 향상도 등의 연관성 측도를 기반으로 두 항목간의 관계를 수치화함으로써 의미 있는 규칙을 찾아낸다. 본 논문에서는 3개의 연관기준값들 중 어느 하나라도 기준 이상이 되는 규칙의 순위를 매겨 필요한 연관성 규칙만을 생성할 수 있는 연관성 순위 결정 함수를 개발하는데 기존의 연구 결과를 개선하기 위해 특정 연관 기준값의 영향을 더 많이 받지 않도록 3개 연관기준값의 범위를 조정한 연관성 순위 결정 함수를 제안하고자 한다. 모의실험을 해본 결과, 대체적으로 본 논문에서 제안한 함수는 연관성 측도들과 최저 연관기준값들간의 차이를 잘 반영하고 있으며, 최저 연관성 기준값들의 범위와는 관계없이 항상 -1과 1 사이의 값을 가지며, 최저 연관기준값을 모두 충족하게 되면 1의 값을 가지며, 3개 모두 충족되지 않으면 -1의 값을 갖게 된다는 사실을 알 수 있었다.

데이타마이닝 기법을 이용한 효율적인 전문 용어 클러스터링 (An Efficient Terminology Clustering Method Using Datamining Technique)

  • 이정화;남상엽;문현정;우용태
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.210-215
    • /
    • 2000
  • 최근 대량의 텍스트 문서로부터 의미 있는 패턴이나 연관 규칙을 발견하기 위한 텍스트마이닝 기법에 대한 연구가 활발히 전개되고 있다. 하지만 비정형 텍스트 문서로부터 추출된 용어의 수는 불규칙적이고 일반적인 용어가 많이 추출되는 관계로 일반적인 연관 규칙 탐사 방법을 사용하게 되면 무의미한 연관 규칙이 대량으로 생성되어 지식 정보를 효과적으로 검색하기 어렵다. 본 논문에서는 연관 규칙 탐사 기법을 이용하여 대량의 문서로부터 유용한 지식 정보를 찾기 위하여 의미적으로 연관된 전문 용어들끼리 클러스터링 하기 위한 방법을 제안하였다. 학술 논문을 대상으로 전문 용어를 추출하여 관련된 용어들끼리 클러스터를 구성하는 실험을 통하여 제안된 방법의 효율성을 보였다.

  • PDF