• 제목/요약/키워드: 연관 마이닝

검색결과 488건 처리시간 0.027초

인위적 데이터를 이용한 군집분석 프로그램간의 비교에 대한 연구 - A Research-In-Progress Paper -

  • 김성호;백승익;최종연
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 추계정기학술대회:지능형기술과 CRM
    • /
    • pp.349-357
    • /
    • 2000
  • 인터넷 비즈니스나 전자상거래와 연관되어 고객관계관리 (Customer Relationship Management: CRM)가 널리 확산됨으로 해서 군집분석에 대한 관심이 한층 높아졌고, 다양한 군집분석 프로그램이 시장에 소개되어 지고 있다. 그러나, 군집분석 프로그램들은 다른 데이터 분석 기법과는 달리 그들의 정확성을 측정하기가 매우 힘들다. 본 논문에서는 이미 알려져 있는 군집구조를 지닌 인위적 데이터를 사용하여 반복적 군집분석 프로그램 (Convergent Cluster Analysis: CCA)과 보다 전통적인 단순군집 프로그램 (One-Shot Clustering Program: Howard-Harris 프로그램), 그리고 데이터 마이닝 기법 중의 하나인 데모그래픽 군집분실 프로그램의 정확성을 비교하기 위한 현재 진행 중인 연구의 방법론을 제시하는데 그 주요 목적을 두고 있다.

  • PDF

웹마이닝을 이용한 상품 추천시스템 설계 및 구현 (A Design and Implementation of Goods Recommendation System using Web Mining)

  • 이경호;박두순
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2003년도 춘계학술발표논문집
    • /
    • pp.222-225
    • /
    • 2003
  • 웹의 급속한 성장으로 수많은 양의 정보가 매일같이 쏟아져 나오고 있다. 이는 특정 상품정보를 얻으려는 고객들에게 많은 혼란을 야기할 수 있다. 이러한 문제의 해결을 위해 추천시스템이 개발되었고, 추천 시스템은 고객들이E-Commerce 상에서 상품을 구매하는 것을 도와주기 위해서 지속적인 증가추세로 사용되고 있다. 이러한 추천시스템은 다양한 고객들의 선호도에 따라 유사성과 비유사성에 대한 정보의 기초위에서 고객들의 잠재적인 관심 항목들에 대해 개인의 취향에 맞게 추천하는 기술들을 제공한다. 그러나, 추천시스템에 많은 관심을 가짐에도 불구하고 그들의 성능에 대한 공개된 기술이나 정보는 매우 제한적이다. 본 논문에서는, 과거 고객들의 구매행동, 고객정보 데이터마이닝의 연관규칙을 이용한 E-Commerce 추천시스템을 설계하고 구현하였다.

  • PDF

개인화에서 사용자 프로파일 구축을 위한 효과적인 규칙확인 방법 (Efficient Rule Validation Methods for User Profiling in Personalization)

  • 손준원;배기성;석민수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.557-560
    • /
    • 2004
  • 추천 시스템에서부터 1:1 마케팅에 이르는 전자 상거래의 다양한 응용 영역에서, 개별 사용자로부터 개인화된 사용자 프로파일을 구축하는 것은 매우 중요하다. 이러한 프로파일들은 사용자들의 구매 행위와 같은 개인별 행동들을 설명해주며, 특히 다양한 데이터 마이닝(Data Mining) 기술들을 이용해 사용자의 거래 기록으로부터 학습된 규칙들을 발견해낼 수 있다. 발견된 규칙들 중에는 거짓이거나 연관 없거나 또는 하찮은 것들도 존재하기 때문에, 가장 중요한 문제 가운데 하나는 발견된 규칙들을 처리후-분석을 어떻게 수행하느냐이다. 예를 들어, 발견된 규칙을 사용자 프로파일에 적합한 것인지를 확인할 때 좋은 규칙과 나쁜 규칙을 어떻게 판명하는가 하는 문제이다. 이 논문에서는 규칙을 확인하는 과정에서 객관적 척도를 이용하는 방법을 제안하였다.

  • PDF

데이터마이닝기법을 이용한 인터넷교육 맞춤 시스템 (Internet Learning customized System for using Data Mining Techniques)

  • 이진호;류준석;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.763-764
    • /
    • 2009
  • 정보통신 기술의 발전은 우리의 생활 전반에 걸쳐 빠르게 흡수되며 급속히 진행되고 있다. 특히 교육의 패러다임이 변화됨에 따라 오늘날 인터넷을 기반으로 한 가상교육의 형태는 학생들로 하여금 더 많은 지식 습득 기회를 제공한다. 본 논문에서는 인터넷상의 교육 시스템에서 개인의 정보를 수집하고, 개인별 교육성향을 분석하여 개인별로 적절한 서비스를 제공하기 위한 연구를 하였다. 데이터 마이닝 기법 중 연관규칙과 클러스터링 협업 필터링을 이용하여 학습자의 교육성향을 파악할 수 있다. 이를 마케팅에 적용한다면 학습자의 선호도를 상승시키고 해당 회사에 신뢰도가 높아져 이익을 증가시킬 수 있는 시스템으로 활용될 수 있다.

효율적인 카테고리 분류기법에 의한 연관 도메인 추천 서비스 (Related domain service by effective categorization)

  • 허형욱;이은주;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.702-705
    • /
    • 2008
  • 인터넷 사용자 증가에 따라 검색 엔진의 사용 또한 급격히 늘어나고 있는 추세이다. 국내외 다양한 검색 엔진들이 존재하지만 대부분의 자료들이 기본적인 카테고리별로 링크 횟수나 키워드 빈발 횟수에 따라 정렬이 되어 있다. 그러므로 사용자들은 수동적으로 정렬된 도메인들을 따라 가는 실정이다. 본 논문에서는 수동적인 서비스가 아닌 능동적인 서비스에 중점을 둔다. 특정 카테고리 내에서 접속한 사용자에게 최근 시점을 기준으로 가장 빈번하게 접속된 도메인 정보를 제공하여 시간의 단축과 유용한 서비스를 받도록 한다. 본 논문의 서비스 모델은 인터넷 사용자의 로그 데이터베이스와 도메인 데이터베이스를 기반으로 한다. 본 논문에서 제안하는 카테고리 분류 기법으로 두 데이터베이스를 통합하고 정제한다. 정제된 데이터들은 최종적으로 순차 패턴 마이닝 기법에 의해 최종 빈발 패턴을 추출 하게 되고 특정 카테고리에 접속한 사용자에게 도메인 형태로 변환 되어 서비스 하게 된다.

위치에 따른 연령대별 유용한 행동패턴 추출 기법 (Efficient Mining of User Behavior patterns by classification of age based on location information)

  • 김혜란;이승철;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.250-253
    • /
    • 2007
  • 통신기술의 발달로 무선단말기의 보급이 급증하고 무선 네트워크 사용이 일반화됨으로써, 최근 유비쿼터스 컴퓨팅 기술이 중요한 이슈가 되고 있다. 유비쿼터스 컴퓨팅은 시간과 장소의 한계를 넘어 사용자가 하고자 하는 일을 컴퓨팅 환경이 상황을 인지하여 돕는 것을 가능하게 한다. 상황인지를 위해 순차패턴과 시간 연관규칙 탐사를 이용하여 사용자의 행동패턴을 추출하는 연구가 활발히 진행되고 있다. 이러한 연구를 통한 행동패턴은 사용자의 특성을 간과하게 되며, 각 사용자에게 더욱 유용한 서비스를 제공하기 위해서는 사용자를 분류하는 것이 필요하다. 그러나 기존의 연구는 단지 통계적인 사용자의 빈발 행동패턴만을 추출하여 각 사용자의 관심사와는 무관한 서비스 제공이 이루어질 수 있다. 성별, 나이, 직업 등의 개인정보와 위치를 고려하여 사용자에게 더욱 더 효율적이고 유용한 서비스를 제공할 수 있도록 행동패턴을 유형별로 분류할 필요가 있다. 본 논문에서는 각 위치에 따른 사용자의 연령대별 유용한 행동패턴을 추출하여 정확한 서비스를 제공할 수 있는 마이닝 기법을 제안한다.

FP-tree를 이용한 효율적인 수강신청 로드맵 제시 기법 (Roadmap of an application for attending the lecture by FP-tree)

  • 박영욱;이승철;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.243-246
    • /
    • 2007
  • 데이터베이스 시스템 사용이 거의 모든 분야에 걸쳐서 필수적인 요소가 되어가고 있다. 따라서 데이터베이스 내에 축적된 정보들의 양과 더불어 정보와 정보 사이의 연관성이 중요한 관심사로 대두되고 있다. 이를 충족하기 위한 구체적인 방안으로 데이터마이닝 기법이 개발되고 발전해나가고 있다. 현재 수강신청시 많은 학생들이 필수 로드맵이라는 단편적인 정보를 가지고 수업 시간표를 구성함으로써 개개인이 많은 시간을 허비하고 있다. 이에 본 논문에서는 관련성 있는 정보 추출에 용이한 FP-Growth 마이닝 기법을 이용하여 수강신청시 도움이 되는 수강신천 로드맵 기법을 제안한다.

빈발 패턴 네트워크에서 아이템 클러스터링을 통한 연관규칙 발견 (Discovering Association Rules using Item Clustering on Frequent Pattern Network)

  • 오경진;정진국;하인애;조근식
    • 지능정보연구
    • /
    • 제14권1호
    • /
    • pp.1-17
    • /
    • 2008
  • 데이터 마이닝은 대용량의 데이터에 숨겨진 의미있고 유용한 패턴과 상관관계를 추출하여 의사결정에 활용하는 작업이다. 그 중에서도 고객 트랜잭션의 데이터베이스에서 아이템(item) 사이에 존재하는 연관규칙을 찾는 것은 중요한 일이 되었다. Apriori 알고리즘 이후 연관규칙을 찾기 위해 대용량의 데이터베이스로부터 압축된 의미있는 정보를 저장하기 위한 데이터 구조와 알고리즘들이 많이 제안되어 왔다. 연관규칙을 발견하기 위한 기존의 연구들은 모든 규칙을 찾아내지만, 사람이 분석하기에 너무 많은 규칙이 생성되기 때문에 규칙을 분석하기 위한 일 또한 많은 과정을 거쳐야 한다. 본 논문에서는 빈발 패턴 네트워크(Frequent Pattern Network)라 부르는 자료 구조를 제안하고 이를 활용하였다. 네트워크는 정점과 간선으로 구성되며 정점은 아이템을 표현하고, 간선은 두 아이템 집합을 표현한다. 아이템의 빈도수를 이용하여 빈발 패턴 네트워크를 구성하고, 아이템 사이의 유사도를 측정한다. 그리고 클러스터 내의 아이템과는 유사도가 높고, 다른 클러스터의 아이템과는 유사도가 낮도록 클러스터를 생성한다. 클러스터를 이용해 연관규칙을 생성하고 실험을 통해 Apriori와 FP Growth 알고리즘과의 성능을 비교를 하였다. 그 결과 빈발 패턴 네트워크에서 신뢰도 유사도를 이용하는 것이 클러스터의 정확성을 높여줌을 볼 수 있었다. 그리고 전통적인 방법과 비교를 통해 빈발 패턴 네트워크를 이용하는 것이 최소지지도에 유연성을 가짐을 알 수 있었다.

  • PDF

CPC 코드 기반 사물인터넷(IoT) 특허의 기술 연관성 규칙 분석 (Analysis of Technology Association Rules Between CPC Codes of the 'Internet of Things(IoT)' Patent)

  • 심재륜
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.493-498
    • /
    • 2019
  • 본 연구는 4차 산업혁명 ICT 기반기술의 핵심인 사물인터넷 특허의 CPC 코드 기반 기술 연관성 규칙 분석에 관한 것이다. 데이터 마이닝을 위한 오픈 소스인 R을 이용하여 CPC 코드간 기술 연관성 규칙을 도출하였다. 이를 위해 2019년 7월까지 특허청에 출원된 사물인터넷(Internet of Things) 관련 특허 605건 중 복합 CPC 코드를 가지는 369건을 대상으로 서브클래스(Subclass) 수준까지 분석하였다. 기술 연관성 규칙 분석 결과 지지도가 높은 CPC 코드는 [H04W ${\rightarrow}$ H04L](18.2%), [H04L ${\rightarrow}$ H04W](18.2%), [G06Q ${\rightarrow}$ H04L](17.3%), [H04L ${\rightarrow}$ G06Q](17.3%), [H04W ${\rightarrow}$ G06Q](9.8%), [G06Q ${\rightarrow}$ H04W](9.8%), [G06F ${\rightarrow}$ H04L](7.9%), [H04L ${\rightarrow}$ G06F](7.9%), [G06F ${\rightarrow}$ G06Q](6.2%), [G06Q ${\rightarrow}$ G06F](6.2%), [G06F ${\rightarrow}$ G06Q](6.2%) 순이고, CPC 코드간 상호 연결망을 분석한 결과 기술 연관성 관련 핵심 CPC 코드는 G06Q와 H04L이다. 본 연구 결과를 활용하면 앞으로의 특허 경향을 예상해 볼 수 있다.

데이터 마이닝을 이용한 리튬 이차전지의 전류밀도 영향인자 분석 (Design Analysis of Current Density in Lithium Secondary Battery Using Data Mining Techniques)

  • 정동호;이종수;최하영
    • 대한기계학회논문집A
    • /
    • 제38권6호
    • /
    • pp.677-682
    • /
    • 2014
  • 본 연구에서는 데이터 마이닝의 방법인 의사결정나무와 인공신경망을 이용하여 리튬 이차전지의 전류밀도 특성에 대해 핵심 설계 인자를 도출하고 비교하였다. 먼저 의사결정나무-인공신경망 모델을 이용한 설계방법으로, 비선형성을 나타내는 초기 극판 설계인자들 중에 의사결정나무 모델을 통해 주요 설계 인자를 도출한 다음 인공신경망을 이용하여 설계인자들 간의 중요도와 전류밀도와의 가중치 분석을 수행하였다. 두 번째 방법은 인공신경망 모델만을 이용한 방법으로, 초기 설계인자들을 별도의 주요 인자 도출 과정 없이 모두 인공신경망을 구축하는데 사용하여 전류밀도와의 연관성 및 가중치를 분석하였다.