• 제목/요약/키워드: 규칙 탐사

검색결과 192건 처리시간 0.031초

시퀀스 데이터베이스를 위한 유연 규칙 매칭 (Matching of Elastic Rules in Sequence Databases)

  • 박상현;;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.57-60
    • /
    • 2001
  • 본 논문에서는 유연 패턴(elastic pattern)을 갖는 규칙(rule)을 탐사하고 매칭하는 기법에 대해 논의한다. 유연 패턴은 시간 축으로 확장 및 수축할 수 있는 요소들의 순서화된 리스트이다. 유연 패턴은 서로 다른 샘플링 비율을 갖는 데이터 시퀀스들로부터 규칙들을 찾아내는데 유용하게 사용된다. 본 연구에서는 헤드(head: 규칙의 왼쪽 부분)와 바디(body: 규칙의 오른쪽 부분)가 모두 유연 패턴으로 구성된 규칙들을 신속하게 찾도록 하기 위하여 데이터 시퀀스로부터 서픽스 트리(suffix tree)를 구성한다. 이 서픽스 트리는 유연 규칙들의 압축된 표현이며, 타깃 헤드 시퀀스와 매치되는 규칙을 찾기 위한 인덱스 구조로서 사용된다. 만일, 매치되는 규칙을 찾을 수 없는 경우에는 규칙 완화(rule relaxation)의 개념을 이용한다. 클러스터 계층(cluster hierarchy)과 완화 오차(relaxation error)를 사용하여 타깃 헤드 시퀀스의 고유한 정보를 대부분 포함하고 있는 최소한으로 완화된 규칙을 찾는다. 다양한 실험을 통한 성능 평가를 통하여 제안한 기법의 우수성을 검증한다.

  • PDF

GMS 에서의 공간 연관 규칙 탐사 시스템의 설계 및 구현 (Design and Implementation of Spatial Association Rule in GMS)

  • 안찬민;이주홍;전석주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.105-108
    • /
    • 2005
  • 본 논문에서는 지리정보 시스템인 GMS 를 기반으로 한 공간 연관 규칙의 구현과 설계 방법을 제안한다. GMS 에는 비공간 데이터와 공간 데이터가 테이블로 구분되어 저장되어 있다. 이를 이용하여 비공간 데이터 집합에서 관련된 데이터 집합을 추출한 후 그에 해당되는 공간 데이터를 이용하여 공간 연관 정보를 찾아내서 연관 규칙을 발견하는 방법에 대입하여 공간 연관 규칙을 발견한다.

  • PDF

시퀀스 데이터베이스에서 유연 규칙의 탐사 및 매칭 (Discovering and Matching Elastic Rules in Sequence Databases)

  • 박상현;;김상욱
    • 한국통신학회논문지
    • /
    • 제26권7A호
    • /
    • pp.1162-1169
    • /
    • 2001
  • 유연 패턴은 시간 축으로 확장 및 수축할 수 있는 요소들의 순서화된 리스트이다. 유연 패턴은 서로 다른 샘플링 비율을 갖는 데이터 시퀀스들로부터 규칙들을 찾아내는데 유용하게 사용된다. 본 연구에서는 헤드(head: 규칙의 왼쪽 부분)와 바디(body: 규칙의 오른쪽 부분)가 모두 유연 패턴으로 구성된 규칙들을 신속하게 찾도록 하기 위하여 데이터 시퀀스로부터 서픽스 트리(suffix tree)를 구성한다. 이 서픽스 트리는 유연 규칙들의 압축된 표현이며, 타깃 헤드 시퀀스와 매치되는 규칙을 찾기 위한 인덱스 구조로서 사용된다. 만일, 매치되는 규칙을 찾을 수 없는 경우에는 규칙 완화(rule relaxation)의 개념을 이용한다. 클러스터 계층(cluster hierarchy)과 완화 오차(relaxation error)를 사용하여 타깃 헤드 시퀀스의 고유한 정보를 대부분 포함하고 있는 최소한으로 완화된 규칙을 찾는다. 다양한 실험을 통한 성능 평가를 통하여 제안한 기법의 우수성을 검증한다.

  • PDF

데이터마이닝 기법을 이용한 변압기 부하패턴 분석 (Load Pattern Analysis of Distribution Transformer using Data Mining Techniques)

  • 신진호;김영일;이봉재;송재주;양일권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 제39회 하계학술대회
    • /
    • pp.1879-1880
    • /
    • 2008
  • 시간 데이터마이닝은 기존 데이터마이닝에 시간 개념을 추가하여 시간 속성을 가진 데이터로부터 이전에 잘 알려지지는 않았지만 묵시적이고 잠재적으로 유용한 시간 지식을 탐사하는 기술이다. 이 논문에서는 시간 속성을 가진 변압기 부하 패턴에 대해 시간의 변화에 따른 적용 시점이 명확한 지식 탐사가 가능하고, 향후 부하 예측에 있어 탐사된 규칙과 시간 지식을 이용함으로써 기존의 정적인 분류규칙을 적용한 방법보다 더 정확한 예측을 할 수 있는 새로운 시간 패턴 마이닝 기법을 제안한다.

  • PDF

가중연관규칙 탐사를 이용한 재활훈련운동과 근육 활성의 연관성 분석 (Analysis on Relation between Rehabilitation Training Movement and Muscle Activation using Weighted Association Rule Discovery)

  • 이아름;박용군;권대규;김정자
    • 전자공학회논문지CI
    • /
    • 제46권6호
    • /
    • pp.7-17
    • /
    • 2009
  • 효과적인 재활 시스템을 구상하는데 있어서 훈련 데이터의 정교한 분석은 다음 단계 훈련을 위한 피드백 자료로서 매우 중요하다. 현재 다양한 생체 역학적 실험을 통해 인간의 운동 능력을 평가하고 이로부터 생성된 데이터의 분석을 위한 객관적이고 신뢰성 있는 연구결과들이 발표되고 있다. 그러나 대부분의 기존 연구들은 기초 통계적인 방법에 근거한 정량분석만을 수행함으로써, 획득된 정보를 임상에 적용 하는데 있어서는 충분한 신뢰성을 보장할 수 없다. 데이터마이닝은 대용량 데이터에 들어있는 숨겨진 규칙과 패턴을 탐사함으로써 임상 데이터에 숨어있는 의미 있는 정보추출에 성공적으로 사용되고 있으며, 특히 임상 연구 분야에서는 훌륭한 의사 결정 지원 시스템으로서 점점 그 사용이 증가되고 있다. 본 연구에서는 신뢰성 있는 자세 제어 능력(Postural control ability) 평가를 위해서 측정된 훈련 데이터에 가중연관규칙 탐사를 적용하여 자세 훈련 유형에 따른 근육 활성 패턴과의 연관성을 분석, 효율적인 재활 훈련 규칙을 탐사하였다. 탐사된 규칙은 재활 및 임상 전문가의 의사결정에 더욱 정성적이고 유용한 선험적 지식으로 사용 될 수 있으며, 이를 근거로 환자 맞춤형 최적의 재활 훈련 모델을 구상하기 위한 지표로서 사용될 수 있다.

연관 규칙 탐사 기법을 이용한 해양 전문 검색 엔진에서의 질의어 처리에 관한 연구 (Research on User's Query Processing in Search Engine for Ocean using the Association Rules)

  • 하창승;윤병수;류길수
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.8-15
    • /
    • 2003
  • 최근 여러 가지 정보들이 WWW를 경유하여 제공되고 있기 때문에 검색엔진의 필요성은 점점 커지고 있다. 그러나 대부분의 검색엔진은 정보의 추출을 위해 웹 문서와 사용자 질의를 단순 패턴비교 방법을 사용함으로써 검색엔진의 효율은 비교적 낮은 편이다. 일반적으로 사용자의 검색 목적에 따라 다른 검색 엔진이 사용되기 때문에 여러 전문검색엔진을 개발하고 있지만 대부분의 검색엔진들이 사용자의 요구를 제대로 반영하고 있지 못하다. 본 연구에서는 웹 데이터마이닝의 연관규칙을 이용하여 사용자 질의를 처리하는 해양전문검색엔진을 제안한다. 데이터 마이닝 분야에서 주로 연구되어온 연관규칙탐사 기법은 지지도와 신뢰도에 따라 연관자료의 확신도를 측정할 수 있기 때문에 웹 문서 사이의 관련성을 입증하는데 이 규칙을 적용하여 기존의 검색 방법에서 자료의 재현률과 정확률을 개선하였다.

  • PDF

유용한 연관 규칙 추출을 위한 시각적 탐색 기반 접근법 (Visual Exploration based Approach for Extracting the Interesting Association Rules)

  • 김준우;강현경
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.177-187
    • /
    • 2013
  • 연관 규칙 탐사는 다양한 분야에서 널리 쓰이는 데이터 마이닝 기법으로 트랜잭션 데이터에 포함된 이산적인 항목들 간의 인과관계를 추출하는데 목적을 둔다. 하지만 분석자들은 때로 방대한 양의 데이터에서 추출된 많은 연관규칙들을 해석하고 활용하는데 곤란을 겪기도 한다. 이러한 문제점을 해결하기 위하여 본 논문에서는 주어진 트랜잭션 데이터에서 유용한연관 규칙을 탐색하기 위한 새로운 방법인 HTM 접근법을 제안하고자 한다. HTM 접근법은 크게 계층 군집, 테이블 뷰 및 모자이크 플롯의 세 가지 단계로 구성되며, 각 단계는 분석자들에게 적절한 시각적 표현을 제공한다. 예시를 위해 본 논문에서는 상기 접근법을 건강 검진 결과 데이터 분석에 적용하였으며, 실험결과 HTM 접근법을 통해 분석자들은 유용한 규칙들을 보다 효과적으로 탐색할 수 있을 것으로 기대된다.

T-알고리즘을 이용한 연관규칙의 효과적인 감축 (An Effective Reduction of Association Rules using a T-Algorithm)

  • 박진희;정환묵
    • 한국지능시스템학회논문지
    • /
    • 제19권2호
    • /
    • pp.285-290
    • /
    • 2009
  • 데이터에 숨겨진 패턴을 탐색하는 데이터마이닝에서 가장 많은 연구가 이루어진 분야가 연관규칙 마이닝이다. 연관규칙 마이닝에서는 방대한 수의 트랜잭션 데이터를 다루게 되므로 고속처리 방식의 실현이 중요한 과제가 되고 있다. 그리고 연관규칙 탐사기법에서 규칙을 도출하는데 소요되는 시간은 데이터에 포함되어 있는 항목의 수에 비례하여 기하급수적으로 늘어나기 때문에 규칙의 수를 줄이는 과정이 필연적으로 요구된다. 본 논문에서는 트랜잭션 데이터 항목들을 이진형식으로 비교하여 연관성 규칙의 수를 효과적으로 감축할 수 있고 항목간의 지지도와 신뢰도를 함께 향상 시킬 수 있는 T-알고리즘을 제안하고 시뮬래이션을 통하여 확인하였다.

복합 해쉬트리를 이용한 효율적인 연관규칙 탐사 알고리즘 (An Efficient Algorithm for Mining Association Rules using a Compound Hash Tree)

  • 이재문;박종수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권3호
    • /
    • pp.343-352
    • /
    • 1999
  • 본 논문에서는 대용량 데이터베이스에서 효율적인 연관 규칙 탐사에 대한 알고리즘을 제안하였다. 제안하는 알고리즘은 복합 해쉬 트리를 사용하여 해쉬 트리 탐색 비용과 데이터베이스 스캔 비용을 동시에 줄임으로서 성능을 향상시켰다. 복합 해쉬 트리는 같은 크기의 항목집합들 대신에 크기가 다른 여러 항목집합을 하나의 해쉬 트리로 구성한다. 복합 해쉬 트리의 유용성을 보이기 위하여 제안한 알고리즘은 잘 알려져 있는 Apriori, DHP 방밥과 수행 시간 측면에서 성능 비교를 하였다. 그 결과 대부분의 최소 지지도에서제안한 알고리즘이 Apriori, DHP 방법보다 우수하게 나타났으며, 최소 지지도가 0.5% 이하인 경우 DHP 방법에 비하여 약 30%의 이득 향상이 있었다.

시퀀스 데이터베이스에서 유연 규칙의 탐사 (Elastic Rule Discovering in Sequence Databases)

  • 박상현;김상욱;김만순
    • 산업기술연구
    • /
    • 제21권A호
    • /
    • pp.147-153
    • /
    • 2001
  • This paper presents techniques for discovering rules with elastic patterns. Elastic patterns are useful for discovering rules from data sequences with different sampling rates. For fast discovery of rules whose heads and bodies are elastic patterns, we construct a suffix tree from succinct forms of data sequences. The suffix tree is a compact representation of rules, and is also used as an index structure for finding rules matched to a target head sequence. When matched rules cannot be found, the concept of rule relaxation is introduced. Using a cluster hierarchy and a relaxation error, we find the least relaxed rules that provide the most specific information on a target head sequence. Performance evaluation through extensive experiments reseals the effectiveness of the proposed approach.

  • PDF