• 제목/요약/키워드: Temporal Association Rules

검색결과 27건 처리시간 0.027초

시간 속성을 갖는 이벤트의 의미있는 희소 관계에 기반한 연관 규칙 탐사 (Finding Association Rules based on the Significant Rare Relation of Events with Time Attribute)

  • 한대영;김대인;김재인;송명진;황부현
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.691-700
    • /
    • 2009
  • 이벤트는 환자의 증상과 같이 시간 속성을 갖는 하나의 흐름을 의미하며 인터벌 이벤트는 시작과 종료 시점에 대한 시간 간격을 갖는다. 그리고 시간 데이터마이닝에 대한 많은 연구가 있었지만 환자 이력, 구매자 이력, 로그 이력과 같은 인터벌 이벤트에 대한 지식 탐사 방법에 대한 연구는 미흡하다. 이 논문에서는 이벤트들의 인과 관계에 대한 연관 규칙을 탐사하고 이 규칙에 기반하여 결과 이벤트 발생을 예측하는 시간 데이터마이닝 방법을 제안한다. 제안 방법은 이벤트 시간 속성을 사용하여 인터벌 이벤트로 요약하고 이벤트들의 인과 관계를 탐사하여 이벤트 발생을 예측한다. 성능평가를 통하여 제안 방법은 다양한 지지도를 적용하여 발생 빈도에 상관없이 이벤트 발생에 높은 영향을 주는 의미있는 희소 관계를 발견함으로써 기존의 데이터마이닝 기법에 비하여 보다 우수한 정보를 탐사할 수 있다.

시간 데이타마이닝 프레임워크 (Temporal Data Mining Framework)

  • 이준욱;이용준;류근호
    • 정보처리학회논문지D
    • /
    • 제9D권3호
    • /
    • pp.365-380
    • /
    • 2002
  • 시간 데이타마이닝은 기존 데이타마이닝에 시간 개념을 추가하여 "시간값을 가진 대용량 데이타로부터 이전에 잘 알려지지는 않았지만, 묵시적이고 잠재적으로 유용한 시간 지식을 탐사하는 기술"로 정의된다. 시간 지식이란 주기적 패턴, 캘린더 패턴, 경향 등과 같이 시간 의미와 시간 관계를 가진 지식을 말한다. 실세계에서는 환자의 병력, 상품 구매 이력, 웹 로그 등과 같은 다양한 시간 데이타가 존재하며 이로부터 여러 형태의 유용한 시간 지식을 찾아낼 수 있다. 데이타마이닝에 대한 연구가 진행되면서 순차 패턴, 유사 시계열 탐사, 주기적 연관규칙 탐사 등과 같이 시간 지식을 탐사하고자 하는 시간 데이타마이닝에 대한 부분적인 연구가 수행되었다. 그러나 기존 연구는 단순히 데이타의 발생 순서 및 유사한 패턴을 찾아내는데 중점을 두고 있어 데이타가 포함하고 있는 시간 의미와 시간 관계를 탐사하는데 부족하며, 시간 지식의 전체적인 측면보다는 연관 규칙과 같은 일부분만을 다루고 있다는 문제점을 가지고 있다. 따라서 이 논문에서는 시간 데이타마이닝에 대한 체계적인 연구를 위하여 시간 데이타마이닝에 대한 기존 연구 내용과 해결해야 할 문제점을 분석하고 이를 바탕으로 전체적인 프레임워크를 제시하였다. 또한 그 구현 방안 및 적용평가를 수행하였다. 프레임워크에서는 시간 데이타마이닝 모델을 제안하고, 이를 바탕으로 시간 데이타마이닝 질의어와 시간 지식을 탐사할 수 있는 시간 데이타마이닝 시스템을 설계하였다.

Finding associations between genes by time-series microarray sequential patterns analysis

  • Nam, Ho-Jung;Lee, Do-Heon
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.161-164
    • /
    • 2005
  • Data mining techniques can be applied to identify patterns of interest in the gene expression data. One goal in mining gene expression data is to determine how the expression of any particular gene might affect the expression of other genes. To find relationships between different genes, association rules have been applied to gene expression data set [1]. A notable limitation of association rule mining method is that only the association in a single profile experiment can be detected. It cannot be used to find rules across different condition profiles or different time point profile experiments. However, with the appearance of time-series microarray data, it became possible to analyze the temporal relationship between genes. In this paper, we analyze the time-series microarray gene expression data to extract the sequential patterns which are similar to the association rules between genes among different time points in the yeast cell cycle. The sequential patterns found in our work can catch the associations between different genes which express or repress at diverse time points. We have applied sequential pattern mining method to time-series microarray gene expression data and discovered a number of sequential patterns from two groups of genes (test, control) and more sequential patterns have been discovered from test group (same CO term group) than from the control group (different GO term group). This result can be a support for the potential of sequential patterns which is capable of catching the biologically meaningful association between genes.

  • PDF

복수 데이터베이스에서 링크를 이용한 연관 규칙 탐사 (Mining Association Rules in Multiple Databases using Links)

  • 배진욱;신효섭;이석호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권8호
    • /
    • pp.939-954
    • /
    • 1999
  • 데이타마이닝 분야에서는 대용량의 트랜잭션 데이타베이스와 같은 하나의 데이타베이스로부터 연관 규칙을 찾는 연구가 많이 수행되어왔다. 그러나, 창고형 할인매장이나 백화점 같이 고객 카드를 이용하는 판매점의 등장으로, 단지 트랜잭션에 대한 분석 뿐만이 아니라, 트랜잭션과 고객과의 관계에 대한 분석 또한 요구되고 있다. 즉, 두 개의 데이타베이스로부터 연관 규칙을 찾는 연구가 필요하다. 이 논문에서는 두 데이타베이스 사이에 링크를 생성하여 연관 항목집합을 찾는 알고리즘을 제안한다. 실험 결과, 링크를 이용한 알고리즘은 고객 데이타베이스가 메모리에 거주가능한 크기라면 시간에 따른 분석에 유용함을 보여주었다.Abstract There have been a lot of researches of mining association rules from one database such as transaction database until now. But as the large discount store using customer card emerges, the analysis is not only required about transactions, but also about the relation between transactions and customer data. That is, it is required to search association rules from two databases. This paper proposes an efficient algorithm constructing links from one database to the other. Our experiments show the algorithm using link is useful for temporal analysis of memory-resident customer database.

Analysis of Group Process with Instant Messaging Technology

  • Park Sanghyuk;Cho Namjae
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2003년도 추계학술대회
    • /
    • pp.41-54
    • /
    • 2003
  • This study examines group process patterns when Instant Messaging is used for decision-making, and examines how these patterns are associated with creative solutions to problems. Our research suggests that certain communication behavior of a group, when appropriately organized, can enhance creative production of outcomes. A qualitative analysis is conducted on communication patterns based on text-based conversation protocols. Specifically, this research tries to extend existing studies on group-work by focusing on the interactive communication process among participants. Study results include that the production of creative outcome depends on the temporal sequence of discussion pattern among group members. (1) Appropriate control of the discussion process is essential to obtain a high level of performance. (2) It is also important to set up discussion rules and rules for the use of communication medium in the early stages of the discussion . (3) Active participants use various protocol types while less-active members rely mainly on 'cognitive' protocols.

  • PDF

Depreciation of Non-Temporal Investment

  • Mohammadi, Shaban;Dashtbayaz, Mahmoud Lari
    • Asian Journal of Business Environment
    • /
    • 제5권3호
    • /
    • pp.17-21
    • /
    • 2015
  • Purpose - This paper compares current requirements for depreciation accounting from the Financial Accounting Standards Board in America for equity securities and all debt securities with determinable fair value, and disclosure requirements related to the fair value of securities below registered cost with the requirements of the international Financial Reporting Standards Board and accounting standards committee. Research design, data, and methodology - Mini-review statements are examined relating to depreciation of investments in America and the Financial Accounting Standards depreciation of investments in Iran that meet the requirements of international reporting standards and the Iranian Accounting Standards Committee. Results - Accounting rules for depreciation of investments in securities requires a good deal of judgment. In particular, devaluation decisions during the recession and market crisis were controversial, although even with no clear guidelines on devaluation, sometimes such decisions were simple. Conclusions -Companies can choose from formal policies applied uniformly and documentations of interest to provide a summary of the principles and conclusions obtained through disclosure, enabling market participants to assess the entity's conclusions reasonably, thereby easing investor and market worries.

연관 규칙을 이용한 이동 호스트의 선반입 알고리즘 (A Prefetch Algorithm for a Mobile Host using Association Rules)

  • 김호숙;용환승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.163-173
    • /
    • 2004
  • 최근 이동 컴퓨팅 환경에서 위치 기반 서비스를 지원하는 다양한 응용이 증가하고 있다. 본 논문은 이동 컴퓨팅 환경에서 대량의 공간 데이타베이스를 기반으로 효율적인 정보 서비스를 제공하기 위한 새로운 연관성 기반 선반입 알고리즘인 STAP을 제안한다. STAP은 이동 환경에서의 위치 기반 질의가 갖는 시-공간적 연관성을 이용한다. 또한 사용자의 이동 특성과 공간 데이타의 중요도를 함께 고려한다. STAP은 기존의 캐쉬 정책에서 고려하지 못했던 서비스 사이의 연관성이라는 새로운 측면을 고려함으로써 캐쉬 정책의 차원을 한 단계 높이는 계기가 되었다. 또한 성능 평가를 통하여 제안된 선반입 알고리즘의 효율성을 입증하였다.

Construction of Customer Appeal Classification Model Based on Speech Recognition

  • Sheng Cao;Yaling Zhang;Shengping Yan;Xiaoxuan Qi;Yuling Li
    • Journal of Information Processing Systems
    • /
    • 제19권2호
    • /
    • pp.258-266
    • /
    • 2023
  • Aiming at the problems of poor customer satisfaction and poor accuracy of customer classification, this paper proposes a customer classification model based on speech recognition. First, this paper analyzes the temporal data characteristics of customer demand data, identifies the influencing factors of customer demand behavior, and determines the process of feature extraction of customer voice signals. Then, the emotional association rules of customer demands are designed, and the classification model of customer demands is constructed through cluster analysis. Next, the Euclidean distance method is used to preprocess customer behavior data. The fuzzy clustering characteristics of customer demands are obtained by the fuzzy clustering method. Finally, on the basis of naive Bayesian algorithm, a customer demand classification model based on speech recognition is completed. Experimental results show that the proposed method improves the accuracy of the customer demand classification to more than 80%, and improves customer satisfaction to more than 90%. It solves the problems of poor customer satisfaction and low customer classification accuracy of the existing classification methods, which have practical application value.

실시간 추천을 위한 분할셋 기반 Up-to-Moment 선호모델 탐색 (Mining the Up-to-Moment Preference Model based on Partitioned Datasets for Real Time Recommendation)

  • 한정혜;변루나
    • 인터넷정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.105-115
    • /
    • 2007
  • 최근 들어 유비퀴터스 컴퓨팅에 대한 많은 연구들이 활발히 시작되고 있는데, 특히 모바일을 활용한 실시간 추천 모델에 대한 요구는 점차 커지고 있다. 본 연구에서는 기존 대용량 데이터베이스에서 실시간 추천을 위하여 Up-To-Moment 연관규칙 탐색 알고리즘이 있는데, 보다 더 정교하게 과거의 거래 세부정보까지 고려할 수 있도록 UP-To-Moment 데이터 셋의 과거 데이터 셋 부분을 (k-1)개로 분할-조합규칙을 적용하는 연관규칙 선호모델을 제안하였다. 제안된 모델은 전자상점 뿐만 아니라 유비퀴터스 컴퓨팅에 적용 가능한 레스토랑 음식 추천 데이터에 대하여, 전통적인 Up-To-Moment 연관규칙 탐색모델 $EM_{past'}$ 데이터 셋 크기값을 가중 조합한 $EM^w_{past'}$ 그리고 시간에 따른 지수평활법 분할-조합규칙을 적용한 $EM^{ES}_{past}$을 비교하여 보았다. 특히 $EM^{ES}_{past}$의 지수평활 상수 a 값의 변화에 따른 세 알고리즘의 연관규칙 계산에 대한 민감도도 비교함으로써, 실제 데이터 적용 시에 보수적 또는 진보적 실시간 추천의 선택이 가능하도록 하였다. 세 알고리즘의 비교 시뮬레이션 결과를 보면, 데이터 셋 크기 값을 가중 조합한 $EM^w_{past}$이 가장 효율이 떨어지는 것으로 나타났으며, 누적된 과거 데이터 셋의 크기가 클수록 $EM^{ES}_{past}$의 정확성이 높은 추천을 하는 것으로 나타났다.

  • PDF