• 제목/요약/키워드: Rule Items

검색결과 246건 처리시간 0.023초

조건부 확률증분비를 이용한 연관성 순위 결정 함수 (Association rule ranking function using conditional probability increment ratio)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.709-717
    • /
    • 2010
  • 연관성 규칙 마이닝은 각 항목들 간의 관련성을 찾아내는 데 활용되며, 지지도, 신뢰도, 향상도 등의 연관성 측도를 기반으로 두 항목간의 관계를 수치화함으로써 의미 있는 규칙을 찾아낸다. 본 논문에서는 조건부 확률 증분비를 이용한 연관성 순위 결정 함수를 제안하고자 한다. 특히 항목 집합간의 고유한 연관성 정도를 제대로 반영하기 위해 조건부 확률 증분비를 이용하여 연관성 순위 결정 함수를 제안하여 3개의 연관기준값들 중 어느 하나라도 기준 이상이 되는 규칙의 순위를 매겨 필요한 연관성 규칙만을 생성할 수 있도록 한다. 모의실험을 해본 결과, 본 논문에서 제안한 함수는 기존의 함수와는 달리 특정 연관 기준값의 영향을 받지 않으며, 최저 연관성 기준값들의 범위와는 관계없이 항상 -1과 1 사이의 값을 가진다는 사실을 확인할 수 있었다. 또한 조건부 확률 증분비를 이용한 연관순위결정 함수는 대체적으로 연관성 측도들과 최저 연관기준값들간의 차이를 잘 반영하고 있는 것으로 나타났다.

연관 규칙과 협력적 여과 방식을 이용한 추천 시스템 (Recommender System using Association Rule and Collaborative Filtering)

  • 이기현;고병진;조근식
    • 지능정보연구
    • /
    • 제8권2호
    • /
    • pp.91-103
    • /
    • 2002
  • 기존의 인터넷 웹사이트에서는 사용자의 만족을 극대화시키기 위하여 사용자별로 개인화 된 서비스를 제공하는 협력적 필터링 방식을 적용하고 있다. 협력적 여과 기술은 비슷한 선호도를 가지는 사용자들과의 상관관계를 기반으로 취향에 맞는 아이템을 예측하여 특정 사용자에게 추천하여준다. 그러나 협력적 필터링은 추천을 받기 위해서 특정 수 이상의 아이템에 대한 평가를 요구하며, 또한 전체 사용자에 대해 단지 비슷한 선호도를 가지는 일부 사용자 정보에 의지하여 추천함으로써 나머지 사용자 정보를 무시하는 경향이 있다. 그러나 나머지 사용자 정보에도 추천을 위한 유용한 정보가 숨겨져 있다. 우리는 이러한 숨겨진 유용한 추천 정보를 발견하기 위하여 본 논문에서는 협력적 여과 방식과 함께 데이터 마이닝(Data Mining)에서 사용되는 연관 규칙(Association Rule)을 추천에 사용한다. 연관 규칙은 한 항목 그룹과 다른 항목 그룹 사이에 존재하는 연관성을 규칙(Rule)의 형태로 표현한 것이다. 이와 같이 생성된 연관 규칙은 개인 구매도 분석, 상품의 교차 매매(Cross-Marketing), 카탈로그 디자인, 염가 매출품(Loss Leader)분석, 상품 진열, 구매 성향에 따른 고객 분류 다양하게 사용되고 있다. 그러나 이런 연관 규칙은 추천 시스템에서 잘 응용되지 못하고 있는 실정이다. 본 논문에서 우리는 연관 규칙을 추천 시스템에 적용해, 항목그룹 사이에 연관성을 유도함으로써 추천에 효율적으로 사용할 수 있음을 보였다 즉 전체 사용자의 히스토리(History) 정보를 기반으로 아이템 사이의 연관 규칙을 유도하고 협력적 여과 방식과 함께 보조적으로 연관 규칙을 추천을 위해 사용함으로써 추천 시스템에 효율성을 높였다.

  • PDF

Guideline on Acceptance Test and Commissioning of High-Precision External Radiation Therapy Equipment

  • Kim, Juhye;Shin, Dong Oh;Choi, Sang Hyoun;Min, Soonki;Kwon, Nahye;Jung, Unjung;Kim, Dong Wook
    • 한국의학물리학회지:의학물리
    • /
    • 제29권4호
    • /
    • pp.123-136
    • /
    • 2018
  • The complex dose distribution and dose transfer characteristics of intensity-modulated radiotherapy increase the importance of precise beam data measurement and review in the acceptance inspection and preparation stages. In this study, we propose a process map for the introduction and installation of high-precision radiotherapy devices and present items and guidelines for risk management at the acceptance test procedure (ATP) and commissioning stages. Based on the ATP of the Varian and Elekta linear accelerators, the ATP items were checked step by step and compared with the quality assurance (QA) test items of the AAPM TG-142 described for the medical accelerator QA. Based on the commissioning procedure, dose quality control protocol, and mechanical quality control protocol presented at international conferences, step-by-step check items and commissioning guidelines were derived. The risk management items at each stage were (1) 21 ionization chamber performance test items and 9 electrometer, cable, and connector inspection items related to the dosimetry system; (2) 34 mechanical and dose-checking items during ATP, 22 multileaf collimator (MLC) items, and 36 imaging system items; and (3) 28 items in the measurement preparation stage and 32 items in the measurement stage after commissioning. Because the items presented in these guidelines are limited in terms of special treatment, items and practitioners can be modified to reflect the clinical needs of the institution. During the system installation, it is recommended that at least two clinically qualified medical physicists (CQMP) perform a double check in compliance with the two-person rule. We expect that this result will be useful as a radiation safety management tool that can prevent radiation accidents at each stage during the introduction of radiotherapy and the system installation process.

장바구니 크기가 연관규칙 척도의 정확성에 미치는 영향 (Effect of Market Basket Size on the Accuracy of Association Rule Measures)

  • 김남규
    • Asia pacific journal of information systems
    • /
    • 제18권2호
    • /
    • pp.95-114
    • /
    • 2008
  • Recent interests in data mining result from the expansion of the amount of business data and the growing business needs for extracting valuable knowledge from the data and then utilizing it for decision making process. In particular, recent advances in association rule mining techniques enable us to acquire knowledge concerning sales patterns among individual items from the voluminous transactional data. Certainly, one of the major purposes of association rule mining is to utilize acquired knowledge in providing marketing strategies such as cross-selling, sales promotion, and shelf-space allocation. In spite of the potential applicability of association rule mining, unfortunately, it is not often the case that the marketing mix acquired from data mining leads to the realized profit. The main difficulty of mining-based profit realization can be found in the fact that tremendous numbers of patterns are discovered by the association rule mining. Due to the many patterns, data mining experts should perform additional mining of the results of initial mining in order to extract only actionable and profitable knowledge, which exhausts much time and costs. In the literature, a number of interestingness measures have been devised for estimating discovered patterns. Most of the measures can be directly calculated from what is known as a contingency table, which summarizes the sales frequencies of exclusive items or itemsets. A contingency table can provide brief insights into the relationship between two or more itemsets of concern. However, it is important to note that some useful information concerning sales transactions may be lost when a contingency table is constructed. For instance, information regarding the size of each market basket(i.e., the number of items in each transaction) cannot be described in a contingency table. It is natural that a larger basket has a tendency to consist of more sales patterns. Therefore, if two itemsets are sold together in a very large basket, it can be expected that the basket contains two or more patterns and that the two itemsets belong to mutually different patterns. Therefore, we should classify frequent itemset into two categories, inter-pattern co-occurrence and intra-pattern co-occurrence, and investigate the effect of the market basket size on the two categories. This notion implies that any interestingness measures for association rules should consider not only the total frequency of target itemsets but also the size of each basket. There have been many attempts on analyzing various interestingness measures in the literature. Most of them have conducted qualitative comparison among various measures. The studies proposed desirable properties of interestingness measures and then surveyed how many properties are obeyed by each measure. However, relatively few attentions have been made on evaluating how well the patterns discovered by each measure are regarded to be valuable in the real world. In this paper, attempts are made to propose two notions regarding association rule measures. First, a quantitative criterion for estimating accuracy of association rule measures is presented. According to this criterion, a measure can be considered to be accurate if it assigns high scores to meaningful patterns that actually exist and low scores to arbitrary patterns that co-occur by coincidence. Next, complementary measures are presented to improve the accuracy of traditional association rule measures. By adopting the factor of market basket size, the devised measures attempt to discriminate the co-occurrence of itemsets in a small basket from another co-occurrence in a large basket. Intensive computer simulations under various workloads were performed in order to analyze the accuracy of various interestingness measures including traditional measures and the proposed measures.

연관 규칙 탐사 응용을 위한 한 번 읽기에 의한 최대 크기 빈발항목 추정기법 (Approximation of Frequent Itemsets with Maximum Size by One-scan for Association Rule Mining Application)

  • 한갑수
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.475-484
    • /
    • 2008
  • 최근에는 데이터를 획득 및 처리하는 방법의 향상으로 인하여 연속적이고 실시간으로 발생되는 데이터를 처리하는 응용이 증가하고 있다. 그러한 응용에서 연관규칙을 추출하기 위해서는 새로운 방식을 사용하여 빈발항목집합을 찾아내야 한다. 기존의 빈발항목을 발견하는 방식에서는 전체 데이터베이스를 반복적으로 읽으면서 처리해야 한다. 그러나 실시간이고 연속적으로 발생하는 데이터를 처리하는 응용에서는 반복적으로 여러 번 데이터를 읽을 수 없기 때문에 일정 구간의 데이터를 한 번만 읽고 처리해야 한다. 따라서 본 논문에서는 입력되는 데이터 구간을 한 번만 읽고 최대 빈발항목 집합의 크기와 해당 빈발항목을 추정함으로써 필요한 연관규칙탐사를 가능하게 하는 빈발항목 추정 기법을 제안한다.

연관규칙 흥미성 척도의 실용성 향상을 위한 장바구니 크기 효과 반영 방안 (Utilizing the Effect of Market Basket Size for Improving the Practicality of Association Rule Measures)

  • 김원서;정승렬;김남규
    • 정보처리학회논문지D
    • /
    • 제17D권1호
    • /
    • pp.1-8
    • /
    • 2010
  • 연관규칙 마이닝은 물품들 간의 동시 구매 패턴 파악에 사용되는 대표적 마이닝 기법 중 하나로, 카탈로그 설계, 교차판매, 매장배치 등 다양한 마케팅 전략 수립에 활용된다. 방대한 데이터로부터 도출된 많은 연관규칙 중 수익성이 있는 규칙만을 식별해 내는 작업은 지나치게 많은 시간 및 비용을 필요로 한다. 따라서 연관규칙들의 흥미성 평가 과정을 신속하고 체계적으로 수행하기 위해 다양한 흥미성 척도들이 고안되어 왔다. 하지만 신뢰도와 지지도를 비롯한 대다수의 척도들은 대상 물품들의 발생 빈도수에만 근거하여 도출되므로, 실제 판매 현상을 정확하게 반영하지 못한다는 한계를 갖는다. 예를 들어, 기존의 척도는 매우 큰 장바구니에서 동시 구매된 한 건의 거래와 작은 크기의 장바구니에서 동시 구매된 한 건의 거래를 동일한 빈도로 측정한다. 그런데 매우 큰 장바구니에서는 서로 연관관계가 없는 물품들이 우연히 동시에 존재할 가능성이 크므로, 이에 대한 보정이 이루어지는 것이 타당하다. 기존의 척도들과 달리, 본 논문에서는 장바구니 크기 효과를 반영한 흥미성 척도를 새롭게 소개한다. 제안하는 척도는 큰 바구니에서 발생한 패턴과 작은 바구니에서 발생한 패턴에 대해 상이한 가중치를 부여하는 방식으로 계산됨으로써, 우연히 발생한 패턴으로 인해 결과가 왜곡되는 현상을 최소화할 수 있을 것으로 기대된다. 또한, 시뮬레이션 데이터 및 실 데이터에 대한 실험을 통해 제안하는 척도와 기존 척도가 다양한 환경 하에서 보이는 정확성과 일관성을 분석하고 그 결과를 제시하였다.

XOnto-Apriori: 확장된 온톨로지 추론 기반의 연관 규칙 마이닝 알고리즘 (XOnto-Apriori: An eXtended Ontology Reasoning-based Association Rule Mining Algorithm)

  • 이종현;김장원;정동원;이석훈;백두권
    • 정보처리학회논문지D
    • /
    • 제18D권6호
    • /
    • pp.423-432
    • /
    • 2011
  • 이 논문에서는 연관 규칙 마이닝 알고리즘의 정확도를 향상시키기 위하여 기존 Onto-Apriori 알고리즘을 확장한 XOnto-Apriori 알고리즘을 제안한다. 기존 알고리즘은 트랜잭션 항목의 식별자만을 비교하여 지지도를 계산하기 때문에 유사한 속성을 가진 항목들간의 관계를 분석하지 못하는 문제점을 지닌다. 이러한 문제점을 해결하기 위해 제안 알고리즘은 온톨로지 추론 기반의 속성 비교를 통해 같은 식별자를 지니지 않는 항목들간의 관계성도 지지도 계산에 반영할 수 있도록 한다. 제안 알고리즘의 규칙 생성 과정을 명확히 서술하기 위해 스마트폰 어플리케이션 추천 시스템을 설계하였으며 이 시스템은 기존 알고리즘 기반의 시스템에 비해 보다 나은 속도와 정확도를 보였다.

제조업근로자의 행동에 대한 인적요인 및 오류관계 연구 (The relationship between human factor and error for behavior of manufacturing industry employee)

  • 윤용구
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2007년도 추계학술대회
    • /
    • pp.107-119
    • /
    • 2007
  • The purpose of this article is to examine the relationship between unsafe behavior, human factor and human error. For the object, several correlation analyses for those three elements were implemented. Several hypotheses for the relationship between them was suggested. The suggested hypotheses were verified by a comprehensive survey received from 132 safety manager of manufacturing industry. The conclusions were proven from the hypotheses verificaiton as belows; 1) The dependent relation items between unsafe behavior and human factor are dress protection tool, machine(equipment) and working rule have a dependent relation. 2) The dependent relation items between human factor and human error are uncommunication, control, slaps, fatigue, education, system, unmonitoring, failure. 3) The dependent relation items between human error and unsfafe behavior are decline and product/working method,failure and uncommunication have a dependent relation.

  • PDF

작업시간창이 주어진 크로스토킹 터미널에서 미 선적 물량 최소화를 위한 입출고 트럭 일정계획 (Inbound and Outbound Truck Scheduling to Minimize the Number of Items Unable to Ship in Cross Docking Terminals with a Time Window)

  • 주철민;김병수
    • 대한산업공학회지
    • /
    • 제37권4호
    • /
    • pp.342-349
    • /
    • 2011
  • This paper considers the inbound and outbound truck scheduling problem in a cross docking terminal. The unloading process from inbound trucks and loading process to outbound trucks are assumed to be performed within a time window. If some items are not able to be loaded to their scheduled outbound trucks within the time window, they are stored in the terminal and shipped using the truck visiting the next time window. The objective of this paper is to schedule inbound and outbound trucks to minimize the number of items unable to ship within the time window. A mathematical model for an optimal solution is derived, and a rule-based local search heuristic algorithm and genetic algorithm (GA) are proposed. The performance of the algorithms are evaluated using randomly generated several examples.

기본적인 연관평가기준 전부를 고려한 비선형 회귀모형에 의한 연관성 규칙 수의 결정 (Non-linear regression model considering all association thresholds for decision of association rule numbers)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권2호
    • /
    • pp.267-275
    • /
    • 2013
  • 데이터 마이닝 기법들 중에서도 연관성 규칙은 가장 최근에 개발된 기법으로 대용량 데이터베이스에서 각 항목들 간의 관련성을 찾아내며, 두 항목간의 관계를 명확히 수치화함으로써 두 개 이상의 항목간의 관련성을 표시하여 주기 때문에 현장에서 직접 적용이 가능하다. 일반적으로 연관성 규칙 생성 여부를 판단할 때, 각 항목간의 연관성을 반영하는 기준인 지지도, 신뢰도, 향상도 등의 흥미도 측도를 활용하게 된다. 실제적으로 연관성 규칙의 수를 결정하기 위해서는 이들 흥미도 측도들의 평가기준을 정하기 위해 반복적으로 조정 과정을 거쳐야 한다. 본 논문에서는 이러한 문제를 해결하기 위해 연관성 평가기준 모두를 일반적으로 많이 활용되고 있는 비선형 회귀모형에 적용하여 연관성 규칙의 수를 추정하는 방안을 강구하였다. 또한 분산팽창계수를 이용하여 다중공선성 문제를 진단하는 동시에 분산분석 결과와 수정 결정계수를 이용하여 각 모형의 기여도를 비교하여 가장 바람직한 회귀 모형을 구하였다.