• Title/Summary/Keyword: 항목 연관성 분석

Search Result 241, Processing Time 0.029 seconds

Item Hierarchy based Frequent Itemset Ordering Method (항목 계층 구조에 기반한 빈발 항목 집합 나열 방법)

  • Kim, jun woo;Kang, hyun kyung
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2013.05a
    • /
    • pp.301-302
    • /
    • 2013
  • 연관 규칙 탐사는 이산적인 항목들을 포함하는 트랜잭션 데이터에 존재하는 항목 간 동시 발생 관계를 찾아내는 데 그 목적을 두고 있다. 연관 규칙은 {전항}${\rightarrow}${후항}의 형태를 갖고, 전, 후항은 모두 사전에 정의된 지지도 하한을 만족하는 빈발 항목 집합으로 구성된다. 연관 규칙 탐사에서 문제가 되는 것은 일반적으로 탐사되는 빈발 항목 집합의 개수가 많아지면서 규칙의 개수도 많아지고, 이들 사이에 중복성이 존재한다는 점이다. 따라서 단순히 지지도나 신뢰도 순으로 빈발 항목 집합이나 규칙을 나열하기보다는 항목들의 연관성을 고려하는 것이 분석자에게 보다 도움이 될 수 있다. 본 논문에서는 이를 위하여 연관 규칙 탐사와 함께 계층 군집 분석을 실시하여 항목들 간 연관성을 정리하고, 이를 토대로 빈발 항목 집합들을 나열하는 방법을 제안하고자 한다.

  • PDF

Analysis of Association between Risk Management Items and PEMS Development Life Cycle for Risk Management of Medical Device Software (의료기기 소프트웨어 위험관리를 위한 PEMS 개발생명주기 기반 위험관리 항목 연관성 분석)

  • Kim, DongYeop;Park, Ye-Seul;Lee, Jung-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.605-608
    • /
    • 2017
  • 최근에는 의료기기의 구성 요소 중 소프트웨어의 기능과 역할이 커지면서 의료기기 소프트웨어의 비중이 높아지고, 의료기기의 사용자의 생명과 안전에 직결되는 특성으로 인해 의료기기 소프트웨어 위험관리의 중요성은 더욱 강조되고 있다. 이를 위해 여러 표준들은 위험관리를 위한 다양한 요구사항들을 제시한다. 그러나 의료기기 소프트웨어 개발생명주기의 각 단계에서 수행되어야하는 위험관리 항목들은 분류되어있지 않다. 이로 인해 개발자들은 의료기기 개발 중에 직접 표준들의 연관성을 분석하여 위험관리 활동을 수행해야하는 어려움을 겪고 있다. 따라서 본 논문에서는 위험관리 프로세스의 항목들을 추출하고 PEMS(Programmable Electrical Medical System) 개발생명주기와 대응시켜 연관성을 분석하고, 이를 통해 의료기기 소프트웨어의 개발 중 효과적이고 체계적인 위험관리를 가능하게 한다.

Association analysis between sports talent test scores and KOSTASS scores (스포츠영재성 검사 항목과 코스타스 점수간의 연관성 분석)

  • Park, Cheol-Yong;Lee, Mi-Sook
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.1
    • /
    • pp.57-64
    • /
    • 2011
  • The Korea Sport Talent Search System (KOSTASS) can easily assess potential of Korean youth in 23 sport events and to identify sports talents who have high potential in track-and-field, swimming and gymnastics. The purpose of present study was to analysis relationship between sports talent test scores and KOSTASS scores. Physique, physical fitness, motor ability and physiological tests including skeletal age were administrated. Data of 201 elementary students who aged 7 to 12 living in Seoul area were collected. For pure association analysis, Pearson correlation coefficient and partial correlation coefficient are used and stepwise regression analysis is used for selecting important sports talent test scores. The results show that skeletal age, weight, chest circumference, 50-meter run, and half-squat jump have relatively low impact on six KOSTASS scores. The KOSTASS program would contribute to identify talented youth in sports among Korean youth population and success for international sports competition.

A Personalization Technology Based on Neural Networks (신경망에 기반한 개인화 기술)

  • 김종수;도영아;류정우;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.28-30
    • /
    • 2001
  • 현 인터넷상에서 취향에 맞는 항목(상품) 정보를 사용자에게 추천해 주는 개인화 기술은 대부분 특정 사용자와 유사한 선호도를 갖는 다른 사용자들의 특정 항목에 대한 선호도를 바탕으로 항목의 선호도를 추정하는 협력적 추천 기술을 적용하고 있다. 이중 최근접 이웃 방법은 적용하기가 용이한 반면 항목간의 가중치를 고려하지 못함으로써 추천의 정확도가 크게 떨어지는 문제점이 있다. 연관규칙 방법은 다른 항목에 대한 선호도 자료로부터 데이터 마이닝 기법을 적용하여 항목 선호에 대한 연관규칙을 추출하고 그 규칙을 사용하여 어떤 항목의 선호도를 추정한다. 따라서 항목들 간의 중요도가 연관규칙의 지지도나 신뢰도 등으로 나타난다고 할 수 있으나, 단순히 항목들간의 연관관계 즉 표면적인 연관관계에 의하여 선호도를 결정함으로써 항목들간의 어떤 내용적인 공통성 또는 어떤 상위개념에 의한 선호도가 고려되지 않음으로써 역시 정확도가 떨어지는 문제점이 있다. 본 논문에서는 추천의 정확도를 향상시키기 위한 신경망 추천 방법에 대해 분석하고, 내용기반 추천과 협력적 추천을 병합한 신경망 추천 방법을 제안한다. 또한, 다른 협력적 추천 방법과의 비교를 통하여 본 추천 방법의 장점과 성능의 우수함을 보인다.

  • PDF

Non-linear regression model considering all association thresholds for decision of association rule numbers (기본적인 연관평가기준 전부를 고려한 비선형 회귀모형에 의한 연관성 규칙 수의 결정)

  • Park, Hee Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.24 no.2
    • /
    • pp.267-275
    • /
    • 2013
  • Among data mining techniques, the association rule is the most recently developed technique, and it finds the relevance between two items in a large database. And it is directly applied in the field because it clearly quantifies the relationship between two or more items. When we determine whether an association rule is meaningful, we utilize interestingness measures such as support, confidence, and lift. Interestingness measures are meaningful in that it shows the causes for pruning uninteresting rules statistically or logically. But the criteria of these measures are chosen by experiences, and the number of useful rules is hard to estimate. If too many rules are generated, we cannot effectively extract the useful rules.In this paper, we designed a variety of non-linear regression equations considering all association thresholds between the number of rules and three interestingness measures. And then we diagnosed multi-collinearity and autocorrelation problems, and used analysis of variance results and adjusted coefficients of determination for the best model through numerical experiments.

Discovery of Association Rules Based on Data of Quantitative Attribute and Time Series (수량적 속성과 시계열 분석에 의한 연관규칙 탐사)

  • 양신모;정광호;김진수;최성용;이정현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.175-177
    • /
    • 2003
  • 연관규칙은 데이터 안에 존재하는 항목들간의 종속 관계를 찾아내는 것이다. 기존의 연구에서는 연관규칙 탐사 과정에서 발견항목 자체에만 관심을 두고 연구되어 왔다. 즉, 연관규칙 생성을 위한 후보 항목은 수량을 배제한 항목 대 수량비가 1:1인 상태에서 규칙을 발견하는 연구였다. 이것은 항목의 구매 수량에 관계없이 같은 가중치로 규칙을 발견하는 문제점을 갖고 있다. 두 번째 문제점은 연관규칙은 시간적 연장선상에서 발견되는 규칙이라 할 수 있다. 즉, 규칙을 발견하는 과정에서 모든 자료를 동일한 시간적 가중치를 두어 취급하는 것이다. 본 논문에서는 각각의 아이템을 (아이템, 수량)의 묶음 단위로 후보항목을 만들어 수량적 속성이 포함된 아이템 대 수량 비 1:n의 관계에서 규칙을 발견하는 방법을 제안한다. 또한 과거의 자료들을 이용하여 예측할 때 모든 자료를 동일하게 취급하기보다는 최근의 자료에 더 큰 비중을 주는 예측법을 사용하여 연관규칙 발견의 신뢰성을 높인다. 성능평가는 기존의 알고리즘과 비교하여 제안한 알고리즘의 성능향상 및 타당성을 보인다.

  • PDF

Comparison of confidence measures useful for classification model building (분류 모형 구축에 유용한 신뢰도 측도 간의 비교)

  • Park, Hee Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.25 no.2
    • /
    • pp.365-371
    • /
    • 2014
  • Association rule of the well-studied techniques in data mining is the exploratory data analysis for understanding the relevance among the items in a huge database. This method has been used to find the relationship between each set of items based on the interestingness measures such as support, confidence, lift, similarity measures, etc. By typical association rule technique, we generate association rule that satisfy minimum support and confidence values. Support and confidence are the most frequently used, but they have the drawback that they can not determine the direction of the association because they have always positive values. In this paper, we compared support, basic confidence, and three kinds of confidence measures useful for classification model building to overcome this problem. The result confirmed that the causal confirmed confidence was the best confidence in view of the association mining because it showed more precisely the direction of association.

An In-depth Survey Analysis Applying Data Mining Techniques (데이터마이닝을 이용한 설문조사의 심층 분석)

  • Kim, Wan-Seop;Lee, Soo-Won
    • Journal of Engineering Education Research
    • /
    • v.9 no.4
    • /
    • pp.71-82
    • /
    • 2006
  • To accomplish the educational objectives of a department, a system for CQI(Continuous Quality Improvement) is necessary. Improving the educational system by survey analysis is one of the most important factors for accomplishing the educational objectives. In general, survey analysis is carried out by using statistical distribution on an attribute or correlation analysis between two attributes. However, these analysis schemes have a limitation that they cannot find relations among various attributes. In this paper, an in-depth survey analysis method applying data mining techniques is presented. Data mining is a technique for extracting interesting knowledges from a large set of data. Survey from undergraduate students in the School of Computing of Soongsil University is analyzed in this paper by using a data mining tool, called Clementine. Results of Clementine analysis show the relationship between 'grade', and other attributes hierarchically, and provide useful information that can be applied in student consulting and program improvement.

Risk Assesment for Large-scale Slopes Using Multiple Regression Analysis (다중회귀분석을 이용한 대규모 비탈면의 위험도 평가)

  • Lee, Jong-Gun;Chang, Buhm-Soo;Kim, Yong-Soo;Suk, Jae-Wook;Moon, Joon-Shik
    • Journal of the Korean Geotechnical Society
    • /
    • v.29 no.11
    • /
    • pp.99-106
    • /
    • 2013
  • In this study, the correlation of evaluation items and safety rating for 104 of large-scale slopes along the general national road was analyzed. And, we proposed the regression model to predict the safety rating using the multiple regressions analysis. As the result, it is shown that the evaluation items of slope angle, rainfall and groundwater have a low correlation with safety rating. Also, the regression model suggested by multiple regression analysis shows high predictive value, and it would be possible to apply if the evaluation items of excavation condition and groundwater (rainfall) are not clear.

Standardization for basic association measures in association rule mining (연관 규칙 마이닝에서의 평가기준 표준화 방안)

  • Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.21 no.5
    • /
    • pp.891-899
    • /
    • 2010
  • Association rule is the technique to represent the relationship between two or more items by numerical representing for the relevance of each item in vast amounts of databases, and is most being used in data mining. The basic thresholds for association rule are support, confidence, and lift. these are used to generate the association rules. We need standardization of lift because the range of lift value is different from that of support and confidence. And also we need standardization of support and confidence to compare objectively association level of antecedent variables for one descendant variable. In this paper we propose a method for standardization of association thresholds considering marginal probability for each item to grasp objectively and exactly association level, check the conditions for association criteria and then compare association thresholds with standardized association thresholds using some concrete examples.