• 제목/요약/키워드: 항목 연관성 분석

검색결과 242건 처리시간 0.032초

항목 계층 구조에 기반한 빈발 항목 집합 나열 방법 (Item Hierarchy based Frequent Itemset Ordering Method)

  • 김준우;강현경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2013년도 춘계 종합학술대회 논문집
    • /
    • pp.301-302
    • /
    • 2013
  • 연관 규칙 탐사는 이산적인 항목들을 포함하는 트랜잭션 데이터에 존재하는 항목 간 동시 발생 관계를 찾아내는 데 그 목적을 두고 있다. 연관 규칙은 {전항}${\rightarrow}${후항}의 형태를 갖고, 전, 후항은 모두 사전에 정의된 지지도 하한을 만족하는 빈발 항목 집합으로 구성된다. 연관 규칙 탐사에서 문제가 되는 것은 일반적으로 탐사되는 빈발 항목 집합의 개수가 많아지면서 규칙의 개수도 많아지고, 이들 사이에 중복성이 존재한다는 점이다. 따라서 단순히 지지도나 신뢰도 순으로 빈발 항목 집합이나 규칙을 나열하기보다는 항목들의 연관성을 고려하는 것이 분석자에게 보다 도움이 될 수 있다. 본 논문에서는 이를 위하여 연관 규칙 탐사와 함께 계층 군집 분석을 실시하여 항목들 간 연관성을 정리하고, 이를 토대로 빈발 항목 집합들을 나열하는 방법을 제안하고자 한다.

  • PDF

의료기기 소프트웨어 위험관리를 위한 PEMS 개발생명주기 기반 위험관리 항목 연관성 분석 (Analysis of Association between Risk Management Items and PEMS Development Life Cycle for Risk Management of Medical Device Software)

  • 김동엽;박예슬;이정원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.605-608
    • /
    • 2017
  • 최근에는 의료기기의 구성 요소 중 소프트웨어의 기능과 역할이 커지면서 의료기기 소프트웨어의 비중이 높아지고, 의료기기의 사용자의 생명과 안전에 직결되는 특성으로 인해 의료기기 소프트웨어 위험관리의 중요성은 더욱 강조되고 있다. 이를 위해 여러 표준들은 위험관리를 위한 다양한 요구사항들을 제시한다. 그러나 의료기기 소프트웨어 개발생명주기의 각 단계에서 수행되어야하는 위험관리 항목들은 분류되어있지 않다. 이로 인해 개발자들은 의료기기 개발 중에 직접 표준들의 연관성을 분석하여 위험관리 활동을 수행해야하는 어려움을 겪고 있다. 따라서 본 논문에서는 위험관리 프로세스의 항목들을 추출하고 PEMS(Programmable Electrical Medical System) 개발생명주기와 대응시켜 연관성을 분석하고, 이를 통해 의료기기 소프트웨어의 개발 중 효과적이고 체계적인 위험관리를 가능하게 한다.

스포츠영재성 검사 항목과 코스타스 점수간의 연관성 분석 (Association analysis between sports talent test scores and KOSTASS scores)

  • 박철용;이미숙
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권1호
    • /
    • pp.57-64
    • /
    • 2011
  • 이 연구에서는 최근 체육영재선정에 공통적으로 사용되고 있는 스포츠영재성 검사 항목과 코스타스 점수간의 연관성 분석을 통해 상대적으로 중요한 검사 항목과 그렇지 않은 검사 항목을 통계적으로 밝혀내는 데 목적이 있다. 이 연구를 위해 2010년도 서울지역 (강동구, 송파구, 노원구, 광진구 등)과 경기지역 (의정부시, 가평군, 구리시 등) H대학 체육영재양성사업에 지원한 201명의 초등학교 학생들의 자료가 사용되었으며, 육상 네 종목 (투척, 도약, 단거리, 중장거리), 수영 및 체조 종목의 코스타스 점수와 1차 스포츠영재성 검사에서 얻은 기본 체격, 체력 운동능력, 생리적 기능 정보를 이용하였다. 구체적으로 순수한 연관성 분석을 위해 피어슨상관계수와 편상관계수를 사용하였으며, 중요한 검사 항목 선택을 위해 단계적 회귀분석을 이용하였다. 그 결과 골연령, 체중, 흉위와 50m달리기, 하프스쿼트점프가 6개 코스타스 점수에 미치는 영향이 상대적으로 미약한 것으로 나타났다.

신경망에 기반한 개인화 기술 (A Personalization Technology Based on Neural Networks)

  • 김종수;도영아;류정우;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.28-30
    • /
    • 2001
  • 현 인터넷상에서 취향에 맞는 항목(상품) 정보를 사용자에게 추천해 주는 개인화 기술은 대부분 특정 사용자와 유사한 선호도를 갖는 다른 사용자들의 특정 항목에 대한 선호도를 바탕으로 항목의 선호도를 추정하는 협력적 추천 기술을 적용하고 있다. 이중 최근접 이웃 방법은 적용하기가 용이한 반면 항목간의 가중치를 고려하지 못함으로써 추천의 정확도가 크게 떨어지는 문제점이 있다. 연관규칙 방법은 다른 항목에 대한 선호도 자료로부터 데이터 마이닝 기법을 적용하여 항목 선호에 대한 연관규칙을 추출하고 그 규칙을 사용하여 어떤 항목의 선호도를 추정한다. 따라서 항목들 간의 중요도가 연관규칙의 지지도나 신뢰도 등으로 나타난다고 할 수 있으나, 단순히 항목들간의 연관관계 즉 표면적인 연관관계에 의하여 선호도를 결정함으로써 항목들간의 어떤 내용적인 공통성 또는 어떤 상위개념에 의한 선호도가 고려되지 않음으로써 역시 정확도가 떨어지는 문제점이 있다. 본 논문에서는 추천의 정확도를 향상시키기 위한 신경망 추천 방법에 대해 분석하고, 내용기반 추천과 협력적 추천을 병합한 신경망 추천 방법을 제안한다. 또한, 다른 협력적 추천 방법과의 비교를 통하여 본 추천 방법의 장점과 성능의 우수함을 보인다.

  • PDF

기본적인 연관평가기준 전부를 고려한 비선형 회귀모형에 의한 연관성 규칙 수의 결정 (Non-linear regression model considering all association thresholds for decision of association rule numbers)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권2호
    • /
    • pp.267-275
    • /
    • 2013
  • 데이터 마이닝 기법들 중에서도 연관성 규칙은 가장 최근에 개발된 기법으로 대용량 데이터베이스에서 각 항목들 간의 관련성을 찾아내며, 두 항목간의 관계를 명확히 수치화함으로써 두 개 이상의 항목간의 관련성을 표시하여 주기 때문에 현장에서 직접 적용이 가능하다. 일반적으로 연관성 규칙 생성 여부를 판단할 때, 각 항목간의 연관성을 반영하는 기준인 지지도, 신뢰도, 향상도 등의 흥미도 측도를 활용하게 된다. 실제적으로 연관성 규칙의 수를 결정하기 위해서는 이들 흥미도 측도들의 평가기준을 정하기 위해 반복적으로 조정 과정을 거쳐야 한다. 본 논문에서는 이러한 문제를 해결하기 위해 연관성 평가기준 모두를 일반적으로 많이 활용되고 있는 비선형 회귀모형에 적용하여 연관성 규칙의 수를 추정하는 방안을 강구하였다. 또한 분산팽창계수를 이용하여 다중공선성 문제를 진단하는 동시에 분산분석 결과와 수정 결정계수를 이용하여 각 모형의 기여도를 비교하여 가장 바람직한 회귀 모형을 구하였다.

수량적 속성과 시계열 분석에 의한 연관규칙 탐사 (Discovery of Association Rules Based on Data of Quantitative Attribute and Time Series)

  • 양신모;정광호;김진수;최성용;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.175-177
    • /
    • 2003
  • 연관규칙은 데이터 안에 존재하는 항목들간의 종속 관계를 찾아내는 것이다. 기존의 연구에서는 연관규칙 탐사 과정에서 발견항목 자체에만 관심을 두고 연구되어 왔다. 즉, 연관규칙 생성을 위한 후보 항목은 수량을 배제한 항목 대 수량비가 1:1인 상태에서 규칙을 발견하는 연구였다. 이것은 항목의 구매 수량에 관계없이 같은 가중치로 규칙을 발견하는 문제점을 갖고 있다. 두 번째 문제점은 연관규칙은 시간적 연장선상에서 발견되는 규칙이라 할 수 있다. 즉, 규칙을 발견하는 과정에서 모든 자료를 동일한 시간적 가중치를 두어 취급하는 것이다. 본 논문에서는 각각의 아이템을 (아이템, 수량)의 묶음 단위로 후보항목을 만들어 수량적 속성이 포함된 아이템 대 수량 비 1:n의 관계에서 규칙을 발견하는 방법을 제안한다. 또한 과거의 자료들을 이용하여 예측할 때 모든 자료를 동일하게 취급하기보다는 최근의 자료에 더 큰 비중을 주는 예측법을 사용하여 연관규칙 발견의 신뢰성을 높인다. 성능평가는 기존의 알고리즘과 비교하여 제안한 알고리즘의 성능향상 및 타당성을 보인다.

  • PDF

분류 모형 구축에 유용한 신뢰도 측도 간의 비교 (Comparison of confidence measures useful for classification model building)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권2호
    • /
    • pp.365-371
    • /
    • 2014
  • 데이터 마이닝 기법 중에서 연관성 규칙은 하나의 거래나 사건에 포함되어 있는 항목들의 관련성을 파악하기 위한 탐색적 자료 분석 방법이다. 이 기법은 지지도, 신뢰도, 향상도 등과 같은 흥미도 측도들을 이용하여 연관성 규칙을 생성한다. 일반적인 연관성 규칙에서는 최소 지지도를 만족하는 빈발항목집합을 생성한 후 최저 신뢰도를 만족하는 것을 연관성 규칙으로 채택하게 된다. 이 때 규칙 여부를 결정하기 위해 가장 많이 사용되는 신뢰도는 고려하는 항목의 순서가 바뀌게 되면 그 값이 달라지는 비대칭적 측도가 되는 동시에 항상 양의 값을 가진다. 따라서 신뢰도 값의 크기로는 양의 연관성이 있는지, 아니면 음의 연관성이 있는지를 알 수 없다. 본 논문에서는 이러한 문제를 극복하기 위해 분류 모형 구축에 유용한 신뢰도 측도들을 소개하고, 신뢰도들 간의 비교 분석을 통해 유용성을 평가하였다. 그 결과, 인과적 확인 신뢰도가 연관성의 방향을 보다 정확하게 나타내고 있다는 사실을 확인 하였다.

데이터마이닝을 이용한 설문조사의 심층 분석 (An In-depth Survey Analysis Applying Data Mining Techniques)

  • 김완섭;이수원
    • 공학교육연구
    • /
    • 제9권4호
    • /
    • pp.71-82
    • /
    • 2006
  • 학과의 교육목표 달성을 위해서는 순환형 자율 개선 구조를 운영하기 위한 시스템이 필요하며, 설문조사 분석을 통한 교육시스템의 개선은 교육목표 달성을 위한 중요한 요소 중의 하나이다. 일반적으로 설문조사 분석에서는 항목별로 통계적인 분포를 조사하거나 두 개의 항목간의 연관성을 조사하는 분석 방법이 주로 사용된다. 그러나 이러한 분석 방법은 다양한 항목들 간의 상호 연관성을 분석하지 못하는 한계가 있으므로 보다 심층적인 분석방법이 필요하다. 본 논문에서는 데이터마이닝 기법을 적용한 심층적인 분석 기법을 제시한다. 데이터마이닝이란 대용량의 데이터에 숨겨져 있는 지식을 추출해 내는 기법으로 설문분석에도 효과적으로 이용될 수 있다. 본 분석에서는 Clementine 데이터마이닝 도구를 사용하여 숭실대학교 컴퓨터학과의 재학생에 대한 설문자료에 대한 심층 분석을 수행하였다. 분석의 결과로 '학점'과 다른 항목들과의 연관성을 계층적으로 분석할 수 있었으며, '학점'에 대한 학생상담과 학과의 교육 프로그램 개선에 실제적으로 사용할 수 있는 유용한 정보들을 획득할 수 있었다.

다중회귀분석을 이용한 대규모 비탈면의 위험도 평가 (Risk Assesment for Large-scale Slopes Using Multiple Regression Analysis)

  • 이종건;장범수;김용수;석재욱;문준식
    • 한국지반공학회논문집
    • /
    • 제29권11호
    • /
    • pp.99-106
    • /
    • 2013
  • 본 연구에서는 일반국도 상에 존재하는 2종 비탈면 104개소에 대해 상태평가 항목과 상태평가 등급의 연관성을 분석하고, 평가항목을 고려한 다중회귀분석을 통해 안전등급을 예측할 수 있는 회귀모형을 제시하였다. 분석결과, 사면경사와 강우 및 지하수의 평가항목은 상태평가 등급과의 연관성이 낮은 것으로 분석되었다. 또한, 다중회귀분석을 통해 제시된 회귀모형은 절취상태, 강우 및 지하수의 항목을 판단하기 어려운 조건에서 활용이 가능한 것으로 판단된다.

연관 규칙 마이닝에서의 평가기준 표준화 방안 (Standardization for basic association measures in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.891-899
    • /
    • 2010
  • 연관성 규칙은 방대한 양의 데이터베이스 속에 있는 각 항목들 간의 관련성을 수치화함으로써 두개 이상의 항목간의 관련성을 나타내는 기법으로 데이터 마이닝 분야에서 가장 많이 활용되고 있다. 의미 있는 연관성 규칙을 탐색하기 위한 가장 기본적인 평가기준에는 지지도, 신뢰도, 향상도 등이 있으며, 이들을 이용하여 연관성 규칙을 생성하게 된다. 이 때 사용되는 향상도는 그 값의 범위가 지지도나 신뢰도와는 다르므로 지지도나 신뢰도의 범위를 동일하도록 하기 위해 표준화할 필요가 있으며, 지지도와 신뢰도도 하나의 후항변수에 대해 여러 개의 전항변수들이 있는 경우 이들 중 어느 것이 후항변수와 가장 연관성이 있는지를 객관적으로 비교하기 위해서도 표준화가 필요하다. 본 논문에서는 각 항목집합의 주변 발생확률을 고려하여 객관적이고도 정확한 연관성 정도를 파악하기 위해 연관성 평가기준을 표준화하는 방안에 대해 연구하고자 한다. 또한 흥미도 측도의 세 가지 조건의 충족 여부를 점검해 본 후, 구체적인 예제를 통하여 기존의 연관성 평가기준과 표준화된 연관성 평가기준을 비교 분석하고자 한다.