• 제목/요약/키워드: 평가규칙

검색결과 1,019건 처리시간 0.04초

연관 규칙 마이닝에서 기여 순수 신뢰도의 제안 (The proposition of attributably pure confidence in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권2호
    • /
    • pp.235-243
    • /
    • 2011
  • 데이터 마이닝 기법 중에서 가장 많이 이용되고 있는 기법은 연관성 규칙을 탐색하는 것으로, 이 기법은 지지도, 신뢰도, 향상도 등의 연관성 평가 기준을 기반으로 하여 각 항목집합들 간의 관련성을 찾아내는 데 활용되고 있다. 연관성을 평가하기 위한 기준으로 많은 흥미도 측도가 개발되어 있다. 그 중에서도 신뢰도가 가장 많이 활용되고 있으나 신뢰도는 연관성의 방향을 알 수가 없다는 단점을 가지고 있다. 이를 보완하기 위한 측도로 순수 신뢰도가 개발되었으나, 이 또한 양의 신뢰도의 값과 음의 신뢰도의 값이 동일한 경우에는 순수 신뢰도의 값이 같아지므로 이러한 경우에는 순수 신뢰도로는 차이를 알 수 없다. 이에 본 논문에서는 기존의 신뢰도와 순수 신뢰도의 단점을 보완한 연관성 평가기준인 기여 순수 신뢰도를 제안하였다. 또한 예제를 통하여 그 유용성을 알아본 결과, 기여 순수 신뢰도는 그 부호에 의해 연관성 규칙의 방향을 파악할 수 있는 동시에 순수 신뢰도에 의해서는 구분할 수 없는 상황도 해석 가능하게 할 수 있다는 사실을 확인하였다.

의료 정보 추출을 위한 TF-IDF 기반의 연관규칙 분석 시스템 (TF-IDF Based Association Rule Analysis System for Medical Data)

  • 박호식;이민수;황성진;오상윤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권3호
    • /
    • pp.145-154
    • /
    • 2016
  • u-Health에 대한 관심과 IT 기술의 발전에 따라 의료 정보를 적극적으로 활용하고자 하는 요구가 커지고 있으며, 이에 대해 텍스트 형태의 의료 정보 데이터에 연관규칙 기법을 적용하여 질병과 증상과의 관계를 추론하는 시스템에 대한 연구들이 이루어지고 있다. 그러나 일반적인 연관규칙 기법을 의료 정보 데이터에 그대로 적용할 경우, 이전에는 새로운 연관규칙들보다 일반적이며 의미없는 연관규칙들이 많이 생성되는 문제가 발생한다. 또한 필터링으로 인해 빈번하게 함께 발생하지는 않지만 의학적으로 의미있는 항목들의 연관 규칙을 발견할 수 없다는 한계점을 가지게 된다. 본 논문에서는 의료데이터 특성을 고려하여 빈번한 항목과 빈번하지 않지만 의학적으로 의미 있는 항목들을 대상으로 연관규칙을 구성하여 의료 전문가의 의사 결정에 도움을 주기 위한 시스템을 제안한다. 제안 시스템은 의료 기록 데이터에서 용어들을 TF-IDF기반으로 가중치를 부여하고 기존 FP-Growth 알고리즘을 확장하여 TF-IDF 가중치를 고려한 빈번하게 발생하거나 빈번하지 않지만 의미 있는 연관규칙을 구성한다. 특정 질의 데이터가 입력되면 해당 데이터에 나타난 연관 규칙들의 유사도를 의학분야 온톨로지를 이용하여 평가하여 해당 데이터의 내용과 관련된 후보 질병들을 추론한다. 추론된 후보 질병명은 의료 전문가에게 의사 결정의 참고 자료로 제공된다. 실제 임상 진료 및 처방 기록 데이터에 대해 제안 시스템을 적용해 본 결과, 본 제안 시스템을 통해 도출한 연관 규칙이 기존 FP-Growth 알고리즘을 적용했을 때 보다 더 구체적인 질병과 증상과의 관계들을 포함함을 확인할 수 있었다. 또한 본 제안 시스템은 자유형식의 의료 및 병리데이터를 마이닝하고 후보 질병들을 가중치 기반으로 보여주므로, 의료 기록 정보로부터 질병 관련 새로운 정보를 획득하고 의료진의 의사 결정에 도움을 주는 시스템으로 활용될 수 있다.

의류제품에 대한 주관적 지식이 정보탐색과 평가규칙에 미치는 영향 (The Effects of Sujective Knowledge on Information Search and Evaluation Rules for Apparel Products)

  • 김은영;이영선
    • 한국의류학회지
    • /
    • 제26권9호
    • /
    • pp.1378-1389
    • /
    • 2002
  • This study was to identify dimensions of subjective knowledge and to test the structural model of the effect of subjective knowledge on information search and evaluation rules for apparel products. A questionnaire was administered to 668 females living in Seoul, Taejon, and Cheongju, and the data were analysed by using LISREL 8. The results of this study were as follows: First, consumers' subjective knowledge regarding apparel products consisted of five factors; Style knowledge, Fashion Knowledge, Store Knowledge, Fabric/Management Knowledge, and Brand knowledge. Those factors were influenced by the experience related with apparel products. Second, the subjective knowledge influenced information searches. That is, internal search was significantly influenced by fashion knowledge and store knowledge, while external search was significantly influenced by fashion knowledge and fabric/management knowledge. Third, the subjective knowledge had indirect effects on evaluation rules via search activities (e.g., internal and external), suggesting that the internal search was mediated in relationship between subjective knowledge and compensatory rule, while the urtemal search was mediated in the relationship between subjective knowledge and noncompensatory rule. Therefore, this study implies that subjective knowledge plays an important role to explain consumers' decision making processes such as information search and evaluation.

언어 지식과 통계 정보의 보완적 특성을 이용한 품사 태깅 (Part-of-Speech Tagging Using Complemental Characteristics of Linguistic Knowledge and Stochastic Information)

  • 임희석;김진동;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.102-108
    • /
    • 1997
  • 기존의 품사 태깅 방법에서 독립적으로 사용해온 언어 지식과 통계 정보는 품사 태깅의 정확도와 처리 범위의 향상을 위해서 상호 보완적인 특성을 갖는다. 이에 본 논문은 언어 지식과 통계 정보의 보완적 특성을 이용한 규칙 우선 직렬 품사 태깅 방법을 제안한다. 제안된 방법은 언어 지식에 의한 품사 태깅 결과를 선호함으로써 규칙 기반 품사 태깅의 정확도를 유지하며, 언어 지식에 의해서 모호성이 해소되지 않은 어절에 통계 정보에 의한 품사 태깅 결과를 할당함으로써 통계 기반 품사 태깅의 처리 범위를 유지한다. 또한, 수정 언어 지식에 의해 태깅 결과의 오류를 보정함으로써 품사 태깅의 정확도를 향상시킨다. 약 2만 어절 크기의 외부 평가 코퍼스에 대해 수행된 실험 결과, 규칙 우선 직렬 품사 태깅 시스템은 통계 정보만을 이용한 품사 태깅의 정확도보다 32.70% 향상된 95.43%의 정확도를 보였다.

  • PDF

다중 출력을 가지는 Interval Type-2 퍼지 집합 기반 퍼지 뉴럴 네트워크 최적 설계 (Optimal Design of Interval Type-2 Fuzzy Set-based Multi-Output Fuzzy Neural Networks)

  • 박건준;김용갑;오성권;김현기
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2011년도 제42회 하계학술대회
    • /
    • pp.1968-1969
    • /
    • 2011
  • 본 논문에서는 패턴 인식을 위한 다중 출력을 가지는 Interval Type-2 퍼지 집합을 이용한 퍼지 집합 기반 퍼지 뉴럴 네트워크를 소개한다. Interval Type-2 퍼지 집합 기반 퍼지 뉴럴 네트워크는 각 입력 변수에 따른 서로 분리된 입력 공간을 분할함으로서 네트워크 및 규칙을 구성한다. 규칙의 전반부는 퍼지 입력 공간을 개별적으로 분할하여 표현하고, 각 공간은 Interval Type-2 퍼지 집합으로 구성된다. 규칙의 후반부는 패턴 인식을 위한 다중 출력을 가지며 Interval 집합을 이용하여 다항식으로서 표현된다. 다항식의 계수인 연결가중치는 오류역 전파 알고리즘을 이용하여 학습한다. 또한 실수 코딩 유전자 알고리즘을 이용하여 제안된 네트워크를 최적화한다. 제안된 네트워크는 표준 모델로서 널리 사용되는 수치적인 예를 통하여 평가한다.

  • PDF

Interval Type-2 퍼지 집합 기반 퍼지뉴럴네트워크 설계 및 최적화 (Design of Interval Type-2 Fuzzy Set-based Fuzzy Neural Network and Its Optimization)

  • 박건준;오성권;김현기
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2009년도 제40회 하계학술대회
    • /
    • pp.1901_1902
    • /
    • 2009
  • 본 논문에서는 Interval Type-2 퍼지 집합을 이용한 퍼지집합 기반 퍼지뉴럴네트워크를 설계하고 최적화한다. Interval Type-2 퍼지뉴럴네트워크는 각 입력 변수에 따른 서로 분리된 입력 공간을 분할함으로서 네트워크 및 규칙을 구성한다. 규칙의 전반부는 퍼지 입력 공간을 개별적으로 분할하여 표현하고, 각 공간은 Interval Type-2 퍼지 집합으로 구성된다. 규칙의 후반부는 Interval 집합을 이용하여 다항식으로서 표현되며, 오류역전파 알고리즘을 이용하여 연결가중치인 후반부 다항식을 학습한다. 또한, 각 입력에 대한 전반부 멤버쉽함수의 정점과 불확실성 계수 그리고 학습률 및 모멘텀 계수를 유전자 알고리즘을 이용하여 최적 동조한다. 제안된 네트워크는 표준 모델로서 널리 사용되는 수치적인 예를 통하여 평가한다.

  • PDF

Bacterial Foraging Algorithm과 FCM 기반 퍼지 시스템을 이용한 비선형 시스템 모델링 (Nonlinear System Modeling Using Bacterial Foraging and FCM-based Fuzzy System)

  • 조재훈;전명근;김동화
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.121-124
    • /
    • 2006
  • 본 논문에서는 Bacterial Foraging Algorithm과 FCM(fuzzy c-means)클러스터링을 이용하여 TSK(Takagi-Sugeno-Kang)형태의 퍼지 규칙 생성과 퍼지 시스템(FCM-ANFIS)을 효과적으로 구축하는 방법을 제안한다. 구조동정에서는 먼저 PCA(Principal Component Analysis)을 이용하여 입력 데이터 성분간의 상관관계를 제거한 후에 FCM을 이용하여 클러스터를 생성하고 성능지표에 근거해서 타당한 클러스터의 수, 즉 퍼지 규칙의 수를 얻는다. 파라미터 동정에서는 Bacterial Foraging Algorithm을 이용하여 전제부 파라미터를 최적화 시킨다. 결론부 파라미터는 RLSE(Recursive Least Square Estimate)에 의해 추정되어진다. PCA(Principal Component Analysis)와 FCM을 적용함으로써 타당한 규칙 수를 생성하였고 Bacterial Foraging Algorithm을 이용하여 최적의 전제부 파라미터를 구하였다. 제안된 방법의 성능을 평가하기 위하여 Box-Jenkins의 가스로 데이터와 Rice taste 데이터의 모델링에 적용하였고 우수한 성능을 보임을 알 수 있었다.

  • PDF

빈발 항목집합 추출을 위한 알고리즘 (Algorithm for Extraction of Large itemsets)

  • 채덕진;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.117-120
    • /
    • 2000
  • 데이터 마이닝이란 대량의 실제 데이터로부터, 이전에 잘 알려지지는 않았지만, 잠재적으로 유용한 정보를 추출하는 작업이라 정의한다. 데이터 마이닝 기술 중에서 현재 가장 활발하게 연구되고 있는 것들 중의 하나가 연관 규칙 탐사이다. 연관 규칙이란 어떤 사건이 일어나면 다른 사건이 일어나는 관련성을 의미한다. 기존의 연관 규칙을 발견하기 위한 알고리즘들은 k-빈발 항목집합을 추출하기 위하여 k-후보 항목집합의 개수를 줄이거나 데이터베이스의 크기를 줄이는데 많은 연구가 이루어져 오고 있다. 본 논문에서는 상대적으로 많은 후보 항목집합의 데이터베이스 스캔을 통하여 추출되는 2-빈발 항목집합은 해쉬 기법을 사용하여 추출하고 k(k>2)-빈발 항목집합은 데이터베이스를 전처리하여 트랜잭션의 길이에 따라 두 개의 트랜잭션 집합으로 분리하고 분리된 데이터베이스에 다른 알고리즘을 사용하여 빈발 항목집합을 찾는 알고리즘을 제안한다. 그리고 성능 평가를 통하여 제안하는 방법의 성능 및 타당성을 보인다.

  • PDF

실내 멀티카메라 환경에서의 퍼지 규칙 기반 이벤트 시퀀스 요약 (Fuzzy Rule-based Summarization of Event Sequences in an Indoor Multi-camera Environment)

  • 박한샘;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.288-292
    • /
    • 2007
  • 최근 동영상 데이터의 폭발적인 증가와 함께 이의 요약을 위한 연구가 활발히 이루어지고 있다. 동영상 데이터 수집 과정에서 하나의 카메라가 아닌 멀티 카메라를 활용하는 경우도 늘고 있는데 이들 대부분은 실내에서 넓은 영역을 커버하거나 물체를 추적하기 위한 목적으로 멀티 카메라 시스템을 사용하였다. 본 논문에서는 하나의 이벤트를 여러 방향으로부터 입력하여 하나의 대상에 대한 다양한 시각과 정보에 초점을 맞추며, 이를 바탕으로 수집된 이벤트 시퀀스에 대한 문제를 다룬다. 과정은 여러 개의 카메라 뷰 가운데 최적의 뷰를 선택하는 카메라 뷰 선택과정과, 그렇게 만들어진 하나의 전체 시퀀스를 요약하는 과정으로 나누어진다. 본 논문에서는 사용자 조사 및 분석을 통해 얻은 사용자 선호도 통계 정보로부터 카메라 뷰 선택을 위한 규칙을 획득하였고, 사람의 의사결정과정을 모방하고자 퍼지 규칙기반 시스템을 사용하여 이벤트를 평가한 후 그 점수에 근거한 요약을 수행하였다.

  • PDF

재시도와 손실을 고려한 BMAP/PH/N 대기모형 분석 (BMAP/PH/N Queueing Model with Retrial and Losses)

  • 김제숭
    • 산업경영시스템학회지
    • /
    • 제29권1호
    • /
    • pp.41-46
    • /
    • 2006
  • 본 논문에서는 재시도와 완전입력 규칙을 갖는 BMAP/PH/N/0 대기시스템에 대한 주요 성능평가척도와 시스템의 정상상태 조건을 제시한다. 고려되는 시스템은 모든 서버가 서비스를 하고 있을 경우 도착이 이루어지는 배치도착은 모두 손실되며, 반대의 경우 도착하는 배치는 서비스를 받기 위해 시스템에 들어가게 된다. 만약 쉬고 있는 서버의 수가 불충분하여 배치의 일부가 즉각 서비스를 받을 수 없다면, 일단 오빗으로 이동하고 표준 재시도 대기 시스템의 규칙에 따라 후에 서비스를 받게 된다. 본 논문에서는 배치 마코프도착과정, 단계 서비스분포 및 유한버퍼를 갖는 다중서버 재시도 대기 시스템에 대한 수리모형을 제시한다. 제시된 시스템의 정상상태 분포 존재를 위한 충분조건을 유도하고, 이 분포를 계산하기 위한 알고리즘이 제시된다. 끝으로 완전입력규칙을 갖는 시스템에 대한 손실확률을 계산하기 위한 식이 유도하고, 수치 예제들을 제시한다.