• 제목/요약/키워드: Frequent

검색결과 8,457건 처리시간 0.033초

다중 최소 임계치 기반 빈발 패턴 마이닝의 성능분석 (Performance Analysis of Frequent Pattern Mining with Multiple Minimum Supports)

  • 양흥모;윤은일
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.1-8
    • /
    • 2013
  • 거대한 데이터베이스로부터 중요하고 의미 있는 정보를 찾아내기 위해 데이터 마이닝 기법들이 사용되며, 패턴 마이닝은 이러한 데이터 마이닝을 위한 중요한 기법 중에 하나이다. 패턴 마이닝은 거대 데이터베이스로부터 유용한 패턴을 찾아내는 기법이며, 패턴 마이닝 분야 중에 하나인 빈발 패턴 마이닝은 데이터베이스에서 최소 임계치 이상의 빈도수를 가지는 빈발 패턴을 마이닝 한다. 전통적인 빈발 패턴 마이닝은 전체 데이터베이스에 대한 단일 최소 임계치를 기반으로 중요 빈발 패턴을 마이닝 한다. 단일 최소 임계치 모델은 데이터베이스 내 모든 아이템이 동일한 특성을 가진다고 암묵적으로 가정한다. 그러나 실제 응용에서는 각 아이템들이 개별적인 특성을 가지고 있을 수 있으며, 따라서 이를 반영한 패턴 마이닝 기법이 요구된다. 데이터베이스 내 아이템들의 이러한 특성이 반영되지 않은 빈발 패턴 마이닝 모델에서, 중요한 희귀 아이템이 포함된 패턴을 마이닝 하기 위해서는 낮은 최소 임계치를 설정해야 한다. 그러나 너무 낮은 최소 임계치는 의미 없는 아이템들을 포함하는 수많은 패턴을 야기한다. 반대로 높은 최소 임계치는 희귀 아이템이 포함된 패턴을 마이닝 하지 못하는 희귀 아이템 문제라 불리는 딜레마가 발생한다. 이러한 문제의 해결을 위한 초기 연구들은 아이템 빈도수에 따라 데이터를 몇 개의 블록으로 분할하거나 관련 희귀 아이템들을 하나의 그룹으로 만드는 방법을 사용한 근사적 접근법을 제안하였다. 그러나 이러한 기법들은 근사적 방법의 적용에 의해 모든 희귀 패턴을 포함한 빈발 패턴을 마이닝 하지 못한다. 다중 최소 임계치를 고려한 패턴 마이닝 모델은 아이템들의 개별적인 특성을 반영하여 희귀 아이템 문제를 해결하기 위해 제안되었다. 다중 최소 임계치 기반의 빈발 패턴 마이닝 모델에서 각 아이템은 MIS (Minimum Item Support)라고 불리는 개별 최소 임계치를 가지며, 아이템들의 데이터베이스 내 빈도수를 기반으로 계산된다. 다중 최소 임계치 모델은 MIS를 통해 수많은 의미 없는 패턴을 생성하지 않고도 손실 없이 모든 희귀 빈발 패턴을 찾아낸다. 한편, 빈발 패턴을 마이닝 하는 과정에서 후보 패턴들이 생성되며, 단일 최소 임계치 모델에서는 각 후보 패턴의 빈도수가 유일한 최소 임계치와 비교된다. 따라서, 희귀 아이템 문제가 발생할 뿐만 아니라 후보 패턴을 구성하는 아이템들의 특성이 고려되지 않는다. 다중 최소 임계치 모델에서는 이 문제를 다루기 위해 후보 패턴을 구성하는 아이템들의 MIS 값 중에서 가장 작은 MIS 값을 해당 후보 패턴의 최소 임계치로 설정하여 패턴 내 아이템들의 특성을 반영한다. 이를 적용하여 효율적으로 희귀 빈발 패턴을 마이닝 하기 위해 트리 구조 기반의 알고리즘은 빈도수 내림차순으로 트리 내 아이템들을 정렬하는 단일 최소 임계치 모델과는 달리 MIS 내림차순으로 아이템들을 정렬하여 마이닝을 수행한다. 본 논문에서는 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘에 대한 특성을 살펴보고, 일반 단일 임계치 기반 알고리즘과의 성능평가를 수행한다. 성능평가는 실행 속도, 메모리 사용량, 그리고 확장성의 관점에서 수행된다. 성능평가 결과, 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘은 희귀 빈발 패턴을 포함한 모든 빈발 패턴을 단일 임계치 기반의 빈발 패턴 마이닝 알고리즘보다 더 빠른 속도로 마이닝 하였으며, 각 아이템의 최소 임계치 정보를 위한 추가적인 메모리를 필요로 하였다. 또한, 비교 알고리즘들은 좋은 확장성 결과를 보였다.

확률 기법에 기반한 근접 빈발 패턴 마이닝 기법의 성능평가 (Performance evaluation of approximate frequent pattern mining based on probabilistic technique)

  • 편광범;윤은일
    • 인터넷정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.63-69
    • /
    • 2013
  • 근접 빈발 패턴 마이닝은 향상된 효율성을 위해 정확한 패턴보다 허용되는 범위 안에서 근접 빈발 패턴을 마이닝한다. 데이터베이스의 크기가 증대함에 따라 거대한 데이터베이스를 처리하기 위해서 더 빠른 마이닝 기법이 필요하게 되고 있다. 또한, 노이지나 데이터의 다양성 때문에 패턴을 마이닝 하는 것에 대한 정확한 결과를 찾기가 더 어렵다. 이러한 경우들에 대해, 근접 빈발 패턴 마이닝을 함으로 실행시간, 메모리 사용량, 그리고 확장성의 관점에서 더 효율적인 마이닝을 수행할 수 있다. 이 논문에서는 확률 기법에 근간한 근접 패턴 마이닝 알고리즘에 대한 특성을 살펴보고 척도가 되는 확률 기법에 기반한 근접 패턴 마이닝 알고리즘에 대해 성능 평가를 한다. 최종적으로 성능의 향상을 위해 테스트 결과를 분석한다.

아토피 피부염에 운용 가능한 경혈(經穴) 탐구 - 상용(常用) 본초(本草)를 중심으로 (A Study about Applicable Acupoints for Atopic Dermatitis : Focused on Frequent Herbs)

  • 이성은;윤화정;고우신
    • 한방안이비인후피부과학회지
    • /
    • 제31권2호
    • /
    • pp.60-85
    • /
    • 2018
  • Objectives : The purpose of this study is to investigate acupoints for atopic dermatitis which have similar impact with frequent herbs. Methods : We collected research materials in "The Journal of Korean Medicine Ophthalmology & Otolaryngology & Dermatology" published from Feburary, 2000 to September, 2017. The search terms are 'atopic Dermatitis', 'antiallergic', 'anti-inflammatory', 'antianaphylaxis', 'dermatitis' and we elected experimental researches about herbal medicine. Among the herbal medicine, we extracted frequent herbs using more than 5 times, and categorized through "Herbal Medicine". By Consulting "Principles of Meridians & Acupoints; A Guidebook for College Students", we matched frequent herbs and acupoints. Results : 1. There are 38 frequent herbs for study except Glycyrrhiza uralensis FISCH. because it was used for balance in herbal medicine. Arrange meridians in order of frequency, the most is 'Lung meridian'. Among the organs, the most related one with skin is 'Lung' and 'Lung meridian' can treat skin diseases. 2. We researched acupoints called 'specific acupoints' under elbow, knee because of clinical usage. Exceptively, SP6 and GV20 are not included in 'specific acupoints' but they can be effective for atopic dermatitis treatment. 3. Researching on MEDLINE about frequent herbs and acupoints, there are many studies that acupuncture is effective for reducing pruritus. Therefore, the acupoints which were mentioned in this study can be choosed for atopic dermatitis. Conclusions : We found several applicable acupoints for Atopic Dermatitis. We hope it will be useful in experiment such as randomized controllized trial on Atopic Dermatitis and acupuncture and futhermore in clinic.

최대 빈도모델 탐색을 이용한 동물소리 인식용 소리모델생성 (Sound Model Generation using Most Frequent Model Search for Recognizing Animal Vocalization)

  • 고유정;김윤중
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권1호
    • /
    • pp.85-94
    • /
    • 2017
  • 본 논문에서는 동물소리 인식시스템을 위하여 최대 빈도모델 탐색 알고리즘을 고안하고 이를 이용한 소리모델을 생성하는 방법을 제안하였다. 소리모델 생성 방법은 동물종의 소리 데이터로부터 학습과정, 비터비 탐색과정 및 최대 빈도모델 탐색과정을 반복하면서 HMM(Hidden Makcov Model)모델의 구조(상태의 수와 GMM의 수)를 탐색하여 최적의 인식률을 갖는 모델집합이 생성하는 방법이다. 최대 빈도모델 탐색 알고리즘은 입력 소리 데이터를 비터비(Viterbi) 알고리즘으로 탐색하여 모델리스트를 생성하고 이 리스트 중에서 최대 빈도수의 모델을 탐색하여 최종 인식결과로 결정하는 방법이다. 알고리즘에서 소리특징으로 MFCC(Mel Frequency Cepstral Coefficient), 모델형식으로 HMM을 이용하고 C# 프로그래밍언어로 구현 하였다. 알고리즘의 성능을 평가하기 위하여 27종의 동물소리를 선정하고 실험을 하였으며 27개의 HMM 모델집합이 97.29 퍼센트의 인식률로 생성됨을 확인하였다.

악안면골(顎顔面骨) 골절환자(骨折患者)의 임상(臨床) 통계적(統計的) 연구(硏究) (A Clinical and Statistical Study on Maxillofacial Fractures.)

  • 김승룡;진우정;신효근;김오환
    • Maxillofacial Plastic and Reconstructive Surgery
    • /
    • 제11권1호
    • /
    • pp.1-11
    • /
    • 1989
  • This is a retrospective study on maxillofacial fractures. This study was based on a series of 442 patients with maxillofacial fractures treated at Dept, of oral and Maxillofacial Surgery, College of Dentistry, Chon Buk National University from Jan, 1984 to Sep. 1988. The results obtained were as follows: 1. The ratio of Male/Female was 4.8 : 1, and 3rd decade (43.9%) was the highest age group in incidence. 2. Monthly incidence was the highest in Oct,(10.6%). 3. The most frequent maxillofacial fracture site was mandible (70.0%), and zygoma & zygomatic arch (13.6%), maxilla(11.7%) and nasal bone (4.7%) were next in order of frequency. 4. Traffic accidents (47.5%), fight(24.8%) were the most common causes of maxillofacial fractures. 5. The most frequent chief complaint was painful swelling(40.7%). 6. In mandibular fractures, the most frequent fracture site was symphyseal area(28.9%) and simple fracture was the most frequent in type of fracture (71.2%). 7. In maxillary fractures, fracture with other facial bones (64.5%) was more frequent than fracture of maxilla only. The most common type of fracture was unilateral fractures(37.1%). 8. In fracture of zygoma complex, zygoma fracture was the most frequent fracture type(40.3%), zygoma and zygomatic arch fx, (30.6%), zygomatic arch fx, (29.1%) were next in order 9. Open reduction was major method of treatment in maxillofacial fractures : Mandible (77.5%), Maxilla (61.3%), Zygoma complex(43.1%). 10. Maxillofacial fractures were most frequently combined with head injury(39.3%), and lower extremities(17.0%), upper extremities(13.6%) were next in order.

  • PDF

예취주기의 상호전환에 따른 White clover 품종의 예취수량 및 생장 (Harvest Yield and Growth Response White Clover Cultivars to Infrequent , Frequent Defoliation and Their Alternation)

  • 강진호;박정민
    • 한국초지조사료학회지
    • /
    • 제15권1호
    • /
    • pp.30-36
    • /
    • 1995
  • Pasture composed of about 30% botanical composition of white clover (Trijolium repem L.) is desirable in its productivity and quality. To get information on maintaining its productivity in the pasture, the experiment was canied out to determine the effect of infrequent, frequent defoliation or their alternation on change of its harvest yield and growth. Individual plants of Regal, Louisiana S-1, Grasslands Huia and Aberystwyth S184 were grown in 22cm plastic pot containing a 2 : 1 : 1 soil : sand : Peat moss mixture for 27 days after transplanting 50day seedlings raised on 3cm pots, and then all their fully expanded leaves are removed. Defoliation treatments were forced every 1 (CC, frequent), 4 week (RR, infrequent) or their alternations (CR, RC) after 8 weeks from the removal. To analyze the treatment effects, plants were sampled on 0 (the removal day), 4, 8, 12 and 16 weeks after the removal and seperated to leaves, petioles, stolons and roots. Each harvest yield of infrequent defoliation (RR) was higher than that of frequent defoliation (CC). Their alternations (RC, CR), however, forced fluctuation of the yield according to defoliation interval. Fraction weights from their altemations showed intermediate ones of infrequent and Frequent defoliation whose weights did the similar result to their harvest yields. Fraction and total dry weights per plant, shoot/root ratio were changed by relative span of defoliation interval, which resulted from the weights of leaves and petioles, removed parts. Root and total dry weight per plant of Regal were greater than the other cultivm in infrequent defoliation interval regardless of continuous or alternations. Productivity of white clover in pasture, therefore, can be controlled by alternation of infrequent and frequent defoliation or reverse.

  • PDF

Risk Factors Associated with Frequent Hospital Readmissions for Exacerbation of COPD

  • Kim, Mi-Hyun;Lee, Kwang-Ha;Kim, Ki-Uk;Park, Hye-Kyung;Jeon, Doo-Soo;Kim, Yun-Seong;Lee, Min-Ki;Park, Soon-Kew
    • Tuberculosis and Respiratory Diseases
    • /
    • 제69권4호
    • /
    • pp.243-249
    • /
    • 2010
  • Background: Chronic obstructive pulmonary disease (COPD) is one of the leading causes of disability and mortality worldwide. The aim of this study was to evaluate the risk factors associated with recurrent hospital admissions for exacerbation of COPD in Korea. Methods: A retrospective study of 77 consecutive patients hospitalized for exacerbation of COPD at Pusan National University Hospital during the time period January 2005 to May 2008 was performed. The information was collected from the hospitalization period: clinical information, spirometric measures, and laboratory variables. In addition, socioeconomic characteristics, co-morbidity, anxiety, and depression were reviewed. Frequent readmission was defined as 2 or more hospitalizations in the year following discharge. Results: During the 1-year period after discharge, 42 patients (54.6%) reported one hospital admission and 35 patients (45.4%) reported 2 or more hospital readmissions. Among the 35 frequent readmission patients, 4 had more than 10 readmissions. Univariate analysis showed that a body mass index (BMI) <$18.5kg/m^2$, duration >36 months, forced expiratory volume in 1 second ($FEV_1$) <50% predicted, arterial $CO_2$ partial pressure ($PaCO_2$) >40 mm Hg, and arterial oxygen saturation ($SaO_2$) <95% at discharge were associated significantly with frequent readmissions. The multivariate analysis revealed that BMI <$18.5kg/m^2$, $PaCO_2$ >40 mm Hg at discharge were independently associated with frequent readmissions for exacerbation of COPD. Conclusion: Frequent readmissions for exacerbation of COPD were associated with low BMI and hypercapnia at discharge.

데이터 스트림 빈발항목 마이닝의 프라이버시 보호를 위한 더미 데이터 삽입 기법 (Dummy Data Insert Scheme for Privacy Preserving Frequent Itemset Mining in Data Stream)

  • 정재열;김기성;정익래
    • 정보보호학회논문지
    • /
    • 제23권3호
    • /
    • pp.383-393
    • /
    • 2013
  • 데이터 스트림 마이닝 기술은 실시간으로 발생하는 데이터를 분석하여 유용한 정보를 얻는 기술이다. 데이터 스트림 마이닝 기술 중에서 빈발항목 마이닝은 전송되는 데이터들 중에서 어떤 항목이 빈발한지 찾는 기술이며, 찾은 빈발항목들은 다양한 분야에서 패턴분석이나 마케팅의 목적으로 사용된다. 기존에 제안된 데이터 스트림 빈발항목 마이닝은 악의적인 공격자가 전송되는 데이터를 스니핑할 경우 데이터 제공자의 실시간 정보가 노출되는 문제점을 가지고 있다. 이러한 문제는 전송되는 데이터에서 원본 데이터를 구별 못하게 하는 더미 데이터 삽입 기법을 통해 해결가능하다. 본 논문에서는 더미 데이터 삽입 기법을 이용한 프라이버시 보존 데이터 스트림 빈발항목 마이닝 기법을 제안한다. 또한, 제안하는 기법은 암호화 기법이나 다른 수학적 연산이 요구되지 않아 연산량 측면에서 효과적이다.

심전도 패턴 판별을 위한 빈발 패턴 베이지안 분류 (Frequent Pattern Bayesian Classification for ECG Pattern Diagnosis)

  • 노기용;김원식;이헌규;이상태;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1031-1040
    • /
    • 2004
  • 심장의 활동을 기록한 심전도는 심장의 상태에 대한 가치 있는 임상 정보를 제공한다. 지금까지 심전도를 이용한 심장 질환 진단 알고리즘에 대한 많은 연구가 진행되어 왔으나, 심장 질환에 대한 진단 결과의 부 정확성으로 인해 심전계에서는 외국의 진단 알고리즘을 사용하고 있다. 이 논문에서는 심전도 데이터의 수집에서부터 전 처리 과정 그리고 데이터마이닝을 이용한 심장 질환 패턴 분류 기법을 제안한다. 이 패턴 분류기법은 빈발 패턴 베이지안이며 기존의 나이브 베이지안과 빈발 패턴 마이닝의 통합이다. 빈발 패턴 베이지안은 훈련단계에서 탐사된 빈발 패턴들을 사용하여 Product Approximation 구성하므로써 클래스 조건 독립 가정을 가진 나이브 베이지안의 단점을 해결한다.

RHadoop 플랫폼기반 CAWFP-Tree를 이용한 적응 빈발 패턴 알고리즘 (Adaptive Frequent Pattern Algorithm using CAWFP-Tree based on RHadoop Platform)

  • 박인규
    • 디지털융복합연구
    • /
    • 제15권6호
    • /
    • pp.229-236
    • /
    • 2017
  • 효율적인 빈발 패턴 알고리즘은 연관 규칙 마이닝이나 융복합을 위한 마이닝 과정에서 필수적인 요소이며 많은 활용성을 가지고 있다. 패턴 마이닝을 위한 많은 모델들이 빈발 패턴에 관한 정보를 추출하여 FP-트리를 이용하여 저장하고 있다. 본 논문에서는 항목들의 무게중심을 이용한 새로운 빈발 패턴 알고리즘(CAWFP-Growth)을 제안하여 항목들이 가지는 가중치와 빈도수를 같이 고려하여 항목간의 중심을 계산하여 기존의 FP-Growth 알고리즘의 효율성을 향상시킨다. 제안한 방법은 하향 폐쇄의 성질을 유지하기 위한 기존의 전역적 최대치 가중치 지지도를 필요로 하지 않기 때문에 자연히 빈발 패턴의 탐색시간이 줄어들고 정보의 손실을 줄일 수 있다. 실험결과를 통하여 제안된 알고리즘이 기존의 동적가중치를 이용하는 다른 방법과 비교해볼 때, 항목들의 무게중심이 빈발패턴의 정확한 정보를 유지하고 FP-트리의 처리시간을 줄여주기 때문에 제안한 방법의 중요성을 보이고 있다 또한 가상 분산모드에서 맵리듀스 프레임을 기반으로 빅데이터를 모델링하고 향후 완전분산 모드에서 제안한 알고리즘의 모델링이 필요하다.