• 제목/요약/키워드: 다중 최소 임계치

검색결과 10건 처리시간 0.027초

다중 최소 임계치 기반 빈발 패턴 마이닝의 성능분석 (Performance Analysis of Frequent Pattern Mining with Multiple Minimum Supports)

  • 양흥모;윤은일
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.1-8
    • /
    • 2013
  • 거대한 데이터베이스로부터 중요하고 의미 있는 정보를 찾아내기 위해 데이터 마이닝 기법들이 사용되며, 패턴 마이닝은 이러한 데이터 마이닝을 위한 중요한 기법 중에 하나이다. 패턴 마이닝은 거대 데이터베이스로부터 유용한 패턴을 찾아내는 기법이며, 패턴 마이닝 분야 중에 하나인 빈발 패턴 마이닝은 데이터베이스에서 최소 임계치 이상의 빈도수를 가지는 빈발 패턴을 마이닝 한다. 전통적인 빈발 패턴 마이닝은 전체 데이터베이스에 대한 단일 최소 임계치를 기반으로 중요 빈발 패턴을 마이닝 한다. 단일 최소 임계치 모델은 데이터베이스 내 모든 아이템이 동일한 특성을 가진다고 암묵적으로 가정한다. 그러나 실제 응용에서는 각 아이템들이 개별적인 특성을 가지고 있을 수 있으며, 따라서 이를 반영한 패턴 마이닝 기법이 요구된다. 데이터베이스 내 아이템들의 이러한 특성이 반영되지 않은 빈발 패턴 마이닝 모델에서, 중요한 희귀 아이템이 포함된 패턴을 마이닝 하기 위해서는 낮은 최소 임계치를 설정해야 한다. 그러나 너무 낮은 최소 임계치는 의미 없는 아이템들을 포함하는 수많은 패턴을 야기한다. 반대로 높은 최소 임계치는 희귀 아이템이 포함된 패턴을 마이닝 하지 못하는 희귀 아이템 문제라 불리는 딜레마가 발생한다. 이러한 문제의 해결을 위한 초기 연구들은 아이템 빈도수에 따라 데이터를 몇 개의 블록으로 분할하거나 관련 희귀 아이템들을 하나의 그룹으로 만드는 방법을 사용한 근사적 접근법을 제안하였다. 그러나 이러한 기법들은 근사적 방법의 적용에 의해 모든 희귀 패턴을 포함한 빈발 패턴을 마이닝 하지 못한다. 다중 최소 임계치를 고려한 패턴 마이닝 모델은 아이템들의 개별적인 특성을 반영하여 희귀 아이템 문제를 해결하기 위해 제안되었다. 다중 최소 임계치 기반의 빈발 패턴 마이닝 모델에서 각 아이템은 MIS (Minimum Item Support)라고 불리는 개별 최소 임계치를 가지며, 아이템들의 데이터베이스 내 빈도수를 기반으로 계산된다. 다중 최소 임계치 모델은 MIS를 통해 수많은 의미 없는 패턴을 생성하지 않고도 손실 없이 모든 희귀 빈발 패턴을 찾아낸다. 한편, 빈발 패턴을 마이닝 하는 과정에서 후보 패턴들이 생성되며, 단일 최소 임계치 모델에서는 각 후보 패턴의 빈도수가 유일한 최소 임계치와 비교된다. 따라서, 희귀 아이템 문제가 발생할 뿐만 아니라 후보 패턴을 구성하는 아이템들의 특성이 고려되지 않는다. 다중 최소 임계치 모델에서는 이 문제를 다루기 위해 후보 패턴을 구성하는 아이템들의 MIS 값 중에서 가장 작은 MIS 값을 해당 후보 패턴의 최소 임계치로 설정하여 패턴 내 아이템들의 특성을 반영한다. 이를 적용하여 효율적으로 희귀 빈발 패턴을 마이닝 하기 위해 트리 구조 기반의 알고리즘은 빈도수 내림차순으로 트리 내 아이템들을 정렬하는 단일 최소 임계치 모델과는 달리 MIS 내림차순으로 아이템들을 정렬하여 마이닝을 수행한다. 본 논문에서는 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘에 대한 특성을 살펴보고, 일반 단일 임계치 기반 알고리즘과의 성능평가를 수행한다. 성능평가는 실행 속도, 메모리 사용량, 그리고 확장성의 관점에서 수행된다. 성능평가 결과, 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘은 희귀 빈발 패턴을 포함한 모든 빈발 패턴을 단일 임계치 기반의 빈발 패턴 마이닝 알고리즘보다 더 빠른 속도로 마이닝 하였으며, 각 아이템의 최소 임계치 정보를 위한 추가적인 메모리를 필요로 하였다. 또한, 비교 알고리즘들은 좋은 확장성 결과를 보였다.

다중 최소 임계치를 이용한 정규 패턴 마이닝 (Regular Pattern Mining with Multiple Minimum Supports)

  • 최형길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1061-1063
    • /
    • 2013
  • 기존의 많은 빈발 패턴 마이닝은 단일 최소 임계치를 전체 트랜잭션 데이터베이스의 각 아이템에 똑같이 적용하고 빈발 패턴을 마이닝해왔다. 단일 최소 임계치를 설정함으로써, 모든 아이템이 동일한 임계치가 적용되므로 레어 아이템 문제가 발생한다. 한편, 일정 주기마다 발생하는 정규 패턴이라고 한다. 실 세계에서는 빈발한 아이템 뿐만 아니라 주기적으로 발생하는 패턴정보의 필요성이 증가하고 있다. 본 논문은 레어 아이템 문제를 해결하는 빈발한 정규 패턴을 마이닝하는 기법을 제시한다.

다중시기 원격탐사 화상의 변화탐지를 위한 임계치 자동 추정 (Automatic Estimation of Threshold Values for Change Detection of Multi-temporal Remote Sensing Images)

  • 박노욱;지광훈;이광재;권병두
    • 대한원격탐사학회지
    • /
    • 제19권6호
    • /
    • pp.465-478
    • /
    • 2003
  • 이 논문은 다중시기 원격탐사 화상의 무감독 변화탐지를 위해 자동으로 임계치를 결정하는 두가지 방법을 제안하였다. 두 방법 모두 3성분 가우시안 혼합 확률 모델의 파라미터 추정과 베이지안 최소 오차 이론을 이용한 임계치 결정의 두 단계로 이루어져 있다. 첫 번째 방법은 Bruzzone and Prieto (2000)의 방법을 확장 적용한 것으로, 혼합 확률 모델의 파라미터 추정에 기대최대화 기법을 적용한다. 두 번째 제안 방법은 연속적으로 임계치 결정과 혼합 확률 모델의 파라미터 추정을 수행한다. 모의 화상과 KOMPSAT-1 EOC 화상에 적용한 결과, 제안한 두 기법 모두 효율적으로 모델 파라미터를 추정할 수 있었으며, 최소 오차를 보이는 임계치에 근사한 값을 추출할 수 있었다.

통신 관로의 상태 조사를 위한 최소 직경 산출 방법 (Estimation of minimum diameter for inspection of communication conduits)

  • 이대호;박영태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.874-876
    • /
    • 2005
  • 본 논문에서는 지하에 매설된 통신 관로의 상태를 조사하기 위해, 레이저 투영 영상을 이용한 관로의 최소 직경을 산출하는 새로운 방법을 제안한다. 투영 영역을 정확히 분할하기 위하여 새로운 색차 모델과 다중 임계치를 적용하였다. 관로의 투영 단면은 레이저가 투영된 곡선의 형상에 나타나므로 곡선의 최소 직경을 계산하여 관로가 찌그러져 있거나 이물질이 존재하는 것을 구분할 수 있다. 제안하는 기법은 100mm의 정상 관로에서 평균 1.83mm의 오류를 나타내어 관로의 상태를 조사하는 기법으로 사용이 가능하다.

  • PDF

다중 프레임 병합을 이용한 스포츠 비디오 자막 영역 추출 (Caption Region Extraction of Sports Video Using Multiple Frame Merge)

  • 강오형;황대훈;이양원
    • 한국멀티미디어학회논문지
    • /
    • 제7권4호
    • /
    • pp.467-473
    • /
    • 2004
  • 비디오내에서의 자막은 비디오 내용을 전달하는 중요한 역할을 수행한다. 기존의 자막 영 역 추출방법들은 잡음에 민감하여 배경에서 자막 영역의 추출이 어려웠다. 본 논문에서는 다중 프레임 병합과 영역 최소 사각형을 이용하여 스포츠 비디오에서 자막 영역을 추출하는 방법을 제안한다. 전처리과정으로서 명암 대비 스트래칭과 Othu Method를 이용하여 적응적 임계치를 추출할 수 있다. 다중 프레임 병합에 의하여 자막 프레임 구간을 추출하고, 자막 영역은 미디언 필터링, 형태학적 불림, 영역 레이블링, 후보 문자영역 필터링, 영역 최소 사각형 검출에 의하여 효율적으로 추출된다.

  • PDF

레이저 투영 영상 분석에 의한 통신 관로 내벽 검사 기법 (Inspection for Inner Wall Surface of Communication Conduits by Laser Projection Image Analysis)

  • 이대호
    • 한국멀티미디어학회논문지
    • /
    • 제9권9호
    • /
    • pp.1131-1138
    • /
    • 2006
  • 본 논문에서는 지하에 매설된 통신 관로를 레이저 투영 영상 분석에 의해 검사하는 새로운 기법을 제안한다. 레이저 다이오드, 발광 다이오드와 카메라로 구성된 장비가 관내에 직접 투입되며, 레이저 다이오드는 관벽에 투영 영상을 생성하고 발광 다이오드는 내부 조명 장치로 사용되며, 카메라는 관로 영상을 획득한다. 카메라에서 전달된 다양한 조건의 관로 영상에 대해 투영 영역을 정확히 분할하기 위하여, 새로운 객차 모델과 다중 임계치 기법을 이용한다. 분할된 투영 고리의 형상은 최소 직경과 푸리에 표기자에 의해 표현하여 관로의 상태를 규칙에 기반하여 분류한다. 국부적인 최소 직경과 전역적인 푸리에 표기자를 모두 사용하므로 파손된 관로, 찌그러진 관로 등의 다양한 조건에서 높은 분류 성능을 나타낼 수 있으며, 여러 상태의 영상에 대한 실험 결과는 2% 미만의 오분류로 높은 성능을 나타냈다.

  • PDF

돼지에 있어서 양적 형질 유전자좌(QTL) 발현 특성 분석을 위한 통계적 검정 모형 설정 (Designing of the Statistical Models for Imprinting Patterns of Quantitative Traits Loci (QTL) in Swine)

  • 윤두학;공홍식;조용민;이지웅;최익서;이학교;전광주;오성종;정일정
    • 한국수정란이식학회지
    • /
    • 제19권3호
    • /
    • pp.291-299
    • /
    • 2004
  • 요크셔종과 버크셔종 교배 실험 집단을 활용하여 양적형질 유전자좌 (QTL)의 발현 특성 관련 유전 양식을 조사하였다. 총 512두의 F$_2$ 자손이 F$_1$간의 65교배 조합으로부터 생산되었으며 표현형 조사 기록은 일당증제량(ADG), 평균 등지방 두께(ABF), 10번째 등뼈 부위 등지방 두께(TRF) 및 등심단면적(LEA), 최후 척추부위 등지방 두께 (LRF)였다. 125종의 유전자 표지 (microsatellite)에 대한 3세대 개체별 유전자형이 분석되었으며 이들 정보를 통하여 최소자승 회귀 모형을 이용한 interval mapping 방법을 적용하였다. QTL의 유전양식 여부 검정에 대한 절차를 도식화하기 위해 귀무가설인 통상의 벤델리안 모형에 근거를 두고 수행하였다. 경험적 다중 검정 통계량에 대한 임계치는 단일 개개의 염색체 수준과 게놈 전반에 걸친 실험수준으로 유도하였으며, permutation에 의해 유도된 임계치의 유효성을 검증하기 위해 본 연구에 활용된 실험축 집단 구조와 유사한 simulation 집단 구조에 의해 산출된 결과들과 비교하여 유효성이 인정되었다. 본 연구에 활용된 실험축 집단구조와 Genome 전반에 걸친 QTL imprinting 여부를 조사한 결과 13종의 QTL 에 대한 imprinting이 확인되었으며 이들 중 9종의 QTL 유전 양식은 부계로부터 전달된 자손에게만 발현되는 것으로 추론되었다.

선택적 중계 기법을 적용한 다중 안테나 기반 협력 통신 시스템의 선형 전처리 기술 (Linear Precoding Technique for Cooperative MIMO Communication Systems Using Selection-Type Relaying)

  • 유병욱;이충용
    • 대한전자공학회논문지TC
    • /
    • 제47권11호
    • /
    • pp.24-29
    • /
    • 2010
  • 선택적 중계 기법은 수신 복잡도가 낮으면서도 선택 다이버시티로 인하여 성능 향상을 도모할 수 있는 협력 통신 시스템의 전송 기법 중 하나이다. 본 논문에서는 이 시스템의 오차 확률을 최소화 할 수 있는 선형 전처리 기술을 다룬다. 전 채널 상태 정보가 모든 단말에서 이용 가능하다는 가정 하에, 수신 신호의 평균 제곱 오차를 최소화하기 위한 송신 및 중계 전처리 필터를 제안한다. 중계 전송을 위한 최적의 송신 및 중계 전처리 필터는 수식적으로 표현하기 어렵고 반복 연산을 요구하므로 이를 단순화한 기법을 적용한다. 게다가, 고정된 신호 대 잡음비의 임계치를 사용하는 기존의 선택적 중계 기법과 달리 직접 경로와 중계 경로에서의 신호 검출 후 최소 신호 대 잡음비를 비교하여 더 큰 값을 갖는 경로를 전송 경로로 선택하는 기법을 소개한다. 모의실험을 통하여 제안한 선택 중계 기법이 기존의 중계 기법 및 선택적 중계 기법보다 우수한 성능을 보임을 확인할 수 있다.

LR-WPAN에서 비주기적 전송 패턴을 갖는 임펄스 기반의 TOA 추정 기법 (Impulse Based TOA Estimation Method Using Non-Periodic Transmission Pattern in LR-WPAN)

  • 박운용;박철웅;홍윤기;최성수;이원철
    • 한국통신학회논문지
    • /
    • 제33권4A호
    • /
    • pp.352-360
    • /
    • 2008
  • 최근 IEEE (Institute of Electrical and Electronics Engineers) 802.15.4a TG (Task Group)에서는 저소비, 저전력 뿐만 아니라 다수개의 피코넷이 공존하는 즉, SOPs (simultaneously operating piconets) 환경하에서 거리 인지가 가능하도록 규정하고 있으며 거리인지 (ranging)의 서비스에 따라 Ternary 코드를 이용한 coherent/non-coherent 방안이 표준으로 채택되었다. 그러나 표준안에서 제시된 최소의 펄스 간 간격(Pulse Repetition Interval; PRI)은 채널의 최대 초과 지연 aximum Excess Delay; MED) 보다 좁아 펄스 간 간섭 (Inter-Pulse Interference; IPI) 문제가 발생되어 DS(Direct Sequence) 기반의 추정기법으로는 부정확한 최초 도착 시간(Time Of Arrival; TOA)을 얻게 된다. 따라서 본 논문에서는 IPI을 줄이면서 고정밀 TOA를 추정하기 위한 비주기적 펄스 전송 (non-periodic transmission; NPT) 패턴 기법을 제안한다. 수신단은 저속 무선 개인 영역 네트워크의 모티브를 고려하여 에너지 검출을 이용한 non-coherent 기반의 수신 구조로 구성하였다. TOA 정보는 슬라이딩 상관처리 후 역 탐색 구간 (Search Back Window; SBW)을 두어 오차를 감소시키고 사전 정해진 임계치를 이용하여 얻기 된다. 제안된 펄스 패턴 기법에 대한 성능을 검증하기 위해서 BEE 802.15.4a TG에서 제시한 두 가지 채널 모델을 적용하였고 시뮬레이션 결과로부터 제안된 기법이 다수개의 피코넷이 공존하는 다중 경로 환경에서 일반적인 기법보다 성능이 개선됨을 확인하였다.

다중 피크의 영역 성장 기법에 의한 전기영동 젤의 영상 분석 ((Image Analysis of Electrophoresis Gels by using Region Growing with Multiple Peaks))

  • 김영원;전병환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권5_6호
    • /
    • pp.444-453
    • /
    • 2003
  • 최근 생명공학(BT)에 대한 관심이 집중되면서, 새로운 생리활성 물질을 찾거나 유전자 정보를 분석하기 위한 목적으로 전기영동 젤의 영상 분석 기술에 대한 요구가 급증하고 있다. 이를 위해서는 젤 영상의 레인에서 각 밴드의 위치와 양을 정확히 측정해야 한다. 기존 연구에서는 주로 레인의 프로파일에서 피크를 탐색하는 접근방법을 사용하는데, 이 피크의 위치는 밴드에 있는 최대 자기 화소의 위치도 아니고 더욱이 밴드 무게중심의 위치도 아니기 때문에 밴드의 대표 위치로 인정하기 어렵다. 또한, 피크 추출을 쉽게 하기 위해 다양한 영상 향상 처리를 적용하기 때문에 밴드의 양을 측정하기에는 부적절한 경우가 많다. 본 논문에서는 영상의 상대적인 밝기를 변화시키지 않으면서 먼저 밴드의 영역을 추출한 후, 밴드 영역의 밝기 합으로 양을 구하고 이의 무게중심을 밴드 위치로 정하는 방식을 채택한다. 실제로, 먼저 젤 영상 히스토그램에 엔트로피기반 임계치를 설정하여 레인을 추출한 후, 밴드 영역 추출을 위해 서로 다른 세 가지 방법을 시도한다. 첫째, 추출된 레인을 이등분하는 중심선을 탐색하여 피크와 밸리를 찾고, 피크의 상하 밸리를 각 밴드의 최소 포함 박스영역으로 지정하는 방법(MER), 둘째, 앞의 방법에서와 같이 구한 피크를 영역 성장의 시드로 사용하여 이웃하는 밴드와의 중첩을 해결하면서 밴드 영역을 추출하는 방법(RG-1), 셋째, 이와 달리 레인을 삼등분하는 두 탐색선에서 피크를 찾고 동일한 밴드에 속하는 피크 쌍을 결정한 후 영역을 성장하는 방법(RG-2)을 제안한다. 이상의 세 방법을 비교하기 위해 밴드의 위치 및 양을 측정한 결과, 밴드 위치의 평균 오차는 레인의 길이를 단위 크기로 정규화 할 때, MER 방법이 6%, RG-1 방법이 3%, RG-2 방법이 1%로 나타났다. 또한, 밴드 양의 평균 오차는 레인 내 밴드들의 양의 합을 단위 크기로 정규화 할 때, MER 방법이 8%, RG-1 방법이 5%, RG-2 방법이 2%로 나타났다. 결과적으로, RG-2 방법이 밴드의 위치 및 양 추출에 있어서 정확도가 가장 높은 것으로 판명되었다.