• 제목/요약/키워드: Prefix Partition

검색결과 5건 처리시간 0.02초

서픽스 검사를 이용한 단계적 순차패턴 분할 탐사 방법 (A Partition Mining Method of Sequential Patterns using Suffix Checking)

  • 허용도;조동영;박두순
    • 한국멀티미디어학회논문지
    • /
    • 제5권5호
    • /
    • pp.590-598
    • /
    • 2002
  • 효율적인 순차패턴 마이닝을 위해서는 후보패턴의 생성 비용을 줄이고 동시에 생성된 후보패턴에 대한 탐색공간을 줄여야 한다. 그러나 이전에 개발된 알고리즘들은 이러한 문제들을 효율적으로 해결하지 못하고 있다. 특히 Apriori-like 방법들은 알고리즘은 단순하지만 많은 크기의 후보패턴 집합생성, 대용량 데이터 베이스의 반복적인 탐사 등의 문제점이 있고, PrefixSpan[2]은 단계별로 분할된 프레픽스 프로젝티드(prefix projected) 데이터 베이스들을 구성 하여 후보패턴의 지지도 계산을 위한 탐색 공간을 줄이지만 프로젝티드 데이타베이스들의 구성비용이 크다는 문제점이 있다. 이러한 문제점들의 개선을 위해 본 논문에서는 새로운 순차패턴 마이닝 방법인 Suffixspan(Suffix Checked Sequential Pattern mining)을 제 안한다. Suffixspan은 순차패턴 집합의 단계별 분할특성과 서픽스(suffix) 특성을 이용하여 적은 비용으로 작은 크기의 후보패턴 집합을 생성하고, 1-프레픽스 프로젝티드 데이타베이스를 구성하여 후보패턴 검사를 위한 탐색공간을 줄인다.

  • PDF

Prefix Cuttings for Packet Classification with Fast Updates

  • Han, Weitao;Yi, Peng;Tian, Le
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권4호
    • /
    • pp.1442-1462
    • /
    • 2014
  • Packet classification is a key technology of the Internet for routers to classify the arriving packets into different flows according to the predefined rulesets. Previous packet classification algorithms have mainly focused on search speed and memory usage, while overlooking update performance. In this paper, we propose PreCuts, which can drastically improve the update speed. According to the characteristics of IP field, we implement three heuristics to build a 3-layer decision tree. In the first layer, we group the rules with the same highest byte of source and destination IP addresses. For the second layer, we cluster the rules which share the same IP prefix length. Finally, we use the heuristic of information entropy-based bit partition to choose some specific bits of IP prefix to split the ruleset into subsets. The heuristics of PreCuts will not introduce rule duplication and incremental update will not reduce the time and space performance. Using ClassBench, it is shown that compared with BRPS and EffiCuts, the proposed algorithm not only improves the time and space performance, but also greatly increases the update speed.

공간 효율적인 DNA 시퀀스 인덱싱 방안 (A Space Efficient Indexing Technique for DNA Sequences)

  • 송혜주;박영호;노웅기
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.455-465
    • /
    • 2009
  • 서픽스 트리는 공통의 프리픽스의 빈도수가 높을 때 효과적인 알고리즘으로, 한정된 문자로만 구성된 DNA 유사성 검색을 위한 연구에서 널리 활용되고 있다. 그러나, 서픽스 트리는 인덱스 특성상 메모리 공간을 많이 차지하며, 트리의 분할 시 DNA 시퀀스의 비율로 인한 쏠림현상이 발생한다는 문제점을 가진다. 따라서, 본 논문에서는 공통의 프리픽스를 가지는 가변길이의 파티셔닝 방법으로 합병하지 않는 인덱싱 방안인 SENoM을 제안한다. SENoM은 전체 시퀀스에서 공통의 프리픽스를 가지는 서픽스들의 발생 빈도수가 임계치 이하인 경우 디스크에 저장하고, 임계치 이상인 경우 임계치 이하가 될 때까지 프리픽스를 확장한다. 모든 파티션은 서브트리로 구축한 후 디스크에 저장하며, 질의처리를 위해, 구축된 파티션의 프리픽스를 서픽스로 가지는 트리를 구축한다. 제안하는 기법은 복잡한 합병과정을 제거하고, 많은 파티션 발생으로 인한 디스크 I/O 발생을 줄인다. 실험을 통해, SENoM이 Trellis 알고리즘에 비해 메모리 사용량을 약 35%, 인덱스 크기를 약 20% 감소시켰음을 보인다. 또한, 질의길이가 긴 경우에도 프리픽스 트리를 이용하여 효과적인 질의처리가 가능함을 보인다.

고속의 라우터를 위한 병렬 IP 주소 검색 기법 (A Parallel IP Address Lookup Scheme for High-Speed Routers)

  • 박재형;정민영;김진수;원용관
    • 정보처리학회논문지A
    • /
    • 제11A권5호
    • /
    • pp.333-340
    • /
    • 2004
  • 인터넷에서 IP 패킷을 목적지로 전달하는 라우터는 목적지의 주소에 따라서 다음 홉을 결정하는 IP 주소를 검색하는 과정을 수행한다. 패킷을 전달하는 과정에서 주소 검색은 고속의 라우터의 설계에 중요한 요인이다. 본 논문에서는 이미 하드웨어로 구현된 간접 IP 주소 검색 칩셋의 변경 없이 고속의 라우터의 설계를 위해서 여러 개의 검색 엔진으로 구성된 병렬 주소 검색 기법을 제안한다. 또한, 라우터 시스템 전체 포워딩 테이블에 존재하는 IP 프리픽스 엔트리를 각각의 검색 엔진에 분할하는 규칙을 제시한다. 본 논문에서 제안한 주소 검색 기법의 성능은 IP 프리픽스에 대한 포워딩 정보를 저장하는데 필요한 메모리의 양과 포워딩 테이블을 구성하기 위해 필요한 메모리 접근 횟수로 평가하였다. 본 논문에서 제안한 기법은 한 개의 검색 엔진을 사용하였을 때에 비해서 네 개의 검색 엔진을 사용할 경우, 하드웨어 로직의 도움으로 약 35%의 메모리 양의 감소와 80%의 메모리 접근 횟수의 감소를 보여준다.

IP 주소 검색의 속도 향상을 위한 분할된 압축 트라이 구조 (A Partitioned Compressed-Trie for Speeding up IP Address Lookups)

  • 박재형;장익현;정민영;원용관
    • 정보처리학회논문지C
    • /
    • 제10C권5호
    • /
    • pp.641-646
    • /
    • 2003
  • 인터넷에서 IP 패킷 전송은 링크의 전송 속도와 더불어 라우터에서의 패킷 처리 속도에 영향을 받는다. 라우터는 외부 인터페이스에서 입력되는 패킷을 목적지로 보내기 위한 다음 홉을 결정하여 패킷을 전달하는 역할을 수행한다. 이 과정에서 주소 검색은 고성능의 라우터 설계에 중요한 요인이다. 본 논문에서는 트라이 자료 구조 기반의 IP 주소 검색 알고리즘의 성능을 향상시키기 위해서 경로 압축을 이용한 분할 압축 트라이 구조를 제안한다. 제안된 분할 압축 트라이에서는 IP 주소 프리픽스들을 여러 개의 분할 압축 트라이로 나누어서 하나의 분할된 압축 트라이에서만 검색이 이루어지도록 하여 압축 트라이에서 탐색하는데 드는 시간을 줄이는 방법이다. 분할을 함으로써 늘어나게 되는 메모리의 부담이 적음을 보여준다.