• 제목/요약/키워드: 프리픽스 분할

검색결과 7건 처리시간 0.017초

공간 효율적인 DNA 시퀀스 인덱싱 방안 (A Space Efficient Indexing Technique for DNA Sequences)

  • 송혜주;박영호;노웅기
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.455-465
    • /
    • 2009
  • 서픽스 트리는 공통의 프리픽스의 빈도수가 높을 때 효과적인 알고리즘으로, 한정된 문자로만 구성된 DNA 유사성 검색을 위한 연구에서 널리 활용되고 있다. 그러나, 서픽스 트리는 인덱스 특성상 메모리 공간을 많이 차지하며, 트리의 분할 시 DNA 시퀀스의 비율로 인한 쏠림현상이 발생한다는 문제점을 가진다. 따라서, 본 논문에서는 공통의 프리픽스를 가지는 가변길이의 파티셔닝 방법으로 합병하지 않는 인덱싱 방안인 SENoM을 제안한다. SENoM은 전체 시퀀스에서 공통의 프리픽스를 가지는 서픽스들의 발생 빈도수가 임계치 이하인 경우 디스크에 저장하고, 임계치 이상인 경우 임계치 이하가 될 때까지 프리픽스를 확장한다. 모든 파티션은 서브트리로 구축한 후 디스크에 저장하며, 질의처리를 위해, 구축된 파티션의 프리픽스를 서픽스로 가지는 트리를 구축한다. 제안하는 기법은 복잡한 합병과정을 제거하고, 많은 파티션 발생으로 인한 디스크 I/O 발생을 줄인다. 실험을 통해, SENoM이 Trellis 알고리즘에 비해 메모리 사용량을 약 35%, 인덱스 크기를 약 20% 감소시켰음을 보인다. 또한, 질의길이가 긴 경우에도 프리픽스 트리를 이용하여 효과적인 질의처리가 가능함을 보인다.

IP 주소 검색의 속도 향상을 위한 분할된 압축 트라이 구조 (A Partitioned Compressed-Trie for Speeding up IP Address Lookups)

  • 박재형;장익현;정민영;원용관
    • 정보처리학회논문지C
    • /
    • 제10C권5호
    • /
    • pp.641-646
    • /
    • 2003
  • 인터넷에서 IP 패킷 전송은 링크의 전송 속도와 더불어 라우터에서의 패킷 처리 속도에 영향을 받는다. 라우터는 외부 인터페이스에서 입력되는 패킷을 목적지로 보내기 위한 다음 홉을 결정하여 패킷을 전달하는 역할을 수행한다. 이 과정에서 주소 검색은 고성능의 라우터 설계에 중요한 요인이다. 본 논문에서는 트라이 자료 구조 기반의 IP 주소 검색 알고리즘의 성능을 향상시키기 위해서 경로 압축을 이용한 분할 압축 트라이 구조를 제안한다. 제안된 분할 압축 트라이에서는 IP 주소 프리픽스들을 여러 개의 분할 압축 트라이로 나누어서 하나의 분할된 압축 트라이에서만 검색이 이루어지도록 하여 압축 트라이에서 탐색하는데 드는 시간을 줄이는 방법이다. 분할을 함으로써 늘어나게 되는 메모리의 부담이 적음을 보여준다.

고속의 라우터를 위한 병렬 IP 주소 검색 기법 (A Parallel IP Address Lookup Scheme for High-Speed Routers)

  • 박재형;정민영;김진수;원용관
    • 정보처리학회논문지A
    • /
    • 제11A권5호
    • /
    • pp.333-340
    • /
    • 2004
  • 인터넷에서 IP 패킷을 목적지로 전달하는 라우터는 목적지의 주소에 따라서 다음 홉을 결정하는 IP 주소를 검색하는 과정을 수행한다. 패킷을 전달하는 과정에서 주소 검색은 고속의 라우터의 설계에 중요한 요인이다. 본 논문에서는 이미 하드웨어로 구현된 간접 IP 주소 검색 칩셋의 변경 없이 고속의 라우터의 설계를 위해서 여러 개의 검색 엔진으로 구성된 병렬 주소 검색 기법을 제안한다. 또한, 라우터 시스템 전체 포워딩 테이블에 존재하는 IP 프리픽스 엔트리를 각각의 검색 엔진에 분할하는 규칙을 제시한다. 본 논문에서 제안한 주소 검색 기법의 성능은 IP 프리픽스에 대한 포워딩 정보를 저장하는데 필요한 메모리의 양과 포워딩 테이블을 구성하기 위해 필요한 메모리 접근 횟수로 평가하였다. 본 논문에서 제안한 기법은 한 개의 검색 엔진을 사용하였을 때에 비해서 네 개의 검색 엔진을 사용할 경우, 하드웨어 로직의 도움으로 약 35%의 메모리 양의 감소와 80%의 메모리 접근 횟수의 감소를 보여준다.

IP 주소 검색을 위한 최적화된 영역분할 이진검색 구조 (Optimized Binary-Search-on- Range Architecture for IP Address Lookup)

  • 박경혜;임혜숙
    • 한국통신학회논문지
    • /
    • 제33권12B호
    • /
    • pp.1103-1111
    • /
    • 2008
  • 라우터는 입력되는 패킷을 인터넷 주소 검색을 통하여 패킷의 목적지로 향하는 포트로 포워딩하는 역할을 하는데, 입력되는 속도와 같은 속도로 패킷을 포워딩하기 위해서는 매우 빠른 검색을 제공할 필요가 있다. 본 논문에서는 이진 검색을 이용한 IP 주소 검색구조에 대해 연구하였다. 대부분의 이진 검색 알고리즘들은 균형 이진 검색을 진행하지 않아 과도한 메모리 접근을 야기함으로써 검색속도가 느린 단점이 있다. 한편 영역분할을 이용한 이진 검색 알고리즘은 매우 빠른 검색 성능을 보이지만, 메모리 요구량이 크다는 단점이 있다. 본 논문에서는 영역분할 이진 검색에서 불필요한 엔트리와 항목을 삭제함으로써 라우팅 테이블의 크기를 최적화하여 메모리 요구량을 감소시키는 방법에 대하여 연구하였다. 이러한 최적화를 통하여 프리픽스의 개수와 비슷하거나 적은 수의 엔트리를 갖는 영역분할 이진 검색 라우팅 테이블을 구성할 수 있음을 보였다. 실제 사용되는 다양한 크기의 라우팅 테이블을 이용하여 영역분할 이진 검색의 원래 구조와 최적화된 구조의 검색 성능을 비교하였으며, 다른 여러가지 이진 검색 알고리즘과의 성능을 비교하였다.

최적화된 영역 분할을 이용한 패킷 분류 알고리즘 (Optimum Range Cutting for Packet Classification)

  • 김형기;박경혜;임혜숙
    • 한국정보과학회논문지:정보통신
    • /
    • 제35권6호
    • /
    • pp.497-509
    • /
    • 2008
  • 현재 패킷 분류에 대한 다양한 알고리즘들이 연구되어 오고 있다 그 중 HiCuts와 HyperCuts와 같은 디시젼(decision) 트리에 기초한 패킷 분류 알고리즘은 룰의 각 필드가 가지는 영역에 따른 기하학적 구조를 이용한 방법으로 잘 알려져 있다. 그러나 이 알고리즘들은 분할(cutting)을 수행할 필드(Field)를 선택하거나 디시젼 트리의 각 노드에서 컷(cut)의 수를 결정해야 하는 등의 비교적 복잡한 작업을 요구하므로 현실적으로 구현하기 어려운 점을 가진다. 또한 각 룰이 차지하는 영역의 특성을 고려하지 않고 일정한 크기의 영역으로 커팅이 이루어지므로 효과적인 커팅을 하지 못하는 단점이 있다. 본 논문에서는 새로운 영역 분할을 사용한 효과적인 패킷 분류 알고리즘을 제안한다. 제안하는 알고리즘은 먼저 프리픽스를 가지는 두 필드를 이용하여 각 룰이 차지하는 영역들을 찾아내 이들을 이용해 영역분할을 수행한다. 따라서 제안된 알고리즘은 보다 효율적인 디시젼 트리를 구성한다. 즉, 디시젼 트리의 각 노드에서는 HiCuts이나 HyperCuts와 같은 복잡한 작업없이 최적화된 커팅을 수행할 수 있다. 클래스 벤치에서 제공된 데이타베이스에 대하여 시뮬레이션을 수행한 결과, 제안된 알고리즘은 평균 검색 속도에서 기존의 알고리즘들보다 훨씬 향상되었고 메모리 요구량에서는 기존의 커팅 알고리즘과 비교하여 대략 $3{\sim}300$배까지 크게 줄어드는 효과를 보였다.

CUDA를 이용한 효율적인 합산 영역 테이블의 생성 방법 (Bandwidth Efficient Summed Area Table Generation for CUDA)

  • 하상원;최문희;전태준;김진우;변혜란;한탁돈
    • 한국게임학회 논문지
    • /
    • 제12권5호
    • /
    • pp.67-78
    • /
    • 2012
  • 합산 영역 테이블은 모든 픽셀에 대해 임의의 크기 사각영역의 이미지 필터링 처리를 일정시간 안에 가능케 한다. 이러한 특성은 각각의 픽셀에 대해서 주변 픽셀의 밝기의 합 혹은 평균을 필요로 하는 이미지 처리 적용 분야에 유용하게 쓰일 수 있다. 합산 영역 테이블의 생성은 단지 행 혹은 열 단위의 합만을 구하는 메모리 바운드 작업임에도 불구하고 기존 연구들은 이미 존재하는 데이터 병렬성만을 활용하기 위하여 대기 시간이 긴 전역 메모리에 과도한 접근을 하여야만 했다. 본 논문에서는 입력 데이터를 정방의 서브 이미지로 분할하고 매개 데이터를 이들 간에 파급시킴으로써 GPGPU 환경 적합한 알고리즘을 제안하고자 한다. 이를 통하여 기존 방법 대비 전역 메모리 접근 량을 거의 반으로 줄임으로써 주어진 메모리 대역폭을 효율적으로 사용한다. 결과에서도 성능이 대폭 향상되었다.

길이에 대한 2차원 이진검색을 이용한 패킷분류 구조 (Packet Classification Using Two-Dimensional Binary Search on Length)

  • 문주형;임혜숙
    • 한국통신학회논문지
    • /
    • 제32권9B호
    • /
    • pp.577-588
    • /
    • 2007
  • 인터넷의 성장은 다양한 응용 프로그램들의 발달을 야기 시켰으며, 그로 인해 모든 패킷을 동일하게 처리하는 현재의 최선지원 서비스 보다 나은 서비스를 제공할 것을 요구하고 있다. 따라서 차세대 인터넷 라우터들은 다양한 레벨의 품질보장 서비스를 제공하여야 한다. 품질보장 서비스를 제공하기 위해서는 모든 입력 패킷을 미리 정의된 룰에 따라 구분하는 패킷 분류가 실시간으로 수행되어야 한다. 패킷분류는 패킷에 포함된 여러 헤더 필드에 대하여 다양한 종류의 검색을 수행하여야 하며, 일치하는 룰들 중에서 가장 높은 우선순위를 갖는 룰을 찾아야 하는 다차원 검색이다. 영역분할을 사용한 사분트라이 구조는 근원지와 목적지 프리픽스를 2차원 트라이 구조로 저장하여 검색을 진행하는 좋은 알고리즘이나, 길이에 대하여 선형검색을 하는 방법이므로 좋은 검색 성능을 보이지 못한다. 본 논문에서는 사분트라이 구조에서 길이에 대하여 이진검색을 진행하는 새로운 패킷분류 알고리즘을 제안한다. 또한 패킷이 여러 개의 룰과 일치하였을 경우 가장 높은 우선순위를 가지는 룰을 선택한다는 특성을 이용하여, 사분트라이를 만드는 과정에서 우선순위를 고려하여 검색 성능을 향상시킬 수 있는 방안을 제안한다.