• 제목/요약/키워드: Parallel Tree-Search

검색결과 28건 처리시간 0.029초

Go와 C++ TBB의 병렬처리 비교 (Comparison of Go and C++ TBB on Parallel Processing)

  • 박동하;문봉교
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.64-67
    • /
    • 2017
  • Applying concurrent structure and parallel processing are a common issue for these day's programs. In this research, Dynamic Programming is used to compare the parallel performance of Go language and Intel C++ Thread Building Blocks. The experiment was performed on 4 core machine and its result contains execution time under Simultaneous Multi-Threading environment. Static Optimal Binary Search Tree was used as an example. From the result, the speed-up of Go was higher than the number of cores, and that of TBB was close to it. TBB performed better in general, but for larger scale, Go was partially faster than the other.

서픽스트리 클러스터링 방법과 블라스트를 통합한 유전자 서열의 클러스터링과 기능검색에 관한 연구 (A Study on Clustering and Identifying Gene Sequences using Suffix Tree Clustering Method and BLAST)

  • 한상일;이성근;김경훈;이주영;김영한;황규석
    • 제어로봇시스템학회논문지
    • /
    • 제11권10호
    • /
    • pp.851-856
    • /
    • 2005
  • The DNA and protein data of diverse species have been daily discovered and deposited in the public archives according to each established format. Database systems in the public archives provide not only an easy-to-use, flexible interface to the public, but also in silico analysis tools of unidentified sequence data. Of such in silico analysis tools, multiple sequence alignment [1] methods relying on pairwise alignment and Smith-Waterman algorithm [2] enable us to identify unknown DNA, protein sequences or phylogenetic relation among several species. However, in the existing multiple alignment method as the number of sequences increases, the runtime increases exponentially. In order to remedy this problem, we adopted a parallel processing suffix tree algorithm that is able to search for common subsequences at one time without pairwise alignment. Also, the cross-matching subsequences triggering inexact-matching among the searched common subsequences might be produced. So, the cross-matching masking process was suggested in this paper. To identify the function of the clusters generated by suffix tree clustering, BLAST was combined with a clustering tool. Our clustering and annotating tool is summarized as the following steps: (1) construction of suffix tree; (2) masking of cross-matching pairs; (3) clustering of gene sequences and (4) annotating gene clusters by BLAST search. The system was successfully evaluated with 22 gene sequences in the pyrubate pathway of bacteria, clustering 7 clusters and finding out representative common subsequences of each cluster

이동 호스트의 병렬적 위치 정보 탐색을 위한 서버의 계층 구조 (A Hierarchical Server Structure for Parallel Location Information Search of Mobile Hosts)

  • 정광식;유헌창;황종선
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권1_2호
    • /
    • pp.80-89
    • /
    • 2001
  • A Hierarchical Server Structure for Parallel Location Information Search of Mobile Hosts이동 컴퓨팅 환경의 발전은 기존의 분산 시스템에서는 볼 수 없었던 이동 호스트의 위치 정보 관리 문제, 이동 호스트의 접속 단절 문제, 낮은 무선 통신 대역폭의 문제 등 과 같은 새로운 문제점을 발생시켰다. 특히 이동 호스트의 위치 정보 관리 기법은 이동 컴퓨팅 환경의 성능을 저하시킨다. 이동 호스트의 이동성으로 인해 이동 호스트의 주소가 이동 호스트의 위치에 종속적으로 변화하며, 이동 호스트의 주소는 고유 주소와 현재 주소의 사상을 통해 관리된다. 이동 호스트의 고유 주소와 현재 주소를 사상시켜 주기 위한 이전의 기법들은 이동 호스트의 증가 및 위치 정보의 분산관리를 고려하지 않았기 때문에 시스템의 확장성에 큰 문제를 가지고 있다. 이 논문에서는 이동 호스트의 주소를 분산 관리하기 위해 개선된 n-깊이 위치 정보 탐색 트리와 개선된 n-깊이 위치 정보 탐색 트리를 기반으로 한 병렬적 위치 정보 탐색과 갱신 기법을 제안한다. 개선된 n-깊이 위치 정보 탐색 트리는 링 구조를 이용하여 위치 정보 서버를 지역적으로 분할한 위치 정보 서버의 논리적 계층 구조이며, 병렬적 탐색 기법을 기반으로 이동 호스트의 위치 탐색 비용과 갱신 비용을 줄였다. 개선된 n-깊이 위치 정보 탐색 트리를 기반으로 한 위치 정보 탐색/갱신 기법은 위치 정보 서버의 논리적 위치가 멀리 떨어져 있는 경우에도 병렬적 탐색 기법을 통해 기존의 방법보다 좋은 결과를 보인다. 또한, 탐색비용의 감소에도 불구하고 갱신 비용의 증가를 가져오지 않는다.

  • PDF

유전자 알고리즘을 이용한 배수관망의 최적 확장 설계 (Genetic Algorithms for Optimal Augmentation of Water Distribution Networks)

  • 이승철;이상일
    • 한국수자원학회논문집
    • /
    • 제34권5호
    • /
    • pp.567-575
    • /
    • 2001
  • 관망해석 시뮬레이션과 유전자 알고리즘에 기초한 최적화 모형을 이용하여 최소비용의 배수관망을 설계하는 방법론이 개발되었다. 유전자 알고리즘은 추계학적 최적화 기법의 하나로, 비선형적이고 계산량이 많은 관망설계 문제에 적용하기에 적합한 장점을 가지고 있다. 기존의 연구가 대부분 전체 관망의 신설 혹은 기존 관망의 병렬확장에만 적용하던 것에 비해 본 연구에서는 개발된 모형을 수지상(tree-type) 신설관 및 loop형 병렬증설관이 공존하는 시스템에 적용하였다. 개발된 모형을 백련 배수관로를 대상으로 적용한 결과, 수리학적 제약조건을 만족시키면서 사업비를 최대 5.37% 절감할 수 있는 설계를 제공하는 것으로 나타났다.

  • PDF

고속 데이터 전송 채널을 위한 신호공간 검출 (Signal Space Detection for High Data Rate Channels)

  • 전태현
    • 대한전자공학회논문지TC
    • /
    • 제42권10호
    • /
    • pp.25-30
    • /
    • 2005
  • 본 논문에서는 신호공간 검출의 개념을 일반화하여 하나의 심볼 구간에서 하나 이상의 심볼들의 블록에 대한 검출을 수행하는 고정지연 트리 검색 신호검출기의 구성을 제안한다. 제안된 기법은 고속의 구현에 적합하다. 두 가지의 접근방법이 논의되며 이들은 모두 효율적인 신호공간 분할에 기반을 두고 있다. 첫 번째 방법에서는 심볼의 검출이 다중 클래스 분할에 기반을 둔다. 이 방법은 2개의 클래스에 기반을 둔 이진 심볼 검출방법을 일반화한 접근방법을 사용한다. 두 번째 방법에서는 이진 신호 검출이 look-ahead 기법과 결합된 고도의 병렬처리 신호검출 구조를 활용한다.

Maximum A Posteriori Estimation-based Adaptive Search Range Decision for Accelerating HEVC Motion Estimation on GPU

  • Oh, Seoung-Jun;Lee, Dongkyu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권9호
    • /
    • pp.4587-4605
    • /
    • 2019
  • High Efficiency Video Coding (HEVC) suffers from high computational complexity due to its quad-tree structure in motion estimation (ME). This paper exposes an adaptive search range decision algorithm for accelerating HEVC integer-pel ME on GPU which estimates the optimal search range (SR) using a MAP (Maximum A Posteriori) estimator. There are three main contributions; First, we define the motion feature as the standard deviation of motion vector difference values in a CTU. Second, a MAP estimator is proposed, which theoretically estimates the motion feature of the current CTU using the motion feature of a temporally adjacent CTU and its SR without any data dependency. Thus, the SR for the current CTU is parallelly determined. Finally, the values of the prior distribution and the likelihood for each discretized motion feature are computed in advance and stored at a look-up table to further save the computational complexity. Experimental results show in conventional HEVC test sequences that the proposed algorithm can achieves high average time reductions without any subjective quality loss as well as with little BD-bitrate increase.

다양한 블록 크기의 전역 탐색 알고리즘을 위한 효율적인 구조를 갖는 움직임 추정기 설계 (The Motion Estimator Implementation with Efficient Structure for Full Search Algorithm of Variable Block Size)

  • 황종희;최윤식
    • 대한전자공학회논문지SD
    • /
    • 제46권11호
    • /
    • pp.66-76
    • /
    • 2009
  • 움직임 추정은 영상 부호화 시스템에서 큰 비중을 차지하는 부분으로, 실시간 동작을 위해서는 효율적인 구조를 필요로 한다. 따라서 H.264 전체 시스템을 위한 움직임 추정기 블록의 구현은 부호화 과정을 고속으로 수행할 수 있도록 별도의 전용 하드웨어 모듈로 설계하는 것이 바람직하다. 본 논문에서는 많은 연산량을 효율적으로 줄일 수 있도록 병렬 처리를 바탕으로 움직임 추정 감지 블록, 41개의 SAD(Sum of Absolute Difference)값 계산 블록, 최소의 SAD값 계산과 움직임 벡터 생성 블록을 제안하고자 한다. 움직임 추정 감지 블록과 최소의 SAD값 계산기에서는 선계산(pre-computation) 방법을 적용함으로써, 입력 Switching Activity를 줄여 고속 구현이 가능하도록 하였으며, 움직임 추정 감지 블록과 41개의 SAD값 계산 블록에서 가장 많은 부분을 차지하는 가산기 구조를 일반적으로 사용되는 Ripple Carry Adder 대신에 Carry Skip Adder를 적용함으로써, Adder Tree 구조를 고속으로 처리할 수 있도록 하였다. 또한 외부에서 탐색 영역 제어와 같은 주요 변수를 쉽게 제어할 수 있도록 하여, 하드웨어 구조의 효율성을 높였다. 시뮬레이션 및 FPGA 검증 결과, 움직임 추정기의 임계 경로를 발생시키는 MED블록에서 일반적인 구조를 적용했을 때보다 19.89%의 Delay 감소 효과를 얻을 수 있었다.

효율적인 병렬 고차원 색인구조 설계 (Design of an Efficient Parallel High-Dimensional Index Structure)

  • 박춘서;송석일;신재룡;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권1호
    • /
    • pp.58-71
    • /
    • 2002
  • 일반적으로 이미지나 공간 데이터베이스와 같은 다차원의 특징을 갖는 데이터들은 대용량의 저장공간을 요구한다. 이 대량의 데이터를 하나의 워크스테이션에 저장하고 검색을 수행하는 데는 한계가 있다. 최근 활발히 연구되고 있는 병렬 컴퓨팅 환경에서 이들에 대한 저장 및 검색을 수행한다면 훨씬 더 높은 성능 향상을 가져 올 수 있을 것이다. 이 논문에서는 기존에 존재하는 병렬 컴퓨팅 환경의 장점을 최대한 이용하는 병렬 고차원 색인구조를 제안한다. 제안하는 색인구조는 nP(프로세서)-nD(디스크)와 lP-nD의 결합 형태인 nP-n$\times$mD의 구조라고 볼 수 있다. 노드 구조는 팬-아웃을 증가시키고 트리의 높이를 줄일 수 있도록 설계되었다. 또한 I/O의 별렬성을 최대화하는 범위 탐색 알고리즘을 제안하고 이것을 K-최근접 탐색 알고리즘에 적용하여 탐색 성능향상을 꾀한다. 마지막으로, 다양한 환경에서의 실험을 통해 제안하는 색인구조의 탐색 성능을 테스트하고 기존에 제안된 병렬 다차원 색인구조와의 비교를 통해 제안한 방법의 우수함을 보인다.

CUDA를 이용한 효과적인 GPU 광선추적 가속 알고리즘 (An efficient acceleration algorithm of GPU ray tracing using CUDA)

  • 지중현;윤동호;고광희
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.469-474
    • /
    • 2009
  • 본 논문은 CUDA를 이용하여 GPU에서의 최적화된 kd-tree 탐색구조 환경과 광선/삼각형의 교차검사 알고리즘을 통한 실시간의 광선추적 시스템을 제안한다. 기존의 GPU 기반 kd-tree 탐색 알고리즘은 대부분 스택이 없는 GPU 하드웨어의 특성상 임의의 단말노드에서 기하요소의 교차검사가 실패할 경우 상위노드로 상향식 탐색을 진행하기 때문에 노드에 대한 중복 방문이 반드시 필요하거나 혹은 불필요한 메모리의 적재가 필요하기 때문에 큰 장면에 대한 광선추적은 어렵게 된다. 본 논문에서 제안하는 알고리즘은 CPU 방식의 kd-tree 탐색과 비슷하게 동작하도록 stack을 CUDA 프레임워크를 이용하여 GPU의 지역메모리로 구현하였기 때문에 기존의 방법 등에서의 문제점을 해결하였다. 또한 탐색구조를 통해서 찾은 말단 삼각형들의 처리를 위해서 최신의 CPU 기반의 교차검사 알고리즘인 Plucker 좌표계 검사를 CUDA로 구현하여 병렬 가속시켰다. Plucker 검사는 기존의 무게중심 좌표 대신에 광선과 삼각형 edge의 관계를 이용하는 간단한 연산만을 이용하는 장점이 있다. 전체 시스템은 단일 커널로 구성되어 있으며 병렬처리를 위한 복잡한 동기화나 광선패킷의 도입 없이 간단하게 구현되었다. 결과적으로 본 논문의 실험은 기존 알고리즘 대비 제안하는 알고리즘이 약 2배의 성능 향상이 있음을 보여 준다.

  • PDF

병렬 Shifted Sort 알고리즘의 Warp 단위 CUDA 구현 최적화 (Optimization of Warp-wide CUDA Implementation for Parallel Shifted Sort Algorithm)

  • 박태정
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권4호
    • /
    • pp.739-745
    • /
    • 2017
  • 본 논문에서는 GPU 병렬 처리 하드웨어 아키텍처 내 최소 물리적 스레드 실행 단위(warp) 내에서 shifted sort 기반 k개 최근접 이웃 검색 기법을 구현하는 방법을 논의하고 일반적으로 동일한 목적으로 널리 사용되는 GPU 기반 kd-tree 및 CPU 기반 ANN 라이브러리와 비교한 결과를 제시한다. 또한 많은 애플리케이션에서 k가 비교적 작은 값이 필요한 경우가 많다는 사실을 고려해서 k가 warp 내부에서 직접 처리 가능한 2, 4, 8, 16개일 때 최적화에 집중한다. 구현 세부에서는 사용한 CUB 공개 라이브러리의 루프 내 메모리 관리 방법, GPU 하드웨어 직접 명령 적용 방법 등의 최적화 방법을 논의한다. 실험 결과, 제안하는 방법은 기존의 GPU 기반 유사 방법에 비해 데이터 지점과 질의 지점의 개수가 각각 $2^{23}$개 일 때 16배 이상의 빠른 처리 속도를 보였으며 이러한 경향은 처리해야 할 데이터의 크기가 커지면 더욱 더 커지는 것으로 판단된다.