• 제목/요약/키워드: 병렬 구현

검색결과 1,474건 처리시간 0.033초

TBB, Cilk Plus를 이용한 병렬 접미사 트리 생성 알고리즘 구현 및 성능 분석 (Implementation and analysis of a parallel suffix tree construction algorithm using TBB and Cilk Plus)

  • 서준호;나중채
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.403-405
    • /
    • 2012
  • 접미사 트리는 문자열 압축, 텍스트 처리, 생물정보학 등 다양한 응용 분야에서 사용되는 인덱스 자료구조이다. 최근 64bit 하드웨어와 멀티코어 CPU가 보급됨에 따라 메모리상에서 병렬로 접미사 트리를 생성하는 알고리즘이 활발히 연구되고 있다. 본 논문에서는 McCreight의 선형시간 알고리즘과 Chen의 병렬 알고리즘을 기반으로 메모리상에서 접미사 트리를 병렬로 생성하는 구현 방법을 보였으며, TBB, Cilk Plus와 같은 병렬 프로그래밍 라이브러리를 이용하여 병렬 알고리즘을 구현하였다. 알고리즘 실험 결과 병렬로 수행한 알고리즘이 직렬로 수행한 결과보다 최대 4배 가량 성능 향상을 얻을 수 있었으며, 병렬 라이브러리를 사용함으로써 가지는 오버헤드는 극히 적은 것으로 나타났다.

클러스터 시스템에서의 양방향 병렬 탐색의 구현 (The Implementation of Parallel Bidirectional Search on Cluster System)

  • 차광호;홍정우;곽재승;변옥환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.189-192
    • /
    • 2002
  • 특정 문제를 위하여 병렬화 알고리즘을 적용할 경우. 기존의 순차적인 알고리즘과는 다른 방식의 문제 접근이 가능한 경우가 있다. 인공 지능 분야의 양방향 병렬 탐색을 그 예로 들 수 있으며 특정 슈퍼 컴퓨터를 대상으로 한 구현 및 성능 측정 결과가 보고 된 바 있다. 본 논문에서는 최근 병렬 시스템의 새로운 분야로 부각되고 있는 클러스터 시스템을 대상으로 양방향 병렬 탐색 알고리즘을 구현하고 테스트 하였다. 구현에 있어서는 클러스터 시스템에서 많이 이용되는 메시지 패싱 인터페이스 (MPI)를 사용하였으며 여러 가지 조건을 조합하여 테스트 함으로서, 클러스터 시스템 환경에서 양방향 병렬 탐색이 갖는 성능을 분석하였다.

  • PDF

고속 HEVC 부호화를 위한 효율적인 PU 레벨 움직임예측 병렬화 구현 기법 (Efficient parallelization implementation technique of PU-level ME for fast HEVC encoding)

  • 박수빈;최기호;박상효;장의선
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 추계학술대회
    • /
    • pp.163-166
    • /
    • 2012
  • 본 논문에서는 차세대 비디오 표준인 High Efficiency Video Coding(HEVC)의 영상 부호화 과정의 시간복잡도 감소를 위한 효율적인 Prediction Unit(PU)레벨 움직임예측(Motion Estimation, ME) 병렬화의 구현 기법을 제시하고자 한다. 움직임예측 과정은 부호화기에서 80%의 복잡도를 차지하는 과정으로 고속 부호화의 걸림돌이 되고 있다. 이를 해결하기 위한 방법으로 제안된 것이 움직임예측 알고리즘의 병렬화이다. 알고리즘 수준에서 ME 의 일부인 Merge Estimation 의 병렬화를 위해서 Merge Estimation Region (MER)기반의 ME 방법이 제안되었다. 하지만 HEVC Test Model reference software(HM)에 반영된 MER 을 이용하여 실제로 병렬화된 ME 를 구현하는 과정에서는 알고리즘 측면에서 아직 고려되지 않은 문제들이 존재한다. 이에 본 논문에서는 MER 을 사용한 안정적인 병렬 ME 를 구현하기 위한 전략으로 각 PU 의 정보를 독립적으로 사용하기 위한 부분 순차화 방법과 메모리 접근제한을 이용한 병렬화 방법을 제시한다. 실험을 통해 본 연구의 우수성이 확인되었는데, 제안된 방법에 기반을 둔 구현에서 순차적인 ME 를 이용한 부호화기 대비 평균 25.64%의 전체 부호화 과정 시간의 감소가 나타났다.

  • PDF

다층 신경망 구현에서의 GPU 사용 (GPU for Multi-Layer Perceptron)

  • 정기철;오경수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.736-738
    • /
    • 2004
  • 신경망의 테스트 단계를 실시간으로 처리하기 위해 많은 노력이 있었다 본 논문은 일반적인 그래픽스 하드웨어를 이용하여 더욱 빠른 신경망을 구현하고, 구현된 시스템을 영상 처리 분야에 적용함으로써 효용성을 검증한다. GPU는 CPU보다 병렬연산에 효과적이다. GPU의 병렬성을 효율적으로 사용하기 위하여, 다수의 신경망 입력벡터와 웨이트벡터를 모아서 많은 내적연산을 하나의 행렬곱 연산으로 대체하였고, 시그모이드와 바이어스 항 덧셈 연산도 픽셀세이더로 병렬 구현하였다. ATI RADEON 9800 XT 보드를 이용하여 구현된 신경망 시스템은 CPU를 사용한 기존의 시스템과 비교하여 정악도의 차이 없이 30배 정도의 속도 향상을 얻을 수 있었다.

  • PDF

데이타베이스 공유 시스템에서 병렬 해쉬 조인 알고리즘의 구현 (Implementation of Parallel Hash Join Algorithms in a Database sharing System)

  • 김창현;조행래
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.43-45
    • /
    • 2002
  • 기존에 제안된 대부분의 병렬 조인 알고리즘들은 데이타베이스가 여러 처리 노드에 분할되어 저장되는 데이타베이스 분할 시스템을 가정하였다. 데이타베이스 분할 시스템은 다수의 노드들을 연결할 수 있으며 지리적으로 분산된 환경도 지원할수 있다는 장점을 갖지만, 데이타베이스 공유 시스템에 비해 부하 분산이나 시스템 가용성이 떨어진다는 단점을 갖는다. 본 논문에서는 데이타베이스 공유 시스템에서 병렬 질의 처리기를 위한 병렬 해쉬 조인 알고리즘을 구현한다. 이를 위하여, 데이타베이스 공유 시스템에 적용 가능하도륵 병렬 질의 처리기를 구성하고 병렬 해쉬 조인 알고리즘의 처리 과정에 대해 설명 한다.

  • PDF

대학교 PC 실습실 기반의 대규모 병렬.분산 처리 시스템 (Parallel and Distributed System Based on PC Lab.)

  • 김상선;정갑주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.367-369
    • /
    • 2003
  • 최근 응용과학 분야를 연구하는데 많은 컴퓨팅 자원을 필요로 하고 있다. 예로 미생물학 분야에서 분자 모사를 이용한 바이오-나노 연구는 대규모 컴퓨팅 자원을 필요로 한다. 그와 함께 대규모 컴퓨팅 환경을 구축하기 위해서는 많은 자본이 필요하지만, 대부분의 대학에서는 예산 부족 및 관리 능력 부족으로 인해 이러한 장비를 보유하지 못하고 있는 실정이다. 본 논문에서는 이러한 상황에서 컴퓨팅 자원을 제공하기 위해 기존의 대학 실습실의 컴퓨터들을 이용해서 대규모 병렬-분산 처리 시스템을 구현 모델로 제시하고 실제 직접 구현한 결과를 보여준다. 구현 결과로는 병렬-분산 처리 시스템인 PLinda 시스템과 애플리케이션인 Raytracing 병렬처리 프로그램을 보여 준다.

  • PDF

은닉 마코프 모델 기반 병렬음성인식 시스템 (A Parallel Speech Recognition System based on Hidden Markov Model)

  • 정상화;박민욱
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권12호
    • /
    • pp.951-959
    • /
    • 2000
  • 본 논문의 병렬음성인식 모델은 연속 은닉 마코프 모델(HMM; hidden Markov model)에 기반한 병렬 음소인식모듈과 계층구조의 지식베이스에 기반한 병렬 문장인식모듈로 구성된다. 병렬 음소인식 모듈은 수천개의 HMM을 병렬 프로세서에 분산시킨 수, 할당된 HMM에 대한 출력확률 계산과 Viterbi 알고리즘을 담당한다. 지식베이스 기반 병렬 문장인식모듈은 음소모듈에서 공급되는 음소열과 지안하는 병렬 음성인식 알고리즘은 분산메모리 MIMD 구조의 다중 트랜스퓨터와 Parsytec CC 상에 구현되었다. 실험결과, 병렬 음소인식모듈을 통한 실행시간 향상과 병렬 문장인식모듈을 통한 인식률 향상을 얻을 수 있었으며 병렬 음성인식 시스템의 실시간 구현 가능성을 확인하였다.

  • PDF

효율적인 병렬 입출력을 지원하기 위한 분산공유디스트의 설계 및 구현 (The Design and Implementation of the Distributed Shared Disk for Efficient Parallel I/O)

  • 송창호;남영진;박찬익
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.718-720
    • /
    • 1998
  • 병렬파일시스템을 분산 환경에서 구현하고자 할 때 하부기능들을 관리 및 유지하기 위해서는 복잡한 내부 동작이 필요하다. 저 수준의 하드웨어 관리기능들을 고수준의 파일 서비스 기능들과 분리함으로써 병렬파일시스템 구현의 복잡도를 감소시킬수 있다. 이를 위해 본 논문에서는 분산환경상에서 물리적으로 분산되어 있는 디스크들을 하나의 거대한 논리적인 가상 디스크로 보여주는 분산공유디스크개념을 제안한다. 분산 공유디스크는 병렬 파일 시스템을 지원하기 위한 저수준의 인터페이스를 제공함으로써 병렬파일시스템에서 필용로 하는 하부기능들을 잠재적으로 제공할 수 있다. 또한 클러스터 기반 시스템에서 분산공유디스크의 프로토타입을 구현하여 그의 동작을 실험하였다.

  • PDF

부분병렬 알고리즘 기반의 LDPC 부호 구현 방안 (Design Methodology of LDPC Codes based on Partial Parallel Algorithm)

  • 정지원
    • 한국정보전자통신기술학회논문지
    • /
    • 제4권4호
    • /
    • pp.278-285
    • /
    • 2011
  • 본 논문에서는 DVB-S2 표준안에서 권고되고 있는 irregular LDPC 부호의 다양한 부호화율에서 부호화 방식 및 복호화 방식에 대해 살펴보고 이에 대한 성능분석을 하였다. 또한 이의 구현에 있어서 효율적인 메모리 할당 및 이에 따른 구현 방법에 대해 연구하였다. LDPC 복호기를 구현하는 방안에는 직렬, 부분병렬, 완전병렬 방식이 있으며, 부분병렬방식이 하드웨어 복잡도와 복호속도를 절충하는 방안이다. 따라서 본 논문에서는 부분병렬 구조를 기반으로 하는 LDPC 복호기의 메모리 설계에서 효율적인 체크노드, 비트노드, LLR 메모리의 구조를 제안하고저 한다.

MPI-IO의 CrownFS 지원 방안 (Supporitng for CrownFS in MPI-IO)

  • 조미옥;강봉직;최경희;정기현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.636-638
    • /
    • 2000
  • 가장 느린 서비스시템인 I/O의 성능이 전체적인 컴퓨터 시스템의 성능을 결정짓게 된다. 따라서 전반적인 시스템의 성능 향상을 위해서는 I/O의 성능이 높아져야 한다. 분산병렬환경에서 I/O의 성능을 높이기 위해서 parallel I/O를 사용한다. 하위레벨에서 최적화된 병렬 파일시스템을 사용하고, 어플리케이션 레벨에서 병렬 에플리케이션의 개발을 쉽게 해줄 수 있는 인터페이스를 사용하면 더 효과적인 parallel I/O를 구현할 수 있다. 본 논문에서는 MPI에서 병렬 파일시스템인 CrownFS를 지원하도록 하기 위해서 MPI-IO에 CrownFS를 추가하여 병렬환경에서 높은 성능을 나타낼수 있는 parallel I/O 환경을 구현한다.

  • PDF