통합 검색 | Korea Science

다중 메모리 모델의 CLUMP 시스템을 이용하기 위한 병렬 프로그래밍 기법과 성능 평가 (Parallel Programming for Exploiting Hybrid Parallel Model of CLUMP system and its Performance Evaluation)

이용욱;라마크리쉬나
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
- /
- pp.621-623
- /
- 2000
클러스터를 구성하는 단위 노드로 SMP가 새로운 대안으로 시장에 등장하였다. 이러한 멀티프로세서 클러스터(CLUMP)는 하나의 시스템에 다중 메모리 구조를 가지는데, CLUMP가 가지는 다중 메모리 구조를 효과적으로 사용하기 위해서 본 논문에서는 중첩된 병렬화 프로그램 모델을 제안하였다. 중첩된 병렬화 모델은 중첩된 루프 레벨의 병렬화, 중첩된 태스크 레벨의 병렬화, 그리고 다중 중첩된 병렬화로 나뉜다. 본 논문에서는 중첩된 루프 레벨의 병렬화를 실험대상으로 하여 그 성능을 평가하고 단일 메모리 구조의 병렬화 프로그램과 성능을 비교하였다. 실험 결과 시험한 중첩된 병렬화 모델이 단일 메모리 구조의 병렬화 프로그램에 비하여 좋은 성능을 나타내었지만, 실험대상이 된 루프 레벨 병렬화의 잠재적인 특징으로 인해 실행에 참여하는 노드 수가 많아질수록 성능 향상 폭이 감소하는 결과를 보였다. 프로그램의 성능 향상 폭과 확장성은 문제 크기가 클수록 좋은 특성을 보였다.
PDF

HEVC의 SAO 병렬화 성능 비교 (Comparison of Parallelization for HEVC SAO)

조현호;심동규
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2013년도 하계학술대회
- /
- pp.117-118
- /
- 2013
본 논문에서는 HEVC (High Efficiency Video Coding) SAO (Sample Adaptive Offset)의 병렬화 성능을 비교한다. HEVC 의 참조 소프트웨어인 HM-10.0 에서는 SAO 수행 과정의 연산량 및 메모리 접근을 최소화하고 카테고리 계산 과정에서 SAO 수행 전의 픽셀값을 사용하기 위해서 라인 버퍼를 사용한다. 그러나 이러한 라인버퍼의 사용은 SAO 에 대해 데이터-레벨의 병렬화를 적용하기 어렵게 만드는 주요 요인이다. 본 논문에서는 HEVC 디블록킹 필터가 적용된 픽쳐를 추가 메모리에 복사하는 구현 방식과 HM-10.0 의 SAO 구현 방식 각각에 대해 데이터-레벨 병렬화를 적용하고 각각의 성능을 비교 분석하였다. 실험 결과, HEVC 디블록킹 필터가 적용된 픽쳐를 추가 메모리에 복사하는 구현 방식은 데이터-레벨 병렬화의 구현은 쉽지만, 디블록킹 필터링 된 픽쳐를 추가 메모리에 복사하는 부분 때문에 HM-10.0 기반의 병렬화보다 복호화 성능이 저하될 수 있음을 확인하였다. 이에 반해 CTU 의 행 단위로 병렬 수행될 영역을 분할하는 방식은 구현의 용이성과 병렬화 성능을 동시에 얻을 수 있음을 확인하였다.
PDF

메모리 로딩 시간을 고려한 GPU 병렬 알고리즘의 성능 개선 방안 (Performance Enhancement of GPU Parallelism Algorithm including Memory Loading Time)

배병걸;이진우;박일남;임은진;강승식
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
- /
- pp.119-120
- /
- 2012
GPU를 이용한 병렬 알고리즘은 어떤 메모리를 사용하는지에 따라 시스템의 전체적인 성능이 달라진다. 본 논문은 GPU 환경에서 실행되는 CUDA 프레임워크에서 병렬처리를 이용하여 문서 분류 시스템의 속도를 향상시키고자 할 때 메모리 로딩 시간이 전체적인 시스템의 성능에 미치는 영항을 연구하였다. 기존의 CPU 환경에서 구현했을 때와 비교하여 어느 정도의 성능 향상이 있었는지 실험하였으며 이전 연구에서 고려하지 않았던 메모리를 읽는데 걸리는 시간을 고려하여 현실적인 실행 시간을 비교하였다. 실험 결과에 의하면 CPU 에서 구현했을 때의 연산 속도보다 GPU의 텍스쳐 메모리를 사용하여 구현하였을 때 문서분류 성능이 향상되는 효과가 있음을 알 수 있었다.
PDF

메모리 중심 컴퓨터 구조에서 MPI 병렬 프로그램의 효율적인 수행 (Efficient Executions of MPI Parallel Programs in Memory-Centric Computer Architecture)

이제만;이승철;신동하
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
- /
- pp.257-258
- /
- 2019
본 논문에서는 "프로세서 중심 컴퓨터 구조"에서 개발된 MPI 병렬 프로그램을 수정하지 않고 "메모리 중심 컴퓨터 구조"에서 더 효율적으로 수행시키는 기술을 제안한다. 본 연구에서 제안하는 기술은 메모리 중심 컴퓨터 구조가 가지는 "빠른 대용량 공유 메모리" 특징을 이용하여 MPI 표준 라이브러리가 수행하는 네트워크 통신을 통한 느린 데이터 전달을 공유 메모리를 통한 빠른 데이터 전달로 대체하여 효율성을 얻는다. 본 연구에서 제안한 기술은 도커 가상화 기술을 사용한 분산 시스템 환경에서 MC-MPI-LIB 라이브러리 및 MC-MPI-SIM 시뮬레이터로 구현되었으며 다수의 MPI 병렬 프로그램으로 시험 수행하여 효율성이 있음을 보였다.
PDF

분산 메모리 구조를 갖는 병렬 컴퓨터 상에서의 압축 기반 볼륨 렌더링 (Compression-Based Volume Rendering on Distributed Memory Parallel Computers)

구기범;박상훈;송동섭;임인성
- 한국정보과학회논문지:컴퓨팅의 실제 및 레터
- /
- 제6권5호
- /
- pp.457-467
- /
- 2000
본 논문에서는 분산 메모리 구조를 갖는 병렬 컴퓨터 상에서 방대한 크기를 갖는 볼륨 데이터의 효과적인 가시화를 위한 병렬 광선 투사법을 제안한다. 데이터의 압축을 기반으로 하는 본 기법은 다른 프로세서의 메모리로부터 데이터를 읽기보다는 자신의 지역 메모리에 존재하는 압축된 데이터를 빠르게 복원함으로써 병렬 렌더링 성능을 향상시키는 것을 목표로 한다. 본 기법은 객체-순서와 영상-순서 탐색 알고리즘 모두의 정점을 이용하여 성능을 향상시켰다. 즉, 블록 단위의 최대-최소 팔진트리의 탐색과 각 픽셀의 불투명도 값을 동적으로 유지하는 실시간 사진트리를 응용함으로써 객체-공간과 영상-공간 각각의 응집성을 이용하였다. 본 논문에서 제안하는 압축 기반 병렬 볼륨 렌더링 방법은 렌더링 수행 중 발생하는 프로세서간의 통신을 최소화하도록 구현되었는데, 이러한 특징은 프로세서 사이의 상당히 높은 데이터 통신 비용을 감수하여야 하는 PC 및 워크스테이션의 클러스터와 같은 더욱 실용적인 분산 환경에서 매우 유용하다. 본 논문에서는 Cray T3E 병렬 컴퓨터 상에서 Visible Man 데이터를 이용하여 실험을 수행하였다.
PDF

다중프론트 해법의 공유메모리 병렬화 (Parallelization of Multifrontal Solution Method for Shared Memory Architecture)

김민기;김정호;박찬익;김승조
- 한국항공우주학회지
- /
- 제40권11호
- /
- pp.972-978
- /
- 2012
본 논문은 유한요소 구조해석의 선형해법으로 널리 사용되는 다중프론트 해법의 공유메모리 환경하의 병렬화 방법을 논의한다. 다중프론트 해법은 병렬성이 내재되어 있어서 여타 해법보다 상대적으로 병렬화가 용이한 방법이다. 다중프론트 해법의 공유메모리 컴퓨터에서 최적의 성능을 내도록 병렬 계산을 수행하기 위한 기법들이 제시되었다. 주로 독립적인 계산 작업 시에 필요한 주 메모리 용량을 줄이는 데 초점을 맞춘 방법들로서 프론트 행렬 연성화와 행렬 분리로 명명된 두 기법에 대해 자세히 설명한다. 개발된 방법으로 기존의 알고리즘과의 성능 비교를 수행하여 본지에 제안한 방법이 현대의 다중코어 컴퓨터에서 훨씬 더 효율적인 기법임을 입증하였다.
https://doi.org/10.5139/JKSAS.2012.40.11.972 인용 PDF KSCI

병렬 프로그래밍 모델 및 사례 연구 (Parallel Programming Models and Examples)

정용화;박진원
- 전자통신동향분석
- /
- 제13권4호통권52호
- /
- pp.32-42
- /
- 1998
본 고는 최근 들어 활발하게 연구가 진행중인 병렬 처리 분야 중에서 여러 가지 병렬 프로그래밍 방법에 대한 정의 및 특징을 살펴보고, 대표적인 사례에 대해 요약해본다. 먼저 데이터 병렬성을 이용한 프로그래밍 방법과 대표적인 프로그래밍 언어 HPF에 대해 살펴본 후, 어드레스 공간이 공유되는 공유 메모리/분산공유 메모리 시스템에서의 프로그래밍 방법과 최근 표준화 작업이 진행중인 OpenMP에 대해서 알아본다. 끝으로 어드레스 공간이 공유되지 않는 분산 메모리 시스템에서의 프로그래밍 방법과 표준 메시지 패싱 인터페이스인 MPI에 대해 서술한다.
https://doi.org/10.22648/ETRI.1998.J.130403 인용 PDF

병렬적 로깅 기법을 통한 주 메모리 DBMS의 병목 현상 해소 (Solving Bottleneck in MMDB using Parallel Logging method)

이주창;이상호;차상균
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
- /
- pp.246-248
- /
- 1999
주 메모리 DBMS에서의 회복 시스템은 디스크에의 접근을 요하는 유일한 경우이기 때문에 시스템 전체 성능의 병목(bottleneck)이 된다. 본 논문에서는 회복 시스템에서 발생하는 주 메모리 DBMS의 병목 현상을 해소하기 위하여 복수 개의 로그 디스크를 이용하는 병렬적 로깅 기법을 제안한다. 또한 병렬적 로깅 기법을 사용하는 경우 로그 레코드들이 여로 디스크에 흩어짐으로써 시스템 재시작 시 이들간의 순서를 재규명해야 하는 오버헤드가 생기는데 이를 해결하기 위해서 병렬적 재시작 알고리즘을 제안한다.
PDF

동적 객체에 대한 병렬 타스크 중심의 메모리 관리기 (A Parallel Task Oriented Memory Manager for Dynamic Objects)

김은정;배종민
- 한국정보처리학회논문지
- /
- 제4권5호
- /
- pp.1391-1400
- /
- 1997
공유 메모리 다중 프로세서상에서 많은 동적 객체를 생성하는 언어가 실행될 때, 동적 객체에 대한 메모리 관리 알고리즘은 프로그램의 실행 속도에 큰 영향을 미친다. 본 논문에서는 이러한 환경에서 프로그램의 성능을 향상 시킬 수 있는 새로운 메모리 관리 알고리즘을 제안한다. 이를 위해 힘 영역의 할당 및 회수 작업을 병렬 타스크 중심으로 행한다. 또한 동적 객체를 병렬 타스크사이에 공유 되는 객체(shared data) 와 비공유 객체(mon-shared data)로 구분하고, 힘 영역을 공동 영역과 전용 영역으로 분리 한다. 이는 병렬 타스크가 동적으로 스케줄링되는 것을 자유롭게 하고 창조 지역성 을 높이는 효과가 있으며, 전용 영역에 대한 메모리 재사용으로 인하여 볼용 셀수집기의 수행 횟수를 줄일 수 있다.
PDF

분산 메모리 환경에서의 방대한 볼륨데이터의 압축기반 광선추적법 (Compression-Based Ray-Casting of Huge Volume Data on Distributed Memory Environments)

송동섭;박상훈;임인성
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
- /
- pp.634-636
- /
- 2000
기존의 병렬 볼륨 렌더링 방법들은 프로세서간의 발생하는 많은 통신량 때문에 통신 속도가 매우 빠른 병렬컴퓨터를 이용하였고 통신속도가 느린 분산 환경에서는 구현이 불가능해 보였다. 또한 가시화하려는 볼륨 데이터도 점점 방대해지고 있는 실정이다. 이에 본 논문에서는 통신 속도에 구애받지 앉을뿐더러 매우 큰 볼륨데이터를 다루는 병렬/분산 볼륨 렌더링을 제안한다. 본 방법은 고비용을 필요로 하는 원격 메모리 접근 대신에 압축을 기반으로 하여 필요한 데이터를 지역 메모리에서 빠르게 복원함으로써 좋은 성능향상(speedup)을 나타낸다. 이것은 각 프로세서가 전체 볼륨 데이터를 모두 적재하고 있다는 것을 의미한다. 다라서 렌더링 과정중에 발생하는 프로세서간의 통신을 최소화할 수 있었고, 이런 방식은 높은 통신 비용으로 효율적 병렬/분산 처리가 힘든 분산 메모리 병렬 컴퓨터나 PC/워크스테이션 클러스터상에서 매우 적합하다.
PDF

검색결과 539건 처리시간 0.026초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)