• 제목/요약/키워드: Overlapping Computation

검색결과 42건 처리시간 0.02초

큐브 계산에서 I/O 비용을 줄이는 구간 기반 큐브 분할 (Range-based Cube Partitioning for Reducing I/O Cost in Cube Computation)

  • 박웅제;정연도;김진녕;이윤준;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.596-605
    • /
    • 2001
  • 본 논문은 OLAP에서의 I/O 비용을 줄이는 큐브 계산 방법으로, 구간 기반 큐브 분할 기법을 제안한다. 제안하는 방법은 큐브 분할 단계들 사이에 존재하는 계산의 일부를 중복시켜 처리하는 방법을 통해 큐브 분할 작업의 I/O 성능을 향상시킨다. 계산의 중복을 위하여 제안하는 방법은 애트리뷰트의 단 일 값이 아닌 애트리뷰트 값의 일정 구간을 기준으로 큐브를 분할한다 분석과 실험을 통하여 제안하는 방법의 성능을 기존 큐브 분할 방법과 비교하여 보인다.

  • PDF

멀티코어 프로세서의 쓰레드-수준 병렬성을 활용한 AES-CCM 계산-통신 중첩화 (Computation-Communication Overlapping in AES-CCM Using Thread-Level Parallelism on a Multi-Core Processor)

  • 이은지;이성주;정용화;이명호;민병기
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권8호
    • /
    • pp.863-867
    • /
    • 2010
  • 최근 멀티코어 프로세서들이 범용 PC 뿐만 아니라 임베디드 시스템에서도 탑재될 만큼 그 사용이 보편화되고 있는 상황에서, 많은 멀티미디어 응용 프로그램이 이들을 활용하여 병렬화 되고 있다. 그러나 멀티미디어 데이터의 암호화와 같이 응용 프로그램에 데이터 종속성이 내재한 경우에는 멀티코어를 이용한 효과적인 병렬처리가 어렵다는 문제가 있다. 본 논문에서는 이러한 한계를 극복하기 위하여 유휴 코어를 이용하여 계산과 통신을 중첩시키는 병렬처리 기법을 제안한다. 특히, 주어진 멀티미디어 데이터를 처리하고 전송하는 문제를 응용 프로그램 수준의 파이프라인 설계 문제로 해석하여 최적의 파이프라인 단계수를 도출하는 방법을 제안한다.

원형 쉬프트 통신의 중첩 효과 분석 (Overlapping Effects of Circular Shift Communication and Computation)

  • 김정환;노정규;송하윤
    • 정보처리학회논문지A
    • /
    • 제9A권2호
    • /
    • pp.197-206
    • /
    • 2002
  • 통신과 계산 작업을 중첩 수행함으로써 통신 시간의 감춤 효과를 얻는 것은 일반적인 병렬 프로그램 최적화 방법 중의 하나이다. 본 논문에서는 데이타 병렬 프로그램에서 자주 사용되는 군집 통신(collective communication)의 하나인 원형 쉬프트(circular shift) 통신에 대해 중첩 효과를 실험하고 고찰하였다. 이더넷 스위치로 연결된 클러스터 시스템에서 원형 쉬프트 통신을 수행할 때, 중첩으로 얻을 수 있는 최대 이득과 중첩할 수 없는 시간을 측정하였다. 각 플랫폼 별로 이러한 측정값들을 얻어 퇴적화 컴파일러의 입력으로 활용할 수 있을 것이다. 한편 기존의 성능 모델을 통해 퇴적화하는 것은 크게 두가지 문제를 갖고 있다. 하나는 기본적인 점대점 통신에 입각한 모델을 제공하기 때문에 통신 라이브러리의 함수를 사용할 때의 종합적인 효과, 특히, 군집 통신과 같은 경우에는 적용하기 어렵다는 것이다. 다른 하나는 군집 통신의 성능은 분석은 가능하지만, 중첩 효과는 분석할 수 없다는 것이다. 본 논문에서는 이러한 기존 모델의 단점을 보완하여 확장하였다. 또한, 원형 쉬프트 통신에 대한 실험 결과를 토대로 확장된 모델의 매개 변수 값들을 추출하여 예제 프로그램을 통해 분석하였다.

BDM 기법에서 양방향 다중 중복관계 일정계산 방법 (Schedule Computation Method of Two-way Multiple Overlapping Relationships on BDM Technique)

  • 김선규;노성범;이용현;유영정;김진봉;구재오
    • 한국건설관리학회논문집
    • /
    • 제13권2호
    • /
    • pp.120-127
    • /
    • 2012
  • 오늘날 대부분의 건설 사업들은 점차 프로젝트의 규모가 고층화, 대형화, 복잡화되어 가고 있다. 이에 국내 건설기업들은 전체적인 공사 흐름을 파악하고 공정의 연결 관계를 고려하는 등 체계적이고 효율적인 공정관리를 위해 여러 가지 관리기법 및 도구들을 개발하여 실무에 도입하고 있다. 그러나 기존의 공정관리 소프트웨어들은 대부분 ADM, PDM기법을 기반으로 하고 있기 때문에 실무 적용 시 많은 문제점들을 발생시키고 있다. 그 중 PDM기법은 선 후행 작업의 착수시점과 완료시점 간의 조합만으로 작업 간의 중복관계를 우회적으로 표현하기 때문에 매우 비효율적이다. 이러한 기존 CPM기법의 단점을 보완하기 위해 직접적으로 작업 간 양방향 다중 중복관계를 표현할 수 있는 새로운 CPM 공정관리기법인 BDM(Beeline Diagramming Method)기법이 제안되었다. 그러나 양방향 다중 중복관계를 표현하고 일정계산을 하게 되면 루프(Loop)현상이 발생하게 된다. 본 연구에서는 BDM기법의 일정계산 방법에 대해 연구하여 양방향 다중 중복관계에서 루프가 발생했을 때 일정계산을 원활하게 할 수 있는 방법에 대해 제안 및 검증을 하고자 한다.

관성항법장치의 초기정렬을 위한 중복 분해 필터 (An overlapping decomposed filter for INS initial alignment)

  • 박찬국;이장규
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1991년도 한국자동제어학술회의논문집(국내학술편); KOEX, Seoul; 22-24 Oct. 1991
    • /
    • pp.136-141
    • /
    • 1991
  • An Overlapping Decomposed Filter(ODF) accomplishing an initial alignment of an INS is proposed in this paper. The proposed filter improves the observable condition and reduces the filtering computation time. Its good performance has been verified by simulation. Completely observable and controllable conditions of INS error model derived from psi-angle approach are introduced under varying sensor characteristics vary. The east components of gyro and accelerometer have to be the first order markov process and the rest of them are the characteristics of the random walk or first order markov process.

  • PDF

데이타 병렬 프로그램에서 루프 세부 분할 및 동적 스케쥴링을 통한 통신과 계산의 중첩 모델 (A Communication and Computation Overlapping Model through Loop Sub-partitioning and Dynamic Scheduling in Data Parallel Programs)

  • 김정환;한상영;조승호;김흥환
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권1호
    • /
    • pp.23-33
    • /
    • 2000
  • 본 논문은 데이타 병렬 프로그램에서 효율적 통신을 위한 하나의 방법으로 통신과 계산 작업을 중첩하여 실행하는 모델을 제안한다. 이 중첩 모델에서는 통신 지연 시간 동안 중첩하여 수행할 계산 작업을 얻기 위해 주어진 루프 분할을 다시 세부 분할한다. 주어진 루프 분할은 다른 외부 데이타 분할을 참조하기도 하지만, 루프 분할의 모든 반복들이 항상 외부 데이타 참조를 필요로 하는 것은 아니다. 따라서 주어진 루프 분할을 외부 데이타를 요구하는 루프 반복들의 집합과 그렇지 않은 루프 반복들의 집합으로 나눌 수 있다. 이렇게 나누어진 루프 세부 분할은 효율적인 수행을 위해 메시지 도착 순서에 따라 동적으로 스케쥴링된다. 제안된 방법에 따라 IBM SP2에서 몇가지 프로그램으로 실험을 한 결과, 중첩 모델이 성능 향상을 보임을 확인할 수 있었다.

  • PDF

분산 딥러닝에서 통신 오버헤드를 줄이기 위해 레이어를 오버래핑하는 하이브리드 올-리듀스 기법 (Hybrid All-Reduce Strategy with Layer Overlapping for Reducing Communication Overhead in Distributed Deep Learning)

  • 김대현;여상호;오상윤
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권7호
    • /
    • pp.191-198
    • /
    • 2021
  • 분산 딥러닝은 각 노드에서 지역적으로 업데이트한 지역 파라미터를 동기화는 과정이 요구된다. 본 연구에서는 분산 딥러닝의 효과적인 파라미터 동기화 과정을 위해, 레이어 별 특성을 고려한 allreduce 통신과 연산 오버래핑(overlapping) 기법을 제안한다. 상위 레이어의 파라미터 동기화는 하위 레이어의 다음 전파과정 이전까지 통신/계산(학습) 시간을 오버랩하여 진행할 수 있다. 또한 이미지 분류를 위한 일반적인 딥러닝 모델의 상위 레이어는 convolution 레이어, 하위 레이어는 fully-connected 레이어로 구성되어 있다. Convolution 레이어는 fully-connected 레이어 대비적은 수의 파라미터를 가지고 있고 상위에 레이어가 위치하므로 네트워크 오버랩 허용시간이 짧고, 이를 고려하여 네트워크 지연시간을 단축할 수 있는 butterfly all-reduce를 사용하는 것이 효과적이다. 반면 오버랩 허용시간이 보다 긴 경우, 네트워크 대역폭을 고려한 ring all-reduce를 사용한다. 본 논문의 제안 방법의 효과를 검증하기 위해 제안 방법을 PyTorch 플랫폼에 적용하여 이를 기반으로 실험 환경을 구성하여 배치크기에 대한 성능 평가를 진행하였다. 실험을 통해 제안 기법의 학습시간은 기존 PyTorch 방식 대비 최고 33% 단축된 모습을 확인하였다.

다중스레드 구조에서 함수 언어 루프의 효과적 실행 (The Efficient Execution of Functional Language Loops on the Multithreaded Architectures)

  • 하상호
    • 한국정보처리학회논문지
    • /
    • 제7권3호
    • /
    • pp.962-970
    • /
    • 2000
  • Multithreading is attractive in that it can tolerate memory latency and synchronization by effectively overlapping communication with computation. While several compiler techniques have been developed to produce multithreaded codes from functional languages programs, there still remains a lot of works to implement loops effectively. Executing lops in a style of multithreading usually causes some overheads, which can reduce severely the effect of multirheading. This paper suggests several methods in terms of architectures or compilers which can optimize loop execution by multithreading. We then simulate and analyze them for the matrix multiplication program.

  • PDF

DOMAIN DECOMPOSITION ALGORITHM AND ANALYTICAL SIMULATION OF COUPLED FLOW IN RESERVOIR / WELL SYSTEM

  • EWING, RICHARD;IBRAGIMOV, AKIF;LAZAROV, RAYCHO
    • Journal of the Korean Society for Industrial and Applied Mathematics
    • /
    • 제5권2호
    • /
    • pp.71-99
    • /
    • 2001
  • The model and analytical method for solving the problem of coupled fluid flow in the reservoir/well system is presented. The 3-D drainage area is composed of three connected media: the tubing, the annuli as a super conducting collector, and the reservoir itself. To couple these three types of fluid flows a non-overlapping Dirichlet-Neumann domain decomposition method is developed. The method allows us to apply an analytical hybrid simulator for accurate evaluation of the impact of main geometrical and hydrodynamic parameters of the 3-D system on the pressure drop along the horizontal well and its production index.

  • PDF

레이다 시스템 실시간 적용을 위한 OS CFAR 연산 시간 단축 방안 (OS CFAR Computation Time Reduction Technique to Apply Radar System in Real Time)

  • 공영주;우선걸;박성호;신승용;장윤희;양은정
    • 한국전자파학회논문지
    • /
    • 제29권10호
    • /
    • pp.791-798
    • /
    • 2018
  • CFAR(Constant False Alarm Rate)는 레이다 시스템에서 표적 탐지에 주요 사용된다. 그 중에서 OS(Ordered Statistic) CFAR는 비균일 잡음환경에서 사용된다. 그러나 OS CFAR는 참조 셀을 오름차순으로 정렬하여 임계값을 계산하므로 많은 연산량이 필요하다. 이로 인하여 실시간 적용에 어려움이 있다. 본 논문에서는 OS CFAR의 연산량을 줄이는 방안을 서술한다. 단순 표적 유무만 판단하기 위하여 참조 셀들을 오름차순 정렬하는 대신 참조 셀과 크기 비교하는 방식으로 수행하였다. 그리고 3개의 테스트 셀을 묶어 구역을 나누고, 구역 내에서 공통 참조 셀을 구하였다. 공통 참조 셀과 테스트 셀과의 크기 비교를 우선 수행함으로써 연산시간을 단축한다.