• 제목/요약/키워드: 병렬적분

검색결과 51건 처리시간 0.031초

실시간 시뮬레이션을 위한 병렬적분 (Parallel Integration for Real-Time Simulation)

  • 이운성
    • 한국자동차공학회논문집
    • /
    • 제2권1호
    • /
    • pp.106-115
    • /
    • 1994
  • A parallel integration approach is proposed for real-time simulation of controlled mechanical systems. The proposed approach, which employs the dual-rate integration method in a parallel computing environment, is developed to deal with stiffness and high frequency characteristics of the controlled mechanical systems effectively. Numerical experiments are performed to demonstrate the effectiveness of the approach in shared memory multiprocessors, Alliant FX/8 and Alliant FX/80.

  • PDF

안정적이고 병렬화가 용이한 옷감 애니메이션 기법 (Stable and Easily Parallizable Cloth Animation Method)

  • 강영민
    • 한국정보통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.995-1001
    • /
    • 2005
  • 효율적인 옷감 애니메이션 생성을 위해 암시적 적분법이 표준적 접근법으로 자리 잡았다. 이 기법은 시스템의 안정성이 보장되므로 큰 시간 간격을 사용할 수 있으며, 옷감 모델의 실시간 혹은 상호작용적 애니메이션을 위한 최선의 선택으로 받아들여지고 있다. 암시적 방법이 옷감 애니메이션에 도입된 이후 다양한 종류의 암시적 적분 기반 옷감 애니메이션 기법들이 제안되었으며 일반적인 PC 환경에서 수천 개의 질점을 가진 옷감 모델을 실시간에 시뮬레이션 할 수 있는 수준에 도달해 있다. 암시적 적분법이 안정성을 보장한다는 장점을 가지지만 명시적 기법에 비해 구현이 조금 더 복잡하며 병렬화가 어렵다는 문제를 가지고 있다. 암시적 적분법을 통해 옷감 애니메이션을 생성하는 것은 대규모 희소행렬을 가진 선형 시스템을 푸는 것으로 정형화된다. 본 논문에서는 암시적 적분법의 특성을 이용하여 안정적으로 복잡한 옷감 모델의 동작을 생성하면서도 매우 쉽게 병렬화가 가능한 기법을 제안한다. 옷감 애니메이션은 동작 시뮬레이션과 함께 자체충돌을 고려해야만 사실적인 결과를 얻을 수 있다. 그런데 자체충돌 감지 역시 중요한 계산상의 병목으로 작용한다. 본 논문에서는 효율적인 자체 충돌 처리 기법도 같이 제안한다.

CUDA programming environment을 활용한 Path-Integral Monte Carlo Simulation의 구현

  • 이화영;임은진
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.196-199
    • /
    • 2009
  • 높아지는 Graphic Processing Unit (GPU)의 연산 성능과 GPU에서의 범용 프로그래밍을 위한 개발 환경의 개발, 보급으로 인해 GPU를 일반연산에 활용하는 연구가 활발히 진행되고 있다. 이와같이 일반 연산에 활용되고 있는 GPU로 nVidia Tesla와 AMD/ATI의 FireStream 들이 있다. 특수목적 연산 장치인 GPU를 일반 연산을 위해 프로그래밍하기 위해서는 그에 맞는 프로그램 개발 환경이 필요한데 nVidia에서 개발한 CUDA (Compute Unified Device Architecture) 환경은 자사의 GPU 프로그램 개발을 위해 제공되는 개발 환경이다. CUDA 개발 환경은 nVidia GPU 프로그래밍 뿐만 아니라 차세대 이종 병렬 프로그램 개발 환경의 공개 표준으로 논의되고 있는 OpenCL (Open Computing Language) 와 유사한 특징을 보일 것으로 예상되기 때문에 그 중요성은 특정 GPU 에만 국한되지 않는다. 본 논문에서는 경로 적분 몬테 카를로 (Path Integral Monte Carlo) 방법을 CUDA 개발 환경을 사용하여 nVidia GPU 상에서 병렬화한 결과를 제시하였다.

  • PDF

CPU와 GPU의 혼합 병렬 계산에 대한 성능 분석 (Performance Analysis on Parallel Processing of a Hybrid of a CPU and a GPU)

  • 황근창;김영태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.59-60
    • /
    • 2016
  • 본 논문에서는 고성능 병렬 계산 장치로 주목받고 있는 GPU를 CPU와 동시에 병렬로 사용한 계산 성능을 분석하였다. 성능 분석을 위하여 원주율(${\pi}$)을 적분으로 계산하는 CUDA 프로그램을 사용하였으며, 전체 계산을 GPU 대비 CPU 계산 부분으로 할당하여 성능을 분석하였다.

쌍트랜지스터 회로에 의한 정착변조방식 (A Delta Modulation Method by Means of Pair Transistor Circuit)

  • 오현위
    • 대한전자공학회논문지
    • /
    • 제8권2호
    • /
    • pp.24-33
    • /
    • 1971
  • 부성특성회로로서 쌍트랜지스터 회가의 양에미터단자사이에 용량 C와 저항 R의 병렬회로를 삽입하고, 표준화주파수의 단형파전류원를 에미터·바이어스전류원으로 하여 쌍회로를 구동하면, RC병렬회로는 정부변조회로의 적분회로로서 동작시킬 수 있다. 이 적분회로와 직렬로 신호파전압원을 접속시키면 쌍회로가 구동전원의 표준화펄스에 의하여 구동될 때 마다, RC 적분회로의 적분전압과 신호파전압이 서로 비교되기 때문에 그들의 차전압에 의하여 쌍회로의 트랜지스터들 중의 어느 한 쪽이 ON되기 때문에 그 베이스결합저항단자에는 one bit의 펄스가 송출된다. 본실험에서는 극히 간소한 회로구성을 갖는 쌍트랜지스터회로에 의한 정착변조회로를 제시하고 그들의 특성을 부기하였다. 정착변조파의 품질 혹은 S/N비의 향상을 위하여 고려하여야 할 문제로서, 적분회로의 회로정수 및 양자화전압의 구동펄스의 파고와 파폭의 관계를 검토한다.

  • PDF

비선형 마찰이 존재하는 조준경 안정화 시스템의 신경망 제어기 설계 (Neuro-controller design for the line of sight stabilization system containing nonlinear friction)

  • 장준오;전병균;전기준
    • 제어로봇시스템학회논문지
    • /
    • 제3권2호
    • /
    • pp.139-148
    • /
    • 1997
  • 본 논문에서는 비선형 마찰이 존재하는 조준경 안정화 시스템에 대해서 마찰력 보상과 성능개선을 위한 신경망제어기의 설계방법을 제시한다. 제안한 신경망제어기는 비례, 적분, 진상(PI/LEAD) 제어기와 신경회로망과의 병렬로 구성되며, 제어 목적은 비선형 마찰과 외란이 존재하여도 안정거울의 각속도 추적성능과 안정화 성능의 향상에 있다. 신경회로망의 입력으로 안정거울의 각속도 추적오차와 추적오차의 적분, 제어입력이 필터를 통과한 신호가 사용되며, 신경호로망은 간접학습구조에 의해 학습된다. 조준경 시스템의 비선형 마찰력인 쿨롱마찰력의 크기가 외부환경에 따라 변하는 경우와 시스템으로 외란이 인가되는 경우에 대하여도 제안한 병렬제어기는 기존의 PI/LEAD 제어기보다 추적과 안정화 성능면에서 우수함을 컴퓨터 모의 실험으로 확인한다.

  • PDF

실시간 차량 시뮬레이터 개발을 위한 암시적 적분기법을 이용한 병렬처리 알고리즘에 관한 연구 (Study on the parallel processing algorithms with implicit integration method for real-time vehicle simulator development)

  • 박민영;이정근;배대성
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 1995년도 추계학술대회 논문집
    • /
    • pp.497-500
    • /
    • 1995
  • In this paper, a program for real time simulation of a vehicle is developed. The program uses relative coordinates and BEF(Backward Difference Formula) numerical integration method. Numerical tests showed that the proposed implicit method is more stable in carring out the numerical integration for vehicl dynamics than the explicit method. Hardware requirements for real time simulation are suggested. Algorithms of parallel processing is developed with DSP (digital signal processor).

  • PDF

MPI를 활용한 PI($\pi$)값 계산 병렬화 알고리즘 (Parallelized PI($\pi$) Calculation Algorithm using MPI)

  • 최민;맹승렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.91-93
    • /
    • 2004
  • 정확한 $\pi$값의 계산은 자연과학의 여러 분야에 도움을 준다 이와 같이 $\pi$값을 계산하는 여러 가지 방법이 제안되어 있으며 널리 사용되고 있으나, 본 논문에서는 MPI 라이브러리를 활용한 $\pi$값 계산의 병렬화 알고리즘을 소개한다. tan$^{-1}$($\chi$)의 정의를 이용하는 $\pi$값 계산 방법은 다항식의 계산과정에서 각 항(term)들의 종속성으로 인하여 병렬화 수행이 힘든 단점이 있다. 본 논문에서는 tan$^{-1}$($\chi$)를 맥클로린 수열(Maclaurin Series)을 통하여 다항함수로 표현하고, 병렬화 수행에 적합한 적분형태로 변형한다. 따라서. MPI 환경에서 수행하기 적합한 $\pi$값 계산의 병렬화 알고리즘을 제안하고 8노드 클러스터 환경에서 성능을 비교해본다. 또한, 직렬화된 방법에 대한 성능향상(speedup)을 측정한다.

  • PDF

레일리 페이딩 채널에서 WCDMA의 단계별 병렬 처리 셀 탐색의 성능 해석 (Performance Analysis of Stepwise Parallel Processing for Cell Search in WCDMA over Rayleigh Fading Channels)

  • 송문규
    • 한국통신학회논문지
    • /
    • 제27권2B호
    • /
    • pp.125-136
    • /
    • 2002
  • 셀간 비동기 방식의 WCDMA 시스템에서 셀간 동기를 맞추는 일은 매우 중요하며, 3 단계 셀탐색 과정에 의해 수행된다. 셀 탐색은 셀 탐색 시간을 줄이기 위해 각 단계가 파이프라인으로 동작하는 단계별 병렬 처리 방식으로 동작할 수 있다. 각 단계에서 실행 시간을 동일하게 설정할 경우 2단계는 최소한 1프레임의 처리시간을 소요하므로 1단계와 3단계에서 과도한 누적이 야기된다. 일반적으로 누적의 횟수가 증가할수록 사후적분 검파의 잇점은 감소한다. 따라서 단계별 병렬 처리로 인한 성능 개선은 그다지 크지 않다. 본 논문에서는 레일리 페이딩 채널에서 WCDMA 시스템에 대한 셀 탐색의 단계별 병렬 처리의 성능을 해석한다. 본 해석을 통해 각 단계에서 사후 검파 적분의 횟수와 채널간 전력 할당비 등 셀 탐색 파라미터에 대한 영향을 조사한다. 또한 각 단계의 처리 시간을 적절히 조절함으로써 단계별 병렬 처리 셀 탐색의 성능을 개선하고, 관례적인 단계별 직렬 처리 방식과 성능을 비교한다.

메모리 크기에 효율적인 적분영상 하드웨어 설계 연구 (A Study of Integral Image Hardware Design for Memory Size Efficiency)

  • 이수현;정용진
    • 전자공학회논문지
    • /
    • 제51권9호
    • /
    • pp.75-81
    • /
    • 2014
  • 적분영상은 입력영상의 픽셀 값을 기준좌표부터 순차적으로 누적하여 만든 영상으로, Haar-like features와 같은 네모난 박스 모양의 필터 연산을 효율적으로 처리하기 위하여 사용된다. 그러나 적분영상은 입력영상보다 3배 이상 많은 메모리를 소모하기 때문에, 메모리 자원이 제한적인 하드웨어 설계 환경에서는 사용이 어렵다. 본 논문에서는 효율적인 메모리 사용을 위한 적분영상 하드웨어 설계 방법을 제안한다. 해당 방법은 적분영상 이외에 세로적분영상과 가로적분영상을 생성하고, 입력영상을 재사용 하는 방법을 사용한다. 그리고 박스 필터의 크기에 따라 modulo 연산을 적용하여 적분영상의 데이터 크기를 줄이는 방법을 함께 적용하였다. 적분 영상 데이터를 읽기 위해 나누어진 영상 데이터를 다시 덧셈해야하는 연산 오버헤드가 발생하지만, 4개의 데이터를 단순히 더하는 연산이므로 병렬처리가 가능한 하드웨어 환경에서는 큰 영향을 미치지 않는다. Xilinx사의 Virtex5-LX330T를 대상으로 실험한 결과 $640{\times}480$ 크기의 8bit gray-scale 입력영상에서 최대 $32{\times}32$ 크기의 필터사용을 기준으로 50%의 적분영상 메모리를 감소시킬 수 있다.