• 제목/요약/키워드: CPU Time

검색결과 939건 처리시간 0.031초

Huge Direct Numerical Simulation of Turbulent Combustion - Toward Perfect Simulation of IC Engine -

  • Tanahashi, Mamoru
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2008년 추계학술대회논문집
    • /
    • pp.359-366
    • /
    • 2008
  • Current state and perspective of DNS of turbulence and turbulent combustion are discussed with feature trend of the fastest supercomputer in the world. Based on the perspective of DNS of turbulent combustion, possibility of perfect simulations of IC engine is shown. In 2020, the perfect simulation will be realized with 30 billion grid points by 1EXAFlops supercomputer, which requires 4 months CPU time. The CPU time will be reduced to about 4 days if several developments were achieved in the current fundamental researches. To shorten CPU time required for DNS of turbulent combustion, two numerical methods are introduced to full-explicit full-compressible DNS code. One is compact finite difference filter to reduce spatial resolution requirements and numerical oscillations in small scales, and another is well-known point-implicit scheme to avoid quite small time integration of the order of nanosecond for fully explicit DNS. Availability and accuracy of these numerical methods have been confirmed carefully for auto-ignition, planar laminar flame and turbulent premixed flames. To realize DNS of IC engine with realistic kinetic mechanism, several DNS of elemental combustion process in IC engines has been conducted.

  • PDF

GPGPU를 이용한 비디오 기반 실시간 화재감지 알고리즘 구현 (An Implementation of a Video-Equipped Real-Time Fire Detection Algorithm Using GPGPU)

  • 손동구;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권8호
    • /
    • pp.1-10
    • /
    • 2014
  • 본 논문에서는 많은 양의 연산량을 요구하는 비디오 기반 4단계 화재감지 알고리즘의 실시간 처리를 위해 범용 그래픽 처리 장치 (general-purpose graphics processing unit, GPGPU)를 이용한 병렬 구현 방법을 제안한다. 또한 GPGPU 기반 화재감지 알고리즘의 효용성을 확인하기 위해 범용 고성능 CPU와의 성능을 비교하였다. SXGA($1400{\times}1050$) 해상도의 화재 비디오 5개를 이용해 모의실험 결과, GPGPU기반 화재감지 알고리즘은 CPU 구현보다 약 6.6배 더 높은 성능을 보였으며, 평균 프레임 당 30.53ms의 실행시간이 소요되어 실시간 처리(초당 30프레임)가 가능함을 보였다.

UNIX의 Decay Usage 알고리즘에서의 지연시간-사용량 정규화 특성 분석 (Analysis of Delay-Bandwidth Normalization Characteristic in Decay Usage Algorithm of UNIX)

  • 박경호;황호영;이창건;민상렬
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권10호
    • /
    • pp.511-520
    • /
    • 2007
  • Decay usage 알고리즘은 CPU를 최근에 적게 사용한 프로세스를 우선시하는 스케줄링 방법으로, UNIX와 같이 계산 위주의 프로세스와 대화형 프로세스가 혼재한 시분할 시스템에서 널리 사용되어 왔다. 하지만, decay usage의 매개변수들이 어떻게 상호작용하며 결국 어떤 서비스 행태를 보이는 지에 대한 분명한 이해가 없었다. 본 논문에서는 decay usage가 사용하는 매개변수들의 상호작용에 따라 서비스의 사용량 및 지연시간이 보이는 행태를 실험적으로 분석한다. 이러한 실험적 분석을 바탕으로, 각 매개 변수가 가지는 의미를 서비스 제공의 관점에서 규명한다. 본 논문의 분석 결과는 decay usage의 매개변수들을 조정하여 응용의 요구에 맞는 서비스를 제공하기 위한 기반이 된다.

실시간 시스템 개발을 위한 데이터 처리 시간과 프로세서 사용율 추정 기법 (An Estimation Scheme on Processing Time and Processor Utilization for Real-Time System Development)

  • 김한동;최태봉;고순주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.820-822
    • /
    • 2005
  • The current paper is on a study of the performance estimation fer data processing time and CPU utilization to efficiently develop the real-time system. The analytical modeling and OPNET modeling and benchmarking tests are applied to perform the estimation for data processing time and CPU utilization in real-time system. We demonstrate that the estimation results can be predicted fairly and accurately through the benchmarking test results although there is a small variance between the estimation results and the benchmarking test results.

  • PDF

마이크로폰 배열로 발생되는 입력 시간차를 이용한 음원의 방향 추정 장치에 관한 연구 (A Study about Direction Estimate Device of the Sound Source using Input Time Difference by Microphones′ Arrangement)

  • 윤준호;최기훈;유재명
    • 한국정밀공학회지
    • /
    • 제21권5호
    • /
    • pp.91-98
    • /
    • 2004
  • Human uses level difference and time difference to get space information. Therefore this paper shows that method to presume direction of sound source by time difference and to mark presumed position. The position means direction from geometrical center of sensors to the sound source. To get the time difference of microphones input level, we will be explained about arrangement of microphones which used for the sensor to take the sound signal. It is included distance among the 3 microphones and distance between microphones and sound source. Secondly, input signals are transmitted to CPU througth digital process. CPU is used to DSP(Digital Signal Processor) for manage the signal by real time. Finally, the position of sound source is perceived by an explained algorithm in this paper.

하이브리드 TCP/IP Offload Engine을 위한 하드웨어 기반 송수신 가속기의 설계 및 구현 (Design and Implementation of a Hardware-based Transmission/Reception Accelerator for a Hybrid TCP/IP Offload Engine)

  • 장한국;정상화;유대현
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권9호
    • /
    • pp.459-466
    • /
    • 2007
  • 최근 Gbps 이상의 고속 네트워크 상에서 호스트 CPU에 많은 오버헤드를 발생시키는 TCP/IP의 문제점을 해결하기 위해 네트워크 어댑터 상에서 TCP/IP를 처리함으로써 호스트 CPU의 작업부하를 줄이는 TCP/IP Offload Engine(TOE) 기술이 연구되고 있다. TOE의 구현 방법에는 범용 임베디드 프로세서에서 소프트웨어로 TCP/IP를 처리하는 방법과 전용 ASIC에서 하드웨어로 TCP/IP를 처리하는 방법이 사용되어 왔으나 소프트웨어 구현은 통신의 성능이 떨어지고 하드웨어 구현은 유연성과 확장성이 떨어지는 문제점들을 가지고 있다. 본 논문에서는 하드웨어적인 접근 방법과 소프트웨어적인 접근 방법을 결합한 하이브리드 TOE 구조를 제안한다. 하이브리드 TOE는 데이타 패킷의 생성과 처리와 같이 통신의 성능에 큰 영향을 끼치는 기능들을 하드웨어로 구현함으로써 하드웨어 기반 TOE 구현에 버금가는 성능을 제공하고, 연결 설정과 같이 통신의 성능에 영향을 크게 끼치지 않는 기능들은 임베디드 프로세서 상에서 소프트웨어로 처리한다. 본 논문에서는 데이타 송수신의 성능을 높이기 위해 데이타 패킷의 생성 및 처리등을 지원하는 하드웨어 송수신 가속기를 설계 및 구현하였다. 실험 결과 송수신 가속기를 사용한 하이브리드 TOE는 약 $19{\mu}s$의 최소 지연시간을 보였다. 그리고 6% 이하의 CPU 점유율에서 약 675 Mbps에 달하는 대역폭을 보였다.

리눅스 커널에서 네트워크 멀티미디어 서비스를 위한 메모리 복사 감소 기법 구현 (Implementation of Memory Copy Reduction Scheme for Networked Multimedia Service in Linux)

  • 김정원
    • 한국통신학회논문지
    • /
    • 제28권2B호
    • /
    • pp.129-137
    • /
    • 2003
  • MPEG(Motion Picture Expert Group)과 같은 멀티미디어 스트림은 연속적 재생으로 인해 데이터의 지속적인 디스크 검색을 요구한다. 따라서, 커널의 효율적인 지원이 필요한데, 유닉스 계열의 리눅스 버퍼 캐시 시스템은 비정기적이고 비실시간 데이터인 텍스트 데이터용으로 설계되었다. 대용량의 연속 미디어의 경우 커널 주소공간에서 사용자 주소공간으로의 대량의 복사가 이루어지므로 이 과정에서 CPU의 과중한 오버헤드가 발생한다. 이것은 시스템 처리율을 저하시킬 뿐만 아니라 QOS(Quality of Service)도 보장할 수 없다. 본 논문에서 이 메모리 복사 오버헤드를 감소시키기 위한 direct I/O와 one copy 기법을 리눅스 커널에서 설계 및 구현하였다. direct I/O는 디스크의 데이터를 커널 버퍼로 복사하지 않고 사용자 버퍼로 직접 복사하므로 CPU 오버헤드를 획기적으로 감소시킬 수 있다. 그리고, one-copy는 사용자 버퍼로 데이터를 복사하지 않고 직접 네트워크로 전송하는 기법이다. 구현 결과, CPU 오버헤드의 상당한 감소와 시스템의 처리율이 향상됨을 확인하였다.

매개변수 연구 기법을 이용한 DVR 내부 방열 유동제어 구조물의 형상 설계 (Shape Design of Heat Dissipating Flow Control Structure Within a DVR using Parametric Study)

  • 정병윤;이경훈;박순옥;유정훈
    • 한국전산구조공학회논문집
    • /
    • 제31권4호
    • /
    • pp.165-171
    • /
    • 2018
  • 본 연구에서는 DVR 내부 공기유동을 직접 제어하여 CPU의 온도를 낮추기 위한 유동제어 구조물을 제안하였다. 제안된 구조물은 세 개의 얇은 판의 형태로 구성되었으며, DVR 내부의 공기 유동을 포괄적으로 제어하여 CPU의 효율적인 방열을 유도하고자 하였다. DOE와 RSM을 이용한 매개변수 연구기법을 통해 유동제어 구조물의 형상을 최적화하였으며, 해석에는 유한체적방법을 이용한 유체역학 분석 패키지인 FlowVision을 사용하였다. 실제 DVR 기기에서의 실험을 통해 해석 결과를 검증한 결과 CPU의 온도가 $16.1^{\circ}C$ 낮아짐을 확인하였다.

GPGPU 기반 조인 연산 병렬화 성능 비교 (Performance Comparison of Join Operations Parallelization by using GPGPU)

  • 이종섭;이상백;이규철
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.28-44
    • /
    • 2018
  • 데이터베이스 시스템 관계 연산자 중에서 연산 비용이 가장 비싼 연산은 조인 연산이다. 일반적으로 CPU 기반의 조인 연산의 경우에는 하나의 코어를 사용하거나 많게는 16개 정도의 코어를 사용하여 병렬 처리를 해서 병렬화에 따른 성능 향상이 크지 않다. 이에 반해, GPGPU(General-Purpose computing on Graphics Processing Units)는 수천 개의 프로세싱 유닛을 통한 병렬 처리가 가능해서 조인 연산 수행 시간을 크게 단축할 수 있다. 본 논문에서는 GPGPU 기반에서 조인 연산 병렬화를 구현하기 위해 NVIDIA의 CUDA SDK가 사용되며, CPU 기반과 GPGPU 기반에서의 조인 연산 성능을 측정한다. 사용되는 조인 연산은 NLJ (Nested Loop Join), SMJ (Merge Join), HJ (Hash Join)이며, GPGPU 장비는 TITAN Xp, GTX 1080 Ti 및 GTX 1080을 사용한다. CPU 기반과 GPGPU 기반의 성능을 비교하고, GPGPU 기반의 조인 연산과 이전 연구의 성능과의 성능을 비교한다. 마지막으로, 실험 결과는 GPGPU 기반의 성능이 CPU 기반의 성능보다 6~328 배 빠른 성능을 보였고 향후 연구의 방향성에 대하여 토의한다.

멀티코어 기반 어플리케이션 운용을 위한 데스크탑 가상화 구성 및 성능 분석 (VDI deployment and performance analysys for multi-core-based applications)

  • 박준용
    • 한국정보통신학회논문지
    • /
    • 제26권10호
    • /
    • pp.1432-1440
    • /
    • 2022
  • 최근 VDI(Virtual Desktop Infrastructure)가 오피스 업무 환경뿐만 아니라 고사양의 멀티코어 기반 어플리케이션을 사용하는 워크로드에도 많이 사용되면서 VDI에 대한 실시간성과 안정성에 대한 요구 사항이 증대되고 있다. 그에 따라 VDI에서 원격접속에 사용되는 디스플레이 프로토콜과 가상머신의 성능 최적화 또한 중요성이 높아졌다. 본 논문에서는 멀티코어 기반 어플리케이션 운용을 위한 데스크탑 가상화 구성을 위해 두 가지를 제안한다. 첫 번째는 멀티 프로세싱으로 인한 고부하 상황에서 최적의 성능을 가진 디스플레이 프로토콜의 코덱 구성을 제안한다. 두 번째는 가상머신 간 CPU 경합 시 스케쥴링 지연을 줄이기 위한 가상 CPU 스케쥴링 최적화 방안을 제안한다. 시험 결과 Blast Extreme의 H.264 코덱이 가장 좋고 안정적인 프레임을 보여줬으며 스케쥴링 최적화를 통해 가상 CPU의 스케쥴링 성능이 개선됨을 확인하였다.