• 제목/요약/키워드: Parallel Process

검색결과 1,462건 처리시간 0.026초

GPU 성능 저하 해결을 위한 내부 자원 활용/비활용 상태 분석 (Analysis on the Active/Inactive Status of Computational Resources for Improving the Performance of the GPU)

  • 최홍준;손동오;김종면;김철홍
    • 한국콘텐츠학회논문지
    • /
    • 제15권7호
    • /
    • pp.1-11
    • /
    • 2015
  • 최신 고성능 컴퓨팅 시스템에서는, 대용량 병렬 연산을 효과적으로 처리할 수 있는 GPU의 우수한 연산 성능을 그래픽 처리 이외의 범용 작업에 활용하는 GPGPU 기술에 관한 연구가 활발하게 진행 중이다. 하지만 범용 응용프로그램의 특성이 GPU 구조에 최적화되어 있지 않기 때문에 범용 프로그램 수행 시 GPGPU는 GPU의 연산 자원을 효과적으로 활용하지 못하고 있다. 그러므로 본 논문에서는 GPGPU 기술을 사용하는 컴퓨팅 시스템의 성능을 보다 향상시킬 수 있는 GPU 연구에 대한 방향을 제시하고자 한다. 이를 위하여, 본 논문에서는 GPU 성능 저하 원인 분석을 수행한다. GPU 성능 저하 원인을 보다 명확하게 분류하고자 본 논문에서는 GPU 코어의 상태를 완전 활성화 상태, 불완전 활성화 상태, 유휴 상태, 메모리스톨 상태, 그리고 GPU 코어 스톨 상태 등 5가지로 정의하였다. 완전 활성화 상태를 제외한 모든 GPU 코어 상태들은 컴퓨팅 시스템의 성능 저하를 유발한다. 본 논문에서 성능 저하 원인을 찾고자 벤치마크 프로그램의 특성에 따라 각 GPU 코어 상태의 비율 변화를 측정하였다. 분석 결과에 따르면, 불완전 활성화 상태, 유휴 상태, 메모리 스톨 상태 그리고 GPU 코어 스톨 상태는 연산 자원 활용률 저하, 낮은 프로그램 병렬성, 높은 메모리 요청, 그리고 구조적 해저드에 의해 각각 유발된다.

초등학교 과학탐구력 측정을 위한 수행평가 도구 개발 (Development of Performance Assessment of Scientific Inquiring Ability in Elementary School)

  • 한광래;김정길;김해경;남철우;송판섭;은경용
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제17권2호
    • /
    • pp.11-22
    • /
    • 1998
  • The present educational and social circumstances require the improvement of science education and the promotion of scientific technology simultaneously Under this situation, it is necessary to develop the performance assessment evaluating the ability of scientific inquiry. The purpose of this study is to develop a valid and reliable instrument of the performance assessment that is can evaluate the scientific inquiring ability. The characteristics of the instrument developed through this study, are as follows, 1. The performance assessment can be impartially achieved for all the elements of scientific inquiry, which are required in the units of elementary science from 3rd to 6th grade of elementary school. 2. To maintain the objectivity of performance assessment, the detailed standpoints and standards are established. 3. The instruments are devised to evaluate the thinking skills with the experimental reports of student, the operation skills by the check list of evaluation that the teacher's observation for the student are recorded. 4. Considering the level of elementary school student, the items required the complex thinking and the investigative skills are exclude as much as possible. 5. The items are arranged according to the learning steps of elementary school, so that the evaluation may be achieved in parallel with the process of the real teaching -learning in class. 6. According to circumstances, make use of these materials for the evaluation as the practical teaching-learning materials instead of the normal teaching-learning materials The first field trial with the instrument was carried out, using a sample of 20 students from the 3rd to 6th at K and Y elementary school located in Kwangju city. The results of mean achievement quotient for each grade are as follows, the first term of 3rd grade (experiment and exercise skills ; 85%, inquiry thinking skills ; 74%), the second term of 3rd grade (experiment and exercise skills : 81%, inquiry thinking skills ; 76%), the first term of 4th grade (experiment and exercise skills ; 70%, inquiry thinking skills ; 59%), the second term of 4th grade (experiment and exercise skills ; 61%, inquiry thinking skills ; 71%), the first term of 5th grade (experiment and exercise skills ; 84%, inquiry thinking skills ; 67%), the second term of 5th grade (experiment and exercise skills; 73%, inquiry thinking skills ; 70%), the first term of 6th grade (experiment and exercise skills : 83%, inquiry thinking skills ; 84%), the second term of 6th grade (experiment and exercise skills ; 87%, inquiry thinking skills ; 81%).

  • PDF

R.C 박스거교의 체계신뢰성 해석 및 안전도 평가 (Assessment of System Reliability and Capacity-Rating of Concrete Box-Girder Highway Brdiges)

  • 조효남;신재철
    • 콘크리트학회지
    • /
    • 제7권3호
    • /
    • pp.187-198
    • /
    • 1995
  • 본 연구는 RC 박스거더교 상부구조의 체계신뢰성 해석과 체계신뢰성에 기초한 내하력 평가를 위하여 실용적이고 실제적인 신뢰성 모델 및 방법을 제안하였다. 시스템으로서 교량의 보유내하력을 정확히 예측한다는 것은, 특히 교량이 높은 여용성을 갖고 있고 열화손상이 심각한 경우에는 더욱 어려운 문제이다. 본 연구는 교량의 체계신뢰성에 상응하는 교량시스템강도로서 정의도리 수 잇는 등가의 시스템가동의 항으로 교량의 보유내하력을 평가하는 새로운 접근방법을 제안하였다. 즉, 이 방법은 체계신뢰성지수의 FOSM(Fdirst Order Second Moment)형태에서 유도된 등가시스템저항강도로서 보다 실제적이고 합리적인 극산시스템저항강도 평가방법이다. 본 연구에서 제안된 RC박스거더교를 위한 강도한계상태모형은 휨 및 전단강도에 기초하였다. 그리고 박스거더 상부구조의 체계신뢰성 문제는 주요 파괴 메카니즘이나 각거더의 한계파괴상태에 기초한 FMA(Failure Mode Approach) 로부터 획득한 직-병렬 혼합모델로서 정식화하였다. 제안된 모형의 신뢰성해석에는 AFOSM(Advanced First Order Second Moment) 과 IST(Importance Sampling Technique) 시뮬레이션 알고리즘을 사용하였다.

슈도-세그멘테이션 기법을 이용한 저 전력 12비트 80MHz CMOS D/A 변환기 설계 (Design of Low Power 12Bit 80MHz CMOS D/A Converter using Pseudo-Segmentation Method)

  • 주찬양;김수재;이상민;강진구;윤광섭
    • 대한전자공학회논문지SD
    • /
    • 제45권4호
    • /
    • pp.13-20
    • /
    • 2008
  • 본 논문에서는 무선 통신 응용 시스템에 적합하도록 슈도-세그멘테이션 기법을 이용하여 저 전력 12비트 80MHz D/A 변환기를 CMOS 0.18um n-well 1-Poly/6-Metal 공정으로 설계하였다. 슈도-세그멘테이션 기법은 간단한 병렬 버퍼로 구성된 이진 디코더를 사용함으로써 구조적으로 간단해지며 저 전력으로 구현이 가능하다. 또한, 스위칭 코어 회로에 글리치 억제 회로와 입력신호의 스윙을 감소시키는 구동 회로를 설계함으로써 추가적인 스위칭 잡음을 줄일 수 있었다. 측정 결과 제안한 저 전력 12bit 80MHz CMOS D/A 변환기는 샘플링 주파수 80MHz일 때, 입력 주파수 1MHz에서 SFDR은 66.01dBc, 유효비트수는 10.67비트를 보여주었다. INL/DNL은 ${\pm}1.6LSB/{\pm}1.2LSB$로 측정되었으며, 글리치 에너지는 $49pV{\cdot}s$로 나타났다. 전력 소모는 1.8V 전원 전압에서 최대 속도인 80MHz일 때 46.8mW로 측정되었다.

MHEMT를 이용한 광대역 특성의 밀리미터파 Cascode 증폭기 연구 (Research on Broadband Millimeter-wave Cascode Amplifier using MHEMT)

  • 백용현;이상진;백태종;최석규;윤진섭;이진구
    • 대한전자공학회논문지SD
    • /
    • 제45권4호
    • /
    • pp.1-6
    • /
    • 2008
  • 본 논문에서는 밀리미터파 대역에서 광대역 특성을 갖는 MHEMT (Metamorphic High Electron Mobility Transistor) cascode 증폭기를 설계 및 제작하였다. Cascode 증폭기 제작을 위해 먼저 $0.1{\mu}m$ InGaAs/InAlAs/GaAs MHEMT를 설계 및 제작하였다. 제작된 MHEMT는 드레인 전류 밀도가 670 mA/mm이고, 최대 전달컨덕턴스(gm)는 688 mS/mm이며, 주파수 특성으로 전류이득 차단 주파수($f_T$)는 139 GHz, 최대 공진 주파수($f_{max}$)는 266 GHz의 특성을 나타내었다. 설계된 cascode 증폭기는 회로의 발진을 막기 위해서 저항과 캐패시터를 commom gate 소자의 드레인이 병렬로 연결하였다. Cascode 증폭기는 CPW (Coplanar Waveguide) 전송선로를 이용하여 광대역 특성을 얻을 수 있도록 정합회로를 설계하였다. 설계된 증폭기는 본 실험실에서 개발된 MHEMT MMIC 공정을 이용해 제작되었다. 제작된 cascode 증폭기의 측정결과, 3 dB 대역폭이 20.76$\sim$71.13 GHz로 50.37 GHz의 넓은 대역 특성을 얻었으며, 대역내에서 평균 7.07 dB 및 30 GHz에서 최대 10.3 dB의 S21 이득 특성을 나타내었다.

이산적 시공간 기반 2차로 도로 차량모형 개발 (Development of Two-lane Highway Vehicle Model Based on Discrete Time and Space)

  • 윤병조
    • 대한토목학회논문집
    • /
    • 제31권6D호
    • /
    • pp.785-791
    • /
    • 2011
  • 2차로 양방향 도로의 교통류는 저속차량과 추월 행태에 따라 다양한 동적 관계를 보인다. 따라서 교통류 모의실험을 이용하여 2차로 도로의 다양한 교통류를 미시적으로 분석하기 위해서는 저속차량의 행태와 더불어 대향차로를 이용한 추월 행태를 동시에 구현하는 차량모형의 개발이 필수적이다. 국내의 경우, 고속도로와 신호교차로를 설명하기 위한 차량추종모형과 차로변경모형에 대한 연구는 보고되고 있으나, 2차로 도로를 구현하기 위한 차량모형에 대한 연구는 미흡한 실정이다. 따라서 본 연구에서는 이산적 시 공간 모형인 CA(Cellular Automata)모형을 기반으로 차량추월을 고려한 미시적 2차로 도로 차량모형을 개발하였다. 개발된 모형은 수정된 CA 차량추종모형과 추월모형을 이용하여 병렬적으로 결합된다. 모의실험을 수행한 결과, 차량추종모형은 다양한 거시적 교통류 관계를 설명하였으며, 추월모형은 대향방향 교통류와 차량추월 확률변수의 조건에 따라 다양한 거시적 교통류를 합리적으로 구현하였다. 따라서 본 연구에서 제시된 차량모형은 보다 다양한 2차로 도로교통류의 모의실험에 활용될 것으로 기대된다.

객체지향 분석-함성 부호화를 위한 효율적 움직임 파라미터 추정 알고리듬 (Efficient Algorithms for Motion Parameter Estimation in Object-Oriented Analysis-Synthesis Coding)

  • 이창범;박래홍
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.653-660
    • /
    • 2004
  • 객체지향 분석-합성 부호화는 일련의 영상들을 여러 개의 동 객체로 분할한 후 각 객체의 움직임을 추정하고 보상한다. 그것은 각 객체에 있는 움직임 정보를 추정하기 위해 변환 파라미터 기법을 적용하는데 이때 변환 파라미터 기법은 그레디언트 연산자를 사용하기 때문에 매우 복잡한 계산이 요구된다. 본 논문의 목적은 객체지향 분석-합성 부호화에서 계층적 구조를 사용한 효율적인 변환파라미터 기법을 개발하는 것이다. 이러한 목표를 달성하기 위해 본 논문은 계층적 구조를 사용한 하이브리드 변환파라미터 추정 방법과 적응형 변환 파라미터 방법의 두 가지 알고리듬을 제안한다. 전자는 파라미터 검증 방법을 사용하는데 원 영상을 1/4로 축소한 저해상도 영상에서 파라미터 검증 처리 방법에 의해 6-파라미터 또는 8-파라미터로 추정한다. 후자는 동일한 계층적 방법을 적용한 다음 변환 파라미터를 적응적으로 추정하기 위해 temporal co-occurrence 행렬에 기반 한 움직임 량을 측정하는 움직임 판단기준을 사용한다. 이러한 방법은 고속이며, 병렬처리 기법을 사용할 경우 쉽게 하드웨어로 구현할 수 있는 이점이 있다. 이론 분석 및 모의시험 결과 제안한 방법이 기존 방법에 비해 약 1/4 정도로 월등한 계산량 감축을 얻을 수 있었으며, 아울러 제안한 방법들에 의해 복원된 신호대 잡음비는 6-파라미터와 8-파라미터 추정 방법에 의해 복원된 결과들 사이에 있음을 보여 준다.

병렬 시스템 환경하에서 비정형 응용 프로그램을 위한 입출력 시스템의 설계 및 구현 (Design and Implementation of An I/O System for Irregular Application under Parallel System Environments)

  • 노재춘;박성순;알록샤우드리;권오영
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권11호
    • /
    • pp.1318-1332
    • /
    • 1999
  • 본 논문에서는 입출력 응용을 위해 collective I/O 기법을 기반으로 한 실행시간 시스템의 설계, 구현 그리고 그 성능평가를 기술한다. 여기서는 모든 프로세서가 동시에 I/O 요구에 따라 스케쥴링하며 I/O를 수행하는 collective I/O 방안과 프로세서들이 여러 그룹으로 묶이어, 다음 그룹이 데이터를 재배열하는 통신을 수행하는 동안 오직 한 그룹만이 동시에 I/O를 수행하는 pipelined collective I/O 등의 두 가지 설계방안을 살펴본다. Pipelined collective I/O의 전체 과정은 I/O 노드 충돌을 동적으로 줄이기 위해 파이프라인된다. 이상의 설계 부분에서는 동적으로 충돌 관리를 위한 지원을 제공한다. 본 논문에서는 다른 노드의 메모리 영역에 이미 존재하는 데이터를 재 사용하여 I/O 비용을 줄이기 위해 collective I/O 방안에서의 소프트웨어 캐슁 방안과 두 가지 모형에서의 chunking과 온라인 압축방안을 기술한다. 그리고 이상에서 기술한 방안들이 입출력을 위해 높은 성능을 보임을 기술하는데, 이 성능결과는 Intel Paragon과 ASCI/Red teraflops 기계 상에서 실험한 것이다. 그 결과 응용 레벨에서의 bandwidth는 peak point가 55%까지 측정되었다.Abstract In this paper we present the design, implementation and evaluation of a runtime system based on collective I/O techniques for irregular applications. We present two designs, namely, "Collective I/O" and "Pipelined Collective I/O". In the first scheme, all processors participate in the I/O simultaneously, making scheduling of I/O requests simpler but creating a possibility of contention at the I/O nodes. In the second approach, processors are grouped into several groups, so that only one group performs I/O simultaneously, while the next group performs communication to rearrange data, and this entire process is pipelined to reduce I/O node contention dynamically. In other words, the design provides support for dynamic contention management. Then we present a software caching method using collective I/O to reduce I/O cost by reusing data already present in the memory of other nodes. Finally, chunking and on-line compression mechanisms are included in both models. We demonstrate that we can obtain significantly high-performance for I/O above what has been possible so far. The performance results are presented on an Intel Paragon and on the ASCI/Red teraflops machine. Application level I/O bandwidth up to 55% of the peak is observed.he peak is observed.

하둡 기반 빅 데이터 기법을 이용한 웹 서비스 데이터 처리 설계 및 구현 (Design and Implementation of an Efficient Web Services Data Processing Using Hadoop-Based Big Data Processing Technique)

  • 김현주
    • 한국산학기술학회논문지
    • /
    • 제16권1호
    • /
    • pp.726-734
    • /
    • 2015
  • 데이터를 구조화하여 사용하는 관계형 데이터베이스가 현재까지 데이터 관리에 가장 많이 사용되고 있다. 그러나 관계형 데이터베이스는 데이터가 증가되면 데이터를 저장하거나 조회할 때 읽기, 쓰기 연산 수행에 제약 조건이 발생되어 서비스가 느려지는 현상이 나타난다. 또 새로운 업무가 추가되면 데이터베이스 내 데이터는 증가되고 결국 이를 해결하기 위해 하드웨어의 병렬 구성, CPU, 메모리, 네트워크 등 추가적인 인프라 구성을 필요로 하게 된다. 본 논문에서는 관계형 데이터베이스의 데이터 증가로 느려지는 웹 정보서비스 개선을 위해 기존 관계형 데이터베이스의 데이터를 하둡 HDFS로 전송하고 이를 일원화하여 데이터를 재구성한 후 사용자에게 하둡 데이터 처리로 대량의 데이터를 빠르고 안전하게 추출하는 모델을 구현한다. 본 시스템 적용을 위해 웹 기반 민원시스템과 비정형 데이터 처리인 이미지 파일 저장에 본 제안시스템을 적용하였다. 적용결과 관계형 데이터베이스 시스템보다 제안시스템 데이터 처리가 0.4초 더 빠른 결과를 얻을 수 있었고 기존 관계형 데이터베이스와 같은 대량의 데이터를 처리를 빅 데이터 기법인 하둡 데이터 처리로도 웹 정보서비스를 지원이 가능하였다. 또한 하둡은 오픈소스로 제공되어 소프트웨어 구매 비용을 줄여주는 장점이 있으며 기존 관계형 데이터베이스의 데이터 증가로 효율적인 대용량 데이터 처리를 요구하는 조직에게 도움을 줄 수 있을 것이다.

시그내쳐 기반의 네트워크 침입 방지에서 고속의 패킷 필터링을 위한 시스템 구조 (A High-speed Packet Filtering System Architecture in Signature-based Network Intrusion Prevention)

  • 김대영;김선일;이준용
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권2호
    • /
    • pp.73-83
    • /
    • 2007
  • 네트워크 침입 방지에서 공격 패킷은 시그내쳐에 기반을 둔 방법에 의해 발견되어 제거된다. 패턴 매칭(Pattem Matching)은 공격 시그내쳐를 발견하기 위해 광범위하게 사용되고 있고, 또한 네트워크 침입방지 시스템에서 시간적으로 가장 많이 수행되는 부분이다. 네트워크 침입방지 시스템에 사용되는 패턴 매칭은 주로 하드웨어를 사용하여 가속화되며 회선 속도로 수행되어야 한다. 그러나 이것만으로는 충분치 않고 다음과 같은 조건들이 더 요구된다. 첫째, 패턴 매칭 하드웨어는 패턴 인덱스 번호와 패턴 발견위치를 포함한 충분한 패턴 매칭 정보를 회선 속도에 맞게 제공해야 한다. 둘째, 불필요한 패턴 매칭을 줄이기 위한 패턴 그룹을 지원할 수 있어야 한다. 셋째, 패턴의 개수가 증가하더라도 최저 성능을 보장 할 수 있어야 한다. 마지막으로, 수행 중단 없이 몇분 또는 몇초 이내에 패턴 업데이트가 가능해야 한다. 본 논문에서는 위의 요구사항을 만족하는 시스템 구조를 제안한다. 이 시스템은 여러 개의 패턴 문자를 동시에 처리하고 파이프라인 구조를 사용하여 고속의 처리를 가능케 한다. Xilinx FPGA 시뮬레이션을 통해 제안된 시스템이 10Gbps 이상의 속도에서 동작하며 위의 모든 요구사항을 만족시킴을 보였다.