• 제목/요약/키워드: 다중연산장치

검색결과 29건 처리시간 0.025초

범용 그래픽 처리 장치의 메모리 설계를 위한 그래픽 처리 장치의 메모리 특성 분석 (Analysis on Memory Characteristics of Graphics Processing Units for Designing Memory System of General-Purpose Computing on Graphics Processing Units)

  • 최홍준;김철홍
    • 스마트미디어저널
    • /
    • 제3권1호
    • /
    • pp.33-38
    • /
    • 2014
  • 소비전력 증가와 같은 문제점들로 인하여, 마이크로프로세서만으로는 컴퓨팅 시스템의 성능을 향상시키기 점점 어려워지고 있다. 이와 같은 상황에서, 대용량 병렬 연산에 특화된 그래픽 처리 장치를 활용하여 중앙 처리 장치가 담당하던 범용 작업을 수행하게 하는 범용 그래픽 처리 장치 기술이 컴퓨터 시스템의 성능을 개선시킬 수 있는 방안으로 주목을 받고 있다. 하지만, 그래픽스 관련 응용프로그램과 범용 응용프로그램의 특징은 매우 상이하기 때문에, 그래픽 처리 장치가 범용 응용프로그램을 수행하는 경우에는 많은 제약 사항으로 인하여 자신의 뛰어난 연산 자원을 활용하지 못하는 실정이다. 일반적으로 그래픽스 관련 응용프로그램에 비해 범용 응용프로그램은 메모리를 매우 많이 요청하기 때문에 범용 그래픽 처리 장치 기술을 효율적으로 활용하기 위해서는 메모리 설계가 매우 중요하다. 특히, 긴 접근 시간을 요구하는 외부 메모리 요청은 성능에 큰 오버헤드이다. 그러므로 외부 메모리로의 접근 횟수를 줄일 수 있는 다중 레벨 캐쉬 구조를 효율적으로 활용할 수 있다면, GPU의 성능은 크게 향상 될 것이 분명하다. 본 논문에서는 다중 레벨 캐쉬 구조에 따른 그래픽 처리 장치의 성능을 다양한 벤치마크 프로그램을 통하여 정량적으로 분석하고자 한다.

반도체 검증을 위한 MPI 기반 클러스터에서의 대용량 FDTD 시뮬레이션 연산환경 구축 (Implementation of Massive FDTD Simulation Computing Model Based on MPI Cluster for Semi-conductor Process)

  • 이승일;김연일;이상길;이철훈
    • 한국콘텐츠학회논문지
    • /
    • 제15권9호
    • /
    • pp.21-28
    • /
    • 2015
  • 반도체 공정에서는 소자 내부의 물리량 계산을 통해 불순물의 움직임을 해석하여 결점을 검출하는 시뮬레이션을 수행하게 된다. 이를 위해 유한 차분 시간 영역 알고리즘(Finite-Difference Time-Domain, 이하 FDTD)과 같은 수치해석 기법이 사용된다. 반도체 칩의 집적도 향상으로 인하여 소자의 크기는 나노스케일 시대로 접어들었으며, 시뮬레이션 사이즈 또한 커지고 있는 추세이다. 이에 따라 CPU와 GPU 같은 하나의 연산 장치에서 수행할 수 없는 문제와 다중의 연산 장치로 구성된 한 대의 컴퓨터에서 수행할 수 없는 문제가 발생하기도 한다. 이러한 문제로 인해 분산 병렬처리를 통한 FDTD 알고리즘 연구가 진행되고 있다. 하지만 기존의 연구들은 단일 연산장치만을 이용하기 때문에 GPU를 사용하는 경우 연산 속도는 빠르나 메모리의 제한이 있으며 CPU의 경우 GPU에 비해 연산 속도가 느린 단점이 존재한다. 이를 해결하기 위해 본 논문에서는 CPU, GPU의 이기종 연산 장치를 포함하는 컴퓨터로 구축된 클러스터 상에서 작업 사이즈에 제한되지 않고 시뮬레이션 수행이 가능한 컴퓨팅 모델을 구현하였다. 점대점 통신 기반의 MPI 라이브러리를 이용하여 연산 장치 간 통신을 통한 시뮬레이션을 테스트 하였고 사용하는 연산 장치의 종류와 수에 상관없이 시뮬레이션이 정상 동작함을 확인하였다.

수정된 유전자 알고리즘과 퍼지 추론 시스템을 이용한 무인 자율주행 이송장치의 다중경로계획 (Multiple Path-planning of Unmanned Autonomous Forklift using Modified Genetic Algorithm and Fuzzy Inference system)

  • 김정민;허정민;김성신
    • 한국정보통신학회논문지
    • /
    • 제13권8호
    • /
    • pp.1483-1490
    • /
    • 2009
  • 본 논문에서는 수정된 유전자 알고리즘과 퍼지 추론 시스템을 이용한 무인 자율주행 이송장치의 다중경로계획을 연구하였다. 기존의 다중경로계획을 위한 방법으로는 최적화 알고리즘들을 이용한 작업별회귀 방법과 매시간 각 개체마다 경로를 재계획하는 방법이 있다. 이러한 방법들은 한 대의 이송장치가 작업을 하기 위해서는 한 대 이상의 이송장치가 정지해야하므로 시간과 에너지 측면에서 비효율적이며, 연산량이 많아 오류가 발생할 가능성이 있다. 본 논문에서는 이러한 문제점들을 해결하기 위해 수정된 유전자 알고리즘과 퍼지 추론 시스템을 이용한 다중경로계획을 제안한다. 제안한 알고리즘의 성능 평가를 위하여 무인 자율주행이 가능한 2대의 이송장치를 설계 제작하였고 지게차와 동일한 주행 제어부를 탑재하여 다중경로계획을 실험하였다. 실험 결과, 빠르고 최적화된 경로 계획과 효율적인 충돌 회피가 가능함을 확인 할 수 있었다.

저전력 내장형 시스템에서 플래쉬 메모리를 위한 효과적인 파일 시스템 설계 (An Efficient File System Design for Flash Memories In Low-Power Embedded Systems)

  • 김중헌;한상우
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.377-378
    • /
    • 2007
  • 본 논문에서는 저전력 임베디드 시스템을 위한 효율적인 다중 NAND 플래쉬 파일 시스템을 제안한다. 기존에 제안되었던 하드디스크를 비롯한 저장 장치들과는 달리 NAND 플래쉬 메모리는 특정 블록에 쓰기 연산을 하기 전에 해당 블록은 이미 소거된 상태이어야 한다. 또한 이러한 소거의 횟수는 각 블록마다 제한적이다. 이러한 문제를 해결하기 위해서 소거 횟수 평준화 기법이 많이 사용되고 있고 관련하여 많은 연구가 진행되고 있다. 본 논문에서는 소거 횟수에 임계치를 설정하여 연산하는 방법을 제안한다. 또한 기존에는 단일 플래쉬 메모리만을 고려하고 있으나 본 논문에서는 다중 플래쉬 메모리 구조를 고려한다.

  • PDF

JPEG 영상 복원을 위한 다중 모드 채도 복원과 연산 재배열 기반의 시간 최적화된 컬러 변환 (Time-optimized Color Conversion based on Multi-mode Chrominance Reconstruction and Operation Rearrangement for JPEG Image Decoding)

  • 김영주
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.135-143
    • /
    • 2009
  • 최근 모바일 장치에서 고해상도 영상의 인코딩 및 디코딩에 대한 요구가 늘어남에 따라 효율적인 영상 코덱 개발의 필요성이 증대되고 있다. 본 논문은 JPEG 디코딩 과정에서 IDCT 변환과 컬러변환 배열간의 선형성을 바탕으로 이들 연산순서를 재배열함으로써 컬러변환 과정에서 요구되는 계산 횟수를 줄이고 재배열된 부동소수점 연산에 정수 맵핑을 적용하여 시간 복잡도를 줄임으로써 실행시간을 크게 단축하는 컬러변환 기법을 제안한다. 또한, 제안된 기법은 연산 재배열 및 정수 맵핑의 양자화오류로 인한 화질 저하를 다중 모드 채도 재구성 기법을 적용하여 보상하도록 한다. 임베디드 시스템 개발 플랫폼에서의 성능평가를 통해 제안 된 기법이 기존의 컬러변환 기법들과 비교하여 복원 영상의 화질 저하를 최소화하면서 실행시간을 크게 단축함을 알 수 있었다.

초다광원 3차원 물체의 디지털 홀로그램 고속 생성 (Digital Hologram Generating of 3D Object with Super-multi-light-source)

  • 송중석;김창섭;박종일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.135-136
    • /
    • 2015
  • 컴퓨터 생성 홀로그램(CGH: computer generated hologram) 기법은 기존의 광학계 장치와 변수들을 수학적으로 모델링하여 일반 범용 컴퓨터(PC: personal computer)로도 디지털 홀로그램을 생성할 수 있는 기술이다. 이 기술은 디지털 홀로그램의 해상도와 3D 물체의 광원 수에 따라 알고리즘의 연산량이 좌우되기 때문에, 실용적인 사용을 위해서 알고리즘의 연산량을 낮추거나 하드웨어의 연산 속도를 높이는 연구가 필수적이다. 본 논문에서는 초다광원 3D 물체의 디지털 홀로그램을 고속으로 생성할 수 있는 방법을 제안한다. 제안하는 방법은 한 개의 서버 PC와 다수의 클라이언트 PC들로 구성되어 있으며, 이들은 일반적으로 사용되는 범용 GPU (graphic processing unit)가 장착되어 있다. 서버에서 3D 물체의 광원을 스캔하여 데이터화 하고, 클라이언트 PC들의 연산 능력에 따라 광원 데이터를 분할하여 클라이언트들에게 각각 전송한다. 각각의 클라이언트들은 전송받은 데이터를 이용해 다중 GPU 기반의 CGH 연산을 수행하여 간섭 패턴들을 생성하고, 생성된 패턴들은 다시 서버 PC로 재전송된다. 서버 PC로 재전송 된 패턴들이 하나로 누적되면 디지털 홀로그램이 생성된다. 본 실험에서, 기존의 방법으로는 139,655개의 광원에 대해 $1,024{\times}1,024$ 해상도의 홀로그램을 생성하는데 약 2,250 ms가 걸린 반면, 제안하는 방법은 약 478 ms의 속도로 생성할 수 있음을 확인하였다.

  • PDF

다중 키워드 검색에 적합한 동등조인 연산 결과의 동적 관리 기법 (Dynamic Management of Equi-Join Results for Multi-Keyword Searches)

  • 임성채
    • 정보처리학회논문지A
    • /
    • 제17A권5호
    • /
    • pp.229-236
    • /
    • 2010
  • 인터넷이나 기업체 안에서 생성되는 문서의 수가 빠르게 증가하고 있고 이에 따라 효율적인 문서 검색 서비스의 중요성도 함께 커지고 있다. 이런 검색 환경에서 사용자의 검색 질의를 미리 예측할 수 없기 때문에 문서 내의 키워드를 자동 추출하여 색인어로 사용하는 전문검색(full-text search)이 일반적으로 적용된다. 전문검색을 위해 생성된 색인 파일의 크기는 문서 수 증가로 대용량화 되고, 이런 대용량 색인에 대한 다중 키워드 질의 처리에는 과도한 디스크 비용이 초래될 수 있다. 논문에서는 이런 비용 문제를 해결하기 위해 대용량 문서의 전문검색 시스템에서 다중 키워드 질의를 효율적으로 처리할 수 있게 하는 색인 파일 구조 및 관리 기법을 제안한다. 제안된 방법은 다중 키워드 검색에 적합한 것으로 알려진 역파일을 기본 색인 구조로 하며, 질의 처리의 조인 연산과 랭킹 연산에 적합하도록 색인 파일을 계층화한다. 이를 바탕으로 다중 키워드 질의를 구성할 확률이 높은 키워드 쌍에 대한 조인 연산 결과를 주기억장치 공간에 동적으로 저장함으로써 디스크 사용량을 크게 줄일 수 있다. 논문에서는 제안된 기법의 우수성을 보이기 위해 디스크 비용 모델에 기반한 성능 비교도 수행한다.

중첩 다중비트 주사기법을 사용하여 레지듀에서 이진수로 변환하는 컨버터 (RNS to Binary Converter Using Overlapped multiple-bit scanning method.)

  • 장상동;김우완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.39-41
    • /
    • 1999
  • 최근의 보편적인 컴퓨터 응용분야인 컴퓨터 그래픽, 패턴인식, 음성 출력 등과 같은 제분야에서는 대용량의 데이터를 실시간으로 처리하는 것이 필수적이다. RNS는 캐리부재, 병렬처리 등의 특징을 가지므로 대용량 데이터의 실시간 처리를 지원하는 장치의 개발에 큰 이점이 있다. 본 논문에서는 RNS에서 웨이티드 수체계로 변환하는 방법을 유도하고 구현한다. 이 방법은 연산의 비트수가 증가하더라도 고정된 연산의 단계를 거치게 되고, 여기에서 이 방법의 효율성이 커진다. 이는 중첩 비트 주사기법을 CRT 변환시에 적용하는 새로운 방법이다. 그리고, 변환식의 유도와 실제 시뮬레이션의 결과를 타 시스템과 비교하여 본 논문의 방법이 타당함을 보여준다. 그 결과, 기존의 승산기보다 많은 하드웨어를 요구하지만, 이는 최근의 반도체 집적기술의 발전으로 인하여 큰 문제가 되지 않고, 반면에 병렬 t행과 캐리 부재의 특성으로 인해 기존의 방법보다 속도를 향상시킬 수 있다.

  • PDF

실시간 다중항법을 이용한 관성측정기의 비행환경 성능 검증 기법 (Performance verification methods of an inertial measurement unit in flight environment using the real time dual-navigation)

  • 박병수;이상우;정상문;한경준;유명종
    • 한국항공우주학회지
    • /
    • 제45권1호
    • /
    • pp.36-45
    • /
    • 2017
  • 본 논문에서는 고기동 항체 적용을 위한 관성측정기의 비행환경 특성을 분석할 수 있는 방법을 제안한다. 먼저 관성측정기의 센서 출력을 직접 비교하는 방법을 제안하고, 시험결과를 통하여 장 단점을 분석하였다. 관성측정기의 센서 출력을 비교하는 방법의 단점 보완과 항법 해를 비교할 수 있는 방법을 제안한다. 이를 위해 유도전자장치를 이용하여 실시간 다중 항법 연산이 가능하도록 구현하였다. 제안한 방법은 유도전자장치를 이용하기 때문에 시스템의 안정성과 타 구성품의 영향도 등을 고려해야 한다. 따라서 실시간 다중 항법 연산이 가능하도록 구현된 내용을 기술하고, 제안한 방법의 검증을 위해 지상시험과 비행시험을 수행하였다. 시험 결과를 통해 제안한 방법은 관성측정기 개발의 신뢰성을 향상하는데 기여함을 확인하였다.

무인기를 위한 이중화 비행제어컴퓨터의 동기화 설계 (Synchronization Method Design of Redundant Flight Control Computer for UAV)

  • 이영서;강신우;이희곤;안태식
    • 한국항행학회논문지
    • /
    • 제25권4호
    • /
    • pp.273-279
    • /
    • 2021
  • 무인항공기에 적용되는 비행제어컴퓨터는 safety-critical 구성품으로, 내결함성을 확보함으로써 운용의 신뢰성을 높이기 위해 다중화 구조로 설계되고 있다. 이러한 다중화 구조가 적용된 비행제어컴퓨터는 각각의 독립적인 연산/제어 장치가 동일한 시점에 동일한 작업을 수행할 수 있도록 설계되어야 하며, 이를 위해 각 연산/제어 장치 간의 작업 동기화를 위한 동기화 알고리즘이 포함되어야 한다. 본 논문에서는 무인기에 적용되는 이중화 비행제어컴퓨터간의 동기화를 위한 소프트웨어 설계 방법을 제안한다. 제안하는 동기화 방법은 고장률 감소를 위해 최소의 하드웨어 리소스만을 사용하여 동기화할 수 있도록 설계하였고, 동기화에 사용되는 하드웨어 타이머의 동작 방식을 고려하여 설계함으로써 타이머 동작에 따른 동기화 오차를 최소화 할 수 있도록 설계하였다.