• 제목/요약/키워드: 병렬 연산 처리

검색결과 554건 처리시간 0.025초

SoC 기반 상황 인식 시스템 구조 (An SoC-based Context-Aware System Architecture)

  • 이건명;손봉기;김종태;이승욱;이지형;전재욱;조준동
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 춘계학술대회 학술발표 논문집 제14권 제1호
    • /
    • pp.487-490
    • /
    • 2004
  • 상황 인식(context-awrare)은 인간-컴퓨터 상호작용의 단점을 극복하기 위한 방법으로써 많은 주목을 받고 있다. 이 논문에서는 SoC(System-on-a-Chip)로 구현될 수 있는 상황 인식 시스템 구조를 제안한다. 제안한 구조는 센서 추상화, 컨텍스트 변경에 대한 통지 메커니즘, 모듈식 개발, if-then규칙을 이용한 쉬운 서비스 구성과 유연한 상황 인식 서비스 구현을 지원한다. 이 구조는 통신 모듈, 처리 모듈, 블랙보드를 포함하는 SoC 마이크로프로세서 부분과 규칙 기반 시스템 모듈을 구현한 하드웨어로 구성된다. 규칙 기반 시스템 하드웨어는 모든 규칙의 조건부에 대해 매칭 연산을 병렬로 수행하고, 규칙의 결론부는 마이크로프로세서에 내장된 행위 모듈을 호출함으로써 작업을 수행한다. 제안한 구조의 SoC 시스템은 SystemC SoC 개발 환경에서 설계되고, 성공적으로 테스트되었다. 제안한 SoC 기반의 상황 인식 시스템 구조는 주거 환경에서 컨텍스트를 인식하여 노인을 보조하는 지능형 이동 로봇 등에 적용될 수 있을 것으로 기대된다.

  • PDF

슈퍼컴퓨터를 이용한 유한요소해석 (Finite element analysis on supercomputers)

  • 이재석
    • 전산구조공학
    • /
    • 제1권2호
    • /
    • pp.26-33
    • /
    • 1988
  • 유한요소해석프로그램들의 적용대상이 최근들어 다(多) 자유도의 비선형문제로 확대됨에 따라 컴퓨터의 계산속도가 특히 중요한 제한조건으로 대두되기 시작하였으며 금속성형해석, 자동차 등의 충돌해석(자유도가 2만-6만), 토질 및 콘크리트 등의 점소성해석과 더불어 항공기, 터빈 등의 열응력해석 및 동적해석 등에 있어서는 막대한 계산시간으로 인하여 해석의 효율성에 대한 문제가 제기되고 있다. 따라서 슈퍼컴퓨터를 포함하여 고속연산기능을 가진 병렬처리컴퓨터를 이용하여 유한요소해석을 수행하여야 할 필요성이 증가하고 있다. 88년 9월중에 한국과학기술원 시스템공학센터에 현존하는 슈퍼컴퓨터중 최상위 성능을 가진 CRAY2S가 설치됨에 따라 국내에도 슈퍼컴퓨터시대가 열리게 되었으며 따라서 본 고에서는 CRAY2S의 시스템개요 및 응용소프트웨어에 대하여 소개하고 슈퍼컴퓨터를 이용한 유한요소해석에 관하여 간략히 기술하고저 한다.

  • PDF

맵리듀스를 이용한 멀티웨이 조인 알고리즘의 비교 (A Comparison of Multi- Way Join Algorithms in MapReduce)

  • 명재석;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.127-130
    • /
    • 2011
  • 맵리듀스는 데이터의 분산 및 병렬 처리를 돕는 프레임워크로서, 하둡과 같은 오픈 소스 맵리듀스 구현이 배포되면서 많은 연구가 이루어지고 있다. 맵리듀스를 이용한 조인은 대용량 데이터 분석을 위한 필수적인 연산이며, 여러 개의 테이블을 한 번의 맵리듀스로 조인하기 위한 멀티웨이 조인 알고리즘에 대한 연구도 계속 진행되고 있다. 이 논문에서는 반복(iteration) 기반 멀티웨이 조인과 중복(replication) 기반 멀티웨이 조인 알고리즘의 장단점을 분석한다. 또한 두 가지 방식의 조인 알고리즘의 단점을 보완하여 하나의 통합적인 2단계 멀티웨이 세미조인을 제시하고, 이를 기존의 방식과 비교한다. 결과적으로, 2단계 멀티웨이 세미조인은 반복 기반의 조인에 비하여 입출력 비용을 절감하고, 중복 기반의 조인에 비하여 커뮤니케이션 비용을 절감한다.

비선형 패턴 분류를 위한 FPGA를 이용한 신경회로망 시스템 구현 (Implementation of a Feed-Forward Neural Network on an FPGA Chip for Classification of Nonlinear Patterns)

  • 이운규;김정섭;정슬
    • 대한전자공학회논문지SD
    • /
    • 제45권1호
    • /
    • pp.20-27
    • /
    • 2008
  • 본 논문에서는 비선형 패턴 분류를 위해 FPGA 칩에 신경회로망을 구현하였다. 병렬처리 연산을 위해 순방향 신경회로망이 구현 되었다. 신경망의 학습을 off-line으로 한 다음에 가중치 값들을 저장하여 사용한다. 예로서, AND와 XOR 논리의 패턴 구분이 수행된다. 실험결과를 통해 FPGA에 구현된 신경회로망이 잘 작동하는 것을 검증하였다.

SDR을 위한 W-CDMA 업링크 소프트웨어 모뎀 구현 (Implementation of W-CDMA Uplink Software Modem for SDR)

  • 백동명;조권도;김진업
    • 전자통신동향분석
    • /
    • 제18권6호통권84호
    • /
    • pp.19-26
    • /
    • 2003
  • 다양한 이동통신기기들을 한 시스템에 수렴시킬 수 있는 기술로서 SDR 기술이 각광받고 있다. 본 논문은 W-CDMA 물리계층 업링크의 트래픽 채널을 DSP로 구현하여 베이스밴드 프로세싱 하는 것을 목적으로 한다. 이러한 소프트웨어 모뎀은 초기화, 소스 데이터 발생, 스프레딩, 스크램블링, 출력단 등으로 이루어진다. 기존의 FPGA, ASIC 등으로 구현된 하드웨어 모뎀을 소프트웨어적인 DSP로 구현할 때 생기는 주요 문제들을 고찰하였다. 로드 밸런싱, 동시성과 실시간성, 버퍼 스킴, 멀티 태스킹, 인터럽트 관리, OVSF 및 스크램블링 코드의 복소수 연산 등이다. 전통적인 구조는 FPGA와 DSP 혼합체인데 각각 칩레벨 프로세싱, 심볼 프로세싱을 담당한다. FPGA와 DSP 혼합체 구조를 넘어서 멀티 DSP를 이용한 병렬처리기법, 또는 reconfiguable 칩을 개발해서 칩레벨 및 심볼 프로세싱을 한 번에 할 수 있는 개발제품도 출시되었다.

GP-GPU를 이용한 H.264/AVC 디코더의 IQ/IDCT구현 (Implementation of IQ/IDCT in H.264/AVC Decoder Using GP-GPU)

  • 정준모;이광엽
    • 전기전자학회논문지
    • /
    • 제14권2호
    • /
    • pp.76-81
    • /
    • 2010
  • 모바일 CPU의 성능이 향상됨에 따라 전용 하드웨어의 필요성이 줄어 들고 있다. 그러나 아직까지 모바일 CPU의 성능은 한계가 있다. 이러한 제약 조건을 병렬처리와 실수 연산이 뛰어난 GP-GPU(General-Purpose computing on Graphics Processing Units)를 이용함으로써 다른 전용 하드웨어의 추가 없이 성능을 향상 시킬 수 있다. 본 논문에서는 모바일 환경에 적합하게 설계된 GP-GPU를 이용하여 H.264 디코더의 Inverse Quantization, Inverse DCT, Color Space Conversion 모듈을 구현하였다. G-PGPU를 이용한 전체 시스템 동작 시 40%의 성능 향상이 있었다.

듀얼 페이즈 구조의 멀티 코어 GP-GPU를 이용한 픽셀 셰이딩 (The Pixel Shading on Multi Core GP-GPU with Dual Phase Architecture)

  • 김준서;박태룡;이광엽
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 추계학술대회
    • /
    • pp.339-342
    • /
    • 2010
  • 최근 프로세서가 클럭 향상의 한계에 부딪힘에 따라, 프로세서의 성능을 향상시키기 위해 멀티 코어 기반의 병렬처리를 이용한 방법들이 제안 되고 있다. 본 논문은 여러개의 연산기를 한 명령어 사이클에 동시에 사용할 수 있는 MIMD(Multiple Instruction, Multiple Data) 구조를 가지며, Scratch Counter를 이용해 멀티 코어와 멀티 스레드의 작업을 할당하는 구조의 GP-GPU(General Purpose - Graphics Processing Unit)를 활용해 멀티 코어, 멀티 스레드 환경에서의 효율적인 픽셀 셰이딩 방법을 설계 하였다. 선형 안개 픽셀 셰이딩의 경우 싱글코어에서 18.3 FPS이며 4개의 멀티코어 GP-GPU에서는 4배가 증가한 73.2 FPS 결과를 얻었다.

  • PDF

경량화된 딥러닝 구조를 이용한 실시간 초고해상도 영상 생성 기술 (Deep Learning-based Real-Time Super-Resolution Architecture Design)

  • 안세현;강석주
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.228-229
    • /
    • 2020
  • 최근 딥러닝 기술은 여러 컴퓨터 비전 응용 분야에서 많이 쓰이고 있다. 물체 인식, 분류 및 영상 생성 등을 예로 들 수 있다. 특히 초고해상도 변환 문제에서 최근 딥러닝을 사용하면서 큰 성능 개선을 얻고 있다. Fast super-resolution convolutional neural network (FSRCNN)은 딥러닝 기반 초고해상도 알고리즘으로 잘 알려져 있으며, 여러 개의 convolutional layer로 추출한 저 해상도의 입력 특징을 활용하여 deconvolutional layer에서 초고해상도의 영상을 출력하는 알고리즘이다. 본 논문에서는 병렬 연산 효율성을 고려한 FPGA 기반 convolutional neural networks 가속기를 제안한다. 특히 deconvolutional layer를 convolutional layer로 변환하는 방법을 통해서 에너지 효율적인 가속기를 설계했다. 또한 제안한 방법은 FPGA 리소스를 고려하여 FSRCNN의 구조를 변형한 Optimal-FSRCNN을 제안한다. 사용하는 곱셈기의 개수를 FSRCNN 대비 2.4 배 압축하였고, 초고해상도 변환 성능을 평가하는 지표인 PSNR은 FSRCNN과 비슷한 성능을 내고 있다. 이를 통해서 FPGA 에 최적화된 네트워크를 구현하여 FHD 입력 영상을 UHD 영상으로 출력하는 실시간 영상처리 기술을 개발했다.

  • PDF

분산 컴퓨팅 기술을 이용한 고해상도 강수량 예측 (High Resolution Rainfall Prediction Using Distributed Computing Technology)

  • 윤준원;송의성
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권1호
    • /
    • pp.51-57
    • /
    • 2016
  • 분산컴퓨팅은 네트워크로 연결된 여러 컴퓨터들의 연산 능력을 이용하여 거대 계산 문제를 해결하려는 분산처리 모델이다. 인터넷에 연결된 수많은 컴퓨팅 자원들의 참여를 통해 대규모의 계산이 필요한 기상, 바이오, 천문학, 암호학 등과 같은 다양한 분야의 어플리케이션 들을 병렬로 처리할 수 있다. 본 논문에서는 기상 분야의 고해상도 강수량 예측 어플리케이션 수행을 위해 인터넷 분산컴퓨팅 모델을 구성하여 성능을 분석하였다. 한반도의 강수량 예측을 위해서 중규모 예측 모형인 QPM(Quantitative Precipitation Model)을 적용하였으며 이 모형은 한반도의 지형을 격자 간격 27km로 나누고 각 격자의 특성인 고도, 기온, 강수, 강도 습도 등을 기반으로 강수량을 예측하게 된다. 그러나 QPM의 격자 간격에 따른 분석은 모형 구축에 많은 시간이 소요 되고 한번에 수행되어야 할 계산량이 많아 효율성이 저하된다. 따라서 이 모형을 기반으로 하여 3km 간격의 상세 지형을 반영하는 모형으로 소규모 지형 효과를 표현함으로써 상세 지역에서의 강수량 산출과 지형에 따른 강수량의 분포 파악이 용이해지며 계산 효율성을 개선시킬 수 있다. 이렇게 상세지역으로 세분화 된 모형은 병렬처리가 필요하며 계산노드의 수가 많아질수록 그 효율은 선형적으로 증가된다. 이 모형은 $20{\times}20$의 아격자 도메인의 분산된 단위작업들로 나뉘어 분산되고 네트워크로 연결된 컴퓨팅 자원에서 수행되게 된다.

패턴인식용 VLSI 펄스형 디지탈 다계층 신경망의 구조및 동작 특성 (A VLSI Pulse-mode Digital Multilayer Neural Network for Pattern Classification : Architecture and Computational Behaviors)

  • 김영철;이귀상
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.144-152
    • /
    • 1996
  • 대규모 병렬처리가 가능하고 칩당 뉴론 집적도가 높은 펄스형 디지털 다계층 신경망 구조를 제안하였다. 제안된 신경망에서는 대수적인 신경망연산이 의사-랜덤 펄스 시퀀스(pseudo-random pulse sequences)와 단순 디지털 논리 게이트를 이용하여 확률적 프로세스로 대치되었다. 확률적 프로세스의 결과로 나타나는 신경망 연산의 통계적 모델을 제시하였으며 이를 바탕으로 랜덤잡음의 영향과 연산의 정확도를 분석하였다. 이진인식 문제를 적용하여 제안된 신경망의 성능을 평가하고 제시한 통계적 분석결과의 정당성을 검증하였다. Gate 레벨과 register transfer 레벨로 기술된 신경망의 VHDL 모델의 시뮬레이션 결과는 개발된 통계적모델로 예측된 인식추정치와 실제 인식률이 거의 일치함을 보였으며, 또한 숫자인식률에 있어서도 일반 Back-Propagation 신경망의 인식률과 거의 차이가 없음을 보였다.

  • PDF