• 제목/요약/키워드: 프로세서 구조

검색결과 1,042건 처리시간 0.026초

목적 코드 레벨에서의 벡터화 기법 (A Vectorization Technique at Object Code Level)

  • 이동호;김기창
    • 한국정보처리학회논문지
    • /
    • 제5권5호
    • /
    • pp.1172-1184
    • /
    • 1998
  • 명령어 재배치는 ILP(Instruction Level Parallelism) 프로세서의 병렬성을 활용하는 주요한 코드 최적화 기법이다. 명령어 재배치 알고리즘을 루프(loop)에 적용하면서 서로 다른 반복(iteration) 사이의 동시 수행 가능한 명령어들이 인접한 위치로 모여지는 소프트웨어 파이프라인(software pipeline)된 루프가 얻어진다. 그러나 루프로부터 병렬성을 추출하는 소프트웨어 파이프라인 방법은 주로 명령어사이의 자료 종속성에 근거하여 스케줄링을 수행하므로 그 자체에 무한한 병렬성을 가지고 있는 벡터 루프의 경우 그 병렬성을 충분히 드러내지 못한다는 문제점을 안고 있다. 본 논문에서는 이러한 벡터루프에 대해 프로그램의 목적 코드 레벨에서 행해질 수 있는 새로운 벡터 스케줄링 방법을 제안한다. 벡터 스케줄링 방법은 프로그램의 목적 코드 레벨에서 루프의 구조나 반복 조건, 그리고 자료 종속성 등에 대한 전체적인 정보에 기반하여 스케줄링을 수행함으로써 소프트웨어 파이프라인 방법보다 프로그램의 수행속도를 향상시킬 수 있다. 본 논문에서는 벡터 스케줄링을 수행한 결과를 전통적인 소프트웨어 파이프라인 방법에 대해 생산된 병렬 루프의 결과와 수행속도 측면에서 비교한다.

  • PDF

DSM 시스템에서 통신 부하의 가중치를 고려한 경쟁적인 갱신 프로토콜 (Weighted Competitive Update Protocol for DSM Systems)

  • 임성화;백상현;김재훈;김성수
    • 한국정보처리학회논문지
    • /
    • 제6권8호
    • /
    • pp.2245-2252
    • /
    • 1999
  • 분산 공유 메모리(Distributed Shared Memory)시스템은 사용자에게 간단한 공유 메모리 개념을 제공하기 때문에 노드 사이의 데이터 이동에 관여할 필요가 없다. 각 노드는 프로세서, 메모리, 그리고 네트워크 연결장치 등으로 이루어져 있다. 메모리는 페이지 단위로 구분되며 페이지는 여러 노드에 복제본을 소유할 수 있다. 이들간 일치성을 유지하기 위하여 무효화 방식(invalidate protocol)과 갱신 방식(update protocol)이 전통적으로 많이 사용되었다. 이 두 가지 프로토콜의 성능은 시스템 변수 또는 응용 프로그램의 공유 메모리 사용 형태에 따라 좌우된다. 메모리 사용 형태에 적응하기 위하여 경쟁적 갱신(competitive update) 프로토콜은 가까운 장래에 사용되어질 복제본을 갱신시키는 반면, 다른 복제본은 무효화시킨다. 본 논문에서는 노드 사이의 통신비용이 동일하지 않은 구조를 감안한 가중치를 고려한(weighted) 경쟁적 갱신 프로토콜을 제안하였다. 시뮬레이션에 의한 성능 측정 결과 가중치를 고려한 경쟁적 갱신 프로토콜의 성능 향상을 보였다.

  • PDF

MPSoC를 위한 저비용 하드웨어 MPI 유닛 설계 (The Design of Hardware MPI Units for MPSoC)

  • 정하영;정원영;이용석
    • 한국통신학회논문지
    • /
    • 제36권1B호
    • /
    • pp.86-92
    • /
    • 2011
  • 본 논문에선 분산 메모리 아키텍처를 사용하는 멀티프로세서 시스템에서 메시지 전달을 지원하는 하드웨어 MPI(Message Passing Interface) 유닛을 설계하였다 데이터 전송 동기화 및 데이터 전송, 완료까지의 과정을 하드웨어 MPI 유닛이 담당하여 동기화에 따른 오버헤드를 경감시켰다. 또한 동기화 메시지를 저장 관리하는 요청 큐(Request Queue), 준비 큐(Ready Queue), 예약 큐(Reserve Queue)를 내장하여 병렬적으로 입력받은 동기화 메시지를 관리하고 비순차적 종료(out of order completion)을 지원한다. BMF(Bus Functional Medel)을 제작해 제안한 구조에서의 전송 대역폭 성능을 확인한 결과 다대다 통신에서 25% 이상의 성능 향상이었음을 확인할 수 있었다. 그 후 HDL로 기술된 하드웨어를 Magnachip 0.18 공정 라이브러리에서 합성하였으며 프로토 타입 chip으로 제작하였다. 제안한 MPI 유닛은 전체 칩 사이즈의 1% 이하의 크기로 높은 성능 향상을 기대할 수 있어, 저비용 설계와 확장성 측면에서 임베디드 MPSoC(Multi-Processor System-on-Chip)의 전체적인 성능을 높이는데 유용하다.

배전설비를 위한 임베디드 무선랜 기술 개발 (Development of the Embedded Wireless LAN Technology for Power Utility Equipments)

  • 우종정;손수국
    • 조명전기설비학회논문지
    • /
    • 제20권10호
    • /
    • pp.126-134
    • /
    • 2006
  • 본 논문에서는 배전설비 중 주상 변압기에 설치되어 운전되는 기존의 각종 제어설비를 무선 네트워크를 경유하여 제어하도록 하는 임베디드 무선랜 제어기술에 대하여 기술한다. 임베디드 무선랜 제어기는 Prism 2.5 칩셋을 포함한 PCMCIA 타입의 무선랜 네트워크 카드와 8비트 마이크로프로세서 Atmega128을 중요 구성요소로 이루어져 있다. 네트워크를 통한 제어를 위하여 임베디드 무선랜 제어기에는 IP, TCP, UDP, ICMP 같은 TCP/IP 스택과 기존 제어기를 인터페이스 하기 위한 Telnet, X/Z 모뎀의 개발내용을 포함된다. TCP/IP 네트워크와 모뎀을 통한 직렬 통신 사이의 데이터 구조와 흐름제어 차이에 대한 해결 방법과 램(RAM)사용량을 최소화하기 위한 알고리즘을 제안한다. 끝으로 개발된 프로토콜들의 동작을 측정하기 위하여 $DU^{(R)},\;CommViewFi^{(R)}$ 등이 사용된다. 개발결과 3,381 바이트 램(RAM)만을 사용하여 호스트 간에 상호 호환성을 잃지 않고 임베디드 무선랜 제어기가 동작된다.

클라우드 컴퓨팅 파라다임을 통한 멀티미디어 컨텐츠 관리 설계 (A Design of Multimedia Content Management through Cloud Computing Paradigm)

  • ;김용태;정윤수
    • 디지털융복합연구
    • /
    • 제10권11호
    • /
    • pp.343-349
    • /
    • 2012
  • 사용 조절 모델은 보호된 컨텐츠의 사용에 대한 포괄적인 기술을 허용하는 새로운 접근 조절 모델의 시초이다. 이 범례에서 객체로의 접근에 관련된 결정은 요청 시간에만 제한되어있지 않다. 그것은 보호된 객체의 사용과 결합되며 사용과 병렬식으로 진행되는 지속적 처리가 된다. 사용 조절의 실현은 오랫동안 보안 문서의 전파에 있어서 조절 능력을 잃게 되는 문제를 해결하려한 연구 과제이다. 클라우드 컴퓨팅의 발현으로 문서들이 클라우드에 저장이 되고 문서를 보거나 편집할 수 있는 프로세서들이 클라우드안에 상주하며 문서들은 브라우저와 같은 신 클라이언트에 의해 접근이 가능해진다. 우리는 그러한 시나리오가 이해 당사자의 정책에 기반을 둔 문서 사용 보안에 대한 사용 조절의 실행에 있어 이상적인 기회를 제공하는 사실에 주목한다. 본 논문에서는 클라우드 기반의 어플리케이션에서 더 나은 멀티미디어 컨텐츠를 실행하기 위한 멀티미디어 컨텐츠 관리(MCM)를 제안한다. 그리고 클라우드 컴퓨터의 발현과 사용을 통해 보안된 객체의 사용에 있어 매끄러운 조절을 제공하기 위한 강력한 구성을 설계한다. 우리는 이러한 실현을 위해 설계 원칙을 기술하고 제안 구조를 논한다.

Programmable DSP 코어를 사용한 고성능 디지털 보청기 프로세서 (A High-performance Digital Hearing Aid Processor Based on a Programmable DSP Core)

  • 박영철;김동욱;김인영;김원기
    • 대한의용생체공학회:의공학회지
    • /
    • 제18권4호
    • /
    • pp.467-476
    • /
    • 1997
  • 본 논문에서는 DSP코어를 채용한 디지털 보청기 칩을 설계 제작하였다. 디지털 보청기 칩은 크기와 소비전력면에서 크게 제한을 받는다. 이와함께 다양한 형태와 범위의 청각 손실에 대해 보상을 할 수 있어야 하기 때문에 알고리즘 개발을 위해 구조적인 유연성을 필요로 한다는 점도 칩 설계에 있어 또다른 제약이 된다. 본 연구에서는 16비트 고정 소수점 연산을 하는 크로그래머블 DSP 코어를 사용하여 보청기 칩을 설계하였다. 제작된 보청기 칩은 난청자의 청각 측정치를 바탕으로 8개의 주파수 대역에 걸쳐 비선형적으로 라우드니스를 보상해 준다. 필터 뱅크를 사용하는 대신에 본 연구에서에서는 단일 필터를 주파수 샘플링 방법으로 설계함으로써 주파수 왜곡을 최소화 하였다. 또한 프로그램 가능한 DSP 코어를 사용하였기 때문에 알고리즘 개발을 위한 시스템으로도 활용이 가능할 뿐만 아니라 $5,500\times5000$$\mu$$m^2$의 크기와 저전력 동작특성을 갖고 있어서 소형 보청기 제작에 적합하다.

  • PDF

FPGA 경계 스캔 체인을 재활용한 FPGA 자가 테스트 회로 설계 (A Design of FPGA Self-test Circuit Reusing FPGA Boundary Scan Chain)

  • 윤현식;강태근;이현빈
    • 전자공학회논문지
    • /
    • 제52권6호
    • /
    • pp.70-76
    • /
    • 2015
  • 본 논문은 FPGA 내부의 경계 스캔 체인을 자가 테스트 회로로써 재활용하기 위한 FPGA 자가 테스트 회로 설계 기술을 소개한다. FPGA의 경계 스캔 체인은 테스트나 디버깅 기능뿐만 아니라 각 셀에 연결되어 있는 입출력 핀의 기능을 설정하기 위해서도 사용되기 때문에 일반적인 칩의 경계 스캔 셀보다 매우 크다. 따라서, 본 논문에서는 FPGA 경계 스캔 셀의 구조를 분석하고 소수의 FPGA 로직과 함께 테스트 패턴 생성과 결과 분석이 가능하도록 설계한 BIST(built-in-self-test) 회로를 제시한다. FPGA의 경계 스캔 체인을 자가 테스트를 위하여 재사용함으로써 면적 오버헤드를 줄일 수 있고 보드상에서 프로세서를 사용한 온-라인(on-line) 테스트/모니터링도 가능하다. 실험을 통하여 오버헤드 증가량과 시뮬레이션 결과를 제시한다.

적응적 영역 가중치를 이용한 실시간 스테레오 비전 시스템 설계 (Design of a Realtime Stereo Vision System using Adaptive Support-weight)

  • 류동훈;박태근
    • 전자공학회논문지
    • /
    • 제50권11호
    • /
    • pp.90-98
    • /
    • 2013
  • 지역적 정합방법을 이용한 스테레오 시스템은 알고리즘의 특성상 하드웨어 설계가 용이하여 많이 사용되나 낮은 정합률로 인해 정확한 깊이 영상을 얻기 힘들기 때문에 많은 응용 분야에 사용하기에 제한이 있다. 본 논문에서 제안한 스테레오 시스템은 픽셀의 변화도(gradient)를 기반으로 한 적응적인 가중치 알고리즘을 이용하여 높은 정합 성능을 보이며 하드웨어로 설계하였을 때 실시간처리가 가능하다. 일반적으로 적응적인 가중치 윈도우를 적용할 경우 중간 결과를 재사용하기 불가능하지만 행, 열을 분리하여 처리함으로써 데이터를 재사용할 수 있고 따라서 처리성능이 개선되었다. 알고리즘에 필요한 지수 및 아크탄젠트 함수를 구현하기 위해 선형(PWL, piecewise linear) 및 계단(step) 함수 등으로 근사화한 뒤 에러를 분석하여 최선의 파라미터를 선택하였다. 제안한 구조는 실시간처리를 위하여 9개의 프로세서를 사용하여 병렬처리를 하였으며, 동부하이텍 0.18um 라이브러리로 합성하였을 경우 최대 동작주파수 350MHz(33 fps)와 424K 게이트의 하드웨어 복잡도를 나타내었다.

1인승 전기차량의 임베디드 전동제어장치 설계 (Design of Embedded Electrical Power Control Unit for Personal Electrical Vehicle)

  • 신규재;차현록
    • 전기전자학회논문지
    • /
    • 제18권2호
    • /
    • pp.282-290
    • /
    • 2014
  • 본 논문은 1인승 전기차량의 임베디드 전동 제어장치 설계를 제안하였다. 제안된 임베디드 장치는 PIC18F8720 프로세서, 16Mb flash ROM, 32Mb SDRAM과 신호처리회로로 설계되었다. 제안된 1인승 전기차량은 4KW 인휠 BLDCM, $180^{\circ}$ 도통 공간 벡터제어 3상 전압형 인버터, PID 속도제어기와 전동제어 장치와 임베디드 제어장치로 구성된다. 이 1인승 전기차량은 역 3륜 형태의 기계적인 구조를 가지고 있으며, 인휠 BLDCM과 틸팅 기능을 가지는 조향 메카니즘이 적용되었다. 또한 제안된 임베디드 전동제어장치의 성능은 PEV에 대한 Lab 실험과 도로 주행시험을 통하여 검증하였다.

GPRS 망에서 GGSN 노드의 패킷 처리 향상을 위한 성능 모델 및 분석 (Performance Model and Analysis for Improving Efficient Packet Service of GGSN in CPRS Network)

  • 곽용원;민재홍;정영식;박웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.826-834
    • /
    • 2002
  • 비동기식 제 3세대 이동통신 시스템인 GPRS망은 기존의 제 2세대 통신인 GSM 방식에 GGSN과 SGSN 노드를 추가함으로써 패킷 교환 방식을 가능하게 하였다. 따라서 GPRS망과 인터넷 망을 연결시켜주는 관문(Gateway) 역할을 수행하는 GGSN 노드의 성능과 용량을 최적화 시키기 위한 패킷 트래픽 처리 방안에 대한 연구가 필요하다. 이를 위해 본 연구에서는 외부 인터넷 망으로부터 GGSN 노드에 도착되는 인터넷 패킷 트래픽의 모델을 정립하고, 이를 효율적으로 처리하기 위한 GGSN노드의 프로토콜 구조를 분석하여 처리 프로세서들의 트래픽 처리 능력을 분석하기 위한 성능모델을 만든다. 제안된 성능 모델의 시뮬레이션을 통해서 다양한 트래픽 부하 상태에서 처리 능력에 대해 분석한다. 입력 트래픽인 Speech, Video, WWW, E-mail에 대해 실시간 트래픽인 Speech와 Video의 QoS 요구사항을 만족시키기 위해 여러 스케줄링 알고리즘을 적용하여 각각의 기법에 대한 성능을 분석하였다.

  • PDF