• 제목/요약/키워드: 하드웨어의성능

검색결과 1,049건 처리시간 0.026초

가변적 하드웨어 구성에 대한 수퍼스칼라 프로세서의 성능 예측 모델 (An Analytical Performance Model for Supercalar Processors)

  • 이종복
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.24-26
    • /
    • 1999
  • 본 논문에서는 주어진 윈도우에 대하여 수퍼스칼라 프로세서의 하드웨어를 구성하는 기본 요소인 인출율과 연산 유닛의 개수로 표현되는 성능 예측 모델을 제시하였다. 이때, 수퍼스칼라 프로세서에서 실행되는 벤치마크 프로그램은 매 싸이클당 각 명령어 개수가 시행되는 확률과 분기 예측 정확도에 의하여 특성화된다. 초기의 실험으로 각종 파라미터를 획득한 후에는 다양한 연산유닛과 인출율을 갖는 수퍼스칼라 프로세서의 성능을 본 논문에서 제안하는 모델에 의하여 간단하게 구할 수 있다. 명령어 자취 모의실험(trace-driven simulation)으로 측정한 성능과 본 논문에서 제안하는 성능 예측 모델에 의한 성능을 비교한 결과, 3.8%의 평균오차를 기록하였다.

  • PDF

모바일 장치에서의 이미지 브라우징을 위한 동작 추적 기반 인터페이스의 설계 및 평가 (Design and Evaluation of Motion-based Interface for Image Browsing in Mobile Devices)

  • 임성훈;최승문
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.40-44
    • /
    • 2009
  • 이 논문에서, 모바일 장치에서의 이미지 브라우징을 위한 모션 기반 상호 작용 방식의 가능성을 평가하였다. 이를 위해 모션을 기반으로 한 인터페이스와 상호작용 방법을 디자인 하였다. 디자인된 인터페이스를 평가하기 위해 이를 현재 모바일 장치에서 사용 가능한, 가속도계와 비전을 이용한 하드웨어와 고성능의 트랙커를 이용한 하드웨어로 구현하여 버튼 인터페이스와 비교 실험을 하였다. 그 결과 모션 인터페이스들의 경우 버튼 인터페이스에 비해, 사용자의 흥미를 유발할 수 있었고, 충분한 훈련을 거치면 사용성 및 사용자 성능의 증대 효과도 컸지만 버튼 인터페이스의 성능에는 미치지 못하였다.

  • PDF

유전자 알고리즘의 퍼지 결정 함수를 이용한 FGNN 구현 (Hardware Implementation of FGNN using Fuzzy Decision Function of the Genetic Algorithm)

  • 변오성;문성룡
    • 한국지능시스템학회논문지
    • /
    • 제10권6호
    • /
    • pp.575-583
    • /
    • 2000
  • 본 논문에서 임의의 데이터가 입력되면 기준 영상 중에서 가장 유사도가 큰 영상을 찾아 국부 승리자로 선택하고, 그 국부 승리자 중에서 전체 승리자를 선택하여 최종 출력값을 얻는 계층적 FGNN(Fuzzy Genetic Neural Network)을 제안하고, 이에 하이브리드 퍼지 소속함수와 유전자 알고리즘을 적용하였다. 하이브리드 퍼지 소속함수는 입력 값을 0~1 사이의 값으로 함으로써 시스템의 속도를 빠르게 하고 유전자 알고리즘을 입력값을 일정한 오차 이내로 하여 최적의 영상을 얻도록 하였다. 위의 계층적 FGNN 알고리즘을 회로 설계 및 검증하였다. 또한 제안한 FGNN을 이용하여 영상에 포함된 잡음을 제거하고, 이와 유사한 구조를 가진 FDNN(Fuzzy Decision Neural Network) 성능보다 FGNN의 성능이 우수함을 여러 가지 영상을 통하여 확인하였다. 또한 모의 실험 결과 영상에 대한 평균자승오차(MSE : Mean Square Error)를 비교하였으며, 그 결과 하이브리드 퍼지 함수와 유전자 알고리즘을 적용한 FGNN이 메디안 필터, OC, CO, FDNN 등에 비해 우수함을 확인하였다. FGNN 알고리즘을 Top-Down 방식으로 VHDL(VHSIC Hardware description Language)을 이용하여 코딩(Coding)하고, Synopsys 툴을 이용하여 하드웨어를 설계하였다. 이 알고리즘의 하드웨어는 총 5개의 블록으로 가지고 있고 각각의 블록은 파이프라인 형태로 구성하고, 이는 Synopsys 툴을 이용하여 동작 및 성능을 검증하였다.

  • PDF

Video SoC를 위한 고성능 ME/MC IP의 설계 (Design of High-Performance ME/MC IP for Video SoC)

  • 서영호;최현준;김동욱
    • 한국정보통신학회논문지
    • /
    • 제12권9호
    • /
    • pp.1605-1614
    • /
    • 2008
  • 본 논문은 비디오 압축을 고성능으로 수행하기 위한 움직임 예측(motion estimation, ME) 및 보상(compensation, MC) 알고리즘의 VLSI 구조를 제안하고 하드웨어로 구현하였다. 움직임 예측을 계산하기 위해서는 일반적으로 SAD 결과를 이용하게 되는데 이를 위하여 새로운 연산방법을 제안하였다. 제안한 SAD 연산방법으로 인해 연산의 효율성이 증대되고 메모리의 사용을 줄임으로써 ME/MC의 성능을 높였다. 제안한 ME/MC 하드웨어는 TSMC 90nm HVT CMOS 공정으로 구현하였다. 구현된 하드웨어는 약 33만 게이트를 점유하였고, 143MHz의 클록 주파수에서 안정적으로 동작하였다.

하드웨어 소프트웨어 통합 설계에 의한 H.263 동영상 코덱 구현 (An Efficient Hardware-Software Co-Implementation of an H.263 Video Codec)

  • 장성규;김성득;이재헌;정의철;최건영;김종대;나종범
    • 한국통신학회논문지
    • /
    • 제25권4B호
    • /
    • pp.771-782
    • /
    • 2000
  • 이 논문에서는 하드웨어와 소프트웨어의 통합 설계에 의한 H.263 동영상 코덱을 구현한다. 동영상의 부호화와 복호화를 실시간으로 수행하기 위해 동작 속도 및 응용성을 동시에 고려하여 H.263 코덱의 각 부분 중 어느 부분이 하드웨어 또는 소프트웨어로 구현된는 것이 바람직한지 결정하였다. 하드웨어로 구현하는 부분은 움직임 추정부 및 보상부와 메모리 제어부이고, 나머지 부분은 RISC (reduced instruction set computer) 프로세서를 사용하여 소프트웨어로 처리한다. 이 논문에서는 하드웨어 및 소프트웨어 모듈의 효과적인 구현 방법을 소개한다. 특히 하드웨어로 구현되는 움직임 추정부를 위해서 주변 움직임 변위의 상관성 및 계층적 탐색을 이용한 다수의 움직임 후보를 가지고 알고리즘을 사용하였으며, 이 알고리즘에 기반한 소면적 구조를 제안한다. 소프트웨어로 처리되는 DCT (discrete cosine transform) 부분의 최적화를 위해서 움직임 추정부에서 얻어진 SAD (sum of absolute difference) 값에 근거하여 DCT 이후 양자화된 계수들의 통계적 특성을 분류하는 기법을 사용한다. 제안된 방법을 실제 RISC 프로세서와 gate array를 이용하여 구\ulcorner하고, 그 성능이 우수함을 확인하였다.

  • PDF

가상 테스트를 위한 프레임워크 (A framework for virtual testing)

  • 박창우;최경희;정기현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.351-353
    • /
    • 2007
  • 기존의 방법으로 소프트웨어를 개발하는 것은 매우 비생산적이다. 소프트웨어의 기능과 성능에 상관없이 PC 에서 시뮬레이션을 통해서 개발할 수 있다면 하드웨어를 구현해야 하는 조건이 없어지기 때문에 시간과 비용이 절감되고 제품의 질도 향상될 것이다. 이 논문에서는 PC 에서 시스템 모델을 실행시켜 소프트웨어를 개발하고 테스트할 수 있는 프레임워크를 제안하고 실제로 비데를 테스트하는데 적용시켰다.

기하 인스턴싱 기법을 이용한 단백질 구조 가시화 및 속도 향상에 관한 연구 (The Study of Protein Structure Visualization and Rendering Speed Using the Geometry Instancing)

  • 박찬용;황치정
    • 정보처리학회논문지A
    • /
    • 제16A권3호
    • /
    • pp.153-158
    • /
    • 2009
  • 구조적 생물 정보학 분야는 단백질의 3차원 구조를 대상으로 단백질을 연구하는 분야이며, 구조적생물 정보학의 중요한 분야 중의 하나는 단백질 3차원 구조 가시화이다. 단백질의 3차원 구조를 규명하는 장비의 발달로, 규명되는 단백질의 크기와 개수가 증가함에 따라, 고성능의 단백질 가시화 시스템의 필요성도 크게 증가하였으나, 기존의 단백질 구조 가시화 시스템은 3차원 그래픽 하드웨어에 최적화 되지 못하여, 거대 단백질의 가시화에 충분한 성능을 가지지 못하였다. 본 논문에서 제안하는 단백질 3차원 구조 가시화 시스템은 거대 단백질의 가시화 하기 위하여, 3차원 그래픽 하드웨어의 최적화 기법중의 하나인 기하 인스턴싱 기법을 사용하여 빠르게 거대 단백질을 렌더링 한다. 성능 실험에서 7종의 다른 크기의 단백질을 대상으로, 4가지 가시화 방법에 대하여, 제안하는 시스템과 기존의 시스템과의 단백질 렌더링 성능 비교 실험을 하여, 대부분의 경우 우수한 성능을 보였다.

OpenCL을 이용한 이미지 처리 프로그램의 자동 최적화 방법 (Automatic Optimization Methods for Image Processing Programs Using OpenCL)

  • 신재호;조강원;이일구;이재진
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권3호
    • /
    • pp.188-193
    • /
    • 2017
  • 영상 장비가 발전하고 고화질 이미지의 사용량이 많아짐에 따라 이를 병렬화하여 빠르게 처리하는 방법이 많이 연구되고 있다. 본 논문은 OpenCL을 사용한 이미지 처리 프로그램이 하드웨어에 관계없이 최적의 성능을 내도록 하는 방법을 제시한다. OpenCL은 계산 디바이스의 아키텍처에 따라 적절한 병렬화 방법과 워크그룹 크기를 개발자가 실험을 통해 찾아야 한다. 하지만 이는 시간적, 자원적 한계가 있다. 본 논문에서는 대상 하드웨어에 최적화된 병렬화 방법과 워크그룹 크기를 프로파일링을 통해 자동으로 선택하는 방법을 제안한다. 또한 OpenCL을 사용한 이미지 처리는 입력 이미지의 크기에 따라 순차코드 보다 성능이 좋을 수도 있고 안좋을 수도 있다. 본 논문에서는 OpenCL코드의 성능이 순차코드 성능보다 좋아지는 시점의 이미지 크기를 자동으로 검색하여 OpenCL을 사용할지 기존의 순차코드를 사용할지 결정하는 이미지 크기 threshold를 설정하는 방법을 제시한다. 이를 통해 이미지 처리 프로그램이 임의의 하드웨어에서 이미지 크기에 상관없이 항상 최적의 성능을 보이는 것을 확인했다.

스케일러 하드웨어 설계를 위한 조합 보간 알고리즘의 연구 (A Study of the Combinatorial Interpolation Algorithm for Scaler Hardware Design)

  • 한시연;강봉순
    • 전기전자학회논문지
    • /
    • 제27권3호
    • /
    • pp.296-302
    • /
    • 2023
  • 멀티미디어 산업이 발전함에 따라 다양한 형식의 해상도를 표시할 수 있게 되었다. 따라서 고화질을 유지하며 해상도를 변환하는 스케일러 알고리즘의 성능과 이를 하드웨어로 구현하는 것은 중요하다고 할 수 있다. 본 논문에서는 이미지 확대/축소 스케일러의 하드웨어 설계를 고려하여 수직 방향으로는 수정된 양 선형 보간, 수평 방향으로는 양 3차 회선 보간을 사용하여 라인 메모리 부담을 줄인 조합 스케일러 알고리즘을 제안한다. 본 논문은 정량적 그리고 정성적 평가를 통해 제안하는 알고리즘의 성능을 널리 사용되는 다른 세 가지 알고리즘과 비교 평가하였고, 이를 하드웨어로 구현할 때에 필요한 하드웨어 부담을 비교하였다. 본 논문은 성능평가를 위해 정현파 신호와 8개의 일반 이미지를 사용하였다.

LAN환경에서 유휴시간 예약에 기반한 PC Cluster의 설계 (Design of an Idle Time Reservation based PC Cluster on LAN Environment)

  • 김영균;오길호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (3)
    • /
    • pp.346-348
    • /
    • 2003
  • 본 논문에서는 TCP/IP프로토콜을 사용하는 LAN환경에서 PC들을 사용한 PC클러스터에 관해 연구하였다. LAN환경의 PC들은 안정된 사용환경을 확보할 수 있고, 특정한 사용 시간에 따라 작업을 배치할 수 있는 특징을 갖는다. 또한 별도의 전용의 클러스터를 설치하기 위한 하드웨어가 필요로 하지 않는 장점도 갖는다. 특히 PC실험 실습실의 PC들은 주로 주간 시간대(오전9시~오후6시)에만 실험실습 수업에 사용이 되고, 야간 시간대(오후6시~익일 오전9시)에는 사용되지 않는 유휴 시간을 갖는다. 이러한 사용되지 않는 유휴 시간대의 PC들을 CPU지향적인 복잡한 작업들을 연산하기 위해 사용할 수 있으며, 별도의 클러스터 시스템을 구성하기 위한 하드웨어(클러스터를 위한 컴퓨터들, 스위치장비, 케이블링 등)를 구입할 필요가 없기 때문에 저가격의 고성능을 요구하는 PC클러스터를 쉽게 구성할 수 있다. 공동실험실습실의 PC들마다 유휴기간을 Time table에 예약하고 이에 따라 작업을 배치하고 연산결과를 수집한다. 장기간의 연산작업이 필요로 하는 대규모 연산에 사용함으로써 상당한 경제적 효과를 얻을 수 있다. 또한 동일 실습실의 PC들은 대개 동일한 성능의 동일한 하드웨어와 운영체제를 사용하는 PC들로 구성되기 때문에 Homogeneous node로 구성된 PC 클러스터를 구축하기가 용이하다.

  • PDF