• 제목/요약/키워드: 슈퍼 트레이스

검색결과 6건 처리시간 0.019초

슈퍼스칼라 프로세서에서 값 예측기의 성능평가 (A Performance Evaluation of Value Predictors in a Superscalar Processor)

  • 전병찬;박희룡;이상정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.10-12
    • /
    • 2001
  • 와이드 이슈 슈퍼스칼라 프로세서에서 값 예측기는 한 명령어의 결과를 미리 예측하여 명령들 간의 데이터 종속관계를 극복하고 실행함으로써 명령어 수준 병렬성(Instruction Level Parallesim ILP)을 향상시키는 기법이다. 본 논문에서는 명령어 수준 병렬성을 이용하여 성능을 향상시키기 위하여 데이터 값을 미리 예측하여 병렬로 이슈하고 수행하는 값 예측기의 성능을 비교분석 한다. 먼저 값 예측기 종류별로 성능을 측정한다 그리고 테이블의 갱신시점, 트레이스 캐시 유무 및 명령윈도우 크기에 따른 값 예측기의 성능영향을 평가분석 한다. 성능분석 결과 최근 값 예측기가 간소한 하드웨어 구성에도 불구하고 우수한 성능을 보였다. 그리고 예측테이블 갱신시점과 트레이스캐시의 사용이 값 예측기의 성능향상에 영향을 주었다.

  • PDF

슈퍼스칼라 프로세서의 자원 활용도 분석 (Resource Usage Analysis of Superscalar Processor)

  • 김지선;전중남;김석일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.691-693
    • /
    • 2002
  • 슈퍼스칼라 프로세서 구조에서 명령어 실행을 수행하는 데 사용되는 자원은 그 양에 비해 실제로 활용된 자원의 양은 적다. 본 논문에서는 낮은 자원활용도를 보이는 자원을 활용하는 방안으로 슈퍼스칼라 프로세서를 멀티쓰레드 프로세서로 확장하는데 필요한 기본 데이터를 얻기 위해서 실제로 활용되는 자원의 양을 측정하여 어느 정도의 자원을 활용할 수 있는 지와 자원이 충분히 활용되지 못하는 원인을 분석하였다. 실험을 위해 RA(Resource Analyzer)를 구현하여 SimpleScalar 시뮬레이터에서 제공되는 명령어 파이프라인 트레이스 파일을 분석하여 각 파이프라인 단계에서 처리되는 자원의 활용도를 실험하였다. 자원 활용도가 낮은 원인을 분석하기 위해 프로그램 내에 존재하는 데이터 의존성과 여러 가지 미스 요인들의 비율을 실험을 통해 알아본 결과 IPC(Instruction Per Cycle)는 평균 0.6으로 나타났으며, EX단계의 평균 활용 빈도는 22.9%로 낮아 멀티쓰레드 처리의 필요성이 있음을 확인할 수 있었다.

  • PDF

슈퍼스칼라 프로세서에서 명령 윈도우 크기에 따른 혼합형 값 예측기 (Hybrid Value Predictor in Wide-Issue Superscalar Processor)

  • 전병찬;최규석
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권2호
    • /
    • pp.97-103
    • /
    • 2009
  • 본 논문에서는 슈퍼스칼라에서 윈도우 크기에 따른 명령 페치율에 따라 혼합형 값 예측기의 성능을 평가한다. 일반적으로, 명령의 데이터 의존성은 명령의 페치수에 따라 증가된다. 그러므로, 명령 페치율이 증가할 때 값 예측기의 성능이 높다고 본다. 이러한 성능은 명령 페치 메카니즘인 컬랩싱 버퍼와 트레이스 캐쉬로 연구한다. 실험결과는 명령 윈도우 크기에 따른 명령 페치율 증가와 혼합형에서 non-tc 와 tc을 적용한 IPC와 예측률의 값 예측기의 성능 효과를 평가한다.

  • PDF

반복적 대화식 통합 탄성파 속도분석 (An Iterative, Interactive and Unified Seismic Velocity Analysis)

  • 서상용;정부흥;장성형
    • 지구물리와물리탐사
    • /
    • 제2권1호
    • /
    • pp.26-32
    • /
    • 1999
  • 탄성파 속도분석법은 일괄식 속도분석법과 대화식 속도 분석등 두 가지가 있다. 일괄식 속도분석법에서는 각 속도 분석점마다 셈블런스 컨투어, 슈퍼게더 및 중합 패널등을 일괄 작성하여 도면화 시킨 후 분석자가 그 도면을 보고 속도 함수를 결정하는 방법이다. 과거 유행한 전산처리 소프트웨어들이 이 방법을 사용하고 있다. 그러나 이 방법은 도면 분석시 아주 많은 수작업이 필요하고 속도분석 결과도 정밀치 못하다는 단점이 있다. 최근에는 워크스테이션의 고속 그래픽 기능을 이용한 대화식 속도분석 기술이 개발되었다. 그런데 이들 프로그램은 기존 일괄식 속도분석법과 대동소이한 내용을 그래픽 화면으로 처리할 수 있도록 함으로써 종이 절약 외에는 특별히 나아진 것이 없다. 프로그램의 주 기능은 속도 스펙트럼에서 속도점 노드를 선택하는 것이며, 입력자료에 있을 수 있는 잡음을 제거하여 다시 속도 스펙트럼을 수정하는 기능은 없다. 잡음의 제거없이 계산한 부정확한 속도 스펙트럼을 이용해서 속도 함수를 선정한다면 정밀 속도분석은 불가능할 것이다. 방대한 탄성파 탐사자료에 대한 속도분석을 신속 정확하게 수행하기 위해서는 속도 분석과 밀접한 관련이 있는 전산처리 공정들 즉, 슈퍼게더 조립, 셈블런스 계산, 동보정, 뮤트, 중합등을 동시에 지원하는 통합된 반복적 대화식 속도분석 프로그램이 필요하다. 분석 구간의 속도와 뮤트함수를 변화시켰을 때 그로부터 얻어지는 셈블런스와 동보정 및 중합을 검토하고 이러한 수정과 검토를 신속히 반복할 수 있도록 함으로써 정확한 속도분석이 가능하기 때문이다. 여기에서는 속도분석을 신속 정확하게 수행하기 위해 속도 분석과 밀접한 관련이 있는 전산처리 공정들 즉, 슈퍼게더 조립, 셈블런스 계산, 동보정, 뮤트, 중합등을 동시에 지원하는 대화식 속도분석 프로그램 xva를 작성하였다. 대화식 속도분석에서는 분석 구간의 트레이스들을 고속으로 참조해야 하는데 이를 위해 간단한 트레이스 인덱스 파일을 설계하여 사용하였다. 직접파와 굴절파등 천부 잡음을 제거하기 위한 효과적인 수단인 뮤트 함수 영역 변환법을 새로 고안하였으며, 본 프로그램은 이 기법을 이용하고 있다. 본 영 역 변환법은 기존 알려진 역동보정법과 같이 정밀 전산처리가 가능할 뿐만 아니라 동보정과 역동보정시 발생하는 자료의 내삽 오차가 없으며 계산 시간이 크게 단축되기 때문에 정밀 대화식 속도 분석에 사용 가능하다. 프로그램 xva는 28개의 소스 파일로 구성된 패키지인데 줄 수는 12,029, 단어 수는 34,990, 글자 수는 304,073이다. 프로그램 xva는 X-Window와 Motif 환경하에서 작동한다. 프로그램 메뉴는 Motif 표준 스타일에 따라 작성하였는 바 그 사용법을 간략히 기술하였다. 본 프로그램이 완성됨으로 인하여 정밀 탄성파 속도 분석이 가능하게 되었고 그 결과 가스층의 존재 여부를 직접 확인할 수 있는 AVO(Amplitude Versus Offset)단면도등의 제작에 활용할 수 있었다.

  • PDF

압축블록의 압축률 분포를 고려해 설계한 내장캐시 및 주 메모리 압축시스템 (An On-chip Cache and Main Memory Compression System Optimized by Considering the Compression rate Distribution of Compressed Blocks)

  • 임근수;이장수;홍인표;김지홍;김신덕;이용석;고건
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권1_2호
    • /
    • pp.125-134
    • /
    • 2004
  • 최근에 프로세서-메모리간 성능격차 문제를 완화하기 위하여 내장캐시의 접근실패율을 낮추고 메모리 대역폭을 확장하는 내장캐시 압축시스템이 제안되었다. 내장캐시 압축시스템은 데이타를 압축해 저장함으로써 내장캐시의 실질적 저장공간을 확장하고, 메모리 버스에서 데이타를 압축해 전송함으로써 실질적 메모리 대역폭을 확장한다. 본 논문에서는 이와 같은 내장캐시 압축시스템을 확장해 기존의 주 메모리 압축시스템과 병합해 설계한 이종 메모리 압축시스템을 제안한다. 주 메모리의 기억공간을 효율적으로 확장하고, 내장캐시의 접근실패율을 낮추고, 메모리 대역폭을 확장하고, 압축캐시의 복원시간을 줄이고, 설계 복잡도를 낮추기 위하여 몇 가지 새로운 기법들을 제시한다. 제안하는 시스템과 비교대상 시스템의 성능은 슈퍼스칼라 구조의 마이크로프로세서 시뮬레이터를 수정하여 실행기반 시뮬레이션을 통해 검증한다. 본 논문에서 사용한 실험방법은 기존의 트레이스기반 시뮬레이션과 비교해 보다 높은 정확도를 갖는다. 실험결과 주 메모리 확장에 따른 이득을 고려하지 않은 경우에 제안하는 시스템은 일반 메모리시스템에 비하여 수행시간을 내장캐시의 크기에 따라 최대 4-23%가량 단축한다. 제안하는 시스템의 데이타 메모리와 코드 메모리의 확장비율은 각각 57-120%와 27-36%이다.

육상 탄성파자료에 대한 나머지 정적보정의 효과: 주행시간 분해기법과 겹쌓기제곱 최대화기법 (Application of Residual Statics to Land Seismic Data: traveltime decomposition vs stack-power maximization)

  • 사진현;우주환;이철우;김지수
    • 지구물리와물리탐사
    • /
    • 제19권1호
    • /
    • pp.11-19
    • /
    • 2016
  • 나머지 정적보정 기법중에서 가장 많이 쓰이는 주행시간 분해기법과 겹쌓기제곱 최대화기법의 적용성을 육상 탄성파자료에서 비교 검토하였다. 모든 발파점과 수신점에 대한 임의의 나머지 정적보정값(시간차이)과 무작위 잡음이 포함된 모델자료에서 겹쌓기제곱 최대화기법은 주행시간 분해기법에 비해 흐트러진 반사 이벤트를 정확히 정렬시키고 보정과정에서 출력된 발파점과 수신점의 정적보정 그래프가 입력된 값과 거의 같은 진폭으로 역전된다는 점에서 신호대잡음이 작은 자료의 반사면 향상에 보다 효과적이었다. 나머지 정적보정에 적합한 입력인자(최대허용 시간차이, 상관창, 반복횟수)들은 공통중간점 자료외에 공통발파점 겹쌓기자료와 공통수신점 겹쌓기자료에 대한 연속 테스트를 거쳐 효과적으로 진단할 수 있었다. 나머지 정적보정에 앞서 송수신점의 높이보정 및 풍화대 깊이보정을 실시하여 장파장 시간차이를 제거하고 진동수-파수 필터링, 예측곱풀기, 시간변화 빛띠흰색화로 잡음을 줄여 교차상관의 오차를 최소화시킨다. 또한 나머지 정적보정후 수직시간차 역보정을 거쳐 속도를 재분석하여 겹쌓기한 결과 저류층을 포함한 반사면들의 향상된 연속성 및 분해능을 확인할 수 있었다.