• 제목/요약/키워드: 메모리 접근 오류

검색결과 16건 처리시간 0.022초

병렬 프로그램의 동적 분석을 위한 효율적인 감시 필터링 기술 (An Efficient Filtered Monitoring Technique for Dynamic Analysis of Parallel Programs)

  • 박세원;하옥균
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제53차 동계학술대회논문집 24권1호
    • /
    • pp.9-10
    • /
    • 2016
  • 본 논문에서는 멀티 스레드 기반 병렬 프로그램의 동적 분석을 통한 자료경합 탐지를 위해 효율적인 감시 필터링 기술을 제시한다. 제시하는 감시 필터링 기술은 자료경합과 같은 동시성 오류를 탐지하기 위해 프로그램의 수행 중에 발생하는 공유 메모리에 대한 스레드들의 접근 분석 시에 동일한 코드영역을 단순 반복하는 스레드들을 감시대상에서 제외시킴으로써 동적 분석을 위한 추가적인 오버헤드를 최소화한다. 제시하는 필터링 기술을 수행 중 자료경합 탐지 도구에 적용한 실험적 평가를 통해 개선된 수행시간 오버헤드의 제공이 가능함을 보인다.

  • PDF

A Tool for On-the-fly Repairing of Atomicity Violation in GPU Program Execution

  • Lee, Keonpyo;Lee, Seongjin;Jun, Yong-Kee
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권9호
    • /
    • pp.1-12
    • /
    • 2021
  • 본 논문은 GPU 프로그램의 메모리의 상태 및 접근사건과 배리어 위치 정보를 감시하고, 실제 메모리 쓰기를 배리어 영역 종료 직전에 발생시키거나 배리어 영역을 재수행시켜 원자성 위배를 수행 중에 수리하는 도구인 ARCAV (Atomatic Recovery of CUDA Atomicity violation)를 제시한다. 기존의 연구들은 Lock과 Sleep 명령어를 사용하여 원자성 위배를 진단 및 수리하도록 구현되었기 때문에 지원되는 명령어와 동기화 기법이 CPU (Central Processing Unit) 프로그램과 다른 GPU (Graphics Processing Unit) 프로그램에는 적용될 수 없었고, GPU 프로그램에서는 원자성 위배의 탐지에 대한 연구만 수행되었다. 제안하는 ARCAV는 GPU 프로그램의 실행모델에서 수행될 수 있도록 설계되어 스레드 구성과 메모리 계층에 무관하게 실세계에서 발생한 원자성 위배를 대표하는 네 가지 패턴의 원자성 위배를 실시간으로 탐지하고 수리할 수 있다. 실험 결과 동시에 실행되는 스레드 개수와 구성에 무관하게 일정한 오버헤드를 보였다. 원자성 위배를 프로그램 수행 중에 실시간으로 탐지하고 수리하기 위해 소요되는 오버헤드는 네 개의 실세계 GPU 커널에서 실험되었고, 원본 프로그램 대비 평균 2.1배의 수행시간으로 동작하였다.

AR/VR 마이크로 디스플레이 환경을 고려한 JPEG-LS 플랫폼 개발 (A Development of JPEG-LS Platform for Mirco Display Environment in AR/VR Device.)

  • 박현문;장영종;김병수;황태호
    • 한국전자통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.417-424
    • /
    • 2019
  • AR/VR 디바이스에서 무손실 이미지 압축을 위한 JPEG-LS(: LosSless) 코덱에서 SBT 기반 프레임 압축기술로 메모리와 지연을 줄이는 설계를 제안하였다. 제안된 JPEG 무손실 코덱은 주로 콘텍스트 모형화 및 업데이트, 픽셀과 오류 예측 그리고 메모리 블록으로 구성된다. 모든 블록은 실시간 영상처리를 위해 파이프라인 구조를 가지며, LOCO-I 압축 알고리즘에 SBT 코딩기반의 개선된 2차원 접근방식을 사용한다. 제시한 STB-FLC기법을 통해 Block-RAM 사이즈를 기존 유사연구보다 1/3로 줄이고 예측(prediction) 블록의 병렬 설계는 처리속도에 향상을 가져올 수 있었다.

Bigdata 분석과 인공지능 적용한 GIS 최적화 연구 (GIS Optimization for Bigdata Analysis and AI Applying)

  • 곽은영;박대우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.171-173
    • /
    • 2022
  • 4차 산업혁명 기술은 국민들의 생활을 효율적인 방향으로 발전시키고 있다. 인터넷 상에서 제공되는 GIS는 국민이 원하는 목적지에 빠르게 도달할 수 있도록 교통안내, 시간안내 등의 서비스를 제공한다. 국토지리정보원과 지방자치단체들은 생활 SOC 접근성을 조사하여 최적지점 분석에 활용하기 위한 기초 자료를 제작하고 있으며, 본 연구는 최단거리 구성을 위하여 출발점에서 도착점까지의 접근성을 분석하였다. Dijkstra알고리즘을 활용하여 도로망도와 출발지점, 도착점을 통해 최단거리를 계산하고 이를 활용하여 최적의 접근성을 계산하였다. 연구 결과 다수의 도착점에 대한 분석을 수행한 경우 약 0.1% 이상의 오류가 나타났으며, 최적지점을 위한 위치 분석을 위하여 3번 이상의 분석이 필요하였다. 다대다(M × N) 계산을 처리할 경우 더 많은 시간이 소요되었으며, 본 분석을 위해 32G이상의 메모리 사양이 요구되었다. 범용적인 최적 접근성 분석 서비스의 제공은 기업의 창업 및 생활 시설의 위치 선정에 효과적으로 이용될 수 있으며, 국민 누구나 시설 및 주거지 선정 시 서비스를 활용할 수 있다. 본 연구를 기반으로 효율적이고 편한 푸시 서비스를 국민과 정부기관에 제공한다면 국가와 사회의 발전에 이바지 될 것이다.

  • PDF

중학교 정보 교과서에 제시된 중앙처리장치 내용 문제점 분석 및 개선 방안 (Problem Analysis and Recommendations of CPU Contents in Korean Middle School Informatics Textbooks)

  • 이상욱;서태원
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제2권4호
    • /
    • pp.143-150
    • /
    • 2013
  • 2007년 개정 교육과정에서 컴퓨터 교육은 컴퓨터 과학의 원리와 개념을 배울 수 있는 내용을 강화하였다. 따라서 정보 교과서는 빠르게 발전하고 있는 컴퓨터 과학의 최신 흐름을 정확하고 일관되게 반영할 필요가 있다. 하지만 현재 중학교 정보 교과서에 제시된 중앙 처리 장치의 구성 요소에 대한 내용은 교과서마다 차이를 보여 정확성과 일관성이 결여되어 있다. 본 연구는 컴퓨터 구조 및 동작의 역사적, 기술적 접근을 통해 교과서 내용의 오류를 파악하고 개선 방안을 제시하였다. 연구 결과, 현재 컴퓨터 시스템의 중앙처리장치는 데이터패스와 제어 장치로 구성되었다고 기술하는 것이 바람직하다. 데이터패스는 명령어의 수행에 따라 데이터의 연산 또는 데이터를 일시적으로 저장하는 기능을 수행하며 메모리, 레지스터, 연산 장치, 가산기 등으로 구성된다. 제어 장치는 명령어의 수행에 따라 데이터패스, 주기억 장치, 입출력 장치 등의 동작유형을 결정한다. 하지만 어려운 전문 용어의 사용이 인지 발달 수준이 낮은 학습자의 학습을 저해할 수 있기 때문에 본 연구에서는 데이터패스와 제어 장치 대신 '연산부'와 '제어부'라는 표현을 사용할 것을 제안한다.

표본적응 프러덕트 양자기의 전송로 잡음에서의 성능 분석에 관한 연구 (On the Performance of Sample-Adaptive Product Quantizer for Noisy Channels)

  • 김동식
    • 대한전자공학회논문지SP
    • /
    • 제42권3호
    • /
    • pp.81-90
    • /
    • 2005
  • 어떠한 신호를 벡터 양자기(vector quantizer: VQ)로 양자화하고, 양자화된 신호, 즉 양자기 출력 인덱스를 잡음이 있는 전송로로 전송하려고 할 때, 전체적인 부호화 시스템의 성능은 사용된 양자화 기법과 전송로 오류에 대한 영향에 의해 좌우된다. 최적의 부호화 시스템 설계를 위해서는 전송로 최적 VQ 같이 소스와 전송로 부호화를 통합하여 최적화시켜야 한다. 설계를 위한 계산량을 줄이는 방법으로 부최적인 접근 방법으로 강인한 VQ (robust VQ: RVQ)가 있다. 양자기는 잡음이 없는 전송로에 최적으로 설계를 하고 양자화 출력인 인덱스 열을 전송로 심볼로 할당 시에, 전체 왜곡이 전송로 잡음에 보다 강인하게 되도록 인덱스 할당 함수를 설계하는 양자기가 RVQ이다. 그런데 최적의 인덱스 할당 함수의 설계도 계산량이 많이 요구된다. 최근에 VQ의 계산량을 줄일 수 있는 표본적응 프러덕트 양자기(sample-adaptive product quantizer: SAPQ)가 제안되었다. SAPQ는 벡터의 차수를 줄이는 프러덕트 양자기(product quantizer: PQ)와 유사한 구조를 가지지만 일반 PQ보다 더 좋은 성능을 가지면서 full-search VQ보다 부호화 복잡도가 낮고 부호책을 위한 메모리의 크기도 작은 일종의 구조적 제한을 가지는 VQ이다. 본 논문에서는 이러한 SAPQ를 사용하여 벡터의 차수를 줄임으로 전송로 오류에 강인한 RVQ 설계가 가능함을 SAPQ의 구조적 고찰과 모의실험을 통해서 살펴보았다.