• 제목/요약/키워드: Spatial Locality

검색결과 111건 처리시간 0.032초

멀티미디어 내장형 시스템을 위한 저전력 데이터 캐쉬 설계 (An Area Efficient Low Power Data Cache for Multimedia Embedded Systems)

  • 김정길;김신덕
    • 정보처리학회논문지A
    • /
    • 제13A권2호
    • /
    • pp.101-110
    • /
    • 2006
  • 대용량의 데이터 처리가 요구되는 내장형 시스템에서 메모리의 비중은 아주 중요하며, 특히 제한적인 메모리를 최적으로 이용하기 위하여 응용의 특성을 활용하는 온칩(on-chip) 메모리 구조의 설계가 필요하다. 본 논문에서는 멀티미디어 응용을 위한 내장형 시스템에서 저전력을 위하여 작은 용량으로 설계되었으나 우수한 성능을 보이는 데이터 캐쉬(data cache)가 제안된다. 제안되는 캐쉬는 컴파일러의 도움 없이 구조적인 특징과 간단한 동작 메커니즘만을 이용하여 해당 응용의 데이터 지역성(data locality)을 효과적으로 반영할 수 있도록 작은 블록 크기를 지원하는 4KB 용량의 직접사상 캐쉬(direct-mapped cache)와 큰 블록을 지원하는 1KB 용량의 완전연관 버퍼(fully-associative buffer)로 구성되어 진다. 전체 5KB의 작은 캐쉬 용량으로 인한 성능 저하를 보완하기 위하여 멀티미디어 응용의 알고리즘 특성을 기반으로 응용 적응적인 다중 블록 선인출(adaptive multi-block prefetching) 기법과 효과적 블록 필터링(effective block filtering) 기법이 제안되었다 시뮬레이션 결과에 따르면 제안된 5KB 캐쉬는 기존의 16KB 4-way 집합연관 캐쉬와 동등한 성능을 보이면서 소비 전력 면에서는 40% 이상의 감소를 보이고 있다.

Enhancing GPU Performance by Efficient Hardware-Based and Hybrid L1 Data Cache Bypassing

  • Huangfu, Yijie;Zhang, Wei
    • Journal of Computing Science and Engineering
    • /
    • 제11권2호
    • /
    • pp.69-77
    • /
    • 2017
  • Recent GPUs have adopted cache memory to benefit general-purpose GPU (GPGPU) programs. However, unlike CPU programs, GPGPU programs typically have considerably less temporal/spatial locality. Moreover, the L1 data cache is used by many threads that access a data size typically considerably larger than the L1 cache, making it critical to bypass L1 data cache intelligently to enhance GPU cache performance. In this paper, we examine GPU cache access behavior and propose a simple hardware-based GPU cache bypassing method that can be applied to GPU applications without recompiling programs. Moreover, we introduce a hybrid method that integrates static profiling information and hardware-based bypassing to further enhance performance. Our experimental results reveal that hardware-based cache bypassing can boost performance for most benchmarks, and the hybrid method can achieve performance comparable to state-of-the-art compiler-based bypassing with considerably less profiling cost.

AN EFFICIENT IMAGE SEGMENTATION TECHNIQUE TO IDENTIFY TARGET AREAS FROM LARGE-SIZED MONOCHROME IMAGES

  • Yoon Young-Geun;Lee Seok-Lyong;park Ho-Hyun;Chung Chin-Wan
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.571-574
    • /
    • 2005
  • In this paper, we propose an efficient image segmentation technique for large-sized monochrome images using a hybrid approach which combines threshold and region-based techniques. First, an image is partitioned into fixed-size blocks and for each block the representative intensity is determined by averaging pixel intensities within the block. Next, the neighborhood blocks that have similar characteristics with respect to a specific threshold are merged in order to form candidate regions. Finally, those candidate regions are refined to get final target object regions by merging regions considering the spatial locality and certain criteria. We have performed experiments on images selected from various domains and showed that our technique was able to extract target object regions appropriately from most images.

  • PDF

Real-time Object Recognition with Pose Initialization for Large-scale Standalone Mobile Augmented Reality

  • Lee, Suwon
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.4098-4116
    • /
    • 2020
  • Mobile devices such as smartphones are very attractive targets for augmented reality (AR) services, but their limited resources make it difficult to increase the number of objects to be recognized. When the recognition process is scaled to a large number of objects, it typically requires significant computation time and memory. Therefore, most large-scale mobile AR systems rely on a server to outsource recognition process to a high-performance PC, but this limits the scenarios available in the AR services. As a part of realizing large-scale standalone mobile AR, this paper presents a solution to the problem of accuracy, memory, and speed for large-scale object recognition. To this end, we design our own basic feature and realize spatial locality, selective feature extraction, rough pose estimation, and selective feature matching. Experiments are performed to verify the appropriateness of the proposed method for realizing large-scale standalone mobile AR in terms of efficiency and accuracy.

인간의 활동 인정 가보 필터 기반의 특징 추출 (Gabor Filter-based Feature Extraction for Human Activity Recognition)

  • 윈안 누;이영구;이승룡
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.429-432
    • /
    • 2011
  • Recognizing human activities from image sequences is an active area of research in computer vision. Most of the previous work on activity recognition focuses on recognition from a single view and ignores the issue of view invariance. In this paper, we present an independent Gabor features (IGFs) method comes from the derivation of independent Gabor features in the feature extraction stage. The Gabor transformed human image exhibit strong characteristics of spatial locality, scale and orientation selectivity.

디렉토리 지역성을 활용한 작은 파일들의 모아 쓰기 기법 (Co-Writing Multiple Files Based on Directory Locality for High Performance of Small File Writes)

  • 이경재;안우현;오재원
    • 정보처리학회논문지A
    • /
    • 제15A권5호
    • /
    • pp.275-286
    • /
    • 2008
  • Fast File System(FFS)은 디스크의 고성능 대역폭을 활용하여 대용량 파일의 여러 블록들을 한 번에 저장함으로써 파일 쓰기 성능을 향상시키고 있다. 하지만, FFS는 파일 단위로 데이터를 저장하기 때문에 작은 파일 쓰기 성능은 디스크 대역폭보다 디스크 회전 및 탐색 시간에 크게 영향을 받는다. 본 논문은 FFS에서 작은 파일 쓰기의 성능 향상을 위해 여러 개의 작은 파일들을 한꺼번에 모아서 저장하는 모아 쓰기(Co-Writing) 기법을 제안하며, 이 기법을 FFS에 적용한 CW-FFS를 구현하였다. CW-FFS의 모아 쓰기 기법은 대역폭을 활용하여 디렉토리 지역성을 가지는 작은 파일들을 모아서 연속적인 디스크 위치에 한 번의 디스크 쓰기로 저장한다. 모아 쓰기 기법은 각 파일 단위로 발생하는 디스크 회전 및 탐색 동작들을 한 번으로 감소시키기 때문에 파일 쓰기가 많은 응용 프로그램에서 작은 파일 쓰기 성능을 개선시킨다. 또한 모아 쓰기 기법이 동일 디렉토리에 포함되는 파일들 간의 디스크 공간 지역성의 저하를 야기하지 않도록 효율적인 파일 할당 방식도 함께 제안한다. CW-FFS는 성능 검증을 위해 OpenBSD 운영체제 커널에서 구현되었으며, postmark 벤치마크를 통한 성능 측정 결과는 기존 FFS 파일 시스템보다 작은 파일 쓰기 성능이 속도 측면에서 $5{\sim}35%$까지 개선되었음을 보여준다.

Doughnut: 효율적인 지역성 및 캐슁을 사용하는 향상된 P2P Pastry 오버레이 네트워크 (Doughnut: An improved P2P Pastry Overlay Network with Efficient Locality and Caching)

  • 김명원;곽후근;정규식
    • 정보처리학회논문지C
    • /
    • 제16C권2호
    • /
    • pp.245-256
    • /
    • 2009
  • Pastry 오버레이 네트워크는 분산 해쉬 테이블(DHT : Distributed Hash Table)을 사용하는 구조적(Structured) P2P이다. Pastry에서는 노드들 사이의 메시지 수를 줄이기 위해 각각 공간적 지역성과 캐슁을 이용한 Rosary와 LAR이 제안되었다. Rosary는 Inter-Pastry와 Intra-Pastry로 구성된다. Rosary에서 루트 노드는 각 Intra-Pastry를 대표하는 노드가 할당되고 Inter-Pastry와 Intra-Pastry 라우팅을 책임진다. 이러한 구조로 인해 Rosary는 다음과 같은 단점을 가진다. 첫째는 루트 노드의 실패 시 고장 방지 능력(Fault Tolerance)에 약하다는 점이고, 둘째는 루트 노드를 사용하기 때문에 라우팅 홉 카운트가 기존 Structured P2P에 비해 증가한다는 점이다. 마지막으로 셋째는 통신 부하가 특정 지역에 집중한다는 점이다. LAR의 경우 캐슁이 Intra-Pastry내의 노드들 사이에 골고루 분포되지 않고 Intra-Pastry내의 특정 노드들에 의해서만 사용되어지는 단점을 가진다. 본 논문에서는 Rosary와 LAR의 문제점을 해결한 Doughnut이라 불리는 개선된 Pastry를 제안한다. Doughnut은 지역적 특성에 따라 노드들을 구분한 Inter-Pastry와 Intra-Pastry로 구성되고, 모든 노드들은 Inter-Pastry와 Intra-Pastry 라우팅을 책임진다. 이것은 모든 노드들이 기존의 루트 노드의 역할을 수행함을 의미한다. 이러한 방법은 고장 방지 능력이 감소하는 문제, 라우팅 홉 카운트가 증가하는 문제 및 통신 부하가 균일하게 분포하지 않는 문제를 해결한다. 또한 Doughnut은 지역적으로(Intra-Pastry) 캐쉬의 균일한 분포를 보장하고, 지역안의 캐쉬 콘텐츠는 다른 지역에서도 사용될 수 있기 때문에 효율적으로 캐쉬를 사용할 수 있다. 제안된 알고리즘은 시뮬레이터를 통해 구현되었고, 실험 결과는 기존 방법에 비해 제안된 방법이 효과적임을 보여준다.

위치 기반 질의 처리를 위한 궤적 보존 색인의 설계 및 구현 (Design and Implementation of Trajectory Preservation Indices for Location Based Query Processing)

  • 임덕성;홍봉희
    • 한국공간정보시스템학회 논문지
    • /
    • 제10권3호
    • /
    • pp.67-78
    • /
    • 2008
  • 위치 기반 서비스(Location-Based Service)는 무선 통신에 기반 한 서비스로서 최근 그 중요성이 증대되고 있다. 차량, 선박과 같이 시간에 따라 위치를 변경하는 이동 객체(moving object)의 이동 경로는 궤적(trajectory)으로 표현된다. 이동 객체의 궤적 모니터링을 위한 데이터베이스에서는 이동객체의 위치를 추적할 뿐만 아니라 이동 경로를 감시하기 위한 궤적 질의를 효율적으로 지원해야 하므로 이동 객체의 궤적 정보를 효과적으로 관리하고, 빠른 검색을 제공하는 이동 객체 색인 방법이 필요하다. 이 논문에서는 먼저 기존 궤적 색인 구조에서 사장 영역 문제를 정의한다. 궤적 색인의 사장 영역은 궤적 보존 속성으로 인해 공간적 지역성을 고려되지 않기 때문에 발생한다. 이를 해결하기 위해 이 논문에서는 사장 영역 및 비단말 노드간의 중첩을 줄이기 위해 엔트리 재배치 기법을 제시하고, 제안된 색인과 기존 알고리즘을 사용하는 색인과의 성능비교를 통하여 제시한 색인의 우수성을 입증한다.

  • PDF

국지기후가 잣나무 차대검정림의 년도별 구과 결실량에 미치는 영향 (Effects of Local Climatic Conditions on the Yearly Cone Production in Progeny Test Stands of Korean White Pine)

  • 신만용;장용석;한상억;김영채
    • 한국농림기상학회지
    • /
    • 제4권3호
    • /
    • pp.141-150
    • /
    • 2002
  • 본 연구는 경기도 가평과 관주 그리고 충청북도 영동에 조성된 잣나무 차대검정림을 대상으로 20년생까지의 연도별 구과 결실량에 미치는 미기후의 영향을 구명하기 위하여 수행되었다. 이를 위해 지역별ㆍ연도별 구과 결실량을 측정하여 분석하였으며, 지형기후학적 방법과 공간통계기법을 사용하여 차대검정림의 연도별 미기후 조건을 추정하여 구과 결실량에 미치는 영향을 분석하였다. 착과수 및 착과 본수를 조사한 결과 가평 지역은 9년생부터, 광주 지역은 10년 생부터 그리고 영동 지역은 이보다 훨씬 늦은 14년생부터 착과가 이루어지기 시작하여 지역별 편차가 있음을 알 수 있었다. 또한 지역별 총 착과수와 가계별 착과수에서도 큰 변이를 나타내고 있는 것으로 파악되었다. 구과 결실량과 지역별 미기후간의 상관분석 결과를 보면 가평 지역의 경우 개화수분 당년의 11월부터 익년 3월까지 5개월 간의 흐린 날수 합계가 높은 부의 상관을 나타내었으며, 광주 지역의 경우 개화수분 당년 6월부터 결실년도 8월까지 15개월 동안의 일조시수 합계가 유의성이 높은 부의 상관을 나타내었다. 한편, 영동 지역의 경우는 개화수분 당년의 11월부터 익년 3월까지의 평균기온 평균치와 개화수분 당년의 5월 평균기온 등에서 부의 상관관계를 인정할 수 있었다. 한편 구과 결실량을 기후지수에 의해 추정하기 위한 최적 회귀식은 지역별로 다양한 기후변수가 채택되었으나 비교적 설명력이 높아 여러 가지 환경 요인 중에서 미기후 조건이 구과 결실량에 영향을 미치는 것으로 판명되었다. 본 연구로부터 얻어진 결과는 잣나무 우량 종자생산에 적합한 입지선정에 필요한 정보로 활용될 수 있을 것으로 기대된다.

로캘러티로서 대덕연구단지의 노동시장 특성과 공간적 네트워크 (Characteristics of Labor Market and Spatial Networks in Daedeok Science Town as Locality, Korea)

  • 한주성
    • 한국지역지리학회지
    • /
    • 제7권2호
    • /
    • pp.35-54
    • /
    • 2001
  • 신지역지리의 접근방법을 종합하여 대덕연구단지의 지역 정체성을 밝히는 것을 목적으로, 노동 시장의 특성, 노동의 공간적 분화, 연구교류의 네트워크와 학 연 산(學 硏 産) 협력 네트워크를 통하여 사회적 상호작용이 공간적으로 어떠한 결합 관계를 나타내는지를 분석한 결과는 다음과 같다. 먼저 1972년 이전에 대역연구단지는 근교 농업지역으로 지역내 자급적 색채가 강한 농업활동 뿐만 아니라 농산물 출하로 지역간의 상호작용에 의한 지역의 정체성을 형성하였다고 할 수 있다. 그 후 세계경제체계의 틀 속에서 생각할 때 $1992{\sim}1998$년 사이에는 대덕연구단지의 정체성 형성의 외적인 요인으로 과학의 발달과 수도권지역의 인구 및 공공기관의 지방분산이라는 요인을 들 수 있다. 그리고 지역의 내적인 면은 국토의 중앙에 입지하여 접근성의 극대화를 가져올 수 있는 지역으로 전국으로부터의 노동력 유입에 유리하고, 대전이라는 모도시를 끼고 있다는 점을 들 수 있다. 마지막으로 1999년 이후의 벤처기업 입지시기에는 지식정보화 사회에서 지식기반 산업을 포함한 첨단산업의 육성이 강조되는 시대적 요청으로 기존의 고도의 기술을 개발하는 연구소의 역할이 벤처기업을 끌어들이는데 크게 공헌하였다고 할 수 있다. 이러한 측면에서 볼 때 대덕연구단지는 기술과학단지로서의 자생력이 생겨나고 있다고 할 수 있다.

  • PDF