• 제목/요약/키워드: memory interface

검색결과 509건 처리시간 0.026초

GPGPU 기반의 효율적인 카메라 ISP 구현 (Implementing Efficient Camera ISP Filters on GPGPUs Using OpenCL)

  • 박종태;;홍진건
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1784-1787
    • /
    • 2010
  • General Purpose Graphic Processing Unit (GPGPU) computing is a technique that utilizes the high-performance many-core processors of high-end graphic cards for general-purpose computations such as 3D graphics, video/image processing, computer vision, scientific computing, HPC and many more. GPGPUs offer a vast amount of raw computing power, but programming is extremely challenging because of hardware idiosyncrasies. The open computing language (OpenCL) has been proposed as a vendor-independent GPGPU programming interface. OpenCL is very close to the hardware and thus does little to increase GPGPU programmability. In this paper we present how a set of digital camera image signal processing (ISP) filters can be realized efficiently on GPGPUs using OpenCL. Although we found ISP filters to be memory-bound computations, our GPGPU implementations achieve speedups of up to a factor of 64.8 over their sequential counterparts. On GPGPUs, our proposed optimizations achieved speedups between 145% and 275% over their baseline GPGPU implementations. Our experiments have been conducted on a Geforce GTX 275; because of OpenCL we expect our optimizations to be applicable to other architectures as well.

Implementing I/O Bandwidth Sharing Scheme between Multiple Linux Containers based on Dm-zoned for Zoned Namespace SSDs

  • Seokjun Lee;Sungyong Ahn
    • International journal of advanced smart convergence
    • /
    • 제12권4호
    • /
    • pp.237-245
    • /
    • 2023
  • In the cloud service, system resource such as CPU, memory, I/O bandwidth are shared among multiple users. Particularly, in Linux containers environment, I/O bandwidth is distributed in proportion to the weight of each container through the BFQ I/O scheduler. However, since the I/O scheduler can only be applied to conventional block storage devices, it cannot be applied to Zoned Namespace(ZNS) SSD, a new storage interface that has been recently studied. To overcome this limitation, in this paper, we implemented a weighted proportional I/O bandwidth sharing scheme for ZNS SSDs in dm-zoned, which emulates conventional block storage using ZNS SSDs. Each user receives a different amount of budget, which is required to process the user's I/O requests based on the user's weight. If the budget is exhausted I/O requests cannot be processed and requests are queued until the budget replenished. Each budget refill period, the budget is replenished based on the user's weight. In the experiment, as a result, we can confirm that the I/O bandwidth can be distributed on their weight as we expected.

버추얼 인터페이스 아키텍처 및 인터벌 캐쉬에 기반한 분산 VOD 서버 (A Distributed VOD Server Based on Virtual Interface Architecture and Interval Cache)

  • 오수철;정상화
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권10호
    • /
    • pp.734-745
    • /
    • 2006
  • 본 논문에서는 VIA(Virtual Interface Architecture) 통신 프로토콜과 인터벌 캐쉬 기법을 적용하여 서버 내부 통신망의 부하를 감소시킨 PC 클러스터 기반 분산 VOD 서버를 제안한다. 분산 VOD 서버의 각 노드는 클러스터상에 분산 저장된 비디오 데이타를 서버 내부 통신망을 사용하여 전송받아 사용자에게 제공한다. 이 때, 대량의 비디오 데이타가 서버 내부 통신망을 통하여 전송됨으로 서버 내부 통신망에 부하가 증가한다. 본 논문에서는 TCP/IP의 통신 오버헤드를 제거한 사용자 수준 통신 프로토콜인 VIA에 기반한 분산 VOD 파일 시스템을 개발함으로써, 원격 디스크를 접근하는데 소요되는 내부 통신망 비용을 최소화하려고 하였다. 또한, VIA의 최대 전송 크기를 VOD 시스템에 맞게 확장함으로써 내부 통신망의 성능을 향상시키려고 하였다. 추가로 본 논문은 인터벌 캐쉬 기법을 적용하여 원격 서버 노드에서 전송 받은 비디오 데이타를 지역 노드의 메인 메모리에 캐쉬함으로써, 서버 내부 통신망에 발생하는 통신량을 감소시켰다. 실험을 통하여 분산 VOD 서버의 성능을 측정하였으며, TCP/IP에 기반하고 인터벌 캐쉬를 지원하지 않는 기존의 분산 VOD 서버와 성능을 비교하였다. 실험결과, VIA 적용으로 약 11.3%의 성능 향상, 그리고 인터벌 캐쉬 기법을 적용하여 추가로 약 10%의 성능 향상이 생겨 총 21.3%의 성능 향상을 얻을 수 있었다.

정보디자인에서 효과적 커뮤니케이션을 위한 멀티미디어 사용원리에 관한 연구 (A Study on Principle for Use of Multimedia in order to have Effective Communication in Information Design)

  • 이일순
    • 만화애니메이션 연구
    • /
    • 통권13호
    • /
    • pp.255-267
    • /
    • 2008
  • 최근 정보디자인 영역에서 애니메이션을 포함한 멀티미디어 활용이 급증하고 디자인 현장에서 응용이 확대되고 있음에도 불구하고 관련 연구는 매우 부족하며, 특히 어떤 특성이 정보전달효과를 향상시키는지에 대한 연구는 많지 않다. 지금까지 디자이너들의 관심은 독창성, 다양성 등 화면의 시각적 완성도에 집중되어 있었으며, 실제로 디자인에서 인지적 문제는 간과되어 왔다. 그러나 정보디자인의 궁극적 목적이 정보의 정확한 전달에 있다는 점을 생각한다면 독창성이나 다양성 이전에 정보 사용자의 혼란을 줄이고 정보전달력을 향상시키기 위한 인간의 시각적 인지능력, 기억력 등에 근거한 연구가 선행되어야 하고 이를 디자인에 적용하는 노력이 필요하다하겠다. 따라서 본 연구는 정보디자인에서 멀티미디어가 사용자인지 및 커뮤니케이션에 어떤 영향을 미치는지를 매체의 효용성 이론에 근거하여 검토하고 어떠한 환경 하에서 효과가 극대화될 수 있는지 살펴보고자 하였다. 매체의 효용성에 관한 이론들을 정리해 보면 멀티미디어와 같은 발달된 정보기술은 매체의 내재된 풍요도로 인하여 정보전달에 효과적으로 작용할 것이나 멀티미디어의 효과는 전적으로 매체풍요도의 관점에서 단순화시키기보다는 과제와의 적절성이나 인지적 적절성의 관점에서 다각적으로 분석해야 한다. 최적의 인터페이스 디자인을 위해서는 불필요한 인지부하를 없애면서 제한된 양의 작동기억을 최대한 활용하여 지식을 습득할 수 있도록 정보를 구조화하는 것이 중요하며, 또한 정확하고 성공적인 심상구축이 가능하도록 정보특성에 맞는 적절한 미디어 선택과 표현방법의 제시가 필요하다 할 것이다. 본 연구는 정보디자인의 커뮤니케이션 효과를 높이기 위하여 어떤 정보기술을 활용해야 하는가에 대한 의문을 매체의 효용성에 관한 이론들을 근거로 살펴봄으로서 향후 디자이너의 의사결정에 있어서 도움을 주고자 하였다.

  • PDF

퐁 음영법을 위한 3차원 그래픽 가속기의 구현 (An Implementation of 3D Graphic Accelerator for Phong Shading)

  • 이형;박윤옥;박종원
    • 한국멀티미디어학회논문지
    • /
    • 제3권5호
    • /
    • pp.526-534
    • /
    • 2000
  • CAD/CAM, 3차원 모델링, 가상현실, 그리고 의학 영상의 처리 속도를 높이기 위한 3차원 가속기에 대한 많은 연구들이 진행 중이다. 본 논문에서는 3차원 그래픽 처리속도를 향상하기 위하여 SIMD처리기 구조의 3차원 가속기를 제안하며, 기존의 퐁 음영법을 제안된 구조에 맞게 병렬화하고 수행함으로써 직접적인 성능분석을 시도하였다. 3차원 SIMD 처리기 구조는 PCI 지역 버스 인터페이스, 16개의 처리기, 그리고 Park's 다중접근기억장치로 구성되며, 다중접근 기억장치는 17개의 외부 메모리 모듈을 갖는다. 기존의 직렬 퐁 음영법을 SIMD 처리기 구조에 수행될 수 있도록 하나의 다면체를 여러 개의 $4\times{4}$의 정방형 다면체로 나누어서 처리하는 병렬 퐁 음영 법으로 수정하였으며, 하나의 정방형 다면체는 다중접근기억장치가 간격이 1인 블록 접근이 가능하기 때문에 17개의 처리기가 동시에 처리할 수 있다. SIMD처리기 구조에서 수행되는 병렬화된 퐁 음영법을 하드웨어 모의실험 패키지인 CADENCE사의 Verilog-XL로 모의실험을 수행한 결과 5.14배의 속도향상을 보임을 확인하였다.

  • PDF

피로현상을 고려한 강유전박막의 Switching 과 MFSFET 소자의 특성 (Switching Behaviour of the Ferroelectric Thin Film and Device Characteristics of MFSFET with Fatigue)

  • 이국표;강성준;윤영섭
    • 대한전자공학회논문지SD
    • /
    • 제37권6호
    • /
    • pp.24-33
    • /
    • 2000
  • 피로현상의 진행에 따라 발생하는 하부전극 주위의 산소공공 축적현상을 적용하여 강유전체 박막의 switching 특성과 MFSFET 소자특성을 시뮬레이션하였다. Switching 모델에서 relative switched charge는 피로현상 전에 0.74 nC 이였으나, 피로가 진행되어 50${\AA}$의 산소공공층이 생성된 후에는 불과 0.15nC 로서 산소공공층이 분극반전을 강력하게 억제함을 알았다. MFSFET 소자의 모델에서 C-V_G와 I_D-V_G 곡선은 2 V 의 memory window를 나타내었고, 캐패시턴스 특성에서 축적과 공핍 및 반전 영역은 확실하게 표현되었다. 그리고, $I_D-V_D$ 곡선에서 두 부분의 문턱전압에 의해 나타난 포화드레인 전류차이는 6mA/$cm^2$이었다. 그러나, 50${\AA}$의 산소공공층이 축적된 후, $I_D-V_D$ 곡선에서 포화 드레인 전류차이는 피로현상이 없는 경우에 비해 약 50% 감소하여 산소공공층이 소자 적용에 난제임을 확인하였다. 본 모델은 강유전체 박막의 다양한 특성과 임의의 강유전체 박막을 사용한 MFSFET 소자의 동작을 예측하는데 중요한 역할을 할 것으로 판단된다.

  • PDF

회전변화에 무관한 실시간 다중 얼굴 검출 엔진 개발 (Development of Rotation Invariant Real-Time Multiple Face-Detection Engine)

  • 한동일;최종호;유성준;오세창;조재일
    • 대한전자공학회논문지SP
    • /
    • 제48권4호
    • /
    • pp.116-128
    • /
    • 2011
  • 본 논문에서는 기존의 방법에 비해서 사용되는 메모리의 증가가 없이, 혹은 메모리의 증가를 최소화하는 영상 메모리의 회전 변환 기법을 개발하여 얼굴 회전 변화에 강인한 고성능 실시간 얼굴 검출 엔진 구조를 제안하였으며 FPGA 구현을 통하여 제안 구조의 타당성을 검증하였다. 고성능 얼굴 검출을 위해 기존에 사용하던 조명 변화에 강인한 MCT(Modified Census Transform) 변환 기법과 최적화된 학습데이터 생성을 위한 Adaboost 학습 기법 이외에 얼굴 회전 변환에 강인함을 위한 영상 회전 기법을 이용하였다. 제안한 하드웨어 구조는 색좌표 변환부, 잡음 제거부, 메모리 인터페이스부, 영상 회전부, 크기 조정부, MCT 생성부, 얼굴 후보 검출부/ 신뢰도 비교부, 좌표 재조정부, 데이터 검증부, 검출 결과 표시부/컬러 기반 검출 결과 표시부로 구성되어있다. 구현 및 검증을 위해 Virtex5 LX330 FPGA 보드와 QVGA급 CMOS 카메라, LCD Display를 이용하였으며, 다양한 실생활 환경 및 얼굴 검출 표준 데이터베이스에 대해서 뛰어난 성능을 나타냄을 검증하였다. 결과적으로 실생활 환경에서 초당 60프레임 이상의 속도로 실시간 처리가 가능하며, 조명 변화 및 얼굴 회전 변화에 강인하고, 동시에 32개의 다양한 크기의 얼굴 검출이 가능한 고성능 실시간 얼굴 검출 엔진을 개발하였다.

Rectangle Layout을 이용한 XML 기반 모바일 정보 시각화 시스템 (An XML based Mobile Information Visualization System for Mobile Devices using Information layout Techniques)

  • 유희용;전서현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권9호
    • /
    • pp.776-786
    • /
    • 2006
  • 본 논문은 제한된 디스플레이를 가지는 모바일 디바이스 상에서 XML로 작성된 정보를 사용자에게 효과적으로 보여주는 rectangle layout을 이용한 XML 기반의 모바일 정보 시각화 시스템을 제안한다. 먼저 트리 형태의 정보뿐만 아니라 사이클이 존재하는 그래프 정보까지 기술하도록 XML 스키마를 정의한다. XML로 기술된 정보에 대해 디스플레이 화면상에 배치할 때, 사각형의 형태를 가지는 디스플레이 화면의 특징을 고려하여 기존 radial layout을 개선한 rectangle layout 방식을 적용한다. 그 다음 전체 정보와 사용자가 관심을 가지는 정보를 동시에 표현하기 위해 어안 뷰(fisheye view)알고리즘의 DOI를 rectangle layout에 표현된 모든 정보에 적용한다. 또한 사용자가 새로운 관심 대상 정보를 선택하였을 때, 정보들의 화면 재배치에 따른 변화에 사용자 혼란을 줄이고 사용자의 인지력을 향상시키기 위한 방법을 모바일 디바이스의 능력을 고려하여 제안한다. 제안된 focus+context 방식의 정보 시각화 시스템은 데스크 탑에 비해 CPU 계산 능력과 디스플레이 화면, 메모리 제약이 심한 PDA, 셀룰라 폰, 스마트 폰과 같은 모바일 디바이스 상에서 정보 검색에 효과적인 인터페이스를 제공한다. 본 논문에서는 제안한 정보 시각화 시스템을 PDA상에 구현하고 제안된 rectangle layout을 이용한 정보 시각화 방식과 기존 radial layout을 이용한 정보 시각화 방식에 다양한 조건을 적용하여 실험 및 평가를 진행한다.

대수적 재구성법과 2차원 수치모델링 및 역산 집합에 기반한 3차원 자력역산 소프트웨어 (A 3D Magnetic Inversion Software Based on Algebraic Reconstruction Technique and Assemblage of the 2D Forward Modeling and Inversion)

  • 고광범;정상원;한경수
    • 지구물리와물리탐사
    • /
    • 제16권1호
    • /
    • pp.27-35
    • /
    • 2013
  • 본 연구를 통하여 3차원 자력역산 소프트웨어 시작품(KMag3D, 가칭)을 개발하고 개발 시 역점사항을 사용자 매뉴얼 형식으로 소개하였다. KMag3D는 다음 두 가지 사항을 기본 뼈대로 구성되었다. 첫째, 지금까지 자력역산에 일반적으로 적용되는 최소제곱법에 의한 방법 대신 대수적 재구성법에 기반한 알고리즘을 도입하였다. 이는 계산시간과 기억용량을 획기적으로 줄여 3차원 자력역산을 매우 효율적으로 수행한다. 둘째, 대수적 재구성법에 의한 3차원 역산에 필요한 초기모형과 사전정보 모형을 결정하는 데 2차원 수치모델링 및 역산 집합과 주향방향 내삽을 이용하는 방법을 제시하였다. 이는 3차원 역산 알고리즘에 사전정보를 효율적으로 적용하며 특히 매우 실용적임을 보여주었다.

분포형 강우유출모형(K-DRUM)의 병렬화 효과 분석 (The Parallelization Effectiveness Analysis of K-DRUM Model)

  • 정성영;박진혁;허영택;정관수
    • 대한공간정보학회지
    • /
    • 제18권4호
    • /
    • pp.21-30
    • /
    • 2010
  • 본 연구에서는 기존에 개발된 GIS 기반의 분포형 강우유출모형(K-DRUM)이 대유역에서 많은 계산시간을 요구하는 단점이 있기 때문에 이를 개선하기 위하여 MPI(Message Passing Interface)기법을 적용한 병렬 K-DRUM모형을 개발하였다. K-DRUM 모형은 홍수기동안의 지표흐름과 지표하 흐름의 시간적 변화와 공간적 분포를 모의할 수 있으며, 전처리과정으로서 ArcView를 이용하여 모형에 필요한 ASCII형태의 입력 매개변수 자료들을 가공하였다. 개발된 병렬 K-DRUM 모형을 이용하여 남강댐유역에서 2006년 태풍 '에위니아' 사상을 대상으로 다양한 영역분할을 통한 유출계산 검토를 하였다. 영역분할 개수에 따른 병렬화 효과를 검토하기 위하여 분할 개수를 1개에서 25개까지 증가시키며 클러스터 시스템에서 유출모의를 수행하였다. 모의결과 영역분할 개수가 증가할수록 컴퓨터 메모리의 개수가 감소하게 되고, 이에 따라 모의수행시간 역시 감소함을 알 수 있었다. 또한 본 연구에서 영역분할 계산방식을 채택함에 따라 영역의 접합부분에서 발생 가능한 유출량 계산오차를 최소화하기 위한 기법을 제시하였다. 유출량 계산오차 발생을 최소화하기 위해서는 단위 계산시간당 영역간 정보교환과 내부유출량 계산을 최소3회 반복하여야 함을 알 수 있었다.