• 제목/요약/키워드: PE블록

검색결과 32건 처리시간 0.027초

퐁 음영법을 위한 3차원 그래픽 가속기의 구현 (An Implementation of 3D Graphic Accelerator for Phong Shading)

  • 이형;박윤옥;박종원
    • 한국멀티미디어학회논문지
    • /
    • 제3권5호
    • /
    • pp.526-534
    • /
    • 2000
  • CAD/CAM, 3차원 모델링, 가상현실, 그리고 의학 영상의 처리 속도를 높이기 위한 3차원 가속기에 대한 많은 연구들이 진행 중이다. 본 논문에서는 3차원 그래픽 처리속도를 향상하기 위하여 SIMD처리기 구조의 3차원 가속기를 제안하며, 기존의 퐁 음영법을 제안된 구조에 맞게 병렬화하고 수행함으로써 직접적인 성능분석을 시도하였다. 3차원 SIMD 처리기 구조는 PCI 지역 버스 인터페이스, 16개의 처리기, 그리고 Park's 다중접근기억장치로 구성되며, 다중접근 기억장치는 17개의 외부 메모리 모듈을 갖는다. 기존의 직렬 퐁 음영법을 SIMD 처리기 구조에 수행될 수 있도록 하나의 다면체를 여러 개의 $4\times{4}$의 정방형 다면체로 나누어서 처리하는 병렬 퐁 음영 법으로 수정하였으며, 하나의 정방형 다면체는 다중접근기억장치가 간격이 1인 블록 접근이 가능하기 때문에 17개의 처리기가 동시에 처리할 수 있다. SIMD처리기 구조에서 수행되는 병렬화된 퐁 음영법을 하드웨어 모의실험 패키지인 CADENCE사의 Verilog-XL로 모의실험을 수행한 결과 5.14배의 속도향상을 보임을 확인하였다.

  • PDF

서브어레이 접근을 위한 충돌회피 기억장치 (Conflict-Free Memory System for Subarray Access)

  • 박춘자;박종원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.43-45
    • /
    • 2002
  • 이 논문에서는 pq개의 PE(Processing Element)를 가진 SIMD처리기에서 기억 장치 접근시간을 감소시키기 위한 충돌회피 기억장치를 제안했다. 이 기억장치는 MxN 배열내 자료들의 임의의 위치에서 일정 간격인 블록형태와 8방향 선형태인 pd개의 자료들의 동시 접근을 지원한다. 기억모듈 수는 pq보다 큰 소수이고, 간격은 기억모듈 수의 배수가 아닌 양수이다. 간단하고 빠른 주소계산회로와 이동회로를 위해, 요구된 자료들에서 첫번째 자료의 기준 주소와 pq개의 주소간의 차들로 구분한 후, 주소간의 차들은 첫번째 자료 요소의 기억모듈번호로부터 번호에 따라 오름차순 정렬되고 빠른 기억모듈에 저장된다. 그래서 m개의 주소간의 차이들에 첫번째 자료의 기준주소 더해진 후, 첫 번째 요소의 기억모듈 번호에 의한 오른쪽 회전이 간격을 가진 9가지 서브어레이 모두이게 요구된다. 9가지 자료 이동 형태를 멀티플렉싱과 회전에 의해 1가지로 감소시킨 효율적인 자료 이동 회로를 제안하였다. 제안된 충돌회피기억 장치는 이전기억 장치와 비교하여 자료 접근형태, 간격, 자료 배열의 크기에 제한, 하드웨어 비용, 속도, 복잡도면에서 개선하였다.

  • PDF

경계의 방향성에 근거를 둔 가변블록형상 적응 예측영상부호화 (Adaptive Predictive Image Coding of Variable Block Shapes Based on Edge Contents of Blocks)

  • 도재수;김주영;장익현
    • 한국정보처리학회논문지
    • /
    • 제7권7호
    • /
    • pp.2254-2263
    • /
    • 2000
  • This paper proposes an efficient predictive image-compression technique based on vector quantization of blocks of pels. In the proposed method edge contents of blocks control the selection of predictors and block shapes as well. The maximum number of bits assigned to quantizers has been in creased to 3bits/pel from 1/5bits/pel, the setting employed by forerunners in predictive vector quantization of images. This increase prevents the saturation in SNR observed in their results in high bit rates. The variable block shape is instrumental in eh reconstruction of edges. The adaptive procedure is controlled by means of he standard deviation ofp rediction errors generated by a default predictor; the standard deviation address a decision table which can be set up beforehand. eh proposed method is characterized by overall improvements in image quality over A-VQ-PE and A-DCT VQ, both of which are known for their efficient use of vector quantizers.

  • PDF

메모리 호출과 연산횟수 감소기법을 이용한 저전력 움직임추정 VLSI 구현 (VLSI Implementation of Low-Power Motion Estimation Using Reduced Memory Accesses and Computations)

  • 문지경;김남섭;김진상;조원경
    • 한국통신학회논문지
    • /
    • 제32권5A호
    • /
    • pp.503-509
    • /
    • 2007
  • 저전력 움직임추정은 휴대용 정보단말의 실시간 비디오 코딩에 필수적이다. 본 논문에서는 전역탐색 블록정합 방식을 적용한 저전력 움직임추정 알고리즘과 이를 1차원 배열의 VLSI로 구현한 하드웨어 구조를 제안한다. 전역 탐색 블럭정합 방법의 전력소비의 주원인은 많은 연산량과 탐색영역의 프레임 데이터를 호출하는 횟수가 많다는 점이다. 본 논문에서는 두 개의 인접한 참조블럭의 움직임추정 연산을 동시에 병렬로 수행하여 탐색영역의 메모리 호출횟수를 감소시켰으며, 움직임추정시 결과에 영향을 미치지 않는 불필요한 연산을 제거하였다. 제안된 움직임추정 알고리즘을 1차원 PE (processing element) 배열구조의 VLSI로 구현하여 실험한 결과, 제안된 움직임추정기는 기존의 저전력 움직임추정기에 비해 9.3%의 소비전력 감소와 2배 정도의 속도향상이 있음을 확인하였다.

16개의 처리기를 가진 다중접근기억장치를 위한 영상처리 알고리즘의 구현에 대한 성능평가 (Performance Analysis of Implementation on Image Processing Algorithm for Multi-Access Memory System Including 16 Processing Elements)

  • 이유진;김재희;박종원
    • 전자공학회논문지CI
    • /
    • 제49권3호
    • /
    • pp.8-14
    • /
    • 2012
  • 최근 3D TV나 영화, 증강현실과 같은 대용량 고화질의 영상 응용분야가 확산됨에 따라 빠른속도로 영상을 처리하는 것이 요구되고 있다. 여러개의 프로세서로 구성되어 병렬처리 성능을 극대화 시킬 수 있는 SIMD구조의 컴퓨터는 다양하고 많은 양의 데이터들을 처리하는 것을 가속화한다. 다중접근기억장치인 MAMS는 여러개의 PE와 고성능 SIMD 구조에 최적화된 시스템으로 MAMS는 메모리 모듈을 $M{\times}N$의 2-D array 개념을 적용하여 X, Y 좌표 및 임의의 간격으로 pq개의 데이터 각각에 수평, 수직, 대각선, 역대각선, 블록의 다양한 방식으로 충돌없이 접근하며, 이 메모리모듈(MM)의 개수 m은 pq 개수보다 큰 소수이다. MAMS-PP4는 4개의 PE와 5개의 MM로 구성되어 기존에 구현된 바 있다. 이 논문에서는 MAMS-PP4의 확장으로 16개의 PE와 17개의 MM으로 구성된 MAMS-PP16에 대한 영상처리 알고리즘의 구현과 그에 따른 성능평가에 대해 소개한다. MAMS-PP16의 인스트럭션 포맷은 64비트로 확장되어 새로 설계 되었으며 특정 어플리케이션의 추가와 새로운 인스트럭션이 포함되어 있다. 본 논문에서는 구현된 알고리즘이 수행될 수 있도록 MAMS-PP16의 시뮬레이터를 개발하였다. 이 시뮬레이터를 통해 구현된 영상처리 알고리즘을 수행함으로서 MAMS-PP16의 성능이 향상되었음을 확인하였다. 영상처리 알고리즘 중 피라미드 기법을 적용하여 수행한 결과, 캐시를 사용하는 Serial processor에서는 랜덤한 응답인 반면, 캐시를 사용하지 않는 MAMS-PP16에서 일정한 응답을 확인하였다.

이산화탄소 분리를 위한 PEBA공중합체 기반 분리막 (Poly(ether block amide) (PEBA) Based Membranes for Carbon Dioxide Separation)

  • 이재훈;라즈쿠마 파텔
    • 멤브레인
    • /
    • 제29권1호
    • /
    • pp.1-10
    • /
    • 2019
  • Poly(ether block amide) (PEBA)는 이산화탄소 분리에 매우 적합한 상용 블록 공중합체 중 하나이다. 기체분리막의 경우 높은 투과도 뿐 아니라 강한 기계적 강도 또한 필요로 한다. PEBA공중합체의 결정성 폴리아마이드(polyamide) 블록은 기계적 강도를 제공하며 동시에 rubbery한 폴리에테르(polyether) 부분은 이산화탄소와의 친화도를 부여하여 이산화탄소 촉진 수송에 기여한다. PEBA공중합체에서 결정성 상과 rubber한 상의 조성은 기체분리막에 적합하게 조절될 수 있다. PEBA 공중합체를 기반으로 한 분리막은 좋은 투과도를 갖지만 추가적으로 분자체 효과를 이용하여 큰 기체 투과도 손실 없이 분리막의 선택도를 향상시킬 수 있다. 혼합 매질 분리막은 혼합막의 한 종류로서 고분자 매트릭스와 유기 첨가제로 이루어져 있다. 하지만 고분자 매트릭스와 유기 첨가제간의 양립성(compatibility)에 따른 문제점 또한 존재한다. 따라서 본 총설에서는 PEBA 공중합체를 기반으로 한 혼합막의 장점과 한계에 대해 다루고자 한다.

다중연산구조기반의 고밀도 성능향상을 위한 움직임추정의 디인터레이싱 방법 (Deinterlacing Method for improving Motion Estimator based on multi arithmetic Architecture)

  • 이강환
    • 대한전자공학회논문지SP
    • /
    • 제44권1호
    • /
    • pp.49-55
    • /
    • 2007
  • 본 논문에서는 필드/프레임의 공간적, 시간적 움직임 특성을 활용한 디인터레이스드 기법을 이용해 재구성된 영상프레임으로부터 넓은 탐색영역에서의 움직임추정이 가능한 이중연산구조 기반의 다해상도 계층적 움직임 추정 방식(multi- resolution hierarchical motion estimation, MHME)의 효율적인 다중연산구조 기반의 움직임 추정을 제안한다. 공간적, 시간적 움직임 특성으로부터 디인터레이스드 기법을 적용하여 재구성된 영상프레임으로부터는 계층적 움직임 추정방식을 적용하여 빠른 움직임 영역에서도 화질의 열화가 거의 없는 다해상도 계층적 움직임 추정(MHME) 영상처리를 구현하였고, 비교적 높은 PSNR을 얻을 수 있었다. 다양한 모드 M=2 또는 M=3의 여러 가지 모의실험을 통해 제안된 구조가 전역탐색 블록정합 알고리듬(Full-search Block Matching Algorithm, FBMA)에 대하여 예측성능에 있어 최고 1.49dB(CAR), 최저0.421dB(Mobile & Calendar)의 모의실험결과 평균 -0.7dB 정도의 미소한 평균 PSNR 저하를 나타내었다. 이의 구현을 위해 제안된 전역/후역 탐색방식의 연산처리방식은 하나의 처리기소자(Processor Element, PE)에 이중연산처리기(DAPE) 구조를 채택하여 제한된 PE로부터 넓은 탐색영역에서의 움직임 추정이 가능한 전역/후역 탐색방식(Foreground & Background Search Algorithm, FBSA)의 비트 처리열 탐색 알고리듬을 제안 적용하여 움직임추정 연산의 성능을 구조적으로 향상시키는 다중프로세서 어레이 구조(Multiple Processor Array Unit, MPAU)를 개발 제안하였다.

층상자기조립법을 이용한 나노구조체의 제조와 응용 (Preparation of Nanostructures Using Layer-by-Layer Assembly and Applications)

  • 조진한
    • 한국진공학회지
    • /
    • 제19권2호
    • /
    • pp.81-90
    • /
    • 2010
  • 층과 층 사이의 정전기적인력, 수소결합 또는 공유결합을 이용하여 층당 두께를 수 옹스트롱에서부터 수십 나노미터까지 제조할 수 있으며 박막의 표면 형태를 흡착시키고자 하는 물질 및 박막 후처리 공정을 통해 제어할 수 있으며 더 나아가, 삽입하는 물질의 특성에 따라 박막의 기능성을 집적화 및 다양화시킬 수 있다. 본 연구에서는 이러한 층상자기조립방법의 특성을 이용하여 반사방지막, 초소수성 필름 및 전기화학센서로의 응용가능성을 제시하였다. 반사방지막의 경우, 구형의 블록공중합체를 유리기판 위에 다층박막으로 적층시킴으로써 박막 굴절률을 1.25까지 감소시켰고 이를 통해 약 99.5%의 빛 투과도를 달성할 수 있었다. 더 나아가 바이오물질인 엔자임을 다층박막에 삽입시킬 경우, 활성 산소를 분해시키는 전기화학센서로의 제조가 가능함을 보인다. 본 연구는 본인이 이미 발표한 논문(J. Am. Chem. Soc. 128, 9935 (2006); Adv. Mater. 19, 4364 (2007); Electro. Mater. Lett. 3, 163 (2007))들을 정리하여 층상자기조립법에 관해 소개하는 논문이다.

블록 정합 재작업 시수 예측 시스템에 관한 연구 (A Study on the Prediction System of Block Matching Rework Time)

  • 장문석;유원선;박창규;김덕은
    • 대한조선학회논문집
    • /
    • 제55권1호
    • /
    • pp.66-74
    • /
    • 2018
  • In order to evaluate the precision degree of the blocks on the dock, the shipyards recently started to use the point cloud approaches using the 3D scanners. However, they hesitate to use it due to the limited time, cost, and elaborative effects for the post-works. Although it is somewhat traditional instead, they have still used the electro-optical wave devices which have a characteristic of having less dense point set (usually 1 point per meter) around the contact section of two blocks. This paper tried to expand the usage of point sets. Our approach can estimate the rework time to weld between the Pre-Erected(PE) Block and Erected(ER) block as well as the precision of block construction. In detail, two algorithms were applied to increase the efficiency of estimation process. The first one is K-mean clustering algorithm which is used to separate only the related contact point set from others not related with welding sections. The second one is the Concave hull algorithm which also separates the inner point of the contact section used for the delayed outfitting and stiffeners section, and constructs the concave outline of contact section as the primary objects to estimate the rework time of welding. The main purpose of this paper is that the rework cost for welding is able to be obtained easily and precisely with the defective point set. The point set on the blocks' outline are challenging to get the approximated mathematical curves, owing to the lots of orthogonal parts and lack of number of point. To solve this problems we compared the Radial based function-Multi-Layer(RBF-ML) and Akima interpolation method. Collecting the proposed methods, the paper suggested the noble point matching method for minimizing the rework time of block-welding on the dock, differently the previous approach which had paid the attention of only the degree of accuracy.

특이치 분해를 위한 최적의 2차원 멀티코어 시스템 탐색 (Exploration of an Optimal Two-Dimensional Multi-Core System for Singular Value Decomposition)

  • 박용훈;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권9호
    • /
    • pp.21-31
    • /
    • 2014
  • 특이치 분해는 다양한 분야의 데이터 집단에서 고유한 특성을 찾는 특징 추출 분야에 많이 활용되고 있다. 하지만 특이치 분해의 복잡 행렬 연산은 많은 연산 시간을 요구한다. 본 논문에서는 특이치 분해의 대표적인 알고리즘인 one-sided block Jacobi를 고속 처리하기 위해 2차원 멀티코어 시스템을 이용하여 효율적으로 병렬 구현하고 성능을 향상시킨다. 또한, one-sided block Jacobi 알고리즘의 다양한 행렬 ($128{\times}128$, $64{\times}64$, $32{\times}32$, $16{\times}16$)을 서로 다른 2차원 PE 구조에 구현하고 성능 및 에너지를 분석함으로써 각 행렬에 대한 최적의 멀티코어 구조를 탐색한다. 더불어 동일한 행렬의 one-sided block Jacobi 알고리즘에 대해 선택된 멀티코어 구조와 상용 고성능 그래픽스 프로세싱 유닛 (GPU)과의 성능 비교를 통해 제안한 2차원 멀티코어 방법의 잠재 가능성을 확인한다.