• 제목/요약/키워드: 단위 연산

검색결과 419건 처리시간 0.03초

SIMT 구조 기반 GPGPU를 이용한 고속 Rasterizer 구현 (Implememtation of Fast Rasterizer processing using GPGPU based on SIMT structure)

  • 김치용
    • 전기전자학회논문지
    • /
    • 제21권3호
    • /
    • pp.276-279
    • /
    • 2017
  • 본 논문에서는 디스플레이 장치의 화면을 픽셀 단위로 구성하는 Rasterizer의 가속화를 위하여 SIMT구조의 GPGPU(General Purpose computing on Graphics Processing Units)를 사용하였다. GPU는 많은 수의 ALU를 가지고 있고, 병렬처리하기 때문에 연산처리가 매우 빠르다. 따라서 본 논문에서는 연산을 순차적으로 수행하는 CPU와 연산을 병렬적으로 수행하는 GPU를 이용하여 3D그래픽스 모델을 생성하는 rasterizer를 구현했다. 한 프레임 생성 시 Intel CPU를 이용한 rasterizer보다 본 논문에서 제안하는 rasterizer가 1.45배 좋은 성능을 확인하였다.

몰포러지 신경망 기반 딥러닝 시스템 (Deep Learning System based on Morphological Neural Network)

  • 최종호
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권1호
    • /
    • pp.92-98
    • /
    • 2019
  • 본 논문에서는 몰포러지 연산을 기본으로 하는 몰포러지 신경망(MNN: Morphological Neural Network) 기반 딥러닝 시스템을 제안하였다. 딥러닝에 사용되는 레이어는 몰포러지 레이어, 풀링 레이어, ReLU 레이어, Fully connected 레이어 등이다. 몰포러지 레이어에서 사용되는 연산은 에로전, 다이레이션, 에지검출 등이다. 본 논문에서 새롭게 제안한 MNN은 기존의 CNN(Convolutional Neural Network)을 이용한 딥러닝 시스템과는 달리 히든 레이어의 수와 각 레이어에 적용되는 커널 수가 제한적이다. 레이어 단위 처리시간이 감소하고, VLSI 칩 설계가 용이하다는 장점이 있으므로 모바일 임베디드 시스템에 딥러닝을 다양하게 적용할 수 있다. MNN에서는 제한된 수의 커널로 에지와 형상검출 등의 연산을 수행하기 때문이다. 데이터베이스 영상을 대상으로 행한 실험을 통해 MNN의 성능 및 딥러닝 시스템으로의 활용 가능성을 확인하였다.

SIDH 기반 암호 구현에 대한 홀수 차수 아이소제니 적용 (On the Use of Odd-Degree Isogenies for Implementing SIDH-Based Cryptography)

  • 김수리;윤기순;박영호
    • 정보보호학회논문지
    • /
    • 제31권1호
    • /
    • pp.19-30
    • /
    • 2021
  • 본 논문에서는 3차, 5차 아이소제니만 이용해 SIDH를 구현할 경우 몽고메리, 에드워드, 허프 곡선 중 어느 곡선에서 더 효율적인지 분석한다. 본 논문에서는 각 타원곡선의 형태에 대해 SIDH 암호를 구성하는 단위연산에 대한 연산량을 비교한 뒤, 홀수 차수만 활용해 SIDH를 구현하기 위해 소수와 파라미터를 설정하는 방법에 관해 설명한다. 본 논문의 결과 몽고메리와 허프 곡선에서 연산량은 유사하며, 에드워드 곡선보다 0.8% 효율적임을 알 수 있다. SIDH 기반 암호에 대한 다양한 파라미터 사용 가능성으로 인해 5차 아이소제니 구현은 필수적이므로, 본 논문은 이러한 SIDH 기반 암호에 대해 어느 타원곡선을 선택해야 하는지에 대해 가이드라인을 제공할 수 있다.

CNN 의 파라미터와 정확도간 상호 강인성 연구 및 파라미터 비트 연산 자동화 프레임워크 개발 (Study the mutual robustness between parameter and accuracy in CNNs and developed an Automated Parameter Bit Operation Framework)

  • 이동인;김정헌 ;임승호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.451-452
    • /
    • 2023
  • 최근 CNN 이 다양한 산업에 확산되고 있으며, IoT 기기 및 엣지 컴퓨팅에 적합한 경량 모델에 대한 연구가 급증하고 있다. 본 논문에서는 CNN 모델의 파라미터 비트 연산을 위한 자동화 프레임워크를 제안하고, 파라미터 비트와 모델 정확도 사이의 관계를 실험 및 연구한다. 제안된 프레임워크는 하위 n- bit 를 0 으로 설정하여 정보 손실 발생시킴으로써 ImageNet 데이터셋으로 사전 학습된 CNN 모델의 파라미터와 정확도의 강인성을 비트 단위로 체계적으로 실험할 수 있다. 우리는 비트 연산을 수행한 파라미터로 InceptionV3, InceptionResnetV2, ResNet50, Xception, DenseNet121, MobileNetV1, MobileNetV2 모델의 정확도를 평가한다. 실험 결과는 성능이 낮은 모델일수록 파라미터와 정확도 간의 강인성이 높아 성능이 좋은 모델보다 정확도를 유지하는 비트 수가 적다는 것을 보여준다.

임베디드 플래시 파일 시스템을 위한 플레인 지움 정책 (A Plain Cleaning Policy for Imbedded Flash File System)

  • 이태훈;이상기;정기동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.778-780
    • /
    • 2005
  • 최근 디지털 융합(Digital Convergence)이 활발히 진행되면서 이동형 장치(Mobile Device)는 더욱 대용량, 고성능화 되고 비휘발성 메모리 요구가 커지고 있다. 이에 휴대가 용이하여, 접근시간이 빠르고, 전력소비가 적은 플래시 메모리가 많이 사용되고 있으나 상대적으로 느린 지움 시간과 지움 횟수의 한계 등 극복해야할 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위한 플레인 지움 정책을 제안하고 성능평가를 실시한다. 제안하는 플레인 지움 정책은 기존의 지움 정책과 같이 플래시의 블록단위의 균등한 사용을 고려할 뿐만 아니라 임베디드 시스템의 제한된 성능을 고려하여 연산을 최소화한다. 제안된 방법은 Greedy, Cost-benefit 방법에 비해 Wear-leveling에서 성능을 향상시켰고, RCP(Ranked Cleaning Policy)에 비해 연산횟수를 감소시켰다.

  • PDF

역 해프토닝을 위한 해프톤 셀 정보 추출방법의 개선 (An Improved Calculation Method of Halftone Cell Information for Inverse Halftoning)

  • 한영미;변지윤;김민환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.184-189
    • /
    • 2000
  • 역 해프토닝의 성능을 향상시키려면 최적의 평활화마스크가 생성되어야하고, ?거의 평활화 마스크를 생성하기 위해서는 정확한 해프톤 셀 정보가 구해져야한다. 이에 본 논문에서는 퓨리에 공간에서 가우시안 보간법에 의해 구해진 피크위치를 이용해서 해프톤 셀 정보의 초기값을 설계하고 spatial 공간에서 셀크기, 각도 및 offset을 미세조정하면서 , 반복연산 (iteration )을 통한 해프톤 셀정보 추출방법을 제안한다. 제안한 방법으로 구한 해프톤 셀 정보를 이용하면 최적의 평활화 마스크를 만들 수 있으며 , 영상의 원점에서 멀리 떨어져 오차가 많이 누적되는 부분에서도 해프톤 셀 중심(seed pixel)을 정확하게 구하는 것을 실험을 통해 확인하였다. 제안한 방법은 평활화 마스크를 만들기 위한 정보로 사용될 뿐만 아니라 , 해프톤 셀단위의 연산이나, 퓨리에 공간의 피크 정보를 이용하여 텍스쳐 패턴을 찾는 분야등에 유용하게 활용할 수 있다.

  • PDF

최종 배선을 고려한 연산 회로 합성 (Layout-Aware Synthesis of Arithmetic Circuits)

  • 엄준형;김태환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.664-666
    • /
    • 2002
  • 현대의 Deep-Sumicron Technology(DSM)에서 배선은 논리 구성 요소들보다 더욱 중요한 위치를 차지 하게 되었다. 최근에, [2]는 연산 회로를 합성하기 위해 비트 단위의 최적 지연시간의 partial product reduction tree(PPRT)를 생성하는 방법을 제시하였고, 이는 현재의 최적 지연시간을 갖는 회로를 능가한다. 그러나, [2]를 포함하는 기존의 합성방법에서는, 합성의 복잡함이나, 배선에서 발생하는 여러가지 예상치 못하는 문제등으로 인하여 최종 배선을 고려하지 못하는 회로를 생성하며, 이는 길고 복잡하며, 특정한 부분에 밀집 되어 있는 배선을 형성하는 결과를 낳게 된다. 이러한 제한점을 극복하기 위하여, 우리는 carry-save-adder(CSA)를 이용한 새로운 모듈 함성 알고리즘을 제시한다. 이는 단지 상위 단계에서의 회로의 지연시간만을 고려한 알고리즘이 아니라, 이후의 배선을 고려하여 최종 배선에서 규칙적인 배선 토폴로지를 생성한다.

  • PDF

홀로그래픽 시스템을 위한 고성능 홀로그램 생성기의 설계 및 FPGA 구현 (Design and FPGA Implementation of High-performance Hologram Generator for Holographic System)

  • 이윤혁;서영호;김동욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 추계학술대회
    • /
    • pp.50-51
    • /
    • 2012
  • 본 논문에서는 기존의 홀로그램 행(열)단위 병렬 연산 방식의 고성능 홀로그램 생성기의 하드웨어 자원 량을 효율적으로 사용하기 위해 공통항을 늘려 자원 량을 줄일 수 있는 구조를 제안한다. 하나의 2D 블록의 행과 열에 해당하는 좌표 항을 연산 후 좌표 항을 이용하여 각 블록의 화소 값을 계산한다. 이전 연구에서의 메모리 접근 량을 줄일 뿐만 아니라 이전 연구에 비하여 조합회로는 45% DSP 블록은 90% 감소하여 하드웨어 자원을 효율적으로 사용할 수 있다.

  • PDF

위치 기반 질의를 지원하기 위한 셀 레벨링 공간 색인 기법 (Cell Leveling Spatial Indexing Technique to Support Location Based Query)

  • 정연욱;김유성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.127-129
    • /
    • 2003
  • 최근 GPS기능을 탑재한 휴대폰ㆍPDA등의 모바일 장치를 사용하여 위치 기반 서비스 (LBS : Location Based Service)를 이용하는 사용자가 급증하고 있다. 이에 대용량의 공간 데이터베이스에 대해 효율적 검색을 가능하게 하기 위한 색인이 필요하다. 공간 데이터베이스를 위한 다차원 공간 색인 기법으로는 R-Tree가 널리 사용되고 있다. 기존의 R-Tree를 이용한 검색은 질의 영역과 관계없는 공간 데이터까지 검색하는 고비용의 연산이 요구되며, 사용자의 질의 위치 단위(Granularity)를 고려하지 않아 사용자의 빠른 검색 응답시간 및 질의 영역에 대한 정확한 공간 객체 검색에 대해 충족하지 못한다. 이에 본 논문에서는 임의의 셀 안에 존재하는 공간 데이터가 자신이 속한 노드의 전체 MBR(Union MBR)영역과 셀 영역에 따라 셀 레벨 값을 구성하는 CLR-Tree(Cell Leveling R-Tree)를 제안한다. CLR-Tree를 사용할 경우 사용자의 질의 영역 셀 레벨 값과 데이터베이스에 저장된 공간 데이터의 셀 레벨 값을 비교한 뒤 겹침 연산 대상이 되는 공간 객체 수를 줄임으로써 검색 시간을 향상시킬 수 있다.

  • PDF

낸드 플래시 메모리 기반 멀티미디어 파일 시스템에서의 효율적인 페이지 할당 및 회수 기법 (An Efficient Page Allocation and Garbage Collection Scheme for a NAND Flash Memory-based Multimedia File Systems)

  • 한준영;김성조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (B)
    • /
    • pp.289-293
    • /
    • 2007
  • 낸드 플래시 메모리는 특성상 덮어 쓰기가 불가능하기 때문에 유효하지 않는 데이터가 저장된 더티(Dirty) 상태의 페이지를 삭제 연산을 통해 클린(Clean) 상태로 만든 후 데이터를 써야 한다. 더티 페이지가 낸드 플래시 메모리에 많이 존재하면 파일을 쓸 때 많은 블록을 삭제해야 하기 때문에 쓰기 지연 시간이 길어지는 문제가 발생한다. 따라서 본 논문에서는 일정한 쓰기 지연 시간을 보장하는 새로운 페이지 할당 및 회수 기법을 제안한다. 파일이 삭제될 때 더티 상태인 페이지를 삭제함으로써 클린 상태로 변경하여 낸드 플래시 메모리에 쓰기 지연 시간을 길게 만드는 더티 페이지가 없는 상태로 유지한다. 또한 삭제 연산은 블록 단위로 수행되므로 삭제할 블록의 유효한 페이지를 다른 블록으로 복사해야 하기 때문에, 페이지를 할당할 때 한 블록에 가급적 적은 개수의 파일을 저장하는 알고리즘을 제시한다.

  • PDF