• Title/Summary/Keyword: 차연산

Search Result 539, Processing Time 0.176 seconds

On the Use of Odd-Degree Isogenies for Implementing SIDH-Based Cryptography (SIDH 기반 암호 구현에 대한 홀수 차수 아이소제니 적용)

  • Kim, Suhri;Yoon, Kisoon;Park, Young-Ho
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.31 no.1
    • /
    • pp.19-30
    • /
    • 2021
  • In this paper, when SIDH is instantiated using only 3- and 5-isogeny, we demonstrate which curve is more efficient among the Montgomery, Edwards, and Huff curves. To this end, we present the computational cost of the building blocks of SIDH on Montgomery, Edwards, and Huff curves. We also present the prime we used and parameter settings for implementation. The result of our work shows that the performance of SIDH on Montgomery and Huff curves is almost the same and they are 0.8% faster than Edwards curves. With the possibility of using isogeny of degree other than 3 and 4, the performance of 5-isogeny became even more essential. In this regard, this paper can provide guidelines on the selection of the form of elliptic curves for implementation.

CUDA programming environment을 활용한 Path-Integral Monte Carlo Simulation의 구현

  • Lee, Hwa-Young;Im, Eun-Jin
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2009.05a
    • /
    • pp.196-199
    • /
    • 2009
  • 높아지는 Graphic Processing Unit (GPU)의 연산 성능과 GPU에서의 범용 프로그래밍을 위한 개발 환경의 개발, 보급으로 인해 GPU를 일반연산에 활용하는 연구가 활발히 진행되고 있다. 이와같이 일반 연산에 활용되고 있는 GPU로 nVidia Tesla와 AMD/ATI의 FireStream 들이 있다. 특수목적 연산 장치인 GPU를 일반 연산을 위해 프로그래밍하기 위해서는 그에 맞는 프로그램 개발 환경이 필요한데 nVidia에서 개발한 CUDA (Compute Unified Device Architecture) 환경은 자사의 GPU 프로그램 개발을 위해 제공되는 개발 환경이다. CUDA 개발 환경은 nVidia GPU 프로그래밍 뿐만 아니라 차세대 이종 병렬 프로그램 개발 환경의 공개 표준으로 논의되고 있는 OpenCL (Open Computing Language) 와 유사한 특징을 보일 것으로 예상되기 때문에 그 중요성은 특정 GPU 에만 국한되지 않는다. 본 논문에서는 경로 적분 몬테 카를로 (Path Integral Monte Carlo) 방법을 CUDA 개발 환경을 사용하여 nVidia GPU 상에서 병렬화한 결과를 제시하였다.

  • PDF

A Problem Study of Arithmetic Section Contents in Computer Architecture Textbooks of the Technical High School (공업 계열 고등학교 컴퓨터 구조 교과서의 연산 장치 영역 내용의 문제점 분석)

  • Lee, Sangwook;Suh, Taeweon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1739-1741
    • /
    • 2012
  • 국가 교육과정에서 컴퓨터 하드웨어만을 교과 내용으로 하는 최초의 과목은 4차 교육과정 시기 중공업 계열 고등학교에 신설된 '전자 계산기 구조' 과목으로 현재의 '컴퓨터 구조' 과목에 해당된다. 컴퓨터 구조 과목의 교과 목표는 학습자가 컴퓨터의 구조와 동작 원리를 바르게 이해하고 컴퓨터를 효율적으로 활용할 수 있도록 하는데 있다. 교과 목표를 위해서는 교과서의 내용이 정확해야 하고 현재의 컴퓨터 구조를 바르게 반영하고 있어야 한다. 본 연구에서는 공업 계열 고등학교의 컴퓨터 구조 과목에 제시된 연산 장치 영역 내용의 문제점을 컴퓨터 구조 전문 서적과의 비교를 통해 파악해 보고자 하였다. 연구 결과, 교과서의 연산 장치 영역에는 정확성과 일관성이 결여된 개념 정의와 현재의 CPU 구조를 반영하지 못한 내용이 포함되어 있었다. ALU와 연산 장치에 대한 설명이 교과서별 상이하였고, 연산 장치의 구성 요소들은 현재 사용되고 있는 CPU 구조를 바르게 나타내고 있지 않았다. 이러한 문제점들은 컴퓨터 과학의 역사적, 기술적 고찰을 통해 개선될 필요가 있다.

Implementation of MPEG4-CELP Vocoder for Speech Codec of Internet Video Phone (인터넷 화상 전화용 음성 코텍을 위한 MPEG4-CELP 부호화기의 구현)

  • 김병수;김동형;강경옥;홍진우;정재호
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.119-122
    • /
    • 2000
  • 인터넷이 일상생활에 다양하게 활용되면서 인터넷 채널을 통한 정보의 형태는 문자와 이미지 외에 음성, 오디오 신호 및 동영상 부분까지 확대되고 있다. 본 논문에서는 MPEG4-CELP를 인터넷 화상 통신의 음성 코덱용으로 사용하기 위한 최적화 기법 및 알고리듬의 개선을, DSP칩이 내장된 보드가 아닌 인터넷의 터미널로 사용되고 있는 펜티엄 프로세서를 장착한 PC에 초점을 맞추어 수행하였다. MPEG4-CELP VM C소스를 분석 및 프로파일(Profile)한 결과를 토대로 패라미터 추출을 위해 많은 연산을 수행하는 부호화기에 대해서 CPU상에 부하를 많이 주는 함수들을 제 1차 최적화 대상 함수들로 선정하고, CPU에 부하를 많이 주지는 않으나 호출되는 회수가 많은 함수를 2차 최적화 대상 함수로 선정해, C소스 레벨의 소프트웨어 파이프 라이닝(Software Pipelinging) 기법들을 적용하여 최적화를 수행하였다. 또한 1차 최적화 대상 함수의 경우에는 소프트웨어 파이프라이닝의 적용과 함께 연산량 감소를 위한 알고리듬 변형까지 수행하였다. 위의 과정을 거쳐 최적화 된 MPEG4-CELP는 펜티엄Ⅲ 450㎒ PC에서 음성을 부호화 하는데 원 VM소스에 비해 약 2배정도의 시간이 단축되는 것을 확인하였다.

  • PDF

Solution of the boundary value problem for the second order ordinary differential equations by a fuzzy system (2계 선형상미방 경계치문제의 퍼지시스템 해법)

  • 문병수;정종은;황인구;김정수
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.05a
    • /
    • pp.289-292
    • /
    • 2002
  • 2계 선형 상미분방정식의 경계치 문제는 보통 해를 구하고자 하는 구간의 양 끝점에서 도함수의 값을 임의로 선정한 후 각 점에서 초기치 문제의 해를 구한 다음 적절한 1차 결합을 이용하여 구하게 된다. 이 경우 초기값과 도함수 값을 사용한 반복연산이 수반되며 따라서 오차의 누적이 불가피 하게 된다. 이 논문에서는 이같은 오차의 누적을 피할 뿐 아니라 3차 Spline 함수를 사용함으로써 오차가 O( $h^2$)인 해를 구하는 방법에 대하여 기술한다 두 개의 경계조건과 근사값을 구하고자 하는 점에서의 함수 값을 "If x is $B_{i}$, then f is $C_{i}$"와 같은 Fuzzy Rule들로 변형하고 주어진 미분방정식을 상수 $C_{i}$들의 관계식으로 변형하여 해를 구하였다. 산출된 결과로부터의 보간 연산은 Fuzzy System사용에 의하여 대체되었다. 이상의 방법으로 산출한 해의 근사오차가 O( $h^2$).임을 증명하였으며 3개의 예제에 대한 계산결과를 4계 Runge-Kutta 방법에 의한 해와 비교하여 기술하였다였다였다였다

  • PDF

Design and Simulation of a Second Order Sigma-Delta Modulator with 14-bit Resolution (14 비트 분해능을 갖는 2차 Sigma-Delta 변조기 설계 및 검증)

  • Cho, Byung-Woog;Choi, Pyung;Sohn, Byung-Ki
    • Journal of the Korean Institute of Telematics and Electronics S
    • /
    • v.36S no.5
    • /
    • pp.122-131
    • /
    • 1999
  • 저주파의 아날로그 신호를 디지털 신호로 변환하기 위해 sigma-delta 아날로그-디지털 변환기의 이용이 용이하다. 이 변환기는 변조기와 디지털 필터로 구성되는데 본 논문에서는 변조기에 대해서만 언급한다. 모델링을 통해 14비트 분해능을 갖는 2차 sigma-delta 변조기를 설계하기 위한 변조기의 구성요소 즉 연산 증폭기, 적분기, 내부 ADC 및 DAC의 최대 허용 에러 범위를 규정하였으며, 이를 토대로 연산증폭기, 2비트 ADC 및 DAC 등을 설계·검증하고, 이들을 서로 연결하여 2차 sigma-delta 변조기를 구성하였다. 3비트 ADC의 기준전압을 조절하여 변조기 성능 향상을 도모하였으며, 내부 DAC를 축전기 및 간단한 제어회로로 구성하여 비선형성 에러를 최소화하였다. 설계된 각각의 구성요소들은 모델링에서 정의된 에러 범위를 모두 만족하였으며, 전체 변조기는87㏈의 입력범위와 87㏈의 최대 신호 대 잡음 비를 가졌다.

  • PDF

Human/Vehicle Classification using Hilbert Scan Distance (할버트 스캔 거리값을 이용한 사람/차 식별 알고리즘)

  • Baek, Young-Min;Choi, Jeong-Hwan;Choi, Jin-Young
    • Proceedings of the KIEE Conference
    • /
    • 2007.10a
    • /
    • pp.455-456
    • /
    • 2007
  • 물체 식별은 감시 시스템에서 중요한 역할을 수행한다. 특히 사람/차 식별은 해당 사물의 존재 유무를 파악하기 위해 다양한 어플리케이션에서 사용된다. 우리는 외곽선 정보를 이용하여 빠르게 물체 식별을 할 수 있는 알고리즘을 제안한다. 감시 영상에서 움직이는 물체를 찾은 후, 외곽선 정보를 추출하여 미리 저장해 둔 사물의 모델과 비교하여 가장 가까운 거리값(유사도)을 찾는 방식이다. 2차원의 영상 처리에는 기본적으로 많은 연산량이 필요하지만, 주변 픽셀 정보를 최대한 유지할 수 있는 할버트 패스(Hilbert Path)를 사용하여 1차원의 배열로 변환한 후 비교하기 때문에 기존 알고리즘보다 빠르게 두 모델간의 유사도를 측정할 수 있다. 제안된 알고리즘은 사람/차 식별에 매우 강인한 성능을 보여주었으며, 기존 템플릿 매칭 기법보다 연산량의 감소로 실시간 감시 시스템에서 사용할 수 있을 것으로 기대된다.

  • PDF

Hardware Design of Pipelined Special Function Arithmetic Unit for Mobile Graphics Application (모바일 그래픽 응용을 위한 파이프라인 구조 특수 목적 연산회로의 하드웨어 설계)

  • Choi, Byeong-Yoon
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.17 no.8
    • /
    • pp.1891-1898
    • /
    • 2013
  • To efficiently execute 3D graphic APIs, such as OpenGL and Direct3D, special purpose arithmetic unit(SFU) which supports floating-point sine, cosine, reciprocal, inverse square root, base-two exponential, and logarithmic operations is designed. The SFU uses second order minimax approximation method and lookup table method to satisfy both error less than 2 ulp(unit in the last place) and high speed operation. The designed circuit has about 2.3-ns delay time under 65nm CMOS standard cell library and consists of about 23,300 gates. Due to its maximum performance of 400 MFLOPS and high accuracy, it can be efficiently applicable to mobile 3D graphics application.

VLSI Architecture of Digital Image Scaler Combining Linear Interpolation and Cubic Convolution Interpolation (선형 보간법과 3차회선 보간법을 결합한 디지털 영상 스케일러의 VLSI 구조)

  • Moon, Hae Min;Pan, Sung Bum
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.51 no.3
    • /
    • pp.112-118
    • /
    • 2014
  • As higher quality of image is required for digital image scaling, longer processing time is required. Therefore the technology that can make higher quality image quickly is needed. We propose the double linear-cubic convolution interpolation which creates the high quality image with low complexity and hardware resources. The proposed interpolation methods which are made up of four one-dimensional linear interpolations and one one-dimensional cubic convolution perform linear-cubic convolution interpolation in horizontal and vertical direction. When compared in aspects of peak signal-to-noise ratio(PSNR), performance time and amount of hardware resources, the proposed interpolation provided better PSNR, low complexity and less hardware resources than bicubic convolution interpolation.