• 제목/요약/키워드: 곱셈 연산

검색결과 550건 처리시간 0.03초

경량화된 딥러닝 구조를 이용한 실시간 초고해상도 영상 생성 기술 (Deep Learning-based Real-Time Super-Resolution Architecture Design)

  • 안세현;강석주
    • 방송공학회논문지
    • /
    • 제26권2호
    • /
    • pp.167-174
    • /
    • 2021
  • 초고해상도 변환 문제에서 최근 딥러닝을 사용하면서 큰 성능 개선을 얻고 있다. 빠른 초고해상도 합성곱 신경망 (FSRCNN)은 딥러닝 기반 초고해상도 알고리즘으로 잘 알려져 있으며, 여러 개의 합성곱 층로 추출한 저 해상도의 입력 특징을 활용하여 역합성곱 층에서 초고해상도의 영상을 출력하는 알고리즘이다. 본 논문에서는 병렬 연산 효율성을 고려한 FPGA 기반 합성곱 신경망 가속기를 제안한다. 특히 역합성곱 층을 합성곱 층으로 변환하는 방법을 통해서 에너지 효율적인 가속기를 설계했다. 또한 제안한 방법은 FPGA 리소스를 고려하여 FSRCNN의 구조를 변형한 Optimal-FSRCNN을 제안한다. 사용하는 곱셈기의 개수를 FSRCNN 대비 3.47배 압축하였고, 초고해상도 변환 성능을 평가하는 지표인 PSNR은 FSRCNN과 비슷한 성능을 내고 있다. 이를 통해서 FPGA에 최적화된 네트워크를 구현하여 FHD 입력 영상을 UHD 영상으로 출력하는 실시간 영상처리 기술을 개발했다.

에너지 효율적인 FPGA 가속기 설계를 위한 하드웨어 및 소프트웨어 공동 설계 플랫폼 (Hardware and Software Co-Design Platform for Energy-Efficient FPGA Accelerator Design)

  • 이동규;박대진
    • 한국정보통신학회논문지
    • /
    • 제25권1호
    • /
    • pp.20-26
    • /
    • 2021
  • 오늘날의 시스템들은 더 빠른 실행 속도와 더 적은 전력 소모를 위해 하드웨어와 소프트웨어 요소를 함께 포함하고 있다. 기존 하드웨어 및 소프트웨어 공동 설계에서 소프트웨어와 하드웨어의 비율은 설계자의 경험적 지식에 의해 나뉘었다. 설계자들은 반복적으로 가속기와 응용 프로그램을 재구성하고 시뮬레이션하며 최적의 결과를 찾는다. 설계를 변경하며 반복적으로 시뮬레이션하는 것은 시간이 많이 소모되는 일이다. 본 논문에서는 에너지 효율적인 FPGA 가속기 설계를 위한 하드웨어 및 소프트웨어 공동 설계 플랫폼을 제안한다. 제안하는 플랫폼은 가속기를 구성하는 주요 성분을 변수화해 응용 프로그램 코드와 하드웨어 코드를 자동으로 생성하여 설계자가 적절한 하드웨어 비율을 쉽게 찾을 수 있도록 한다. 공동 설계 플랫폼은 Xilinx Alveo U200 FPGA가 탑재된 서버에서 Vitis 플랫폼을 기반으로 동작한다. 공동 설계 플랫폼을 통해 1000개의 행을 가지는 두 행렬의 곱셈 연산 가속기를 최적화한 결과 응용프로그램보다 실행 시간이 90.7%, 전력 소모가 56.3% 감소하였다.

PQC 표준화 알고리즘 CRYSTALS-KYBER에 대한 비프로파일링 분석 공격 및 대응 방안 (Non-Profiling Analysis Attacks on PQC Standardization Algorithm CRYSTALS-KYBER and Countermeasures)

  • 장세창;하재철
    • 정보보호학회논문지
    • /
    • 제32권6호
    • /
    • pp.1045-1057
    • /
    • 2022
  • 최근 양자 내성 암호 표준화 사업을 진행 중인 미국의 국립표준기술연구소는 표준화가 확정된 4개의 알고리즘을 발표하였다. 본 논문에서는 PKE/KEM 분야에서 표준화가 확정된 CRYSTALS-KYBER 알고리즘의 복호화 과정 중 비프로파일링 기반 전력 분석 공격인 CPA(Correlation Power Analysis)와 DDLA(Differential Deep Learning Analysis)에 의해 개인 키가 노출될 수 있음을 보이고자 한다. 실험 결과 개인 키의 일차 다항식 계수복구에 성공하였으며, 특히 DDLA에서는 중간 값의 해밍 웨이트(Hamming Weight)를 라벨로 사용하는 모델에서 평가 기법인 NMM(Normalized Maximum Margin)의 값이 13.0으로 가장 높은 값을 가져 개인 키를 복구할 수 있는 것을 확인하였다. 또한, 복호화 과정 중 암호문을 랜덤하게 분할하고 계수별 곱셈 연산의 시작 지점을 랜덤화하는 방어 기법을 적용하면 상기한 공격을 방어하는 것을 확인하였다.

모돈 섭식 분석을 위한 ADC 샘플링 시분할 방법 연구 (A Study about Time-sharing Method in ADC Sampling for Analysis of Breeding Pig's Feeding)

  • 조진호;오종우;조용진;이동훈
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.164-164
    • /
    • 2017
  • 스마트 돈사 환경의 복지 및 생산성 향상을 위하여 정량 분석법을 기반으로 한 모돈 관리의 중요성이 증가하고 있다. 모돈은 교배, 임신, 분만, 포유, 이유를 순환적 반복하여 이루어지는데 모돈의 관리는 돈사 농장의 생산성 및 경제성과 직결된다. 모돈 관리에 필요한 환경 및 계측정보를 획득하고 이 정보로부터 모돈의 개체관리를 극대화시키고 최적의 방안을 찾고자 지속적으로 계측이 가능한 모돈의 돈사 모니터링 시스템이 필요하다. 모돈의 행동특성 계측이 가능한 시스템이 필요한 이유는 모돈의 행동 특성(섭식 및 지제불량 등)에 상응하는 대사 불량, 질병 및 발정 징후 등을 조기에 발견할 수 있기 때문이다. 돈사 내에서 정지 상태로 판별이 되는 모돈의 지제상태(기립상태, 누운 상태, 앉은 상태)와 다르게 연속적인 움직임으로부터 판별되는 모돈의 섭식상태를 분석하기 위해서는 계측 시스템과 이를 분석해주는 시스템간의 시간적 차이를 최소화 할 수 있는 실시간 신호 처리 기술이 필수적이다. 모돈의 섭식을 정량적으로 지수화하기 위한 센서의 최소 SPS(sample per second)는 600 Hz($100Hz{\times}6$개)로서 최소 6개 ADC 채널과 최소 1,200 Hz 이상으로 샘플링 할 수 있는 마이크로 컨트롤러가 필요하다. 또한 16 비트의 분해능으로 1분 동안 연속 계측을 수행할 경우 필요한 정보량은 153,600 KByte ($1,200sample/s{\times}16bit/sample{\times}8Byte/bit$)으로 실시간 처리를 수행하기에 매우 큰 정보량이라 판단할 수 있다. 수행하고자 하는 정보처리 기법에 따라 다소 상이할 수 있으나, 1분을 주기로 모돈의 섭식 분석을 수행하고자 할 경우 최도 150 MByte의 정보량을 처리하기 위한 최소의 클럭수는 단순 대입의 경우 2.5 Mhz (clock/second) ($=1clock/Byte{\times}150MByte/60seconds$) 이며 덧셈(4 clock)의 경우 10 Mhz, 곱셈(16 clock)의 경우 40 Mhz의 클럭이 필요하다. 또한 정보의 저장 및 도시를 위해 필요한 부가적인 회로(LCD, SD메모리) 구동을 위해 필요한 클럭을 고려할 경우 추가적인 클럭이 필요하다. 이를 종합적으로 고려하여 120 Mhz ($= 40Mhz{\times}3$) 이상의 클럭이 필요하다고 판단할 수 있다. 또한 센서 계측 주기의 시간 분해능을 균등하게 유지하기 위해선 계측->도시->저장의 과정을 교차적으로 수행해야 한다. 이러한 과정을 거처 최종적으로 선정한 마이크로 프로세서는 ARM Cortex-M4이며 168 MHz로 연산 수행이 가능하여 목표하고자 하는 신호처리를 수행 할 수 있다. 현장 예비 실험을 통해 기대 성능을 만족하였으며, 시간 복잡도가 높은 연산을 대비하여 최적 시분할 스케쥴링 기법에 대한 보완이 필요하다고 판단되었다.

  • PDF

우리나라 초등학교 1~2학년 수학 교과서/익힘책에서의 용어 사용 실태 분석: <수와 연산> 영역에서의 '곱', '자릿값', '구구', '숫자'를 중심으로 (An Analysis on Real State of Using Terms in Grade 1~2 Math Textbook/Workbook in Korea: Centered on 'Product', 'Place Value', 'Multiplication Stairs', 'Numeral')

  • 박교식
    • 대한수학교육학회지:학교수학
    • /
    • 제15권4호
    • /
    • pp.833-846
    • /
    • 2013
  • 본 논문에서는 우리나라 초등학교 1~2학년 수학 교과서/익힘책 <수와 연산> 영역에서 '곱', '자릿값', '구구', '숫자'라는 용어를 잘못 사용하거나 또는 비일관적으로 사용하고 있는 실태를 분석하고 있다. 이러한 분석을 바탕으로 다음 네 가지를 결론으로 제시한다. 첫째, ${\ll}$수학 3${\gg}$ 교과서에서 '곱'을 정의해야 한다. ${\ll}$수학 3${\gg}$ 교과서/익힘책에서 곱셈을 도입하지만, 그 계산 결과를 '곱'이라 하고 있지는 않다. 둘째, 초등학교 2학년 수학에서 '자릿값'이라는 용어의 사용을 재고할 필요가 있다. ${\ll}$수학 3${\gg}$${\ll}$수학 4${\gg}$ 교과서/익힘책에서 사용하는 '자릿값'이라는 용어의 의미는 명료하지 않다. 셋째, ${\ll}$수학 2${\gg}$${\ll}$수학 4${\gg}$ 교과서에서 '덧셈구구표'와 '뺄셈구구표'라는 표현을 사용하지 말아야한다. 넷째, 초등학교 1, 2학년 수학에서 '숫자'의 사용을 최소화하고, 가급적 '수'로 통일해서 사용하는 것을 고려할 필요가 있다.

  • PDF

수 연산과정에서 ERP로 확인된 숫자어휘와 부호변환 과정 (Words for Numbers and Transcoding Processes Reflected by ERPs during Mental Arithmetic)

  • 김충명;김동휘
    • 한국산학기술학회논문지
    • /
    • 제11권2호
    • /
    • pp.689-695
    • /
    • 2010
  • 한글 숫자어휘의 부호변환 과정을 알아 봄에 있어, 수연산이 시행되는 동안 주어진 목표자극들 간의 연산결과가 일치하는지에 대한 과제를 ERP 실험방법에 의거 시행하였다. 평균진폭에 대한 실험 결과는 과제-의존적인 처리가 아닌 자극유형-의존적인 처리과정을 보여주었는데, 덧셈 및 곱셈과제에서의 한글 숫자어휘의 시간적인 뇌파개형은 아라비아 숫자에 대한 그것과 유사하게 나타났다. 이 처리과정에서의 유의미한 차이점은 300ms 부근에서 나타난 지연된 양성파형의 성분으로서, 이는 한글 숫자어휘의 아라비아 숫자로의 부호변환 과정으로 해석가능하다. 이 과정에 수반된 뇌영상을 분석한 결과, 두 조건에서 서로 다른 파형을 야기한 영역은 한글문자 처리에 관여하는 좌측 측두-두정영역으로 확인되었다. 이와 같은 결과는 수연산 과정의 개개 자극인 한글 숫자어휘의 내재적 수표상 방식이, 수개념으로의 직접적 접근이 아니라 일정한 부호변환 과정을 통한 도식화된 통로를 거치고 있음을 시사한다 할 수 있다.

학습과 시험과정 일체형 신경회로망의 하드웨어 구현 (The Implementation of Digital Neural Network with identical Learning and Testing Phase)

  • 박인정;이천우
    • 전자공학회논문지C
    • /
    • 제36C권4호
    • /
    • pp.78-86
    • /
    • 1999
  • 신경회로망은 학습 시에는 입력패턴이 변하지 않고 조정된 결합계수 값을 레지스터에 저장시키며, 시험시에는 반대로 결합계수가 고정되고, 레지스터에 입력패턴을 기억시킴으로써 학습과 시험 뉴런회로를 공유할 수 있는 특성을 가지고 있다. 본 연구에서는 신경회로망의 이러한 특성을 고찰하여, 신경회로망 구현시 게이트의 수를 줄일 수 있으며, 학습(learning) 및 시험(testing)시의 연산처리 시간을 단축시키기 위하여 곱셈연산 대신 어드레싱 LUT를 사용하여 학습과 시험이 동일한 신경회로망에서 수행할 수 있는 일체형 디지털 신경회로망 구현을 제안하였다. 제안한 신경회로망의 동작을 검증하기 위하여 수정된 오차역전파 학습 알고리듬에 의한 학습과정을 소프트웨어와 VHDL로 시뮬레이션 하였다. 7-segment 인식기 학습을 비교 검토한 결과, 입력패턴에 따라 다소 학습시간 및 학습횟수의 차이는 있지만 대체로 반복회수는 1000∼10000회 정도로 학습시간은 4∼20㎲로 나타났다. 신경회로망의 동작이 소프트웨어 시뮬레이션 학습 진행 상황과 동일하게 학습됨을 알 수 있었고 구현한 신경회로망이 정상적으로 수행됨을 확인하였으며, 또한 초기치 변화에 대한 실험에서도 초기치의 변화에 구애받지 않고 원활하게 학습되었다. 또한 본논문에서 구현된 신경회로망은 기존의 보드형 신경회로망보다 적은 수의 소자로 구현됨을 보였다.

  • PDF

학교수학에서의 대수적 구조 지도에 대한 소고 (A study on the teaching of algebraic structures in school algebra)

  • 김성준
    • 한국학교수학회논문집
    • /
    • 제8권3호
    • /
    • pp.367-382
    • /
    • 2005
  • 본 연구는 학교수학에서 대수적 구조(군)의 지도에 관한 논의를 담고 있다. 이를 위해 먼저 Bruner가 제시한 지식의 구조에 대해 논의하고, 그 내용을 학교대수의 지도와 관련지어 살펴본다. 또한 대수적 구조 가운데 군 개념을 중심으로 하여 이와 관련된 선행연구를 Piaget, Freudenthal, Dubinsky, Burn 등의 논의에서 검토해본다. 그리고 초등수학에서부터 고등학교 수학까지 군 개념과 관련된 내용이 어떻게 표현되고 있는지를 살펴본다. 학교수학에서 군 개념과 관련된 내용은 초등수학에서부터 시작되는데, 초등수학의 경우 항등원, 교환법칙, 결합법칙 등을 수의 맥락에서 찾아볼 수 있다. 중학교 수학에서는 덧셈과 곱셈 연산에 있어서 항등원, 역원, 교환법칙, 결합법칙이 보다 구체적으로 제시되고 있으며, 이러한 규칙은 등식의 성질과 이항, 일차방정식의 풀이 등을 통해 살펴볼 수 있다. 고등학교 수학에서는 이항연산을 비롯한 여러 영역에서 군 개념을 포함하는 대수적 구조가 제시되고 있다. 이에 비해 학교대수에서는 이러한 주제들을 통합적으로 구성하려는 시도가 이루어지지 않고 있으며 각각의 내용이 독립적으로 다루어지고 있다. 본 연구에서는 학교대수에서 군 개념과 관련된 내용들을 검토함으로써 대수적구조(군) 측면에서 이러한 내용들을 종합해보고자 한다.

  • PDF

무손실 의료 영상 압축을 위한 적응적 심볼 교환에 기반을 둔 이진 적응 산술 부호화 방법 (A binary adaptive arithmetic coding algorithm based on adaptive symbol changes for lossless medical image compression)

  • 지창우;박성한
    • 한국통신학회논문지
    • /
    • 제22권12호
    • /
    • pp.2714-2726
    • /
    • 1997
  • 본 논문은 디지탈 의료 영상을 효과적으로 무손실 압축하기 위한 적용적 심볼 교환에 기반을 둔 새로운 부호화 방법을 제안한다. 제안하는 알고리즘은 먼저 원영상에 차분 규칙 또는 적용 예측기를 적용하여 차분 영상값을 구하며, 이러한 차분 영상값에 대한 개별 context를 결정한다. 다음 단계에서 context하에서 현재 부호화될 차분 영상값과 모델 템플리트상의 차분 영상값들 사이의 극성 일치를 갖는 심볼의 추정을 기반으로 한 적응적인 심볼 교환 과정을 적용하여 예측 심볼을 얻는다. 예측 심볼은 부호화 될 차분 영상값에 대해 가장 빈번하게 발생하리라고 예측되는 심볼을 가리키며, 예측 심볼이 차분 영상값과 동일할 때 부호화 효율이 높게 유지된다. 마지막 부호화 단계에서 이진 적응 산술 부호기는 특정 context가 주어진 차분 영상값의 예측 여부를 판단하는 이진 판단 트리를 사용하여 차분 영상값을 부호화 한다. 차분 영상값 예측 적중율 향상을 통하여 제안된 알고리즘의 부호화 효율은 ISO JPEG 무손실 예측기를 산술 부호기에 적용한 경우보다 약 33% 정도 높아지고, 차분 예측기 또는 적용 예측기를 산술 부호기에 적용한 경우에 비해 약 23% 정도 높아짐을 알 수 있다. 제안된 부호화 방법은 단위 구간 부분할시 곱셈 연산이 아닌 덧셈 연산을 사용하기 때문에 부호기의 복잡성이 낮고 다중 비트 공간의 영상을 이진 공간 열로 분할하지 않고 바로 다중 비트 의료 영상을 부호기에 적용 할 수 있기 때문에 의료 PACS의 영상 압축부에서 사용될 수 있다.

  • PDF

양방향 예측 모드를 위한 저복잡도 LIC 방법 연구 (Low-complexity Local Illuminance Compensation for Bi-prediction mode)

  • 최한솔;변주형;방건;심동규
    • 방송공학회논문지
    • /
    • 제24권3호
    • /
    • pp.463-471
    • /
    • 2019
  • 본 논문에서는 양방향 화면 간 예측에서 LIC(Local Illuminance Compensation)의 복잡도 감소를 위한 방법을 제안한다. LIC는 화면 간 예측의 정확도를 높이기 위해 현재 블록과 참조블록의 주변 복원샘플을 이용하여 지역 조명 보상을 수행한다. 지역 조명 보상을 위해 필요한 가중치와 오프셋을 주변 복원 샘플을 이용하여 부/복호화기 양측에서 계산하기 때문에 별도의 정보 전송 없이 부호화 효율이 향상되는 장점이 있지만 부호화 예측 단계 및 복호화 단계에서 가중치와 오프셋을 구하기 때문에 부/복호화 복잡도가 높아지는 단점을 가지게 된다. 따라서 본 논문에서는 저 복잡도 LIC를 위해 크게 두 가지 방법을 제안한다. 첫 번째 방법은 양방향 예측 시 가중치 없이 오프셋만으로 조명보상을 적용하는 방법이고, 두 번째는 양방향 예측에서 LIC를 양방향예측을 통해 구해진 참조 블록의 가중 평균 단계 이후 적용하는 방법이다. 제안하는 방법의 성능 평가를 위하여 RA(Random Access) 조건에서 MPEG 표준 실험 영상의 B, C, D 클래스를 이용하여 BMS-2.0.1과 BD-rate 성능을 비교한다. 실험결과로서 본 논문에서 제안하는 방법이 BMS-2.0.1 대비 BD-rate 성능 관점에서 Y, U, V 각각에 대하여 평균 0.29%, 0.23%, 0.04%의 BD-rate 결과를 보이고 부/복호화 시간은 거의 동일하다. BD-rate의 손실이 있었지만, LIC 파라미터 유도과정에서 곱셈 연산이 제거되고 덧셈 연산이 절반으로 감소됨에 따라 LIC의 계산 복잡도가 크게 감소되었다.