• 제목/요약/키워드: 64bit

검색결과 391건 처리시간 0.023초

BioFET 시뮬레이션을 위한 CUDA 기반 병렬 Bi-CG 행렬 해법 (CUDA-based Parallel Bi-Conjugate Gradient Matrix Solver for BioFET Simulation)

  • 박태정;우준명;김창헌
    • 전자공학회논문지CI
    • /
    • 제48권1호
    • /
    • pp.90-100
    • /
    • 2011
  • 본 연구에서는 연산 부하가 매우 큰 Bio-FET 시뮬레이션을 위해 낮은 비용으로 대규모 병렬처리 환경 구축이 가능한 최신 그래픽 프로세서(GPU)를 이용해서 선형 방정식 해법을 수행하기 위한 병렬 Bi-CG(Bi-Conjugate Gradient) 방식을 제안한다. 제안하는 병렬 방식에서는 반도체 소자 시뮬레이션, 전산유체역학(CFD), 열전달 시뮬레이션 등을 포함한 다양한 분야에서 많은 연산량이 집중되어 전체 시뮬레이션에 필요한 시간을 증가시키는 포아송(Poisson) 방정식의 해를 병렬 방식으로 구한다. 그 결과, 이 논문의 테스트에서 사용된 FDM 3차원 문제 공간에서 단일 CPU 대비 연산 속도가 최대 30 배 이상 증가했다. 실제 구현은 NVIDIA의 태슬라 아키텍처(Tesla Architecture) 기반 GPU에서 범용 목적으로 병렬 프로그래밍이 가능한 NVIDIA사의 CUDA(Compute Unified Device Architecture) 환경에서 수행되었으며 기존 연구가 주로 32 비트 정밀도(single floating point) 실수 범위에서 수행된 것과는 달리 본 연구는 64 비트 정밀도(double floating point) 실수 범위로 수행되어 Bi-CG 해법의 수렴성을 개선했다. 특히, CUDA는 비교적 코딩이 쉬운 반면, 최적화가 어려운 특성이 있어 본 논문에서는 제안하는 Bi-CG 해법에서의 최적화 방향도 논의한다.

VIA 기반 PC 클러스터 시스템을 위한 무복사 파일 전송 메커니즘의 개발 및 성능분석 (Development and Performance Study of a Zero-Copy File Transfer Mechanism for Ink-based PC Cluster Systems)

  • 박세진;정상화;최봉식;김상문
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권11_12호
    • /
    • pp.557-565
    • /
    • 2005
  • 본 논문에서는 VIA(Virtual Interface Architecture) 기반 클러스터 시스템 상에서 효과적인 파일 전송을 위한 무복사 파일 전송 메커니즘의 개발 및 구현에 관하여 나타내었다. VIA는 클러스터 시스템을 위한 대표적인 사용자 수준 통신 방법이지만 파일 전송에 대한 라이브러리는 제공하지 않으며 파일 전송을 위해서는 커널 공간에서 사용자 공간으로 한번의 데이타 복사가 필요하다. 본 논문의 파일 전송 메커니즘은 파일시스템의 수정 없이 파일 전송 라이브러리만 제공함으로써, 네트워크 인터페이스 카드가 보내고자 하는 노드의 파일을 상대방 노드의 사용자 버퍼로 복사 없이 전송 가능케 하였다. 이를 위해 본 연구에서는 PCI 64bit/66MHz를 지원하고 물리적 네트워크로 기가비트 이더넷을 사용하는 VIA 기반의 네트워크 카드를 개발하였고, 이를 바탕으로 무복사 파일 전송 메커니즘을 구현하였다. 이러한 구현의 결과로 sender 측의 데이타 복사 횟수 및 문맥전환 시간을 줄였고, 기존의 VIA의 send/receive에 비해 CPU 사용률을 $30\%\~40\%$ 정도로 줄일 수 있었다. 본 논문에서는 TCP/IP에서 제공하는 무복사 파일 전송 및 VIA에서 사용되는 파일 전송 방법과의 비교 분석 실험을 통하여 본 논문에서 제시한 무복사 파일 전송 메커니즘의 성능을 보였다.

레일레이 페이딩 환경하에서 적응형 변조기를 적용한 다중 반송파 CDMA 시스템의 성능 분석 (Performance Analysis of Multicarrier CDMA System with Adaptive Modulators in Rayleigh Fading Channel)

  • 이광희;김항래;한태영;김남
    • 한국전자파학회논문지
    • /
    • 제14권12호
    • /
    • pp.1300-1310
    • /
    • 2003
  • 본 논문은 레일레이 페이딩 채널 환경하에서, 적응형 변조기와 적응형 부채널 할당 방식을 적용한 다중 반송파 CDMA 시스템의 성능을 분석한다. 제안한 적응형 변조기는 QPSK, 16 QAM, 64 QAM, 256 QAM으로 구성하고, 신호점은 그레이 코드(Gray Code)로 나타내며, 임계값은 비트 에러율(BER)이 1 %일 경우의 평균 Eb/No를 사용한다. 적응형 부채널 할당 방식을 적용한 다중 반송파 시스템은 사용자의 DS파형을 L개의 부채널 중 가장 큰 K개의 부 채널로 선택하여 전송한다. 제안한 시스템의 경우, 총 부 채널수가 4이고 이 가운데 두 개의 부 채널로 데이터를 전송한다면 각 채널의 임계값은 5.2 dB, 9 dB, 13.2 dB와 8.4 dB, 12.2 dB, 16.3 dB 나타났다. BER이 $10^{-3}$을 만족하는 평균 $E_{b/}$ $N_{o}$ 는 8.1 dB로 기존의 시스템에 비해 12.9 dB의 성능이 개선되었다. 평균 심볼당 비트수(BPS)는 7 bit의 경우 15 dB의 평균 $E_{b/}$ $N_{o}$ 가 필요하다. 부 채널 에러가 발생한다면 BER이 $10^{-3}$을 만족하는 평균 $E_{b/}$ $N_{o}$ 는 13.6 dB로 5.5 dB의 성능 저하가 일어났다. 일어났다.

3-Hydroxy-3-methylglutaryl Coenzyme A reductase 활성에 미치는 마그네슘과 칼슘의 영향 (The Effect of Dietary Calcium and Magnesium on the 3-Hydroxy-3-methylglutaryl Coenzyme A Reductase)

  • 정영태;남현근
    • 한국식품영양과학회지
    • /
    • 제12권3호
    • /
    • pp.212-218
    • /
    • 1983
  • 토끼에 마그네슘 칼슘이 첨가된 식이를 급여하여 토끼의 liver microsomal protein에 함유된 HMG-CoA reductase의 활성과 혈청 콜레스테롤, 트리글리세리드, 마그네슘 및 칼슘의 양을 측정하여 다음과 같은 결과를 얻었다. 1. 혈청 마그네슘의 경우 대조군이 9.5mg% 인데, 마그네슘 첨가군은 평균 8.27이었고, 칼슘을 첨가하여 사육한 실험군에서 상당히 낮은 값 T-D : 3.5, T-E : 3.0, T-F : 4.0, T-G : 7.3으로 평균 4.45를 보였다. 2. 혈청 칼슘의 경우 대조군이 15.3mg %인데, 마그네슘 첨가 실험군은 평균 14.6이나 칼슘 첨가 실험군에 있어서 평균 14.1로서 큰 차이가 없었다. 3. 혈청 트리글리세리드의 경우 대조군 82.8에 비하여 마그네슘첨가 실험군은 평균 60.3이었으나, 칼슘 첨가 실험군은 평균 69.5로서 다소 높은 값을 보여 주었다. 4. 혈청 콜레스테롤의 경우 대조군이 80mg%인데 반하여, 마그네슘 첨가 실험군은 평균 64.3이었고, 칼슘 첨가 실험군은 평균 56.3으로 상당히 낮은 값을 보여 주었다. 5. microsomal protein의 HMG-CoA reductase의 활성의 경우는 대조군이 0.995nmol/min/mg 인데, 마그네슘 첨가 실험군은 평균 0.948을 보였고 칼슘 첨가 실험군은 평균 0.849를 보여 주었다.

  • PDF

SPI-4.2 인터페이스 코어의 설계 (A Design of SPI-4.2 Interface Core)

  • 손승일
    • 한국정보통신학회논문지
    • /
    • 제8권6호
    • /
    • pp.1107-1114
    • /
    • 2004
  • 시스템 패킷 인터페이스 4레벨 2단계(System Packet Interface Leve14 Phase 2)는 10Gbps 이더넷응용 뿐만 아니라, OC-192 대역폭의 ATM 및 POS를 통한 패킷 또는 셀 전송을 위한 물리계층과 링크계층 소자간의 인터페이스이다. SPI-4.2 코어는 전송 인터페이스 블록과 수신 인터페이스 블록으로 구성되어 있으며, 전이중 통신을 지원한다. 전송부는 사용자 인터페이스로부터 64비트의 데이터와 14비트의 헤더 정보를 비동기 FIFO에 쓰고, PL4 인터페이스를 통해 DDR 데이터를 전송한다. 그리고 수신부의 동작은 전송부와 역으로 동작한다. 전송부와 수신부는 캘런더 메모리를 컨피규레이션함으로서 최대 256개의 채널 지원이 가능하고, 대역폭 할당을 제어할 수 있도록 설계하였다 DIP-4 및 DIP-2 패리티 생성 및 체크를 자동적으로 수행하도록 구현하였다. 설계된 코어는 자일링스 ISE 5.li 툴을 이용하여 VHDL언어를 사용하여 기술하였으며, Model_SIM 5.6a를 이용하여 시뮬레이션 하였다. 설계된 코어는 라인당 720Mbps의 데이터 율로 동작하였다. 따라서 총 11.52Gbps의 대역폭을 지원할 수 있다. SPI-4.2 인터페이스 코어는 기가비트/테라비트 라우터, 광학 크로스바 스위치 및 SONET/SDH 기반의 전송 시스템에서 라인카드로 사용할 경우 적합할 것으로 사료된다.

확장 유클리드 알고리즘을 이용한 파이프라인 구조의 타원곡선 암호용 스칼라 곱셈기 구현 (Implementation of a pipelined Scalar Multiplier using Extended Euclid Algorithm for Elliptic Curve Cryptography(ECC))

  • 김종만;김영필;정용진
    • 정보보호학회논문지
    • /
    • 제11권5호
    • /
    • pp.17-30
    • /
    • 2001
  • 본 논문에서는 타원곡선 암호시스템에 필요한 스칼라 곱셈기를 $GF(2^{163})$의 standard basis상에서 구현하였다. 스칼라 곱셈기는 래딕스-16 유한체 직렬 곱셈기와 유한체 역수기로 구성되어 있다. 스칼라 곱셈을 계산하기 위해서는 유한체 곱셈, 덧셈과 역수의 계산이 필요하지만, 기존의 스칼라 곱셈기는 이러한 스칼라 곱셈을 유한체 곱셈기만으로 계산하였으므로 역수를 계산하는데 많은 시간을 소모하였다. 따라서, 본 논문의 중요한 특징은 가장 많은 연산시간을 필요로 하는 역수 연산을 빠르게 계산하기 위해 유한체 역수기를 추가 사용한 것이다. 유한체 역수기는 기존의 많은 구현 사례 중 두 번의 곱셈 시간이 소요되는 확장 유클리드 알고리즘(Extended Euclid Algorithm)을 이용하였다. 본 논문에서 구현한 유한필드 곱셈기와 역수기는 하드웨어 구조가 규칙적이어서 확장성이 용이하고, 파이프라인 구조와 하드웨어 리소스의 재활용을 이용해 계산과정에서 100%의 효율(throughput)을 발휘할 수 있는 구조를 가지고 있다. 스칼라 곱셈기는 현대전자 0.6$\mu\textrm{m}$ CMOS 공정 라이브러리인 IDEC-C631을 이용하여 예측한 결과 최대 140MHz까지 동작이 가능하며, 이때 데이터 처리속도는 64Kbps로 163bit 프레임당 2.53ms 걸린다. 이러한 성능의 스칼라 곱셈기는 전자서명(Digital Signature), 암호화 및 복호화(encryption & decryption) 그리고 키 교환(key exchange)등에 효율적으로 사용될 수 있을 것으로 여겨진다.

커뮤니티케어 제도 내 지역사회중심재활 서비스 접근을 위한 애플리케이션 디자인의 제안 : 작업과 활동 중심으로 (Proposed Application Design for Community-Based Rehabilitation Services Access in Community Care System: Occupation and Activity Based)

  • 배성환;장연식;백지영
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권4호
    • /
    • pp.325-335
    • /
    • 2021
  • 최근 인간의 평균수명이 연장됨에 따라 만성 질환이 증가하고 있으며, 이러한 추세는 보건 및 재활 서비스의 광범위한 수요와 의료비 등이 증가하는 문제점을 발생시키고 있다. 이를 해결하기 위해 국내에서는 지역사회중심재활사업을 발전 및 강화하여 2019년부터 단계적으로 추진하고 있다. 지역사회중심재활사업을 활성화하기 위해서는 서비스를 이용하려는 클라이언트의 접근성 확보가 중요하다. 따라서 본 연구에서는 지역사회중심재활사업의 일환으로써 작업과 활동 중심의 지역사회중심 작업치료 서비스 접근성 확보를 위한 스마트폰 애플리케이션 디자인을 고안하고 프로토타입을 개발하고자 한다. 작업과 활동 중심의 애플리케이션 콘텐츠를 고안하고 범주화를 위해 작업치료 실행체계(OTPF), 국제 기능·장애·건강 분류(ICF)와 알렌진단모듈(ADM-2)이 사용되었으며, 선행연구 분석 및 전문가 회의를 통해 OTPF, ICF와 ADM-2를 링킹하였다. 도출된 콘텐츠는 문헌고찰과 활동분석을 통해 영상으로 제작하였으며, YouTube API를 활용하여 애플리케이션 내에서 직접 재생이 가능하도록 구현하였고, 최종적으로 애플리케이션 프로토타입을 개발하였다. 애플리케이션 프로토타입을 제작하기 위한 프로그램은 Android Studio 3.5.2 for Windows 64-bit를 사용하였다. 추후 연구에서는 사용자의 편의를 위한 다양한 디지털 기술을 융합하고 지역사회중심 작업치료 서비스 제공자의 의견과 서비스 이용자의 만족도에 대한 추가적인 연구를 진행하여 실용성에 대해 입증하고 이를 보완한다면, 지역사회 내 작업수행에 어려움을 겪는 클라이언트들의 지역사회중심 작업치료 서비스 접근성을 향상할 것이다.

네트워크 보안을 위한 다중모드 블록암호시스템의 설계 (Design of Multimode Block Cryptosystem for Network Security)

  • 서영호;박성호;최성수;정용진;김동욱
    • 한국통신학회논문지
    • /
    • 제28권11C호
    • /
    • pp.1077-1087
    • /
    • 2003
  • 본 논문에서는 IPsec등의 네트워크 보안 프로토콜을 위해 다중모드를 가지는 블록암호시스템의 구조를 제안하고 ASIC 라이브러리를 이용해서 하드웨어로 구현하였다. 블록 암호시스템의 구성을 위해서 AES, SEED, 그리고 3DES 등의 국내외 표준 블록암호화 알고리즘을 사용하였고 네트워크를 비롯한 유/무선으로 입력되는 데이터를 최소의 대기시간(최소 64클럭, 최대 256클럭)만을 가지면서 실시간으로 데이터를 암호화 혹은 복호화시킬 수 있다. 본 설계는 ECB, CBC, OFB뿐 아니라 최근 많이 사용되는 CTR(Counter) 모드를 지원하고 다중 비트단위(64, 128, 192, 256 비트)의 암/복호화를 수행한다. IPsec등의 네트워크 보안 프로토콜로의 연계를 위해 알고리즘 확장성을 보유한 하드웨어로 구현되었고 여러 암호화 알고리즘의 동시적인 동작이 가능하다. 적절한 하드웨어 공유와 프로그래머블한 특성이 강한 내부데이터 패스를 통해 자체적인 블럭암호화 모드를 지원하기 때문에 다양한 방식의 암/복호화가 가능하다. 전체적인 동작은 직렬 통신에 의해서 프로그래밍되고 명령어의 디코딩을 통해 생성된 제어신호가 동작을 결정한다. VHDL을 이용해 설계된 하드웨어는 Hynix 0.25$\mu\textrm{m}$ CMOS 공정을 통해 합성되었고 약 10만 게이트의 자원을 사용하였으며, 100MHz 이상의 클럭 주파수에서 안정적으로 동작함을 NC-Verilog에서 확인하였다.

HEVC 부호화기를 위한 효율적인 적응적 루프 필터 설계 (An Efficient Adaptive Loop Filter Design for HEVC Encoder)

  • 신승용;박승용;류광기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.295-298
    • /
    • 2014
  • 본 논문에서는 필터 계수 추출을 위한 HEVC 적응적 루프 필터(ALF, Adaptive Loop Filter)의 효율적인 설계를 제안한다. ALF는 필터 계수를 추출하기 위해 $10{\times}10$ 행렬의 촐레스키 분해를 반복적으로 수행한다. ALF의 촐레스키 분해는 루트 연산 및 나눗셈 연산 등 하드웨어로 설계하기 어려운 연산들로 구성되어 있고, LCU($64{\times}64$) 한 개당 최대 30비트의 큰 값들을 소수점 단위로 연산하기 때문에 많은 연산량과 수행 시간을 필요로 한다. 본 논문에서 제안한 하드웨어 구조는 멀티플렉서와 뺄셈기, 비교기 등을 이용하여 촐레스키 분해에 사용되는 루트 연산을 구현하였다. 또한, 촐레스키 분해의 특징적인 연산 과정들을 파이프라인 구조로 설계함으로써 효율적이면서 적은 연산량을 갖는 하드웨어 구조로 구현하였다. 구현한 하드웨어는 Xilinx ISE 14.3 Vertex-6 XC6VCX240T FPGA 디바이스를 사용하여 설계하였으며, 최대 동작 주파수 150MHz에서 4K UHD($4096{\times}2160$) 영상을 초당 40프레임으로 실시간 처리할 수 있다.

  • PDF

Opencable 방식과 DVB-C 방식의 전송성능에 관한 연구 (Studies on the Transmission Performance of Opencable and CVB-C)

  • 이재련;손원
    • 한국통신학회논문지
    • /
    • 제27권2C호
    • /
    • pp.184-190
    • /
    • 2002
  • 이 논문은 미국과 유럽에서 디지털 CATV (Community Antenna Television) 전송방식으로 각각 채택되고 있는 OpenCable 방식과 DVB-C (Digital Video Broadcasting-Cable System) 방식의 전송성능을 모의실험을 통하여 동일한 채널환경에서 비교 및 분석하였다. 두 방식을 공정하게 비교하기 위하여, 랜던잡음과 CTB (Composite Tripple Beats) 잡음을 신호손상요소로서 포함한 채널 모형을 고려하였으며, 가변 인터리빙 깊이 기능을 가지는 OpenCable 전송시스템은 여러 가지 인터리빙 깊이에 대한 전송성능을 분석하였다. 전송선능을 비교하기 위하여 각 전송방식에 대한 송수신 시스템을 소프트웨어로 구현한 다음, C/N값의 증가에 따른 BER(Bit Error Rate) 값을 비교 및 분석하였다. 모의실험결과, 각 잡음에 대하여 BER 값 ${10}^{-6}$을 얻기 위한 C/N 값이 64-QAM 모드에서는 OpenCable 방식이 DVB-C 방식보다 약 1.2 dB 정도 낮았으며, 256-QAM 모드에서는 두 방식이 유사하다는 결과를 얻었다.