• Title/Summary/Keyword: 하드코어

Search Result 86, Processing Time 0.032 seconds

스마트팜 빅데이터 분석을 위한 이기종간 심층학습 기법 연구 (A Study on Deep Learning Methodology for Bigdata Mining from Smart Farm using Heterogeneous Computing)

  • 민재기;이동훈
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.162-162
    • /
    • 2017
  • 구글에서 공개한 Tensorflow를 이용한 여러 학문 분야의 연구가 활발하다. 농업 시설환경을 대상으로 한 빅데이터의 축적이 증가함과 아울러 실효적인 정보 획득을 위한 각종 데이터 분석 및 마이닝 기법에 대한 연구 또한 활발한 상황이다. 한편, 타 분야의 성공적인 심층학습기법 응용사례에 비하여 농업 분야에서의 응용은 초기 성장 단계라 할 수 있다. 이는 농업 현장에서 취득한 정보의 난해성 및 완성도 높은 생육/환경 모델링 정보의 부재로 실효적인 전과정 처리 기술 도출에 소요되는 시간, 비용, 연구 환경이 상대적으로 부족하기 때문일 것이다. 특히, 센서 기반 데이터 취득 기술 증가에 따라 비약적으로 방대해진 수집 데이터를 시간 복잡도가 높은 심층 학습 모델링 연산에 기계적으로 단순 적용할 경우 시간 효율적인 측면에서 성공적인 결과 도출에 애로가 있을 것이다. 매우 높은 시간 복잡도를 해결하기 위하여 제시된 하드웨어 가속 기능의 경우 일부 개발환경에 국한이 되어 있다. 일례로, 구글의 Tensorflow는 오픈소스 기반 병렬 클러스터링 기술인 MPICH를 지원하는 알고리즘을 공개하지 않고 있다. 따라서, 본 연구에서는 심층학습 기법 연구에 있어서, 예상 가능한 다양한 자원을 활용하여 최대한 연산의 결과를 빨리 도출할 수 있는 하드웨어적인 접근 방법을 모색하였다. 호스트에서 수행하는 일방적인 학습 알고리즘과 달리 이기종간 심층 학습이 가능하기 위해선 우선, NFS(Network File System)를 이용하여 데이터 계층이 상호 연결이 되어야 한다. 이를 위해서 고속 네트워크를 기반으로 한 NFS의 이용이 필수적이다. 둘째로 제한된 자원의 한계를 극복하기 위한 메모 공유 라이브러리가 필요하다. 셋째로 이기종간 프로세서에 최적화된 병렬 처리용 컴파일러를 이용해야 한다. 가장 중요한 부분은 이기종간의 처리 능력에 따른 작업을 고르게 분배할 수 있는 작업 스케쥴링이 수행되어야 하며, 이는 처리하고자 하는 데이터의 형태에 따라 매우 가변적이므로 해당 데이터 도메인에 대한 엄밀한 사전 벤치마킹이 수행되어야 한다. 이러한 요구조건을 대부분 충족하는 Open-CL ver1.2(https://www.khronos.org/opencl/)를 이용하였다. 최신의 Open-CL 버전은 2.2이나 본 연구를 위하여 준비한 4가지 이기종 시스템에서 모두 공통적으로 지원하는 버전은 1.2이다. 실험적으로 선정된 4가지 이기종 시스템은 1) Windows 10 Pro, 2) Linux-Ubuntu 16.04.4 LTS-x86_64, 3) MAC OS X 10.11 4) Linux-Ubuntu 16.04.4 LTS-ARM Cortext-A15 이다. 비교 분석을 위하여 NVIDIA 사에서 제공하는 Pascal Titan X 2식을 SLI로 구성한 시스템을 준비하였다. 개별 시스템에서 별도로 컴파일 된 바이너리의 이름을 통일하고, 개별 시스템의 코어수를 동일하게 균등 배분하여 100 Hz의 데이터로 입력이 되는 온도 정보와 조도 정보를 입력으로 하고 이를 습도정보에 Linear Gradient Descent Optimizer를 이용하여 Epoch 10,000회의 학습을 수행하였다. 4종의 이기종에서 총 32개의 코어를 이용한 학습에서 17초 내외로 연산 수행을 마쳤으나, 비교 시스템에서는 11초 내외로 연산을 마치는 결과가 나왔다. 기보유 하드웨어의 적절한 활용이 가능한 심층학습 기법에 대한 연구를 지속할 것이다

  • PDF

CUDA와 OPenMP를 이용한 빠르고 효율적인 신경망 구현 (Fast and Efficient Implementation of Neural Networks using CUDA and OpenMP)

  • 박안진;장홍훈;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권4호
    • /
    • pp.253-260
    • /
    • 2009
  • 컴퓨터 비전이나 패턴 인식 분야에서 이용되고 있는 많은 알고리즘들이 최근 빠른 수행시간을 위해 GPU에서 구현되고 있지만, GPU를 이용하여 알고리즘을 구현할 경우 크게 두 가지 문제점을 고려해야 한다. 첫째, 컴퓨터 그래픽스 분야의 지식이 필요한 쉐이딩(shading) 언어를 알아야 한다. 둘째, GPU를 효율적으로 활용하기 위해 CPU와 GPU간의 데이터 교환을 최소화해야 한다. 이를 위해 CPU는 GPU에서 처리할 수 있는 최대 용량의 데이터를 생성하여 GPU에 전송해야 하기 때문에 CPU에서 많은 처리시간을 소모하며, 이로 인해 CPU와 GPU 사이에 많은 오버헤드가 발생한다. 본 논문에서는 그래픽 하드웨어와 멀티코어(multi-core) CPU를 이용한 빠르고 효율적인 신경망 구현 방법을 제안한다. 기존 GPU의 첫 번째 문제점을 해결하기 위해 제안된 방법은 복잡한 쉐이팅 언어 대신 그래픽스적인 기본지식 없이도 GPU를 이용하여 응용프로그램 개발이 가능한 CUDA를 이용하였다. 두 번째 문제점을 해결하기 위해 멀티코어 CPU에서 공유 메모리 환경의 병렬화를 수행할 수 있는 OpenMP를 이용하였으며, 이의 처리시간을 줄여 CPU와 GPU 환경에서 오버 헤드를 최소화할 수 있다. 실험에서 제안된 CUDA와 OpenMP기반의 구현 방법을 신경망을 이용한 문자영역 검출 알고리즘에 적용하였으며, CPU에서의 수행시간과 비교하여 약 15배, GPU만을 이용한 수행시간과 비교하여 약 4배정도 빠른 수행시간을 보였다.

의견, 여론지각, 지각편향이 공개적 의견표명에 미치는 영향 (The Influence of One's Opinion, Perceived Public Opinion, and Perception Bias on Expression of Opinion)

  • 박선희;한혜경
    • 한국언론정보학보
    • /
    • 제42권
    • /
    • pp.168-204
    • /
    • 2008
  • 이 연구는 여론지각과 의견표명의 관계가 의견분포가 상이한 지역에서도, 상이한 이슈에 대해서도 여전히 유효한지를 분석하고 이슈에 대한 의견과 지각편향이 의견표명에 어떠한 영향을 미치는지를 검증하였다. 또한 여론형성과정에서 개인이 수행하는 역할유형별로 어떠한 특성을 지니는지 검토하였다. 분석결과 이슈에 대한 의견과 의견강도는 이슈 및 지역에 관계없이 의견표명과 유의미한 관계가 있었지만, 여론지각은 지역과 이슈에 따라, 의견표명지역에 따라 의견표명에 미치는 영향이 상이하였고, 지각편향집단간에는 의견표명에 유의미한 차이가 발견되지 않았다. 회귀분석 결과 반대의견과 의견강도는 의견표명을 예측하는 주요 변인이었으나 여론지각은 침묵의 나선이론과 달리 어떤 이슈에서도 유의미한 예측변인이 아니었다. 오히려 반대편향집단에서 의견표명의사가 낮게 나타나 지각편향이 의견표명을 예측하는 주요 변인임을 알 수 있다. 여론형성과점에서 하드코어는 두 이슈에 대해 찬성의견이 많았고 반대편향의 비율이 다른 집단들에 비해 월등하게 많았다. 연구결과는 의견표명을 설명하는 여론관련 변인들을 다차원적으로 고려할 필요가 있음을 제기한다.

  • PDF

70MIPS 이내에서 동작하는 MPEG-2 AAC 부호화 칩 설계 (An MPEG-2 AAC Encoder Chip Design Operating under 70MIPS)

  • 강희철;박주성;정갑주;박종인;최병갑;김태훈;김승우
    • 대한전자공학회논문지SD
    • /
    • 제42권4호
    • /
    • pp.61-68
    • /
    • 2005
  • MPEG-2 오디오 압축방식인 AAC(Advanced Audio Coding) LC(Low Complexity) 스테레오 부호화기를 고속으로 구현할 수 있는 칩을 32비트 DSP 코어를 기반으로 설계하고 0.25um CMOS 기술을 이용하여 제작하였다. 계산량과 메모리 용량을 줄이기 위하여 알고리즘 구현방법 측면에서 최적화를 하였으며, FFT(Fast Fourier Transform)를 하드웨어로 구현하여 고속화하였다. 제작된 칩의 크기는 $7.20\times7.20 mm^2$ 이었으며 등가 게이트는 약 830,000 이었으며 70MIPS 이내에서 AAC 부호화를 할 수 있음을 확인하였다.

차세대 저궤도 위성의 PCI 기반의 1553B 통신 소프트웨어 설계 (Design and Development of PCI-based 1553B Communication Software for Next Generation LEO On-Board Computer)

  • 최종욱;정재엽;유범수
    • 한국위성정보통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.65-71
    • /
    • 2016
  • 현재 한국항공우주연구원에서 개발 중인 차세대 저궤도 위성의 탑재컴퓨터는 높은 성능을 위해 LEON2-FT/AT697F 프로세서를 사용하며 SpaceWire, 1553B, DMAUART, CAN Master 등의 다양한 통신을 지원하기 위해 별도의 FPGA 기반의 통신칩이 개발되었다. 프로세서와 통신칩간의 통신은 PCI 버스를 통해서 이루어지며, 탑재소프트웨어에서 직접 PCI 버스를 통해 각종 디바이스를 제어 및 통신을 수행한다. 차세대 탑재컴퓨터에서는 기존 1553B 통신을 위해 사용되었던 VASI IP1553B 컨트롤러 대신 Actel 1553BRM 코어를 사용하며 통신칩의 AMBA 버스상에 연결을 위해 Aeroflex Gaisler에서 개발 된 B1553BRM Wrapper를 사용한다. 본 논문에서는 차세대 저궤도 위성에서의 PCI기반의 1553B 통신 소프트웨어의 구조와 통신방법에 대해서 기술하고 탑재소프트웨어 레벨의 태스크를 통한 1553B 처리방식에 대해서 설명한다. 그리고 시뮬레이터 및 실제 하드웨어에서 테스트 된 결과에 대해 설명한다.

RTOS를 이용한 위폐검출 계수기의 구현 (Implementation of counterfeit banknote detection counter using RTOS)

  • 정원근;신태민;이건기
    • 한국정보통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.364-370
    • /
    • 2002
  • 본 논문에서 일반 지폐 계수기에 권종구분 기능과 복수장 검출기능 그리고 위조지폐판별기 능을 부가시킨 지폐계수기를 구현하였다 권종구분에는 센서 신호처리기술, 위조지폐 판별에는 센서응용기술 및 정보처리 기술을 사용하였고, 고속계수에는 정밀기구설계 기술과 마이크로프로센서 응용기술을 사용하였다. 소프트웨어는 RTOS를 기반으로 한 C 언어를 사용하여 효과적인 제어 알고리즘과 실시간으로 신호를 처리함으로 써 디버깅 및 추가 하드웨어와의 접목이 어려운 점을 개선하였다. 센서 디바이스로는 하드웨어 비용절감과 처리속도를 감안하여 포토다이오드와 포토다이오드 응용제품, 그리고 자기저항센서를 사용하였다. 마이크로 콘트롤러는 Intel I8051 코어를 사용한 필립스사의 PCF 80C552-24를 사용하였다. 실험 결과 컬러복사 및 컬러 프린트로 만든 위폐가 잘 구분되는 것을 확인하였으며, 계수 중 이권종이 있을 경우 구분해 냄으로써 다른 지폐가 섞여 계수 되는 것을 방지 할 수 있었다.

모바일용 블록암호 알고리듬 HIGHT의 하드웨어 구현 (An implementation of block cipher algorithm HIGHT for mobile applications)

  • 박해원;신경욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.125-128
    • /
    • 2011
  • 본 논문에서는 한국기술표준원(KATS)과 국제표준화기구(ISO/IEC)에 의해 표준으로 채택된 블록암호 알고리즘 HIGHT의 효율적인 하드웨어를 구현하였다. HIGHT 알고리듬은 USN과 RFID와 같은 유비쿼터스 환경에 적합하도록 개발되었으며, 128 비트 마스터 키를 사용하여 64 비트 평문을 64 비트 암호문으로, 또는 그 역으로 변환한다. 저면적과 저전력 구현을 위해 암호화 및 복호화를 위한 라운드 변환 블록과 키 스케줄러의 하드웨어 자원이 공유되도록 설계 최적화를 하였다. $0.35-{\mu}m$ CMOS 표준 셀 라이브러리를 이용한 합성결과, HIGHT64 코어는 3,226 게이트로 구현되었으며, 80-MHz@2.5-V로 동작하여 150-Mbps의 성능을 갖는 것으로 평가되었다.

  • PDF

IEEE 802.11i MAC Layer 설계 및 구현 (Design and Implementation of IEEE 802.11i MAC Layer)

  • 홍창기;정용진
    • 한국통신학회논문지
    • /
    • 제34권8A호
    • /
    • pp.640-647
    • /
    • 2009
  • IEEE 802.11i에서는 기존의 802.11a,b,g가 가지고 있던 보안상 문제점을 보완하기 위해서 RSNA(Robust Security Network Association)를 새로이 규정하고 있다. RSNA에서는 기존의 데이터 암호화를 위한 WEP(Wired Equivalent Privacy)을 대신하여 좀 더 견고한 데이터 암호화를 위하여 TKIP(Temporal Key Integrity Protocol)와 CCMP(Counter with CBC-MAC Protocol)를 사용하고 있다. 본 논문에서는 WEP, TKIP, CCMP의 암.복호 엔진을 설계하여 IEEE 802.11i를 지원하는 MAC Layer를 설계, 구현 하였다. WEP은 기존의 IEEE 802.11 legacy MAC과의 호환성을 보장하기 위하여 구성되었고, TKIP와 CCMP는 IEEE 802.11i에서 규정한 데이터 보안을 보장한다. 본 논문의 CCMP 블록은 동작 주파수 134MHz에서 최대 816.7Mbps의 데이터의 처리속도를 가짐으로써 802.11n의 성능을 보장 한다. 또한 2단 파이프 라인 구조를 가지는 AES 구조를 제안하여 CCMP에서의 동작 모드인 CBC 모드와 CTR 모드를 1개의 AES 코어에서 처리하도록 하여 적은 면적의 하드웨어를 가지도록 하였다.

파이썬 활용한 데이터 처리 성능 향상방법 제안 (Proposal For Improving Data Processing Performance Using Python)

  • 김효관;황원용
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권4호
    • /
    • pp.306-311
    • /
    • 2020
  • 본 논문은 대량의 데이터를 활용한 모델 개발 시 다양한 라이브러리를 갖춘 파이썬 언의의 성능 향상방법을 다룬다. 파이썬 언어는 엑셀과 같은 스프레드시트 형태 데이터 처리 시 Pandas 라이브러리를 사용한다. 데이터 처리 시파이썬은 기가단위 이하 데이터 처리 시에는 인-메모리로 연산하여 성능 측면에서 크게 이슈가 없다. 하지만 기가단위 이상 데이터 처리 시 성능 이슈가 발생한다. 이에 본 논문은 데이터 처리 시 Pandas와 같이 사용할 수 있는 Dask 라이브러리를 활용하여 단일 클러스터 및 다중 클러스터에서 실행 작업을 분산처리 가능한 방법을 소개한다. 실험은 동일 사양의 하드웨어에서 간단한 지수산출 모델을 Pandas만 사용해서 처리하는 속도와 Dask를 같이 사용해서 처리하는 속도를 비교한다. 본 논문은 파이썬의 장점인 다양한 라이브러리를 쉽게 사용할 수 있다는 점을 유지하면서 성능측면에서도 대량의 데이터를 CPU 코어들이 분산 처리하여 모델을 개발할 수 있는 방법을 제시한다.

원격 제어를 위한 임베디드 통신 변환기 구현 (Implementation of An Embedded Communication Translator for Remote Control)

  • 이병권;전영숙;전중남
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.445-454
    • /
    • 2006
  • 구형 산업용 계측 장비들은 대부분 직렬 통신 기능만 갖추고 있다. 이러한 장비들을 인터넷으로 연결하기 위한 임베디드 통신 변환기를 구현하였다. 이 장비는 입출력 장치로 한 개의 WAN 포트, 두 개의 LAN 포트, 두 개의 직렬 포트를 갖고 있으며, 소프트웨어에 의하여 직렬 통신과 네트워크 통신 간의 상호 변환 기능을 수행하고, 기존의 직렬-이더넷 변환기와 구별되는 웹 모니터링 기능을 지원한다. ARM922T를 프로세서 코어를 사용하는 MICREL 사의 KS8695 네트워크 전용 칩셋을 사용하여 하드웨어를 구현하였고, 인터넷 기반 원격 제어를 위하여 웹 서버인 boa와 CGI 기능을 활용하였으며, 사설 IP 주소를 갖는 네트워크에서도 인터넷 접속이 가능하도록 IP 공유 기능을 추가하였으며, 통신 변환기의 역할을 수행하는 직렬-이더넷 변환 프로그램을 개발하였다. 그리고 개발된 통신 변환기를 태양열 에너지 전력 생산시스템의 원격 감시 장치로 활용하는 예를 제시하였다.