• 제목/요약/키워드: 1단 병렬 시스템

검색결과 77건 처리시간 0.026초

병렬 분산 컴퓨팅을 이용한 초다광원 3차원 물체의 홀로그램 고속 생성 (Fast Hologram Generating of 3D Object with Super Multi-Light Source using Parallel Distributed Computing)

  • 송중석;김창섭;박종일
    • 방송공학회논문지
    • /
    • 제20권5호
    • /
    • pp.706-717
    • /
    • 2015
  • 컴퓨터 생성 홀로그램(CGH: computer-generated hologram) 기법은 일반적인 범용 컴퓨터(PC: personal computer)에서도 홀로그램을 쉽게 생성해주는 기술이다. CGH 알고리즘의 연산량은 생성하려는 홀로그램의 해상도 크기와 3D (three-dimensional) 물체의 광원 개수에 따라 결정되기 때문에, 초다광원 물체나 초고해상도 홀로그램을 생성하기 위해서는 방대한 양의 연산이 요구된다. 따라서 CGH 기법을 실용적으로 사용하기 위해서는 CGH 연산량을 줄이거나, 하드웨어의 연산 속도를 높이는 방법이 필요하다. 본 논문에서는 병렬 분산 컴퓨팅을 이용하여 초다광원 3차원 물체의 홀로그램을 고속으로 생성할 수 있는 시스템을 제안한다. 기존의 방법들은 주로 단일 PC를 이용하여 고속으로 CGH를 연산하는 방법을 사용했기 때문에 연산 능력을 증가시키는데 한계가 있었던 반면, 본 논문에서 제안하는 방법은 서버 PC가 일반적인 GPU가 장착되어 있는 다수의 클라이언트 PC들의 연산 능력을 효율적으로 사용하여 초다광원 물체에 대해 고속으로 CGH를 연산할 수 있다. 실험 결과, 제안하는 방법을 사용하면 157,771개의 광원을 갖는 초다광원 3차원 물체에 대해 1,5361,536 해상도를 갖는 홀로그램을 약 121ms로 생성할 수 있음을 확인할 수 있었다. 또한, 클라이언트 PC의 수를 증가시킬수록 디지털 홀로그램을 생성하는 시간이 줄어드는 것을 확인할 수 있었다.

다중 사용자 CDMA 통신 시스템에서 프리코딩 기법을 사용한 2진 정진폭 시스템 설계 (Design of Binary Constant Envelope System using the Pre-Coding Scheme in the Multi-User CDMA Communication System)

  • 김상우;유흥균;정순기;이상태
    • 한국전자파학회논문지
    • /
    • 제15권5호
    • /
    • pp.486-492
    • /
    • 2004
  • 본 논문에서는 기존의 CDMA 시스템에서 다중사용자 데이터 전송에 의해 발생하는 높은 PAPR 문제를 해결하기 위하여 pre-coding 기법을 이용한 2진 constant amplitude CDMA(CA-CDMA) 방식을 새롭게 제안한다. 제안하는 CA-CDMA의 기초인 4-user CA-CDMA 기법은 4명의 사용자에 대해 binary 크기의 신호를 출력하는 시스템이며, 이는 parity 신호를 이용하여 항상 $\pm$2의 크기를 갖고 길이가 4인 신호를 출력한다. Parity 신호는 입력되는 4명의 사용자 신호를 XOR한 신호로써 사용자들의 신호와 함께 전송되므로 별도의 부가채널을 필요로 하지 않으며, 수신단에서 쉽게 복원될 수 있다. 한편, 시스템 사용자 수의 확장은 4-user CA-CDMA를 반복 사용함으로써 이루어질 수 있다. 예로써 16-user의 경우, 4개의 4-user CA-CDMA를 병렬로 배치하고 각각의 4-user CA-CDMA에서 출력되는 신호를 다시 하나의 4-user CA-CDMA에 입력함으로써 쉽게 구현될 수 있다. 이는 각 4-user CA-CDMA의 출력 신호 역시 binary 신호이기에 가능하며, 동일한 방법으로 64-user, 256-user에 대해서도 2진 constant amplitude를 만족하는 출력 신호를 얻을 수 있다. 결국, 본 논문에서 제안하는 CA-CDMA는 코드율이 1이므로 전송속도나 대역폭 변화가 없으며, 항상 constant한 즉, PAPR이 항상 0 ㏈인 신호의 출력하여, 다중 사용자 전송에서도 비선형 HPA에 의한 왜곡을 방지하고 전력효율을 최대화 할 수 있다. 시뮬레이션 성능확인 결과, 기존의 CDMA가 다중 레벨의 크기를 갖는 신호를 출력하는데 반해, 제안된 2진 CA-CDMA는 항상 binary 레벨로서 신호를 출력함을 알 수 있으며, 비선형 HPA를 고려하였을 때 BER(bit error rate)이 크게 증가하는 일반 CDMA와 달리, 제안된 2진 CA-CDMA의 BER은 전혀 변하지 않음을 알 수 있다.

UHF대역 지상국용 무지향 고이득 안테나 (An Omnidirectional High Gain Antenna for UHF Band Ground Station)

  • 배기형;장민수;주재우;황찬호;홍기표
    • 한국지식정보기술학회논문지
    • /
    • 제12권4호
    • /
    • pp.539-550
    • /
    • 2017
  • 본 논문에서는 UHF대역 원통형 다이폴 배열 안테나에 대해서 설계, 제작 및 시험을 하였다. 제안하는 안테나는 원통형 다이폴을 수직으로 4단 배열하였다. 원통형 다이폴 내부에는 병렬구조 급전회로를 설치하여 광대역 매칭이 되도록 구현하였다. 급전회로를 원통형 다이폴 중심에 설치하여 방위각 방향 무지향 방사패턴의 이득평탄도 특성을 최적화하였다. 급전회로에서 분기되는 신호의 차이를 최소화하여 대칭적인 방사패턴을 구현하였다. 요구 규격은 UHF대역에서 대역폭 11.2% 이상, 이득 6dBi 이상, 2:1 이하의 정재파비, 수평방향 방사패턴 이득평탄도 ${\pm}1dB$ 이내, 고각 방향 방사패턴 3dB 빔폭 13도 이상이다. M&S를 통해서 구현 가능성을 확인하고, 제작 및 시험을 통해서 M&S 결과를 검증하였다. 시험결과는 UHF대역에서 대역폭 11.2%, 이득 6.30~8.31dBi, 정재파비 1.53:1 이하, 방위각 방향 방사패턴 이득평탄도 ${\pm}0.2dB$ 이내, 고각 방향 방사패턴 3dB 빔폭은 15.62~15.84도이다. 시험결과 모든 규격을 충족하였다.

솔더 페이스트의 고속, 고정밀 검사를 위한 이차원/삼차원 복합 광학계 및 알고리즘 구현 (An implementation of 2D/3D Complex Optical System and its Algorithm for High Speed, Precision Solder Paste Vision Inspection)

  • 조상현;최흥문
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.139-146
    • /
    • 2004
  • 본 논문에서는 솔더페이스트의 이차원 및 삼차원 자동검사를 함께 할 수 있는 복합 검사 광학계와 그 구동유닛을 단일 프로브 시스템으로 구현하고, 그를 위한 효과적인 비젼검사 알고리즘을 제안하였다. 솔더페이스트의 이차원 검사에는 One-pass Run Length 레이블링 알고리즘을 제안하여 입력 영상으로부터 솔더 페이스트 형상을 효과적으로 추출하도록 하였고, 고속 검사를 위한 프로브의 최적 이동 경로도 구하였으며, 삼차원 검사에는 기존의 레이져 슬릿빔(slit-beam) 방식 대신 격자 투영식 모아레 간섭계에 기반한 위상이동 알고리즘을 도입하여 고정밀 검사가 가능토록 하였다. 전체 소프트웨어 구현에는 MMX 병렬처리기법도 적용함으로써 더욱 고속화 하였다. 10㎜×10㎜의 단위 측정영역(field of view: FOV)에 대하여 x, y 축으로 10㎛ Z축으로 l ㎛의 분해능을 가지는 이차원 및 삼차원 복합 광학 검사 시스템을 제작하여 실험한 결과, 한 FOV에 대한 솔더페이스트의 이차원 및 삼차원 검사를 영상포착 후 각각 평균 11msec와 15msec의 짧은 시간에 처리할 수 있었고, ±1㎛의 두께 측정 정밀도를 얻을 수 있었다.

그래픽 프로세서를 이용한 탄성파 수치모사의 계산속도 향상 (Acceleration of computation speed for elastic wave simulation using a Graphic Processing Unit)

  • Nakata, Norimitsu;Tsuji, Takeshi;Matsuoka, Toshifumi
    • 지구물리와물리탐사
    • /
    • 제14권1호
    • /
    • pp.98-104
    • /
    • 2011
  • 탐사 지구물리학에서 수치 모사는 지하매질에서의 탄성파 전파 현상을 이해하는데 중요한 통찰력을 제공한다. 탄성파 모사는 음향파 근사에 의한 수치 모사보다 계산시간이 많이 소요되지만 전단응력 성분을 포함하여 보다 현실적인 파동의 모사를 가능하게 한다. 그러므로 탄성파 모사는 탄성체의 반응을 탐사하는데 적합하다고 할 수 있다. 계산 시간이 길다는 단점을 극복하기 위해 본 논문에서는 그래픽 프로세서(GPU)를 이용하여 탄성파 수치 모사 시간을 단축하고자 하였다. GPU는 많은 수의 프로세서와 광대역 메모리를 갖고 있기 때문에 병렬화된 계산 아카텍쳐에서 사용할 수 있는 장점이 있다. 본 연구에서 사용한 GPU 하드웨어는 NVIDIA Tesla C1060으로 240개의 프로세서로 구성되어 있으며 102 GB/s의 메모리 대역폭을 갖고 있다. NVIDIA에서 개발된 병렬계산 아카텍쳐인 CUDA를 사용할 수 있음에도 불구하고 계산효율을 상당히 향상시키기 위해서는 GPU 장치의 여러 가지 다양한 메모리의 사용과 계산 순서를 최적화해야만 한다. 본 연구에서는 GPU 시스템에서 시간영역 유한차분법을 이용하여 2차원과 3차원 탄성과 전파를 수치 모사하였다. 파동전파 모사에 가장 널리 사용되는 유한차분법 중의 하나인 엇갈린 격자기법을 채택하였다. 엇갈린 격자법은 지구물리학 분야에서 수치 모델링을 위해 사용하기에 충분한 정확도를 갖고 있는 것으로 알려져 있다. 본 논문에서 제안한 모델링기법은 자료 접근 시간을 단축하기 위해 GPU 장치를 메모리 사용을 최적화하여 가능한 더 빠른 메모리를 사용한다. 이점이 GPU를 이용한 계산의 핵심 요소이다. 하나의 GPU 장치를 사용하고 메모리 사용을 최적화함으로써 단일 CPU를 이용할 경우보다 2차원 모사에서는 14배 이상, 3차원에서는 6배 이상 계산시간을 단축할 수 있었다. 세 개의 GPU를 사용한 경우에는 3차원 모사에서 계산효율을 10배 향상시킬 수 있었다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.

Rijndael 알고리즘을 이용한 물리 계층 ATM 셀 보안 기법 (ATM Cell Encipherment Method using Rijndael Algorithm in Physical Layer)

  • 임성렬;정기동
    • 정보처리학회논문지C
    • /
    • 제13C권1호
    • /
    • pp.83-94
    • /
    • 2006
  • 본 논문에서는 미국 NIST에서 차세대 암호화 알고리즘으로 채택한 Rijndeal 알고리즘을 적용한 물리 계층 ATM 셀 보안 기법에 관한 것이다. ATM 셀 보안 기법을 기술하기 위해 물리 계층에서의 데이터 암호화 시의 표준 ISO 9160을 만족하는 데이터 보안 장치를 하드웨어로 구현하여 STM-1급(155.52Mbps) 의 ATM 망에서 암호화/복호화 과정을 검증하였다. 기존의 DES 알고리즘이 블럭 및 키 길이가 64 비트이므로 대용량 데이터 처리가 어렵고 암호화 강도가 취약함에 비해, Rijneal 알고리즘은 블럭 크기가 128 비트이며 키 길이는 128, 192, 256 비트 중 선택 가능해 시스템에 적용 시 유연성을 높일 수 있고 고속 데이터 처리 시에 유리하다. 물리 계층 ATM 셀 데이터의 실시간 처리를 위해 Rijndael 알고리즘을 FPGA로 구현한 소자를 사용하여 직렬로 입력되는 UNI(User Network Interface) 셀을 순환 여유 검사 방법을 이용하여 셀의 경계를 판별하고 셀이 사용자 셀인 경우, 목적지의 주소값 등 제어 데이터를 지니고 있는 헤더 부분을 분리한 48 옥텟의 페이로드를 병렬로 변환, 16 옥텟(128 비트) 단위로 3 개의 암호화 모듈에 각각 전달하여 암호화 과정을 마친 후 버퍼에 저장해 둔 헤더를 첨가하여 셀로 재구성하여 전송하여 준다. 수신단에서 복호화 시에는 페이로드 종류를 판별하여, 사용자 셀인 경우에는 셀의 경계를 판별한 다음 페이로드를 128 비트 단위로 3 개의 암호화 모듈에 각각 전달하여 복호화하며, 유지 보수 셀인 경우에는 복호화 과정을 거치지 않는다. 본 논문에 적용한 Rijndael 암호화 소자는 변형된 암복호화 과정을 적용하여 제작된 소자로 기존에 발표된 소자에 비해 비슷한 성능을 지니면서 면적 대 성능비가 우수한 소자를 사용하였다.ochlorococcus의 수층별 평균 풍도의 수직분포는 표면 혼합층에서 유사한 수준을 보이다 이심에서 급격한 감소를 나타냈다. 그러나 TSWP에선 풍도의 급격한 감소가 나타나지 많고 100 m 수심까지 높은 풍도를 나타냈다. Picoeukaryotes는 C-ECS에서 100 m까지 유사한 수준의 풍도를 보였으며, 동해의 $20\sim30\;m$ 수심에선 최대 풍도층이 나타났다.특별한 영향을 미치지 않는 것으로 나타났다. 동일 환자들의 골상태의 변화관찰과 신질환 관련 골감소의 요인을 밝혀내기 위한 추가적인 연구가 필요할 것으로 사료된다. 정확한 진단 및 동반된 질환을 감별하기 위한 노력이 필요하다.심되나 X-ray VCUG로 발견되지 않은 경우에는 RI VCUG를 꼭 시행하는 것이 방광요관역류의 정확한 진단을 하는데 도움이 된다..25% sodium 식이 enalapril군에서 사구체여과율이 증가됨을 관찰할 수 있었다. 4) 신절제술후 남아 있는 신조직무게를 비교하여 보면 24주째 0.25% sodium 식이군, 0.25% sodium 식이 enalapril군, 0.25% sodium 식이 nicardipine군에서 16주째 0.49% sodium 식이군, 0.49% sodium 식이 enalapril군, 0.49% sodium 식이 nicardipine 군보다 의의있게 신조직무게가 증가됨을 관찰할 수 없었다. 5) 0.25% sodium 식이군은 0.49% sodium 식이군과 비교하여 MES의 현저한 감소를 보였고 (0.25% sodium식이군: 12주; $1.97{\pm}0.02$, 24주; $2.06{\pm}0.03$ vs. 0.49% sodium 식이군: 12주; $2.29{\pm}0.09$, 16주; $2.55{\pm}0.