• 제목/요약/키워드: parallel computer processing

검색결과 651건 처리시간 0.032초

CDMA 채널 환경에서의 MAP 기반 터보 부호에 관한 연구 (A Study on Iterative MAP-Based Turbo Code over CDMA Channels)

  • 박노진;강철호
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.13-16
    • /
    • 2000
  • 최근의 이동통신 시스템에서 오류 정정 부호화 방식으로 사용되는 Turbo Code의 성능은 부호기에 내재되어 부호의 자유 거리 결정에 큰 영향을 미치는 인터리버와 복호기에서 수행되는 반복 복호에 의한 것이다. 하지만 우수한 성능을 얻기 위해 수신과정에서 많은 지연시간이 요구되는데 이는 주로 인터리버의 크기에 의존하게 된다 또한 Turbo Code는 페이딩 채널 상에서도 신뢰성 있는 강력한 코딩 기법으로 알려져, 최근 ITU 둥에서 IMT-2000과 같은 차세대 이동 통신에서 채널 코드의 표준으로 채택되었다. 따라서 본 논문에서는 복잡도는 2배로 증가하나 성능을 개선시킨 터보 복호기를 제안하고, 차세대 무선 멀티미디어 통신에서 실시간 음성 덴 비디오 서비스를 제공시 복호 지연시간을 단축시키기 위해 가변 복호 방법을 이용하여 AWCN과 페이딩 채널 환경에서의 컴퓨터 모의 실험을 통해 성능 분석을 하였다.

  • PDF

분산 공유 메모리 시스템에서 메모리 접근지연을 줄이기 위한 이중 슬롯링 구조 (A Dual Slotted Ring Organization for Reducing Memory Access Latency in Distributed Shared Memory System)

  • 민준식;장태무
    • 정보처리학회논문지A
    • /
    • 제8A권4호
    • /
    • pp.419-428
    • /
    • 2001
  • 집적회로 기술의 발달은 처리기의 속도를 계속적으로 증가시켜 왔다. 처리기 응용분야의 주요한 도전은 공유 메모리 다중 처리기 시스템에서 고성능 처리기들을 효과적으로 사용하고자 하는 것이다. 우리는 상호 연결망 문제가 소규모의 공유 메모리 다중처리기 시스템에서 조차 완전히 해결되었다고 생각하지 않는다. 그 이유는 공유버스의 속도는 새로운 강력한 처리기들의 대역폭 요구를 수용할 수 없기 때문이다. 지난 수년간 점대점 단방향 연결은 매우 가능성 있는 상호 연결망 기술로서 대두되었다. 단일 슬롯링은 점대점 상호 연결망의 가장 간단한 형태이다. 단일 슬롯링 구조의 단점은 링에서 처리기의 수가 증가함에 따라 메모리 접근지연 시간이 선형적으로 증가한다는 것이다. 이런 이유로 우리는 캐쉬 기반의 다중처리기 시스템에서 단일 슬롯링을 대체할 수 있는 이중 슬롯링 구조를 제안한다. 또한 본 논문에서 새로운 스누핑 프로토콜을 사용하는 이중 슬롯링 구조를 분석하고 분석적모델과 모의 실험을 통하여 기존의 단일 슬롯링과 성능을 비교한다.

  • PDF

프로그램유도 컴비네이터를 이용하는 함수프로그램의 포로세스망 구성 (Functional Programs as Process Networks using Program-derived Combinators)

  • 신승철;유원희
    • 한국정보처리학회논문지
    • /
    • 제3권3호
    • /
    • pp.478-492
    • /
    • 1996
  • 병렬 구문을 갖지 않는 함수 프로그램의 병렬 수행을 위해 람다 계산 해석법(λ- calculus encoding)이 도입되었고 이것은 함수 프로그램을 프로세스 계산(process calculus) 을 이용하여 프로세스망으로 구성하고 프로세스간의 통신 행위에 의해 결과를 얻는 새로운 계산 모델에서 사용될 수 있다. 그러나 람다 계산 해석 법은 상수식 조차도 너무 많은 통신 행위를 야기시키는 문제가 지적되어 왔다. 본 논문은병렬 구문을 갖지 않는 컴비네이터 프로그램을 위한 해석법을 제안한다. 또 이것은 프로세스망 리덕션을 결합할 수 있도록 계산 프로세스인 초어 프로세스(chore process ; chore)를 도입한다. 초어는 지역 그래프 리덕션이 가능한 상수식을 위한 그래프 리덕션 함수를 포함할 수 있으며 초어 프로세스의 생성은 주어진 컴비네이터 프로그램에 대한 표식과 변환에 의해 추출되는 컴비네이터 적용식을 포함하지 않는 G-감축가능한 (G-reducible) 부분식으로부터 이루어진다. 본 논문은 이러한 초어 프로세스를 포함하는 해석법으로 생성된 프로세스망이 초어를 갖지 않는 것보다 더 적은 통신 행위의 회수를 발생한다는 것을 보인다.

  • PDF

IoT 환경을 위한 빅데이터 기반 센서 데이터 처리 및 분석 (Big Data-based Sensor Data Processing and Analysis for IoT Environment)

  • 신동진;박지훈;김주호;곽광진;박정민;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.117-126
    • /
    • 2019
  • IoT 환경에서 발생하는 데이터는 아주 다양하고, 4차 산업혁명의 발전으로 인해 특히 스마트팩토리와 같은 제조 설비 공장에서 발생하는 정형, 비정형 데이터도 확연하게 증가하는 추세이다. 이를 빅데이터 관련 솔루션을 이용하면 다양한 대용량 데이터의 수집, 저장, 처리, 분석 및 시각화 과정을 거쳐 정확한 분석 및 데이터 기반 의사결정을 통한 시스템의 개선 및 확장을 할 수 있다. 따라서 본 논문에서는 IoT 환경에서 사용되는 라즈베리 파이를 이용하여 직접 데이터를 생성하고, 다양한 빅데이터 솔루션을 이용하여 분석한다. 수집에는 Sqoop 솔루션을 이용하여 데이터베이스에서 HDFS로 수집 및 저장하고, 처리에는 Hadoop과 연결되어 병렬 처리가 가능한 Hive 솔루션을 사용하여 데이터를 처리한다. 마지막으로 범용적으로 쓰이는 R 프로그래밍을 통해 처리된 데이터를 분석 및 시각화하여 최종 검증하고자 한다.

워크 그룹 구성 변화에 따른 GPU 기반 천 시뮬레이션의 성능 분석 (The Performance Analysis of GPU-based Cloth simulation according to the Change of Work Group Configuration)

  • 최영환;홍민;이승현;최유주
    • 인터넷정보학회논문지
    • /
    • 제18권3호
    • /
    • pp.29-36
    • /
    • 2017
  • 오늘날 3D 다이내믹 시뮬레이션은 많은 산업들과 밀접한 관계를 가지고 있다. 과거에는 자동차 충돌, 건축물 분야에서 주로 사용되었으나 최근에는 영화나 게임 분야에도 물리 시뮬레이션이 중요한 역할을 하고 있다. 일반적으로 3D 물체를 사실적으로 표현하기 위해서는 많은 수학적 연산이 필요하기 때문에 기존의 CPU 기반의 응용 프로그램들은 이러한 많은 연산량을 실시간으로 처리하는데 무리가 있다. 최근 그래픽 하드웨어의 발전과 아키텍쳐의 개선으로 GPU는 기존의 렌더링 연산뿐만 아니라 범용 목적의 연산 기능을 제공하고 있고 이러한 GPU를 활용하는 연구가 활발히 진행되고 있다. 본 논문에서는 GPU를 이용한 천 시뮬레이션 수행시 수행 성능을 최적화하기 위하여, GPU 셰이더의 실행 환경 변화에 따른 천 시뮬레이션 알고리즘의 수행 성능의 변화를 분석하였다. GPU를 이용한 천 시뮬레이션은 GLSL 4.3의 Compute shader를 사용하여 스프링 중심 알고리즘과 노드 중심 알고리즘을 PC기반으로 구현하였고, GLSL Compute shader의 다양한 워크 그룹 (Work Group) 크기와 차원 분배에 따른 연산 속도의 변화를 비교 분석하였다. 실험은 5,000 프레임까지 10회 반복 수행하여 FPS(Frame Per Second)의 평균을 구하여 진행하였다. 실행결과, 노드 중심의 알고리즘이 오히려 스프링 중심의 알고리즘 보다 빠른 수행속도를 보여 주었다.

근사접근법 분석을 위한 오차허용치의 분배방법 (Sharing Error Allowances for the Analysis of Approximation Schemes)

  • 김준모;구은희
    • 대한전자공학회논문지TC
    • /
    • 제46권5호
    • /
    • pp.1-7
    • /
    • 2009
  • 센서네트워크를 포함한 다양한 모바일 네트워크를 구축하는 경우, 네트워크를 구성하는 단말 또는 노드들을 상호연결 하기 위한 배치 및 그래프를 찾아내는 문제가 대두된다. 이러한 문제를 해결 할 수 있는 공통적인 scheme을 제시하고, 이를 기반으로 구성되는 알고리즘의 실행시간 및 그 결과의 바운드를 수리적으로 정립하면, 관련 시스템 구축의 타당성을 정확하게 평가할 수 있게 된다. 본 논문은 이러한 문제를 대표하는 EMST(Euclidean Minimum Spanning Tree) 문제를 대상으로 하여 분산환경 기반에서 EMST를 병렬처리 형태로 구성할 수 있는 scheme을 제공하고, 이 scheme에 의해 구해 질 수 있는 배치 및 그래프가 EMST와 최대로 어느 정도의 차이를 가지게 되는 지를 판단할 수 있는 기준을 제시한다. 그리고 이 scheme에 의해 구성되는 알고리즘의 실행시간 상한을 제시한다.

고밀도 3D 형상 계측 시스템에서의 고속 시차 추정을 위한 NCC 알고리즘 기반 하드웨어 구조 (A hardware architecture based on the NCC algorithm for fast disparity estimation in 3D shape measurement systems)

  • 배경렬;권순;이용환;이종훈;문병인
    • 센서학회지
    • /
    • 제19권2호
    • /
    • pp.99-111
    • /
    • 2010
  • This paper proposes an efficient hardware architecture to estimate disparities between 2D images for generating 3D depth images in a stereo vision system. Stereo matching methods are classified into global and local methods. The local matching method uses the cost functions based on pixel windows such as SAD(sum of absolute difference), SSD(sum of squared difference) and NCC(normalized cross correlation). The NCC-based cost function is less susceptible to differences in noise and lighting condition between left and right images than the subtraction-based functions such as SAD and SSD, and for this reason, the NCC is preferred to the other functions. However, software-based implementations are not adequate for the NCC-based real-time stereo matching, due to its numerous complex operations. Therefore, we propose a fast pipelined hardware architecture suitable for real-time operations of the NCC function. By adopting a block-based box-filtering scheme to perform NCC operations in parallel, the proposed architecture improves processing speed compared with the previous researches. In this architecture, it takes almost the same number of cycles to process all the pixels, irrespective of the window size. Also, the simulation results show that its disparity estimation has low error rate.

다중 스케일 텍스처 합성 (Multi-scale Texture Synthesis)

  • 이성호;박한욱;이정;김창헌
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제14권2호
    • /
    • pp.19-25
    • /
    • 2008
  • 이 논문에서는 각기 다른 스케일에서 각각의 구조를 띤 텍스처를 합성하는 기법을 제안한다. 우리의 기법은 GPU로 실시간으로 수행되는 병렬 텍스처 합성 기법에 기반을 두었다. 새로 도입된 좌표 변환 연산자를 이용하면 이미 합성된 좌표 맵을 다른 스케일의 입력 텍스처로의 좌표 공간으로 변환할 수 있다. 이 연산자는 작은 룩업 테이블로 미리 연산될 수 있기 때문에 본 기법을 도입함으로써 생기는 오버헤드는 매우 적다. 우리의 업샘플 기법은 텍스처가 두드러전 이미지의 해상도를 높일 때 특히 유용하다. 그리고, 우리의 기법을 이용하여 저해상도 컨트롤 이미지를 이용한 텍스처 디자인도 가능하다. 이 디자인 툴은 지형을 특정한 스타일로 디자인하는 데에 유용하며 일반적인 높낮이 조절 브러시를 이용할 수 있으므로 직관적이다.

  • PDF

Efficient GPU Framework for Adaptive and Continuous Signed Distance Field Construction, and Its Applications

  • Kim, Jong-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.63-69
    • /
    • 2022
  • 본 논문에서는 적응형 및 연속적인 부호 거리장을 빠르게 계산하기 위한 새로운 GPU 기반 프레임워크를 제안하고, 이를 활용한 렌더링/충돌처리 관련 사례를 살펴본다. 삼각형 메쉬로부터 구성된 쿼드트리를 GPU 메모리로 전달하고, 이를 활용하여 삼각형에 대한 유클리디안 거리를 각 스레드 별로 병렬 처리함으로써 적응형 격자 공간에서 불연속 없이 연속적인 최단 거리를 찾는다. 이 과정에서 적응형 부호 거리장의 절단면 보기, 특정 위치에서의 거리 값 조회, 실시간 레이트레이싱 및 충돌처리 작업을 빠르고 효율적으로 수행될 수 있는지를 실험을 통해 보여준다. 제안하는 방법을 사용하면 하이폴리곤 메쉬에서도 1초 내외로 빠르게 적응형 부호 거리장을 계산할 수 있기 때문에 강체뿐만 아니라 변형체에서도 충분히 활용될 수 있는 방법이며, 다양한 모델에서도 정확하게 샘플링하고 거리 값을 나타낼 수 있는지 다양한 실험 결과를 통해 알고리즘의 안정성을 보여준다.

무선메쉬 네트워크 환경에서 다중홉 ARP 기반의 효율적인 이동성 지원 (An Efficient Mobility Support Scheme based Multi-hop ARP in Wireless Mesh Networks)

  • 전승흡;조영복;이상호
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권11호
    • /
    • pp.91-96
    • /
    • 2009
  • 이 논문에서는 이기종 무선 메쉬 네트워크망에서 상호 연동성 및 메쉬 노드의 효율적인 IP 이동성을 제공하기 위한 다중홉 ARP 기법을 제안한다. 이기종 무선 메쉬 네트워크는 무선 메쉬 네트워크를 기본으로 하는 백본 무선 메쉬 네트워크와 non-무선 메쉬 네트워크 구조를 기반으로 하는 클라이언트 무선 메쉬 네트워크. 이 두 개의 네트워크가 이동성을 가지고 결합된 하이브리드 무선 메쉬 네트워크로 구분된다. 하이브리드 무선 메쉬 네트워크에서 두 네트워크 연결 시 서로 다른 라우팅 프로토콜을 사용할 경우 두 프로토콜의 접점인 게이트웨이에서 프로토콜 변환처리를 병행해야 하는 과부하 문제가 심각하게 발생한다. 이 논문에서는 서로 다른 라우팅 프로토콜을 병행하여 사용할 경우 발생하는 과부하 문제를 해결하기 위해서 다중홉 ARP 기법을 제안한다. 제안된 기법은 효율적인 연동을 위해 L3 라우팅 프로토콜로 다중홉 ARP 기법을 설계 구축하여 실험을 통해 이동 메쉬 노드의 수가 증가하는 경우와 홉수가 증가 시 패킷전달 비율을 통해 노드의 신뢰성과 안정성을 보장하였다.