• 제목/요약/키워드: 스레드

검색결과 277건 처리시간 0.025초

다중코어 프로세서를 이용한 전산화단층촬영의 재구성 시간 개선 (Improvement in Reconstruction Time Using Multi-Core Processor on Computed Tomography)

  • 천권수
    • 한국방사선학회논문지
    • /
    • 제9권7호
    • /
    • pp.487-493
    • /
    • 2015
  • 전산화단층촬영에서 재구성 과정은 상당한 시간이 요구된다. 단면 영상의 품질을 높이기 매트릭스 크기를 증가시키면 재구성 시간이 매우 빠른 속도로 증가한다. 다중코어 프로세서는 오늘날 광범위하게 사용되고 있으며, 다중코어 프로세서의 다중 스레드를 이용하여 계산 시간을 줄이는 것이 가능하다. 본 연구는 다중 스레드로 CT의 재구성 시간을 개선하였다. 다중 스레드를 위해 Pthread와 OpenMP를 이용하였고, 재구성 과정에서 많은 시간이 소비되는 컨볼루션과 역투역 과정을 자세히 조사하였다. Pthread와 OpenMP 모두 스피드업과 효율성 측면에서 비슷한 성능을 나타내었다.

GPGPU 프로그램의 자료경합 탐지기법을 위한 벤치마크 모음 (A Benchmark Suite for Data Race Detection Technique in GPGPU Progrmas)

  • 이건표;최으뜸;전용기
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.7-8
    • /
    • 2019
  • 자료경합은 두 개 이상의 스레드가 같은 공유메모리에 적절한 동기화 없이 접근하고, 적어도 한 개의 접근사건이 쓰기일 때 발생할 수 있는 동시성 오류이다. 자료경합은 프로그래머가 의도하지 않은 비결정적인 수행결과를 초래하여, 항공기 소프트웨어와 같은 고신뢰성이 요구되는 프로그램에서 치명적인 오류를 발생시켜 인적 물적 손해로 이어질 수 있다. 자료경합 탐지기법은 이러한 문제를 사전에 탐지하여 수정하는데 사용되어진다. 하지만 GPGPU 프로그램에서의 자료경합은 CPU 병행프로그램에서보다 복잡한 실행구조를 가지고 있어 스레드 및 메모리 계층, 스케줄링, 동기화 기법 등의 많은 변수가 존재한다. 이로 인해 실세계 프로그램에 자료경합 탐지기법을 적용하여 검증 시 이러한 변수들을 반영하여 실험하는데 많은 노력이 소요된다. 본 논문은 실세계 프로그램에서의 자료경합을 대표하는 4가지 패턴의 합성프로그램으로 이루어지고 실행 시 스레드 및 메모리 계층, 스레드 구조, 메모리 사용량 및 동기화 방안을 지정할 수 있는 벤치마크 모음을 제시한다.

  • PDF

다중 접속 온라인 게임을 위한 유니티 엔진의 네트워크 스레드 패킷 폐기 기법 (Packet Discard Policy of Network Thread in an Unity Engine for Multi-player Online Games)

  • 유종근;김영식
    • 한국게임학회 논문지
    • /
    • 제15권6호
    • /
    • pp.97-106
    • /
    • 2015
  • 유니티 엔진 기반 다중 접속 온라인 게임에서는 통신 패킷 처리를 담당하는 네트워크 스레드와 게임 로직을 담당하는 메인 스레드를 분리해야 한다. 네트워크 스레드 간에 통신 패킷은 렌더링 속도 향상을 위하여 중복되는 패킷을 폐기할 필요가 있다. 본 논문에서는 유니티 엔진 기반 다중 접속 온라인 게임을 위한 네트워크 스레드 간 통신 패킷 폐기 기법을 제안한다. 제안하는 기법은 Partial Packet Discard 기법과 Periodic Packet Discard 기법을 혼합한 기법으로 네트워크 패킷을 큐로 관리하고 중복되는 패킷을 주기적으로 폐기하여 렌더링 속도를 향상시킨다. 제안하는 기법은 유니티 엔진 기반 다중 접속 온라인 게임의 다양한 패킷 발생 시뮬레이션을 통하여 렌더링 속도를 분석하고 효율성을 증명하였다.

CC-NUMA 시스템을 위한 다중 스레드 프로세스의 노드 스케줄링 설계 및 구현 (The Node Scheduling of Multi-Threaded Process for CC-NUMA System)

  • 김정녀;김해진;이철훈
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.488-496
    • /
    • 2000
  • 본 논문에서는 여러 개의 노드가 상호연결망으로 연결되어 각각의 메모리를 공유하는 CC-MUMA 시스템인 고성능 멀티미디어 서버(MX-Server)상에서 다중 스레드 프로세스의 노드 스케줄링 설계 및 구현 내용을 소개한다. 고성능 멀티미디어 서버의 컴퓨팅 서버용 운영체제인 COSMIX(cache COherent Shared Memory unIX)에서는 서버의 플랫폼에 알맞은 하드웨어 및 시스템 관련하여 CC-NUMA 시스템에 적합한 운영체제 기능을 설계하였다. 고성능 멀티미디어 서버는 최대 8개까지의 노드로 구성된 CC-NUMA 시스템으로 각 노드들은 SCI ring으로 연결된다. 이러한 CC-NUMA 구조의 시스템에서 데이터의 지역성을 고려한 노드 스케줄링 방식으로 Oracle8i와 같은 DBMS의 성능을 높이고자 한다. 고성능 멀티미디어 서버에서는 데이터의 저역성을 고려하여 한 노드에 프로세스를 바인드 하는 기능이 있으나, 그중 다중 스레드로 구성된 프로세스의 바인드 기능은 없다. Oracle 8i와 간츤 DBMS에서는 다중 스레드로 구성된 하나의 프로세스가 일정한 디스크를 점유하여 사용할 수 있으므로 이와 같은 다중 스레드의 프로세스를 해당 디스크가 있는 하나의 노드 즉 cg에 마인드 하는 기능을 구현하였다. 현재는 가용한 플랫폼이 없어서 MX Server 대신 PC 테스트베드를 이용한 CC-NUMA 시스템의 시뮬레이션 환경을 구축하여 다중 스페드의 CG 바인드 기능을 개발하고 그 시험을 완료하였다.

  • PDF

멀티코어 시스템에서 쓰레드 수에 따른 병렬 색변환 성능 검증 (A Performance Evaluation of Parallel Color Conversion based on the Thread Number on Multi-core Systems)

  • 김정길
    • 한국위성정보통신학회논문지
    • /
    • 제9권4호
    • /
    • pp.73-76
    • /
    • 2014
  • 멀티 코어 프로세서의 보급 확산으로 최근에는 임베디드 시스템에서도 채택되고 있다. 따라서 일반적으로 대규모의 컴퓨팅과 메모리 접근을 필요로 하는 멀티미디어 응용은 멀티 코어 플랫폼 기반의 병렬화가 가능하다. 본 논문에서는 멀티 코어 CPU을 이용한 효율적 색 공간 변환을 위한 스레드 수준 병렬 기법의 성능 향상을 검증하였다. 스레드 수준 병렬화 특히 멀티 코어 프로세서기반 공유 메모리 컴퓨팅 시스템에서는 매우 유용한 병렬 처리 패러다임이 되고 있다. 본 구현에서 스레드 수준 병렬화는 각 스레드에 다른 입력 픽셀을 할당하여 실행하였다. 성능 평가를 위해 직렬 및 병렬 구현들 사이의 처리 속도의 비교에 기초하여 대표적 멀티 코어 프로세서에서 색 변환을 위한 성능 향상 정도를 평가하였다. 결과는 스레드 수준의 병렬 구현에 관계없이 다른 멀티 코어에서 전반적으로 비슷한 성능 향상의 비율을 보여주었다.

GPGPU 기반 Convolutional Neural Network의 효율적인 스레드 할당 기법 (Efficient Thread Allocation Method of Convolutional Neural Network based on GPGPU)

  • 김민철;이광엽
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권10호
    • /
    • pp.935-943
    • /
    • 2017
  • 많은 양의 데이터 기반으로 학습하는 neural network 중 이미지 분류나 음성 인식 등에 사용되어 지고 있는 CNN(Convolution neural network)는 현재까지도 우수한 성능을 가진 구조로 계속적으로 발전되고 있다. 제한된 자원을 가진 임베디드 시스템에서 활용하기에는 많은 어려움이 있다. 그래서 미리 학습된 가중치를 사용하지만 여전히 한계점이 있기 때문에 이를 해결하기 위해 GPU의 범용 연산을 위해서 사용하는 GP-GPU(General-Purpose computing on Graphics Processing Units)를 활용하는 추세다. CNN은 단순하고 반복적인 연산을 수행하기 때문에 SIMT(Single Instruction Multiple Thread)기반의 GPGPU에서 스레드 할당과 활용 방법에 따라 연산 속도가 많이 달라진다. 스레드로 Convolution 연산과 Pooling 연산을 수행할 때 쉬어야 하는 스레드가 발생하는 데 이러한 문제를 해결하기 위해 남은 스레드가 다음 피쳐맵과 커널 계산에 활용되는 방법을 사용함으로써 연산 속도를 증가시켰다.

임베디드 시스템에서 프로세스 기반 소프트웨어를 쓰레드 기반으로 전환시 재사용성 측정 (Measuring Software Reusability when converting process-based software to thread-based RTOS software on Embedded System)

  • 경보현;최혁승;박정형
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.400-402
    • /
    • 2004
  • 정보 가전 분야에 있어서 급속한 기술 발전으로 인해 하루가 다르게 새로운 기능이 추가됨에 따라 임베디드 시스템 소프트웨어의 크기 및 복잡도 또한 함께 증가하고 있고 이를 개발하고 유지보수 하는데 있어서도 막대한 비용과 노력이 요구된다. 이를 해결하기 위한 방안으로 소프트웨어의 재사용성을 높이기 위한 노력이 이어지고 있다. 본 논문에서는 프로세스 방식 기반의 OS를 적용한 소프트웨어를 스레드 방식의 OS 기반의 소프트웨어로 전환하여 임베디드 시스템을 구현하였으며 소프트웨어 방법론으로는 스레드 방식의 OS 기반 소프트웨어에 수정된 DARTS(Design Approach to Real- Time Systems) 방법론을 적용하여 시스템을 구현하였다. 이 구현된 시스템에서 재사용성을 측정하여 표로 제시하며 그 측정 결과를 분석하였다. 그리고 스레드 방식의 OS 기반 소프트웨어에 수정된 DARTS 방법론을 적응하여 코드만 재사용이 아니라 설계방법도 재사용이 가능함을 CE 제품에 보이고자 한다.

  • PDF

스택을 이용하지 않는 스레드 트리 구성 알고리즘 (A Threaded Tree Construction Algorithm not Using Stack)

  • 이대식
    • 인터넷정보학회논문지
    • /
    • 제5권5호
    • /
    • pp.119-127
    • /
    • 2004
  • 언어 기반 프로그래밍 환경의 발전에 따라 점진적 파싱에 대한 연구는 핵심적인 분야가 되었다. 본 논문의 목적은 파싱 속도(lime)와 기억장소가 많이 요구하는 기존의 알고리즘들보다 효율적인 점진적 파싱 알고리즘을 제시하는데 있다. 본 논문에서는 스택을 이용하지 않는 스레드 트리 구성 알고리즘을 제안하였다. 또한 노드의 재파싱 과정을 없애기 위해 스택을 이용하지 않는 노드 생성 알고리즘과 점진적 스레드 트리 구성 알고리즘을 제안하였다.

  • PDF

병렬 프로그램의 동적 분석을 위한 효율적인 감시 필터링 기술 (An Efficient Filtered Monitoring Technique for Dynamic Analysis of Parallel Programs)

  • 박세원;하옥균
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제53차 동계학술대회논문집 24권1호
    • /
    • pp.9-10
    • /
    • 2016
  • 본 논문에서는 멀티 스레드 기반 병렬 프로그램의 동적 분석을 통한 자료경합 탐지를 위해 효율적인 감시 필터링 기술을 제시한다. 제시하는 감시 필터링 기술은 자료경합과 같은 동시성 오류를 탐지하기 위해 프로그램의 수행 중에 발생하는 공유 메모리에 대한 스레드들의 접근 분석 시에 동일한 코드영역을 단순 반복하는 스레드들을 감시대상에서 제외시킴으로써 동적 분석을 위한 추가적인 오버헤드를 최소화한다. 제시하는 필터링 기술을 수행 중 자료경합 탐지 도구에 적용한 실험적 평가를 통해 개선된 수행시간 오버헤드의 제공이 가능함을 보인다.

  • PDF

다중스레드를 이용한 분산 환경에서의 이미지 검색 에이전트 (Multi-Thread based Image Retrieval Agent in Distributed Environment)

  • 차상환;김순철;조용현;황병곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.947-950
    • /
    • 2004
  • 본 논문에서는 분산 환경에서 이미지 정보를 수집하고 검색하기 위해 다중스레드를 사용한 이미지 검색 에이전트를 구현하였다. 본 논문에서 제안한 이미지 검색 에이전트는 정보의 효과적인 검색을 위해 다중스레드를 사용함으로써 처리기의 이용률을 높일 수 있었고 웹상의 정보를 전달받는데 소요되는 대기시간과 처리시간을 줄일 수 있었다. 이미지 검색을 위한 에이전트는 플랫폼에 독립적인 자바언어를 사용하여 분산 환경에 적합하도록 하였고, 검색한 이미지 저장을 위해 JDBC를 사용하여 데이터베이스에 연결하였다. 또한 이미지 자체는 분산된 에이전트의 데이터베이스에 저장하고 이미지의 인덱스만 인덱스 서버에 저장함으로써 검색 시간을 줄일 수 있었다.

  • PDF