• 제목/요약/키워드: Cluster Computing

검색결과 425건 처리시간 0.027초

IT 모듈의 자유 낙하 모사를 위한 병렬처리시스템의 적용 (Application of Parallel Processing System for free drop simulation of IT-related modules)

  • 박영재;이준성;고한옥;장윤석;최재붕;김영진
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2006년도 춘계학술대회 논문집
    • /
    • pp.405-406
    • /
    • 2006
  • Recently, the flat display modules such as plasma or TFT-LCD employ thin crystallized panels which are normally weak to high level transient mechanical energy inputs. As a result, anti-shock performance is one of the most important design specifications for TFT-LCD modules. However, most of large display module designs are generated based on engineers own experiences. Also, a large-scale analysis to evaluate complex material and structural behaviors is one of interesting topic in diverse engineering and scientific fields. The utilization of massively parallel processors has also been a recent trend of high performance computing. The objective of this paper is to introduce a parallel process system which consists of general purpose finite element analysis solver as well as parallelized PC cluster. The parallel processing system is constructed using thirty-two processing elements and the finite element program is developed by adopting hierarchical domain decomposition method. In order to verify the efficiency of the established system, an impact analysis on thin and complex sub-parts of flat display modules is performed. The evaluation results showed a good agreement with the corresponding reference solutions, and thus, the parallel process system seems to be a useful tool fur the complex structural analysis such as IT related products.

  • PDF

세부 동작 기반 사물인터넷 서비스 분류 기법 개발 (Development of IoT Service Classification Method based on Service Operation Characteristic)

  • 조정훈;이화민;이대원
    • 인터넷정보학회논문지
    • /
    • 제19권2호
    • /
    • pp.17-26
    • /
    • 2018
  • 최근 사물인터넷 서비스의 등장 및 융합으로 통합 사물인터넷 서비스 플랫폼에 관한 다양한 연구가 진행되었다. 현재 사물인터넷 서비스는 서비스 제공자의 목적에 따라 독립적인 시스템으로 구축되어 유사한 서비스를 제공하는 서비스 간의 정보 교환 및 모듈 재사용이 불가능 하였다. 이에 본 연구에서는 통합 사물인터넷 플랫폼 환경을 제공하기 위하여 다양한 서비스들의 세부 동작 기반 서비스 분류 알고리즘을 제안한다. 구현을 통하여 상용화된 100여개의 사물인터넷 서비스를 분류 및 군집화를 진행하였으며 이를 기반으로 K-means알고리즘과 비교하여 제안하는 알고리즘의 성능을 평가하였다. 또한 표본 집단의 부족으로 발생하는 단일 클러스터를 방지하기 위하여 K-means 알고리즘을 활용하여 재 군집화를 진행하였다. 향후 연구로 기존의 서비스 표본 집단을 확대하고 현재 구현한 분류 시스템을 보다 빠르고 대량의 데이터 처리를 위하여 스파크를 활용할 예정이다.

MPICH-GP : 그리드 상에서 사설 IP 클러스터 지원을 위한 MPI 확장 (MPICH-GP : An MPI Extension to Supporting Private IP Clusters in Grid Environments)

  • 박금례;윤현준;박성용;권오영;권오경
    • 정보처리학회논문지A
    • /
    • 제14A권1호
    • /
    • pp.1-14
    • /
    • 2007
  • 그리드 네트워크에서 MPI를 사용하여 지리적으로 산재된 컴퓨팅 자원을 활용하여 복잡한 문제를 해결하기 위한 MPICH-G2는 사설 IP 클러스터를 지원하지 못한다는 단점을 가지고 있다. MPICH-G2의 경우에는 모든 계산노드가 외부에 노출되어 악의적인 보안 침해의 가능성이 높아지게 된다. MPICH-GP는 NAT와 프락시를 병용하여 사설 IP 클러스터의 문제를 해결한다. 사설 IP 클러스터의 프론트 노드에 프락시를 두고, 이를 통해 내부 계산 노드로의 통신 링크를 중계한다. 따라서 사설 IP 클러스터와 공인 IP 클러스터가 혼재된 네트워크에서도 적정한 경로를 설정하고 성공적으로 MPI 작업을 수행할 수 있다. 본 논문에서는 MPICH-GP의 성능을 기존의 MPICH-G2와 비교하였다. 그리드 환경에서 MPICH-GP는 MPICH-G2의 80% 이상의 성능을 보이며, RANK 관리기법을 적용한 경우는 95% 이상의 성능을 나타낸다.

데이타베이스 공유 시스템에서 버전 캐싱을 이용한 단일 노드 고장 회복 기법 (A Recovery Scheme of Single Node Failure using Version Caching in Database Sharing Systems)

  • 조행래;정용석;이상호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권4호
    • /
    • pp.409-421
    • /
    • 2004
  • 데이타베이스 공유 시스템(DSS)은 고성능 트랜잭션 처리를 위하여 여러 개의 처리 노드를 연결한 구조로서, 각 노드는 데이타베이스를 저장한 디스크를 공유한다. DSS를 구성하는 노드들이 고장날 경우 데이타베이스를 정확한 상태로 복구하기 위한 회복 과정이 필요한데 DSS에서 회복 작업은 하나의 노드로 구성된 일반적인 데이타베이스 시스템보다 많은 시간이 소요된다. 그 이유는 데이타베이스를 회복하기 위해 여러 노드에 나누어 저장된 로그들을 병합하여야 하며, 병합된 로그들을 이용하여 REDO 작업을 수행하여야 하기 때문이다. 본 논문에서는 Oracle 9i Real Application Cluster (ORAC)에서 제안된 캐쉬 연합 알고리즘의 성능을 개선한 2VC(Two Version Caching) 알고리즘을 제안한다. 2VC는 단일 노드 고장에 대한 회복 작업에서 로그 병합 과정을 생략할 수 있으므로 빠른 데이타베이스 회복을 지원할 수 있다는 장점을 갖는다. 뿐만 아니라, ORAC에서 발생하는 불필요한 디스크 기록 오버헤드를 줄임으로써 정상적인 트랜잭션 처리의 성능을 향상시킬 수 있다.

리눅스 기반의 클러스터 VOD서버와 내장형에 클라이언트의 구현 (Implementation of a Cluster VOD Server and an Embedded Client based on Linux)

  • 서동만;방철석;이좌형;김병길;정인범
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권6호
    • /
    • pp.435-447
    • /
    • 2004
  • VOD 시스템에서는 한정된 자원을 이용하여 많은 사용자에게 안정적인 QoS(Quality of Service)를 제공하는 것이 중요하다. 실제 구현 환경에서 QoS의 문제점들을 분석하기 위하여 본 연구에서는 소스 공개 플랫폼인 리눅스를 기반으로 하는 클러스터형 VOD 서버와 내장형 클라이언트 시스템을 구현하였다 서버에서는 MPEG 미디어 데이타의 병렬 처리와 부하 균등, VCR 기능을 구현하였다. VOD 사용자에게 보다 친밀한 인터페이스를 제공하기 위하여 일반 TV를 단말로 사용하였고 VCR 기능들을 제공하기 위하여 내장형 보드를 사용하였다. 본 논문에서는 사용자들의 다양한 요구사항에서의 성능 측정을 바탕으로 VOD 시스템의 성능 한계 일인들을 평가한다. 또한, 분석된 자료를 근거로 VOD 시스템에서의 가용 메모리와 가용 네트워크 대역폭을 기준으로 하는 동적 진입 제어의 방법을 제안한다. 제안된 방법은 시스템 자인의 효율성을 증가시켜 더욱 많은 사용자들에게 QoS가 보장되는 미디어 스트림을 제공한다.

GPU 클러스터 기반 대용량 온톨로지 추론 (Scalable Ontology Reasoning Using GPU Cluster Approach)

  • 홍진영;전명중;박영택
    • 정보과학회 논문지
    • /
    • 제43권1호
    • /
    • pp.61-70
    • /
    • 2016
  • 근래에 들어 다양한 시멘틱 서비스를 위하여 기존의 지식을 바탕으로 새로운 지식을 고속으로 추론할 수 있는 대용량 온톨로지 추론 기법이 요구되고 있다. 이런 추세에 따라 대규모의 클러스터를 활용하는 하둡 및 Spark 프레임워크 기반의 온톨로지 추론 엔진 개발이 연구되고 있다. 또한, 기존의 CPU에 비해 많은 코어로 구성되어 있는 GPGPU를 활용하는 병렬 프로그래밍 방식도 온톨로지 추론에 활용되고 있다. 앞서 말한 두 가지 방식의 장점을 결합하여, 본 논문에서는 RDFS 대용량 온톨로지 데이터를 인-메모리 기반 프레임워크인 Spark를 통해 분산시키고 GPGPU를 이용하여 분산된 데이터를 고속 추론하는 방법을 제안한다. GPGPU를 통한 온톨로지 추론은 기존의 추론 방식보다 저비용으로 고속 추론을 수행하는 것이 가능하다. 또한 Spark 클러스터의 각 노드를 통하여 대용량 온톨로지 데이터에 대한 부하를 줄일 수 있다. 본 논문에서 제안하는 추론 엔진을 평가하기 위하여 LUBM10, 50, 100, 120에 대해 추론 속도를 실험하였고, 최대 데이터인 LUBM120(약 1백7십만 트리플, 2.1GB)의 실험 결과, 인-메모리(Spark) 추론 엔진 보다 7배 빠른 추론 성능을 보였다.

무선 센서 네트워크에서 C-SCGP를 이용한 RSS/AOA 이상치 제거 기반 표적 위치추정 기법 (Outlier Reduction using C-SCGP for Target Localization based on RSS/AOA in Wireless Sensor Networks)

  • 강세영;이재훈;송종인;정원주
    • 융합정보논문지
    • /
    • 제11권11호
    • /
    • pp.31-37
    • /
    • 2021
  • 본 논문에서는 무선 센서 네트워크에서 이상치를 포함한 수신 신호 강도와 신호의 도달 각도 측정치 기반의 표적위치추정 성능 저하를 방지하기 위한 이상치 검출 알고리즘 C-SCGP를 제안한다. 센서 오작동, 재밍, 심한 잡음과 같은 다양한 이상치 원인으로 인해 표적 위치추정 정확도가 크게 떨어질 수 있어, 모든 이상치를 탐지하고 제거하는 것이 중요하다. 이러한 이상치를 제거하기 위해 single cluster graph partitioning (SCGP) 알고리즘이 널리 사용되고 있다. 기존의 SCGP 알고리즘은 hyperparameter 최적화를 통한 threshold 설정과 이상치 확률 계산이 필수적이므로 다양한 분야에 효율적인 적용이 제한되어왔다. 본 논문에서 제안된 continuous-SCGP (C-SCGP) 알고리즘은 이러한 SCGP의 약점을 극복한다. 다양한 잡음 환경에서 threshold 설정과 이상치 확률 계산이 필요 없는 제안된 C-SCGP 알고리즘과 threshold 설정과 이상치 확률 계산을 요구하는 SCGP 알고리즘의 이상치 제거 성능이 같음을 최종 추정된 표적의 RMSE 성능을 통하여 검증하였다.

클라우드 컴퓨팅을 이용한 유시티 비디오 빅데이터 분석 (An Analysis of Big Video Data with Cloud Computing in Ubiquitous City)

  • 이학건;윤창호;박종원;이용우
    • 인터넷정보학회논문지
    • /
    • 제15권3호
    • /
    • pp.45-52
    • /
    • 2014
  • 유비쿼터스 시티(유시티)에서는 수많은 비디오 카메라들이 설치된다. 이렇게 설치된 많은 카메라로부터 대용량의 비디오 데이터가 실시간으로 끊임없이 발생하고 유시티의 관리 시스템으로 전달된다. 유시티의 다양한 서비스들을 뒷받침하기 위해서는 이러한 비디오 데이터를 저장하고, 이렇게 저장된 대용량의 비디오 데이터를 분석할 수 있는 방법과 관리 시스템이 요구된다. 그래서, 이 논문에서는 클라우드 컴퓨팅을 기반으로 한 유시티 비디오 관리 시스템을 제안한다. 또한, 근래 주목받고 있는 데이터 병렬처리 프레임워크인 Hadoop MapReduce를 이용하여 이러한 빅데이터 비디오를 분석하는 방법을 제안하고, 이에 따른 우리의 성능 평가를 소개한다.

M&S 지원을 위한 HEMOS-Cloud 서비스의 경제적 효과 (Economic Impact of HEMOS-Cloud Services for M&S Support)

  • 정대용;서동우;황재순;박성욱;김명일
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권10호
    • /
    • pp.261-268
    • /
    • 2021
  • 클라우드 컴퓨팅은 서비스 사용자 요구에 따라 컴퓨팅 자원을 임대하여 사용하는 컴퓨팅 패러다임이다. 클라우드 컴퓨팅에서 컴퓨팅 자원은 사용자의 서비스 수요에 따라 컴퓨팅 자원을 확장 또는 축소가 가능하여 전체 서비스 비용 절감 효과를 가질 수 있다. 그리고, M&S (Modeling and Simulation) 기술은 컴퓨팅 자원과 CAE 소프트웨어를 통해 엔지니어링 분석 작업 결과를 얻어, 실제 실험 결과가 없이 제품의 상태를 시뮬레이션을 수행하여 분석하는 방법이다. M&S 기술은 FEA(Finite Element Analysis), CFD(Computational Fluid Dynamics), MBD(Multibody Dynamics) 및 최적화 분야에서 활용된다. M&S 통한 작업 절차는 전처리, 해석, 후처리 단계로 구분된다. CAE 소트프웨어를 통한 3D 모델링 작업인 전/후처리는 GPU 연산이 집약적이며, 3D 모델 해석은 CPU 또는 GPU 연산이 요구된다. 일반적인 개인 데스크톱에서 복잡한 3D 모델을 해석하는 시간이 많이 소요된다. 결과적으로, M&S를 원활하게 수행하기 위해서는 고성능 컴퓨팅 자원이 요구된다. 이 문제를 해결하기 위해 우리는 통합 클라우드 및 클러스터 컴퓨팅 환경인 HEMOS-Cloud 서비스를 제안한다. 제안한 클라우드 기반 방식에서는 M&S에 필요한 전/후처리 및 솔버 작업을 원활하게 수행할 수 있도록 구성했다. 이 시스템에서 전/후처리는 VDI(Virtual Desktop Infrastructure)에서 수행되고 해석은 클러스터 환경에서 수행된다. 각 용도에 맞게 서로 다른 환경에서 분리하여 컴퓨팅 자원 간에 간섭을 최소화했다. HEMOS-Cloud 서비스는 기업 또는 학교에서 M&S의 경험이 필요로 하는 사용자에게 CAE 소프트웨어와 컴퓨팅 자원을 제공한다. 본 논문에서는 HEMOS-Cloud 서비스의 경제적 파급효과를 산업연관분석을 활용하여 분석했다. 전문가의 의견을 반영하여 조정된 계수를 통한 분석 결과는 생산유발효과 74억원, 부가가치유발효과 41억원, 취업자유발효과 10억원당 50명으로 분석되었다.

A Study on Distributed System Construction and Numerical Calculation Using Raspberry Pi

  • Ko, Young-ho;Heo, Gyu-Seong;Lee, Sang-Hyun
    • International journal of advanced smart convergence
    • /
    • 제8권4호
    • /
    • pp.194-199
    • /
    • 2019
  • As the performance of the system increases, more parallelized data is being processed than single processing of data. Today's cpu structure has been developed to leverage multicore, and hence data processing methods are being developed to enable parallel processing. In recent years desktop cpu has increased multicore, data is growing exponentially, and there is also a growing need for data processing as artificial intelligence develops. This neural network of artificial intelligence consists of a matrix, making it advantageous for parallel processing. This paper aims to speed up the processing of the system by using raspberrypi to implement the cluster building and parallel processing system against the backdrop of the foregoing discussion. Raspberrypi is a credit card-sized single computer made by the raspberrypi Foundation in England, developed for education in schools and developing countries. It is cheap and easy to get the information you need because many people use it. Distributed processing systems should be supported by programs that connected multiple computers in parallel and operate on a built-in system. RaspberryPi is connected to switchhub, each connected raspberrypi communicates using the internal network, and internally implements parallel processing using the Message Passing Interface (MPI). Parallel processing programs can be programmed in python and can also use C or Fortran. The system was tested for parallel processing as a result of multiplying the two-dimensional arrangement of 10000 size by 0.1. Tests have shown a reduction in computational time and that parallelism can be reduced to the maximum number of cores in the system. The systems in this paper are manufactured on a Linux-based single computer and are thought to require testing on systems in different environments.