• 제목/요약/키워드: 다중코어

검색결과 160건 처리시간 0.024초

효과적인 메모리 테스트를 위한 가상화 저널 (A Virtualized Kernel for Effective Memory Test)

  • 박희권;윤대석;최종무
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권12호
    • /
    • pp.618-629
    • /
    • 2007
  • 본 논문에서는 64비트 다중-코어 컴퓨팅 환경에서 효과적인 메모리 테스트를 위한 가상화 커널을 제안한다. 이때 효과적이라는 용어는 커널이 존재하는 메모리 공간을 포함한 모든 물리 메모리 공간에 대한 테스트를 시스템 리부팅 없이 수행할 수 있음을 의미한다. 이를 위해 가상화 커널은 4가지 기법을 제공한다. 첫째, 커널과 응용이 물리 메모리를 직접 접근 할 수 있게 하여 원하는 메모리 위치에 다양한 메모리 테스트 패턴을 쓰고 읽는 것이 가능하게 한다. 둘째, 두 개 이상의 커널 이미지가 다른 메모리 위치에서 수행 가능하도록 한다. 셋째, 커널이 사용하는 메모리 공간을 다른 커널로부터 격리한다. 넷째, 커널 하이버네이션을 이용하여 커널 간에 문맥 교환을 제공한다. 제안된 가상화 커널은 인텔사의 Xeon 시스템 상에서 리눅스 커널 2.6.18을 수정하여 구현되었다. 실험에 사용된 Xeon 시스템은 2개의 Dual-core CPU와 2GB 메모리를 탑재하고 있다. 실험 결과 설계된 가상화 커널이 메모리 테스트에 효과적으로 사용될 수 있음을 검증할 수 있었다.

고성능 클러스터 시스템을 위한 인피니밴드 시스템 연결망의 설계 및 구현 (Design and Implementation of an InfiniBand System Interconnect for High-Performance Cluster Systems)

  • 모상만;박경;김성남;김명준;임기욱
    • 정보처리학회논문지A
    • /
    • 제10A권4호
    • /
    • pp.389-396
    • /
    • 2003
  • 인피니밴드(InfiniBand) 기술은 클러스터 컴퓨팅용 고성능 시스템 연결망으로의 활용을 목적으로 컴퓨터 업계를 중심으로 활발히 개발되고 있는 차세대 시스템 연결망 기술이다. 본 논문에서는 고성능 클러스터 시스템을 위한 인피니밴드 시스템 연결망의 설계와 구현을 다루며, 특히 이중(dual) ARM9 프로세서를 기반으로 한 인피니밴드 호스트 채널 어댑터(host channel adapter HCA) 개발에 초점을 맞추어 기술한다. KinCA라는 코드명이 부여된 HCA는 클러스터 시스템의 각 호스트 노드(host node)를 하드웨어 및 소프트웨어적으로 인피니밴드 연결망에 연결한다. ARM9 프로세서 코어는 다중 처리기 구성을 위해 필요한 기능을 지원하지 않으므로, 두 개의 프로세서간 통신 및 인터럽트 메커니즘을 설계하여 Kinch 칩에 내장하였다. 일종의 SoC인 KinCA 칩은 0.18$\mu\textrm{m}$ CMOS 기술을 사용하여 564핀 BGA(Ball Grid Array) 소자로 제작되었다. KinCA는 호스트 노드에 장착되어 송신과 수신 각각에 대하여 10Gbps의 고속 대역폭을 제공함으로써 고성능 클러스터 시스템의 구현을 가능하게 해준다.

EPON 기반 홈게이트웨이를 이용한 댁내 망에서의 방송통신 융합 서비스 (Convergence of Broadcasting and Communication in Home Network using E-PON based Home Gateway)

  • 박완기;김대영
    • 대한전자공학회논문지TC
    • /
    • 제42권6호
    • /
    • pp.9-16
    • /
    • 2005
  • 본 논문에서는 액세스 망 인터페이스로 EPON 정합을 기본으로 하는 홈 네트워크에서 방송 서비스와 IP 데이터 서비스를 융합하는 것에 초점을 두고자 한다. 본 논문에서는 액세스 망에서는 오버레이 전송 방법을 이용하고 홈 네트워크에서는 멀티캐스트 그룹 관리 프로토콜인 IGMP와 IGMP 스누핑 기능을 이용함으로써 액세스 망에서뿐만 아니라 댁내에서도 방송 서비스와 데이터 서비스를 융합시킬 수 있는 새로운 구조를 제안한다. 또한, 홈 게이트웨이를 통해 댁내 방송 서비스를 지원하기 위한 일련의 방법 및 절차에 대하여 설명한다. 본 논문에서 제안하고자 하는 방법은 다음의 3 가지로 구성되어 있다. I) 방송신호와 인터넷 데이터의 오버레이 전송 모델, ii) 다중 튜너 시스템을 이용하는 튜너/변화 모듈에서 특정 방송 채널을 선택하고 선택된 방송 스트림을 IP 멀티캐스트 패킷으로의 변환, iii) 변환된 IP 멀티캐스트 패킷을 L2 이더넷 홈 게이트웨이의 코어 모듈인 L2 이더넷 스위치로 보내고 IGMP 스누핑 기능을 이용하여 L2 멀티캐스트 처리 방법에 의하여 목적지 포트로의 전송.

버스 프로토콜 호환 가능한 네트워크-온-칩에서의 분리된 주소/데이터 네트워크 설계 (Separated Address/Data Network Design for Bus Protocol compatible Network-on-Chip)

  • 정승아;이재훈;김상헌;이재성;한태희
    • 전자공학회논문지
    • /
    • 제53권4호
    • /
    • pp.68-75
    • /
    • 2016
  • 다중 프로세서 시스템-온-칩(Multi-Processor SoC, MPSoC)에서의 코어 및 IP 개수 증가 추세에 따라 병렬처리와 확장성에 유리한 인터커넥션 구조인 네트워크-온-칩(Network-on-Chip, NoC)이 등장하였다. 하지만 기존 IP를 재활용하기 위해서는 버스 프로토콜과 호환가능한 NoC에서의 지연시간을 최적화하기 위한 연구가 필요하다. 본 논문에서는 버스 프로토콜 호환 가능한 NoC 설계 시, 버스 프로토콜에서 특성이 다른 다수의 트랜잭션 단계에서 유발되는 홉 수와 경로 충돌의 대립관계로 인해 지연시간이 증가하는 문제를 주소 및 데이터 네트워크로 분리 설계함으로써 해결하였다. 모의실험으로 벤치마크 어플리케이션과 무작위 생성한 어플리케이션에서의 실험 결과를 통해 Mesh구조와 TopGen의 비정형 토폴로지와 비교했을 때, 평균 지연시간은 19.46% 및 실행시간은 10.55% 감소하였다.

인공송신원 전자탐사 자료의 효율적인 3차원 모델링 (Efficient 3D Modeling of CSEM Data)

  • 정용현;손정술;이태종
    • 한국지구물리탐사학회:학술대회논문집
    • /
    • 한국지구물리탐사학회 2009년도 학술대회 초록집
    • /
    • pp.75-80
    • /
    • 2009
  • 유한요소법을 이용한 3차원 모델링은 모형에 대한 기하학적 유연성에도 불구하고 대형 연립방정식에 대한 계산이 필요하여 실용성에는 많은 제약이 있었다. 본 연구에서는 최근 컴퓨터와 수치해석기술을 바탕으로 직접해법과 반복해법을 선택적으로 사용한 효율적인 유한요소 3차원 모델링을 구현하였다. 직접해법인 PARDISO는 멀티코어 계산환경에서 병렬 연산을 이용하여 계산속도를 현저히 감소시킬 수 있었고 특히 단딜 주파수 다중 송신의 계산에서 최대의 계산효율을 보였다. 소규모 메모리 환경에서는 BiCGSTAB(1)이 다른 반복해법들에 비해 빠르고 안정적으로 수치해를 계산하였다. 효율적인 3차원 모델링은 주어진 문제와 상황에 적합한 해법을 선택적으로 사용함으로써 가능하다. 모델링에는 다양한 형태의 인공송신원이 고려되어 있으며 향후 3차원 역산의 효율적인 엔진으로 활용할 수 있다.

  • PDF

광 버스트 스위칭 망에서 장애에 둔감한 SCM 기반의 노드 구조 설계 (Design of Fault-Tolerant Node Architecture based on SCM in Optical Burst Switching Networks)

  • 송규엽;유경민;유완;이해정;김영천
    • 한국통신학회논문지
    • /
    • 제30권8B호
    • /
    • pp.514-524
    • /
    • 2005
  • 광 버스트 스위칭 망은 Ingress 에지 라우터에서 입력된 If 패킷을 모아서 데이터 버스트를 생성하고 과도한 프로세싱 오버헤드 없이 효율적인 버스트 교환을 수행하기 위하여 채널에 대한 예약을 목적으로 데이터 버스트보다 offset 시간 이전에 제어 패킷을 전송하여 파장 채널을 예약한다. 따라서 OBS 방식은 광 계층에서 버퍼에 의존하지 않고 단방향 예약 방식으로 빠르게 투명성을 지닌 광전송 경로를 설정할 수 있다. 그러나 링크 장애와 같은 망 장애가 발생할 경우 광 버스트 스위칭 망의 단 방향 예약 특성 때문에 데이터 버스트의 많은 손실이 발생하게 되어 트래픽 QoS에 심각한 영향을 초래하게 된다. 따라서 본 논문에서는 광 버스트 스위칭 망에서 장애 발생시에도 손실되는 버스트를 최소화하여 QoS를 보장할 수 있도록 Ingress 에지 라우터에서는 부 반송파 다중화 방식 기반의 버스트 생성 및 전송모듈 구조를 설계하고 코어 망에서는 신속한 장애 복구가 가능한 혼합형 장애 복구 기법을 제안하였다. 또한 제안된 기법의 성능 평가를 위하여 망 장애 발생에 따른 버스트 손실률, 버스트 처리율 및 망 자원 사용량 관점에서 기존의 기법과 비교 평가하였다.

임베디드 시스템 상에서 블루투스 프로토콜 스택 개발 (Development of Bluetooth Protocol Stack on Embedded System)

  • 이상학;정태충
    • 정보처리학회논문지A
    • /
    • 제11A권2호
    • /
    • pp.123-128
    • /
    • 2004
  • RF 기술 및 무선 네트워크의 발전은 다양한 형태의 새로운 네트워크가 제시되고 개발될 수 있도록 하였다. 다양한 응용분야에서 사용될 수 있는 블루투스 기술은 가장 많이 알려진 무선 개인 영역 네트워크(WPAN : Wireless Personal Area Network) 표준이다. 음성, 데이터의 동시처리가 가능한 무선 네트워크 통신 표준인 블루투스는 표준 프로파일을 기반으로 하여 다양한 응용 애플리케이션들이 나와 있다. 본 논문에서는 블루투스 기기들의 네트워크 접속을 위한 블루투스 네트워크 액세스 포인트(AP: Access Point) 개발에 대해 기술하였다. 이미 시장에 출시되어 있는 블루투스 마우스, 키보드, 헤드셋 등의 주변장치와 다르게 액세스 포인트는 네트워크 접속장치로서 다중접속, 전송 속도 등을 안정적으로 지원해야 한다. 임베디드 시스템 상에서 표준 규격을 만족하는 블루투스 액세스 포인트를 구현하기 위해 시스템을 설계, 개발하였으며, 블루투스 프로토콜 코어 스택과 프로파일을 구현하여 기능 및 성능을 평가하였다. 다양한 제품과의 접속 테스트를 통해 규격에 호환됨을 보였고, 기존의 블루투스 프로토콜 스택과 비교하여 우수한 네트워크 성능 평가 결과를 나타내었다.

파이썬 활용한 데이터 처리 성능 향상방법 제안 (Proposal For Improving Data Processing Performance Using Python)

  • 김효관;황원용
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권4호
    • /
    • pp.306-311
    • /
    • 2020
  • 본 논문은 대량의 데이터를 활용한 모델 개발 시 다양한 라이브러리를 갖춘 파이썬 언의의 성능 향상방법을 다룬다. 파이썬 언어는 엑셀과 같은 스프레드시트 형태 데이터 처리 시 Pandas 라이브러리를 사용한다. 데이터 처리 시파이썬은 기가단위 이하 데이터 처리 시에는 인-메모리로 연산하여 성능 측면에서 크게 이슈가 없다. 하지만 기가단위 이상 데이터 처리 시 성능 이슈가 발생한다. 이에 본 논문은 데이터 처리 시 Pandas와 같이 사용할 수 있는 Dask 라이브러리를 활용하여 단일 클러스터 및 다중 클러스터에서 실행 작업을 분산처리 가능한 방법을 소개한다. 실험은 동일 사양의 하드웨어에서 간단한 지수산출 모델을 Pandas만 사용해서 처리하는 속도와 Dask를 같이 사용해서 처리하는 속도를 비교한다. 본 논문은 파이썬의 장점인 다양한 라이브러리를 쉽게 사용할 수 있다는 점을 유지하면서 성능측면에서도 대량의 데이터를 CPU 코어들이 분산 처리하여 모델을 개발할 수 있는 방법을 제시한다.

GPU 컨테이너 동시 실행에 따른 응용의 간섭 측정 프레임워크 설계 (A design of GPU container co-execution framework measuring interference among applications)

  • 김세진;김윤희
    • KNOM Review
    • /
    • 제23권1호
    • /
    • pp.43-50
    • /
    • 2020
  • 범용 그래픽 처리 장치(General Purpose Graphics Processing Unit, GPGPU)는 최근 고성능 컴퓨팅에서 중요한 역할을 함으로써, 여러 클라우드 서비스 공급업체들은 GPU 서비스를 제공하기 시작했다. 컨테이너를 사용하는 클라우드 환경에서 대부분의 클러스터 오케스트레이션 플랫폼은 정수 개의 GPU를 작업에 할당하고 다른 작업과 이를 공유하는 것을 허용하지 않는다. 이 경우 작업이 GPU에서 코어 및 메모리 등 자원이 집중적으로 필요하지 않다면 GPU 노드의 리소스 사용률이 저하될 수 있다. GPU 가상화는 응용의 동시 수행을 가능하게 하며 자원을 공유할 수 있는 기회를 제공한다. 하지만 응용의 동시 수행 성능은 동시 수행되는 응용의 특성과 노드 안에서 자원 경쟁으로 인한 간섭에 따라 달라질 수 있다. 본 논문은 컨테이너 오케스트레이션 플랫폼인 쿠버네티스(Kubernetes)를 기반으로 다중 서버 생성 및 실행을 통하여 GPU를 공유함으로써 발생할 수 있는 간섭을 측정하기 위한 프레임워크를 제안한다. 본 프레임워크를 통해 다양한 스케줄링 방법으로 GPU에서 여러 작업을 실행함으로써 이에 따른 성능 변화를 조사하였으며, 이를 통해 GPU 메모리 사용량 및 컴퓨팅 리소스만 고려해서는 최적의 스케줄링을 할 수 없음을 보인다. 마지막으로 해당 프레임워크를 사용하여 응용들의 동시 실행에 따라 발생한 간섭을 측정한다.

정사모자이크 제작을 위한 Agisoft Metashape의 병렬처리 성능 평가 (Assessment of Parallel Computing Performance of Agisoft Metashape for Orthomosaic Generation)

  • 한수희;홍창기
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.427-434
    • /
    • 2019
  • 본 연구에서는 SfM (Structure from Motion) 기술을 기반으로 항공삼각측량을 수행하고 3차원 포인트 클라우드를 생성하며 정사모자이크를 제작할 수 있는 Agisoft Metashape의 병렬처리 성능을 평가하였다. SfM의 속성상 상호표정에 해당하는 Align photos와 3차원 포인트 클라우드를 생성하는 Build dense cloud가 대부분의 시간을 차지하는데, Metashape에서는 이러한 과정에서 CPU (Central Processing Unit)의 다중코어와 함께 GPU (Graphics Processing Unit)를 이용하여 병렬처리를 수행할 수 있다. 세 가지 병렬처리 방법(CPU only, GPU only, CPU + GPU)과 두 가지 운영체제(Windows, Linux)를 조합하여 총 여섯 가지 조건으로 대용량 무인기 영상으로부터 정사모자이크를 제작하였다. 아울러 사용자의 개입 없이 자동화된 방법으로 영상에서 지상기준점을 인식하여 항공삼각측량의 RMSE (Root Mean Square Error)를 측정함으로써 각 조건에 따른 결과의 일관성을 평가하였다. 4220만 화소의 무인기 영상 521장으로부터 정사모자이크를 제작한 결과, 본 연구에서 사용한 시스템에서는 CPU와 GPU의 조합이 가장 나은 성능을 나타내었고 모든 조건에서 Linux가 Windows보다 나은 성능을 나타내었다. 그러나 항공삼각측량의 RMSE를 측정한 결과, 각 설정에 따른 RMSE 값에서 오차 범위 안에서 미세한 차이가 나타났다. 따라서 Metashape는 운영체제 및 병렬처리 여부에 관계없이 동일한 결과가 도출되도록 개선할 여지가 있는 것으로 판단된다.