• 제목/요약/키워드: Distributed File Systems

검색결과 123건 처리시간 0.022초

MAHA-FS : 고성능 메타데이터 처리 및 랜덤 입출력을 위한 분산 파일 시스템 (MAHA-FS : A Distributed File System for High Performance Metadata Processing and Random IO)

  • 김영창;김동오;김홍연;김영균;최완
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권2호
    • /
    • pp.91-96
    • /
    • 2013
  • 바이오 응용과 같은 대용량 데이터 처리와 고성능 계산을 동시에 지원하는 발판으로 슈퍼컴퓨팅 시스템의 활용 분야가 변화하고 있다. 이러한 응용에서는 발생하는 대용량의 데이터를 고속으로 처리하고 효율적으로 저장 관리하기 위한 고성능의 분산 파일 시스템이 요구된다. 본 논문에서는 대용량의 데이터 처리와 고성능 계산을 동시에 지원하는 슈퍼컴퓨팅 시스템을 위해 우수한 메타데이터 연산 성능 및 입출력 성능을 제공하는 MAHA-FS를 소개한다. 아울러 성능 분석을 통해 MAHA-FS가 메타데이터 연산 처리 성능 및 random 입출력 성능이 우수함을 보인다.

Fair Peer Assignment Scheme for Peer-to-Peer File Sharing

  • Hu, Chih-Lin;Chen, Da-You;Chang, Yi-Hsun;Chen, Yu-Wen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제4권5호
    • /
    • pp.709-735
    • /
    • 2010
  • The reciprocal virtue of peer-to-peer networking has stimulated an explosion of peer population and service capacity, ensuring rapid content distribution in peer-to-peer networks. Critical issues such as peer churn, free riding, and skewed workload significantly affect performance results such as service agility, fairness, and resource utilization. To resolve these problems systematically, this study proposes a peer assignment scheme that supports fair peer-to-peer file sharing applications. The proposed scheme exploits the peer duality of both server-oriented peer capacity and client-oriented peer contribution. Accordingly, the system server can prioritize download requests and appropriately assign server peers to uploading file objects. Several functional extensions, including peer substitution and elimination, bandwidth adjustment, and distributed modification, help cope with subtle situations of service starvation and download blocking, and hence make the system design robust and amenable. Simulation results show this design is examined under both centralized and distributed peer-to-peer environments. Performance results confirm that the proposed mechanisms are simple but effective in maintaining service agility and fairness, without loss of overall service capacity in peer-to-peer files sharing systems.

BeanFS: 대규모 이메일 서비스를 위한 분산 파일 시스템 (BeanFS: A Distributed File System for Large-scale E-mail Services)

  • 정욱;이대우;박은지;이영재;김상훈;김진수;김태웅;전성원
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권4호
    • /
    • pp.247-258
    • /
    • 2009
  • 저가의 하드웨어를 이용하는 분산 파일 시스템은 대용량의 저장 장치를 경제적으로 제공해주는 해법으로 많은 인터넷 서비스 업체에 의해 주목받고 있다. 본 논문에서는 대규모 이메일 서비스를 위한 분산 파일 시스템인 BeanFS의 설계와 구현에 대해 소개한다. BeanFS는 다음과 같이 이메일 서비스에 최적화되었다. 첫째, 이메일 서비스에서 이용되는 작고 많은 파일을 효과적으로 처리하기 위해서, 볼륨 기반의 복제 기법을 도입하여 중앙 서버의 병목현상을 완화시킨다. 둘째, 이메일 메시지의 단순한 접근 패턴을 고려하여 일관성 유지 기법을 경량화시킨다. 셋째, 재복제시에 발생하는 오버헤드를 줄이기 위해 일시적인 장애를 영구적인 장애와 분리하여 대처한다.

분산 시스템의 동적 파일 할당 연구 (Dynamic File Allocation Problems In Distributed Systems)

  • 서필교
    • 한국정보처리학회논문지
    • /
    • 제4권7호
    • /
    • pp.1681-1693
    • /
    • 1997
  • 분산 시스템에서 파일 할당 문제는 시스템의 운영비용을 최소화하기 위해 파일 및 그의 복제물의 최적 위치를 결정하는 것이다. 정적인 파일 할당 문제는 분산 시스템의 각 노드에서 특정 파일에 발생하는 질의 및 갱신에 관련된 비용이 일정하다는 가정에서 출발하고 있다. 그러나 실제로는 시간이 지남에 따라 질의 및 갱신 등에 관련된 매개변수들은 변하게 마련이다. 이 연구에서 다루고 있는 동적인 파일 할당 문제는 변화하는 매개변수들을 고려하고 있으며, 또한 시스템 내에 파일이 한 종류만 있는 경우뿐만 아니라 여러 종류가 있는 경우도 다루고 있다. 동적인 파일 할당 문제는 혼합 정수계획법으로 모형화 되었으며 문제 해결을 위해 Lagrange 함수를 이용한 분단탐색법(branch-and-bound method) 알고리즘이 개발되었다. 제시된 알고리즘은 포트란으로 프로그램화되었으며, 여러 종류의 문제 해결을 통하여 그의 유용성을 보여주고 있다.

  • PDF

MapReduce에서 Reuse JVM을 이용한 대규모 스몰파일 처리성능 향상 방법에 관한 연구 (A Study on the Improving Performance of Massively Small File Using the Reuse JVM in MapReduce)

  • 최철웅;김정인;김판구
    • 한국멀티미디어학회논문지
    • /
    • 제18권9호
    • /
    • pp.1098-1104
    • /
    • 2015
  • With the widespread use of smartphones and IoT (Internet of Things), data are being generated on a large scale, and there is increased for the analysis of such data. Hence, distributed processing systems have gained much attention. Hadoop, which is a distributed processing system, saves the metadata of stored files in name nodes; in this case, the main problems are as follows: the memory becomes insufficient; load occurs because of massive small files; scheduling and file processing time increases because of the increased number of small files. In this paper, we propose a solution to address the increase in processing time because of massive small files, and thus improve the processing performance, using the Reuse JVM method provided by Hadoop. Through environment setting, the Reuse JVM method modifies the JVM produced conventionally for every task, so that multiple tasks are reused sequentially in one JVM. As a final outcome, the Reuse JVM method showed the best processing performance when used together with CombineFileInputFormat.

웹기반 협업을 위한 치수검증이 가능한 경량캐드파일 설계 (Design of Lightweight CAD Files with Dimensional Verification Capability for Web-Based Collaboration)

  • 송인호;정성종
    • 대한기계학회논문집A
    • /
    • 제30권5호
    • /
    • pp.488-495
    • /
    • 2006
  • The demand for the use of 3D CAD data over the Internet environment has been increased. However, transmission of 3D CAD data has delayed the communication effectiveness because of the CAD data size. Lightweight CAD file design methodology is required for rapid transmission in the distributed environment. In this paper, to derive lightweight CAD files from commercial CAD systems, a file translation system producing a native file is constructed first by using the InterOp and API of the ACIS kernel. Using the B-rep model and mesh data extracted from the native file, the lightweight CAD file with topological information is constructed as a binary file. Since the lightweight CAD file retains topological information, it is applied to the dimensional verification, digital mock-ups and visualization of CAD files. Effectiveness of the proposed lightweight CAD file is confirmed through various case studies.

분산 데이타베이스에서의 동적 화일배정에 관한 연구

  • 황영헌;김대환;김영호;강석호
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1996년도 추계학술대회발표논문집; 고려대학교, 서울; 26 Oct. 1996
    • /
    • pp.275-278
    • /
    • 1996
  • We propose dynamic file allocation method in distributed database management system with changing access patterns. There are a lot of studies on file allocation problem in D-DBMS, and those studies deal with off-line analysis and optimization. Those works are well for systems with static database access patterns, but are inadequate for systems that have changing access patterns. In these systems, dynamic file allocation along with access pattern is more proper. In advance, Brunstrom et al. studied on this area, but they dealt a extremely simplified model. So, we make more practical models to simulate real system. In these models, many factors that were disregard in the advance study are considered. These models are composed with the non-replication system and the replication system. In addition to, we deal with CPU workload balancing in such system in order to improve performance of systems. Our methodology is very simple and realistic, therefore we think that it will give a lot of improvement in D-DBMS with changing access pattern.

  • PDF

분산 컴퓨터 시스템에 있어서의 화일 할당 알고리듬에 관한 연구 (A Study on File Allocation Algorithm in Distributed Computer Systems)

  • 홍진표;임제탁
    • 대한전자공학회논문지
    • /
    • 제27권2호
    • /
    • pp.118-125
    • /
    • 1990
  • 분산 컴퓨터 시스템에서 정보 화일을 효율적으로 관리, 운용하기 위한 화일 할당 문제의 최적해를 구하는 화일 할당 알고리듬을 제안한다. 컴퓨터 노드(site)가 많은 경우 화일 할당에 많은 시간이 소요되므로 선 할당(preassignment)을 수행하여 문제의 규모를 축소하고 계산시간을 개선한다. 할당이 진행중인 상태의 표시치(representative value)를 정확하게 나타내기 위해 기대값을 이용한 평가치 계산기법을 제안하고 빠른 시간에 최적 할당이 이루어지도록 후보 노드(candidate node)에 대한 선택기준(selection criteria)을 설정한다. 선택기준에 의해 각 노드의 화일 할당 여부를 결정하고 최종 평가치가 할당 상태의 전체 비용을 나타낸다. 제안한 알고리듬은 다항식 시간(polynomial time)알고리듬이며 여러 예제에 실현한 결과 할당 소요시간이 개선되고 기존의 할당 알고리듬과 비교하여 최적해를 구하는데 있어 우수함을 나타냈다.

  • PDF

하둡 분산 파일시스템의 동적 클러스터 관리 기법 (Dynamic Cluster Management of Hadoop Distributed Filesystem)

  • 류우석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.435-437
    • /
    • 2016
  • 하둡 분산 파일시스템(HDFS)는 빅데이터의 병렬 분산 처리를 위해 다수의 노드에 데이터를 중복 저장하는 파일시스템이다. HDFS의 분산 노드 클러스터는 수천 개 이상의 규모 확장성을 갖추고 있으나 빅데이터 처리를 위한 전용 하드웨어를 가정하고 있으며, 기존의 기업 및 병원에서 사용하고 있는 다양한 유휴 전산 자원을 고려하지는 못하는 문제가 있다. 본 논문에서는 기관 내 존재하는 다양한 유휴 전산 자원을 필요에 따라 동적으로 HDFS에 추가함으로써 빅데이터 저장 및 분석 성능을 향상시킬 수 있는 동적 클러스터 관리 기법을 제시한다.

  • PDF

대용량 공유 분산 화일 시스템에서 망 분할 시 순환 리스를 사용한 고장 감내성 향상 (Improving Fault Tolerance for High-capacity Shared Distributed File Systems using the Rotational Lease Under Network Partitioning)

  • 탁병철;정연돈;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권6호
    • /
    • pp.616-627
    • /
    • 2005
  • 서버를 통하여 저장 장치를 사용하는 네트워크 연결형 화일 시스템과 달리, 대용량 공유 저장 장치 화일 시스템에서는 서버들이 데이타 전용망을 통하여 저장 장치를 직접 공유하여 사용한다. 이런 구조에서는 데이타의 일관성을 유지하기 위하여 잠금 관리자가 존재하여 제어망을 통하여 잠금 정보를 주고 받는다. 또한 예기치 않은 제어망의 고장에 대비하여 리스를 사용한다. 하지만 제어망에 분할 고장이 발생할 경우 격리된 서버들은 고장이 해결되기 전까지는 더 이상 작업을 진행할 수 없게 된다. 본 논문에서는 이러한 제어망 분할 고장이 발생한 상황에서도 서버들이 계속 화일 시스템을 사용하여 작업을 진행할 수 있도록 하는 기법을 제안한다. 제안하는 기법은 주기적으로 각 서버들에게 리스를 순환하여 할당하는 방식으로 동작한다. 또한 제안하는 기법은 항상 데이타의 일관성을 유지함을 보인다.