Design of Extended Real-time Data Pipeline System Architecture (확장형 실시간 데이터 파이프라인 시스템 아키텍처 설계)

  • Shin, Hoseung;Kang, Sungwon;Lee, Jihyun
    • Journal of KIISE
    • v.42 no.8
    • pp.1010-1021
    • 2015
  • Big data systems are widely used to collect large-scale log data, so it is very important for these systems to operate with a high level of performance. However, the current Hadoop-based big data system architecture has a problem in that its performance is low as a result of redundant processing. This paper solves this problem by improving the design of the Hadoop system architecture. The proposed architecture uses the batch-based data collection of the existing architecture in combination with a single processing method. A high level of performance can be achieved by analyzing the collected data directly in memory to avoid redundant processing. The proposed architecture guarantees system expandability, which is an advantage of using the Hadoop architecture. This paper confirms that the proposed architecture is approximately 30% to 35% faster in analyzing and processing data than existing architectures and that it is also extendable.

Implementation of Universal Grid Data System (범용 그리드 데이터 시스템의 구현)

  • 이상근;황석찬;최재영
    • Proceedings of the Korean Information Science Society Conference
    • 2002.04a
    • pp.619-621
    • 2002
  • 90년대 중반에 등장한 그리드(GRID)는 지역적으로 분산되어 있으며 소유자가 서로 다른 다양한 컴퓨팅 자원의 효과적인 공유를 목적으로 하며, 시스템의 구축에 필요한 스케쥴링, 자원 관리, 보안, 성능 측정 및 상태 모니터링 등의 문제를 해결하기 위한 다양한 미들웨어 및 개발 도구가 연구되고 있다. 그리드 시스템에서 사용되는 데이터는 FTP 서버, 파일 시스템, 데이터베이스 등 여러 장치에 저장되어 개별적인 인터페이스를 통해 접근된다. 각각의 인터페이스론 통하여 접근하므로 사용 방법이 어렵고 확장성이 떨어지는 단점이 있다. 이러한 문제점을 해결하기 위하여, 본 연구에서는 데이터베이스, FTP, 파일 시스템에 산재한 그리드 데이터를 동시에 지원하고, URL을 통해 단일 인퍼페이스로 접근하게 해 주며, 3계층 구조와 데이터 캐시를 이용하여 성능과 확장성을 제공하는 시스템을 구현한다.

CBIR-based Data Augmentation and Its Application to Deep Learning (CBIR 기반 데이터 확장을 이용한 딥 러닝 기술)

  • Kim, Sesong;Jung, Seung-Won
    • Journal of Broadcast Engineering
    • v.23 no.3
    • pp.403-408
    • 2018
  • Generally, a large data set is required for learning of deep learning. However, since it is not easy to create large data sets, there are a lot of techniques that make small data sets larger through data expansion such as rotation, flipping, and filtering. However, these simple techniques have limitation on extendibility because they are difficult to escape from the features already possessed. In order to solve this problem, we propose a method to acquire new image data by using existing data. This is done by retrieving and acquiring similar images using existing image data as a query of the content-based image retrieval (CBIR). Finally, we compare the performance of the base model with the model using CBIR.

A Study on Improvement of Blockchain Scalability (블록체인 확장성 개선 연구)

  • Lee, Daesung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • 2018.05a
    • pp.86-87
    • 2018
  • As blockchain technology has the potential to revolutionize trust models and business processes across industries, applications are expected to be endless. However, this technology is still in the early stage, and the scalability caused by the accumulation of transaction data due to the increase of blocks is emerging as a serious problem. In this paper, we propose various alternatives to solve the scalability problem.

방송대학 디지털라이브러리 시스템 구축(오디오/비디오 자료를 중심으로)

  • 곽덕훈
    • Proceedings of the Korea Database Society Conference
    • 1998.09a
    • pp.313-326
    • 1998
  • DL의 필요성ㆍ방대한 데이터의 효율적 관리와 재활용ㆍ아날로그 매체의 보관장소 및 열화 문제해소ㆍ대학본부와 지역학습관 사이의 효과적 자원공유ㆍ실시간 단방향 방송의 제한성 극복ㆍ학생과 방송대의 상호작용성 증진ㆍ인터넷을 활용한 ON-DEMAND 교육 ◆업무분석 및 요구사항에 따른 정확한 설계 ◆용도별 하드웨어 시스템 설계 ◆네트워크 대역폭의 효율적 적용 - 모뎀 환경, LAN 환경 ◆사용자 접속환경을 고려한 Network 설정 - 전용망 : T1급 이상 ◆타 시스템과 연계 및 확장성(중략)

The Efficient IP Paging Provisioning Scheme Based on DNS (DNS를 이용한 효율적인 IP 페이징 제공 방안)

  • 김기일;서정현;김상하
    • Proceedings of the Korean Information Science Society Conference
    • 2001.10c
    • pp.256-258
    • 2001
  • 이동 환경에서의 서비스가 대중화 되면서 문제가 되고 있는 것이 바로 이동 호스트의 전력 제어 문제이다. 이동 호스트는 충분한 전력을 얻기 힘들기 때문에 데이터 전송을 받지 않는 경우에는 최소한의 정보만을 교환하는 상태로의 전의가 필수적이다. 현재 IETF의 Seamoby Working Group에서 논의되고 있는 IP 페이징 프로토콜의 경우에는 요구사항과 논리적인 구조만이 정의되어 있다. 현재 정의되어 있는 구조의 문제점은 유휴 (formant) 모드에 있는 이동 호스트에 데이터를 전송하기 위해서는 Dormant Monitoring Agent(DMA)로 전송된 데이터에 대하여 버퍼링이 수행되어야만 한다. 버퍼링의 목적은 이동 호스트의 유휴 모드에서 활성 (active) 모드로 전의 되는 시간 동안의 데이터의 손실을 방지하기 위함이다. 따라서, 하나의 DMA해서 관리해야 하는 이동 호스트가 많은 경우에는 대회의 양이 문제가 된다. 즉, 확장성 문제점이 존재하게 된다. 본 논문은 이러한 문제점을 줄이기 위하여 Domain Name Server(DNS)를 이용한 IP 페이징 제공 방안을 제안한다. 본 메커니즘은 송신자가 DNS에 호스트의 IP주소를 얻고자 하는 경우 IP 페이징 프로토콜을 먼저 이동 호스트의 페이징 에이전트에 전송함으로써 미리 이동 호스트를 활성 모드로 변경하게 함으로써 이전 메커니즘에서 적용되어야 하는 버퍼의 크기를 줄일 수 있는 메커니즘이다.

An Ontology Matching Method based on ISO/IEC 11179 (ISO/IEC 11179 기반의 온톨로지 매칭 방법)

  • Lee, Ji-Yoon;Lee, Suk-Hoon;Kim, Jang-Won;Jeong, Dong-Won;Baik, Doo-Kwon
    • Proceedings of the Korean Information Science Society Conference
    • 2012.06c
    • pp.95-97
    • 2012
  • 다양한 온톨로지들이 구축되고 이를 적용한 시스템들이 늘어가면서 시스템 간 상호운용성에 문제가 발생하게 되었다. 이러한 문제점을 해결하기 위해 공통 개념이라 볼 수 있는 온톨로지를 메타데이터 레지스트리에 등록하고, 이를 기반으로 한 시스템들이 개발되면서 시스템 간 상호운용성이 향상되었다. 하지만 서로 다른 메타데이터 레지스트리를 기반으로 한 시스템 간에는 상호운용성 문제가 여전히 존재하므로, 메타데이터 레지스트리에 등록된 온톨로지 간 매칭 방법에 대한 필요성이 대두되었다. 기존의 온톨로지 매칭 방법들은 온톨로지의 규모가 작을 경우 정확한 매칭 결과를 제공하지 못하는 문제점을 가진다. 따라서 이 논문에서는 메타데이터에 레지스트리에 등록된 온톨로지들을 매칭하기 위하여 메타데이터 레지스트리의 구조상의 특징을 반영하여 온톨로지를 확장한다. 그리고 확장된 온톨로지를 이용하여 온톨로지를 매칭 함으로써 정확한 매칭이 이루어지는 온톨로지 매칭 방법을 제안한다. 또한 제안 방법의 장점을 보이기 위해 기존 온톨로지 매칭 방법들과의 비교평가를 수행한다. 제안 방법은 매칭의 정확성을 보장하고 효율성을 높이며 메타데이터 레지스트리간 상호운용성을 높인다.

A System Level Spatial Data Model for Object-Oriented Spatial Databases (객체지향 공간 데이터베이스를 위한 시스템 수준 공간 데이터 모델)

  • 박창원;홍남희;정진완
    • Proceedings of the Korean Information Science Society Conference
    • 1998.10b
    • pp.164-166
    • 1998
  • 객체지향 공간 데이터베이스 시스템에서 공간 데이터 모델을 제공하는 방법은 크게 두 가지로 나누어진다. 첫째 방법은 객체지향 데이터 모델의 확장성을 이용하여 사용자 클래스와 동등한 수준의 공간클래스 라이브러리를 제공하는 방법이고, 둘째 방법은 데이터베이스 시스템을 확장하여 공간 기본 타입과 공간 연산자를 제공하고 이를 데이터베이스 시스템을 확장하여 공간 기본 타입과 공간 연산자를 제공하고 이를 데이터베이스 언어에 반영하는 방법이다. 기존의 객체지향 공간 데이터베이스 시스템들은 주로 첫 번째 방법에 기반한 공간 데이터 모델을 제공하지만, 이는 여러 가지 문제를 야기시킨다. 본 논문에서는 공간 클래스 라이브러리로 제공된 공간 데이터 모델의 문제점들을 분석하고, 그러한 문제점들을 모두 해결하는 시스템 수준 공간 데이터 모델을 제시한다.

Recovery Method Using Extendable Hashing Based Log in A Shared-Nothing Spatial Database Cluster (비공유 공간 데이터베이스 클러스터에서 확장성 해싱 기반의 로그를 이용한 회복 기법)

  • 장일국;장용일;박순영;배해영
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • 2004.03a
    • pp.7-10
    • 2004
  • 회복기법은 비공유 공간 데이터베이스 클러스터에서 고가용성을 위해 매우 중요하게 고려되고 있다. 일반적으로 데이터베이스 클러스터의 회복기법은 노드의 오류가 발생한 경우 로컬 로그와는 별도로 클러스터 로그를 생성하며, 이를 기반으로 해당 노드에서의 회복과정을 수행한다. 그러나, 기존의 기법은 하나의 레코드를 위해 다수의 갱신정보를 유지함으로써 클러스터 로그의 크기가 증가되고, 전송비용이 증가된다. 이는 회복노드에서 하나의 레코드에 대해 털러 번의 불필요한 연산을 실행하여 회복시간이 증가되고, 전체적인 시스템의 부하를 증가시키는 문제를 발생시킨다. 본 논문에서는 비공유 공간 데이터베이스 클러스터에서 확장성 해싱 기반의 로그를 이용한 회복기법을 제안한다. 제안기법에서의 클러스터 로그는 레코드 키값을 이용한 확장성 해싱을 기반으로 레코드의 변경사항과 실제 데이터를 가리키는 포인터 정보로 구성된다. 확장성 해싱 기반의 클러스터 로그는 크기와 전송비용이 감소하며, 회복노드는 하나의 레코드에 대해 한번의 갱신연산만 실행하므로 빠른 회복이 가능하다. 따라서 제안 기법은 확장성 해싱 기반의 클러스터 로그를 이용하여 효율적인 회복처리를 수행하며, 시스템의 가용성을 향상시킨다.

A Recommendation Technique using Weight of User Information (사용자 정보 가중치를 이용한 추천 기법)

  • Yun, So-Young;Youn, Sung-Dae
    • Journal of the Korea Institute of Information and Communication Engineering
    • v.15 no.4
    • pp.877-885
    • 2011
  • A collaborative filtering(CF) is the most widely used technique in recommender system. However, CF has sparsity and scalability problems. These problems reduce the accuracy of recommendation and extensive studies have been made to solve these problems, In this paper, we proposed a method that uses a weight so as to solve these problems. After creating a user-item matrix, the proposed method analyzes information about users who prefer the item only by using data with a rating over 4 for enhancing the accuracy in the recommendation. The proposed method uses information about the genre of the item as well as analyzed user information as a weight during the calculation of similarity, and it calculates prediction by using only data for which the similarity is over a threshold and uses the data as the rating value of unrated data. It is possible simultaneously to reduce sparsity and to improve accuracy by calculating prediction through an analysis of the characteristics of an item. Also, it is possible to conduct a quick classification based on the analyzed information once a new item and a user are registered. The experiment result indicated that the proposed method has been more enhanced the accuracy, compared to item based, genre based methods.