• Title/Summary/Keyword: 데이터 처리량

Search Result 2,586, Processing Time 0.033 seconds

Efficient Data Scheduling considering number of Spatial query of Client in Wireless Broadcast Environments (무선방송환경에서 클라이언트의 공간질의 수를 고려한 효율적인 데이터 스케줄링)

  • Song, Doohee;Park, Kwangjin
    • Journal of Internet Computing and Services
    • /
    • v.15 no.2
    • /
    • pp.33-39
    • /
    • 2014
  • How to transfer spatial data from server to client in wireless broadcasting environment is shown as following: A server arranges data information that client wants and transfers data by one-dimensional array for broadcasting cycle. Client listens data transferred by the server and returns resulted value only to server. Recently number of users using location-based services is increasing alongside number of objects, and data volume is changing into large amount. Large volume of data in wireless broadcasting environment may increase query time of client. Therefore, we propose Client based Data Scheduling (CDS) for efficient data scheduling in wireless broadcasting environment. CDS divides map and then calculates total sum of objects for each grid by considering number of objects and data size within divided grids. It carries out data scheduling by applying hot-cold method considering total data size of objects for each grid and number of client. It's proved that CDS reduces average query processing time for client compared to existing method.

A Novel Way of Context-Oriented Data Stream Segmentation using Exon-Intron Theory (Exon-Intron이론을 활용한 상황중심 데이터 스트림 분할 방안)

  • Lee, Seung-Hun;Suh, Dong-Hyok
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.16 no.5
    • /
    • pp.799-806
    • /
    • 2021
  • In the IoT environment, event data from sensors is continuously reported over time. Event data obtained in this trend is accumulated indefinitely, so a method for efficient analysis and management of data is required. In this study, a data stream segmentation method was proposed to support the effective selection and utilization of event data from sensors that are continuously reported and received. An identifier for identifying the point at which to start the analysis process was selected. By introducing the role of these identifiers, it is possible to clarify what is being analyzed and to reduce data throughput. The identifier for stream segmentation proposed in this study is a semantic-oriented data stream segmentation method based on the event occurrence of each stream. The existence of identifiers in stream processing can be said to be useful in terms of providing efficiency and reducing its costs in a large-volume continuous data inflow environment.

A Study of Path-based Retrieval for JSON Data Using Suffix Arrays (접미사 배열을 이용한 JSON 데이터의 경로 기반 검색에 대한 연구)

  • Kim, Sung Wan
    • Journal of Creative Information Culture
    • /
    • v.7 no.3
    • /
    • pp.157-165
    • /
    • 2021
  • As the use of various application services utilizing Web and IoT and the need for large amounts of data management expand accordingly, the importance of efficient data expression and exchange scheme and data query processing is increasing. JSON, characterized by its simplicity, is being used in various fields as a format for data exchange and data storage instead of XML, which is a standard data expression and exchange language on the Web. This means that it is important to develop indexing and query processing techniques to effectively access and search large amounts of data expressed in JSON. Therefore, in this paper, we modeled JSON data with a hierarchical structure in a tree form, and proposed indexing and query processing using the path concept. In particular, we designed an index structure using a suffix array widely used in text search and introduced simple and complex path-based JSON data query processing methods.

Parallel Accessed Mirroring based on Stripping (스트라이핑 기반의 병렬 접근 미러링 기법)

  • Kang, Dong-Jae;Kim, Chang-Soo;Shin, Bum-Joo;Kim, Hag-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.539-542
    • /
    • 2002
  • 멀티미디어와 인터넷의 대중화가 야기한 급격한 데이터의 증가는 테라(Tera)바이트 이상의 대용량 저장공간과 대용량 정보의 효율적인 공유를 지원하는 스토리지 시스템을 요구하고 있으며 이를 위하여 SAN 기반의 스토리지 클러스터링 시스템들이 많이 사용되고 있다. 이러한 환경에서 하드웨어 또는 소프트웨어 RAID(Redundant Array of Independent Disks)는 대용량 정보의 고성능의 입출력과 신뢰성을 위해서 필수적이 되었다. 범용적인 RAID로는 RAE-0, RAID-1, RAID-5가 주로 사용되고 있으며 각각의 레벨은 장단점을 갖는다. 본 논문에서는 RAID-0와 RAID-1이 갖는 문제점들의 보완을 위하여 변형된 RAID 레벨인 RAID-SM을 제안한다. RAID-SM은 기존의 RAID-1이 가지는 데이터의 가용성을 유지하면서 추가적인 비용 없이 RAID-0의 우수한 입출력 성능을 얻기 위한 RAID-1의 변형된 방식이다. RAID-SM의 구현을 위하여 디스크상의 데이터의 배치 및 데이터 맵핑 탕식을 정의하고 RAID-SM에서의 I/O방법을 기술한다. 제안하는 RAID-SM은 멀티미디어나 GIS 데이터와 같은 읽기 연산 집약적인 시스템을 대상으로 하는 안정적인 레이드 방식이며 RAID-SM의 장점 및 성능은 본 논문에서의 실험을 통한 결과로서 제시한다.

  • PDF

A Study of Data Processing Model for Overseas S&T Information System (학술지정보서비스를 위한 해외학술정보 가공모델 연구)

  • Lee, Seok-Hyoung;Kim, H.K.;Yoon, H.J.;Yoon, H.M.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.583-586
    • /
    • 2005
  • 한국과학기술정보연구원(KISTI)은 국내 과학기술자의 연구를 돕기 위해 국내외의 여러 기관으로부터 정기적, 또는 비정기적으로 발간되는 학술지, 연구보고서, 특허 및 각종 동향, 분석 정보를 수집하여 서비스하고 있다. 국내에서 생산되는 정보는 그 발생양이 방대하지 않고 일정 수준 이상의 서지정보를 담고 있으며 원문정보까지 제공이 가능하기 때문에 정보의 질이 비교적 높은 편이나, 해외에서 수집되는 학술 정보는 데이터 처리량이 방대하기 때문에 처리시간이 오래 걸릴 뿐만 아니라, 기본적인 서지 정보만을 담고 있어 원문 서비스나 초록 및 주제 분류 등의 부가적인 서비스를 위해서는 추가적인 데이터 가공이 필수적이다. 따라서 본 논문에서는 데이터 처리 속도와 이용자 중심의 해외학술정보의 원문 및 부가 서비스 제공 등을 고려한 데이터 가공 방법에 대해 연구한다.

  • PDF

A Study on the Cooling Energy Saving System for Data Centers Using Multi-Machine Learning (다중 기계 학습을 활용한 데이터 센터의 냉방 에너지 절감 시스템에 관한 연구)

  • Jang, Hyun-Cheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.458-460
    • /
    • 2019
  • 최근 클라우드 시스템 환경이 점차 늘어남에 따라 데이터 센터(IDC) 구축이 점차 늘어나가고 있다. 데이터 센터는 최근 부각하고 있는 4 차 산업 영역에서 사물 인터넷(IoT), 자율주행차 등 에서 처리될 대용량 데이터로 인한 이를 처리하는 중요한 역할을 담당하고 있다. 데이터센터 운영에는 대량의 에너지가 필요하다. 수 많은 컴퓨터에서 발생하는 열에너지를 처리하기 위하여 대량의 전력 냉방 에너지를 소비하고 있다. 냉방 공조 운영은 데이터 센터 운영에 중요한 역할을 한다. 이유는 많은 컴퓨터를 가동하는 비용보다 부대 시설로 운영되는 냉방 에너지를 보다 많이 소비하는 현상까지 발생하고 있다. 이에 최근 데이터 센터 냉방 공조 운영을 효율화하는 것에 연구를 맞추고 있다. 본 논문에서는 냉방 공조 운영 효율화 하도록 하기 위해서 다중 기계 학습을 활용한 데이터 센터의 냉방 에너지 절감 시스템을 제안하고자 한다. 기존의 단수 알고리즘을 활용하여 머신 러닝의 모델구현 방식이 아닌 다중의 기계 학습을 통하여 최적화된 모델을 일일 배치로 생성하여 예측을 하는 시스템이다. 본 시스템을 통하여 사전에 최적화된 냉방 운영을 하여 기존 데이터 센터의 운영되는 과다 냉방을 감축 시켜 에너지를 절감해주는 기능을 제공한다. 본 논문 시스템 연구 결과는 폭발적으로 늘어가고 있는 데이터 센터의 에너지 효율화에 기여할 수 있고, 클라우드 사업에서 경쟁력을 줄 수 있는 운영 시스템 방안을 제시한다.

In-Memory Based Incremental Processing Method for Stream Query Processing in Big Data Environments (빅데이터 환경에서 스트림 질의 처리를 위한 인메모리 기반 점진적 처리 기법)

  • Bok, Kyoungsoo;Yook, Misun;Noh, Yeonwoo;Han, Jieun;Kim, Yeonwoo;Lim, Jongtae;Yoo, Jaesoo
    • The Journal of the Korea Contents Association
    • /
    • v.16 no.2
    • /
    • pp.163-173
    • /
    • 2016
  • Recently, massive amounts of stream data have been studied for distributed processing. In this paper, we propose an incremental stream data processing method based on in-memory in big data environments. The proposed method stores input data in a temporary queue and compare them with data in a master node. If the data is in the master node, the proposed method reuses the previous processing results located in the node chosen by the master node. If there are no previous results of data in the node, the proposed method processes the data and stores the result in a separate node. We also propose a job scheduling technique considering the load and performance of a node. In order to show the superiority of the proposed method, we compare it with the existing method in terms of query processing time. Our experimental results show that our method outperforms the existing method in terms of query processing time.

A Fast Editing/Writing Technique for Large-scale Multimedia Files with Data Block Sharing (데이터 블록 공유를 통한 대용량 멀티미디어 파일 고속 편집 저장 기법)

  • Jung, Seung-Wan;Nam, Young-Jin;Seo, Dae-Wha
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.05a
    • /
    • pp.694-697
    • /
    • 2008
  • 디지털 기술의 발전과 디지털 캠코더와 같은 장비의 대중화로 인하여, 오늘날 누구나 쉽게 영상물을 촬영하고 디지털화 하여 저장할 수 있다. 특히 이런 장비들이 제공하는 고화질의 미디어 컨텐츠는 대용량 파일의 형태로 저장된다. 대용량 파일의 필요한 부분만을 편집하여 재 저장하기 위해서는 새로운 기법이 요구된다. 현재의 리눅스 시스템에서는 편집된 파일의 내용을 새롭게 저장하는 방법을 사용하는데 미디어 컨텐츠와 같은 대용량 파일의 경우 많은 디스크 대역폭과 시간을 요구한다. 본 논문에서는 아이노드 블록 포인터 재설정 기법과 데이터 블록 공유 기법을 사용하여 대용량 파일에서 필요한 부분을 빠르고 효율적으로 편집하여 저장 및 복제할 수 있는 방법을 제시한다. 시뮬레이션을 통해 편집하여 저장할 시 리눅스 Ext3 파일 시스템에 비해 최대 16배 시간 단축을 확인하였다. 또한 편집한 내용을 새로운 파일로 저장할 경우 제안 기법은 공유 데이터 블록을 사용하므로 실제 사용하는 디스크 공간용량은 원본 동영상 파일의 크기만큼만 사용한다.

GIVI: The Integrated Interface for Controlling Rotor Dynamics Data Visualized On Immersive Virtual Reality Environments (GIVI: 몰입형 가상현실 환경에서 가시화된 데이터를 제어하는 통합 인터페이스)

  • Hur, YoungJu;Kim, MinAh;Lee, JoongYoun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.799-802
    • /
    • 2010
  • HPC에서 시뮬레이션을 수행한 결과로 생성된 데이터는 크기가 방대하고 구조가 복잡해지는 양상을 보이고 있다. 데이터 크기로만 보더라도 기가바이트를 넘어 테라바이트에 이를 정도로 대형화되는 경향을 보이고 있으며, 이렇게 복잡도가 놓은 대형 데이터는 이미 컴퓨터 한 대에서 처리하고 분석할 수 있는 범주는 넘어서고 있다. 본 논문에서는 이런 복잡한 과학 시뮬레이션 데이터 중, 특히 로터 동역학 분야의 데이터를 가시화하고 제어하는데 필요한 통합 가상현실 인터페이스를 소개하기로 한다. 현재 개발중인 GLOVE 프레임워크는 대용량 데이터를 연구자가 필요로 하는 형태로 다양하게 가공해서 가시화해서 분석할 수 있게 하는 프레임워크이며, GIVI는 그 중 사용자와의 인터페이스 부분을 담당하는 프레임워크다. GIVI는 가상현실 환경에서 시뮬레이션 데이터를 실시간으로 상호작용을 통해 분석하는데 필요한 기반환경을 제공하며, 향후에는 실시간 시뮬레이션을 위한 인터페이스로도 확장될 것이다.

Performance Improvement of Storage System Using De-duplication (중복 데이터 관리 기법을 통한 저장 시스템 성능 개선)

  • Jeong, Ho-Min;Kim, Byung-Ki;Kim, Jin;Ko, Young-Woong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.909-912
    • /
    • 2009
  • 기존의 저장 방식은 대용량의 데이터를 비효율적으로 처리해 왔지만 데이터 중복 제거 기법을 이용하면서 저장 공간과 네트워크 대역폭을 효율적으로 사용할 수 있게 되었다. 그러나 기존의 데이터 중복 제거 알고리즘들은 수행시간이 길고 중복 데이터를 효율적으로 제거하지 못하는 문제가 있다. 본 논문에서는 개선된 중복 검색 및 제거 메커니즘을 제공하는 저장 시스템을 제안하고 있다. 제안하는 알고리즘은 저장 공간을 최소화하고 네트워크 대역폭을 줄일 수 있다. 주요 아이디어는 스트라이드 방식의 중복 검색 메커니즘이며 중복된 데이터 블록을 발견하는데 있어서 계산 시간을 줄여주고 있다. 제안하는 시스템의 성능을 검증하기 위하여 리눅스 배포 데이터를 저장하는 실험을 수행하였으며 실험 결과 스트라이드 방식이 저장 공간을 줄이고 중복된 데이터 블록을 효율적으로 관리할 수 있음을 보였다.