• Title/Summary/Keyword: 대용자료

Search Result 456, Processing Time 0.024 seconds

A Fast Algorithm for Constructing Suffix Arrays (써픽스 배열을 구축하는 빠른 알고리즘)

  • 조준하;박희진;김동규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.736-738
    • /
    • 2004
  • 써픽스 배열은 정렬된 모든 써픽스들의 인덱스를 저장한 자료구조이며, 긴 문자열에서 임의의 패턴을 효율적으로 검색을 할 수 있는 자료구조이다. 비슷한 자료구조인 써픽스 트리에 비해 적은 공간을 사용하기 때문에 대용량의 텍스트에 대한 처리에 더 적합하다. 본 논문에서는 써픽스 배열을 빠르게 구축하는 방법을 제안하고, 써픽스 배열 구축 알고리즘들 중에서 빠르다고 알려진 Larsson and Sadakane 알고리즘, 대표적인 선형 시간 알고리즘인 Karkkainen and Sanders 알고리즘 및 최근에 발표된 고정길이 문자집합에 효율적인 Kim et al. 알고리즘과 성능을 비교한다. 실험 결과 본 논문에서 제안한 알고리즘이 전반적으로 빠르게 써픽스 배열을 구축하였다.

  • PDF

Classification of large-scale data and data batch stream with forward stagewise algorithm (전진적 단계 알고리즘을 이용한 대용량 데이터와 순차적 배치 데이터의 분류)

  • Yoon, Young Joo
    • Journal of the Korean Data and Information Science Society
    • /
    • v.25 no.6
    • /
    • pp.1283-1291
    • /
    • 2014
  • In this paper, we propose forward stagewise algorithm when data are very large or coming in batches sequentially over time. In this situation, ordinary boosting algorithm for large scale data and data batch stream may be greedy and have worse performance with class noise situations. To overcome those and apply to large scale data or data batch stream, we modify the forward stagewise algorithm. This algorithm has better results for both large scale data and data batch stream with or without concept drift on simulated data and real data sets than boosting algorithms.

A Method to Provide Context from Massive Data Processing in Context-Aware System (상황인지 시스템에서 대용량의 데이터 처리결과를 컨텍스트 정보로 제공하기 위한 방법)

  • Park, Yoo Sang;Choi, Jong Sun;Choi, Jae Young
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.8 no.4
    • /
    • pp.145-152
    • /
    • 2019
  • Unlike a single value from a sensor device, a massive data set has characteristics for various processing aspects; input data may be formed in a different format, the size of input data varies, and the processing time of analyzing input data is not predictable. Therefore, context aware systems may contain complex modules, and these modules can be implemented and used in different ways. In order to solve these problems, we propose a method to handle context information from the result of analyzing massive data. The proposed method considers analysis work as a different type of abstracting context and suggests the way of representing context information. In experiment, we demonstrate how the context processing engine works properly in a couple of steps with healthcare services.

Data Exchange System Implementation for Data Transmission between Physically Disconnected Networks (물리적으로 분리된 네트워크간 데이터 전송을 위한 자료교환시스템 구현)

  • Han, Youngsub;Kim, Jungsoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.436-438
    • /
    • 2010
  • 중요한 정보를 보유하고 있는 인트라넷 서버의 보안을 강화하기 위해 공공기간에서는 최근에 인터넷과 인트라넷을 물리적으로 분리하여 운영하고 있다. 그러나 물리적으로 분리된 네트워크로 인해 서버간의 데이터 전송에 어려움이 발생하였다. 사용자들이 인터넷 자료를 인트라넷에서 사용하고 싶을 때 또는 그 반대의 경우에 자료교환이 불편하고 처리시간도 많이 소요되었다. 이 문제를 해결하기 위해 분리된 인터넷과 인트라넷간에 사용자들이 손쉽게 자료를 교환할 수 있는 시스템 개발이 필요하였다. 본 논문에서는 분리된 네트워크간에 대용량 파일의 효과적인 송수신 및 e-mail 을 발송할 수 있는 자료교환 아키텍처를 제안하고, 구현한 내용을 다루었다. 자료교환시스템을 구현함으로써 사용자에게 사용 편의를 제공하였고, 자료교환을 위한 행정처리 시간도 감소되었다.

A Study on the Relationship between Skill and Competition Score Factors of KLPGA Players Using Canonical Correlation Biplot and Cluster Analysis (정준상관 행렬도와 군집분석을 응용한 KLPGA 선수의 기술과 경기성적요인에 대한 연관성 분석)

  • Choi, Tae-Hoon;Choi, Yong-Seok
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.3
    • /
    • pp.429-439
    • /
    • 2008
  • Canonical correlation biplot is 2-dimensional plot for investigating the relationship between two sets of variables and the relationship between observations and variables in canonical correlation analysis graphically. In general, biplot is useful for giving a graphical description of the data. However, this general biplot and also canonical correlation biplot do not give some concise interpretations between variables and observations when the number of observations are large. Recently, for overcoming this problem, Choi and Kim (2008) suggested a method to interpret the biplot analysis by applying the K-means clustering analysis. Therefore, in this study, we will apply their method for investigating the relationship between skill and competition score factors of KLPGA players using canonical correlation biplot and cluster analysis.

과학기술위성 1호의 탑재체 자료 수신 시스템

  • 강경인;김문규;이종주;임종태
    • Bulletin of the Korean Space Science Society
    • /
    • 2004.04a
    • /
    • pp.91-91
    • /
    • 2004
  • 과학기술위성 1호의 탑재체는 원자외선 분광기(FIMS), 우주물리 관측기(SPP), 자료수집 시스템(DCS), 그리고 고정밀 별감지기(NAST)가 있으며, 우주물리 관측기는 저에너지 검출기(ESA), 고에너지 검출기(SST), 랑마이어 탐침(LP)과 자기력 측정기(SMAG) 등 4개의 센서로 구성되어있다. 위성에 탑재된 각각의 관측기는 운용시 발생되는 데이터를 위성의 대용량 메모리 시스템에 저장되며, 위성이 한반도 상공을 지나는 교신구간에 X-Band 대역의 RF를 통하여 지상으로 전송된다. (중략)

  • PDF

Techniques for Building Remote Sensing Databases (원격탐사 데이터베이스 구축 기술)

  • 이용주;정진완
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.150-152
    • /
    • 1999
  • 본 연구에서는 원격탐사 데이터베이스를 구축하기 위한 요구사항들을 분석하고, 원격탐사 자료의 메타 데이터 스키마를 설계하고 이를 구현한다. 특히, 현행 지형 공간 표준화 스펙을 따르는 자료구조가 연구되고, OMEGA(Object Management systEem for Geo-Spatial Applications) 객체지향 데이터베이스 관리시스템을 사용하여 SAIF(Spatial Archive and Interchange Format)를 기반으로 한 스키마 구현에 관해 기술한다. 이 연구는 차세대 데이터베이스 기술(예를 들면, 복잡한 데이터 타입 지원, 병렬처리, 사용자 편의성 인터페이스, 그리고 웹(Web) 데이터베이스 기술)에 대한 사전 기초 연구로써 실험적인 대용량 데이터베이스를 구축하기 위하여 수행되어 졌다.

  • PDF

Extension of SHORE storage system for multimedia applications (멀티미디어 응용을 위한 SHORE 하부저장 시스템의 확장)

  • 정재욱;장재욱
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.6-8
    • /
    • 1999
  • 컴퓨터 통신 기술의 급속한 발달로 인해 정지영상, 오디오, 비디오와 같은 다양한 미디어로 구성된 대용량의 멀티미디어 자료를 효율적으로 저장하고 관리할 수 있는 하부 저장 시스템이 필요하다. 이러한 멀티미디어 자료에 대한 내용-기반 검색을 위해 텍스트 기반 검색과 색상 또는 질감과 같은 특징 벡터에 기반한 검색이 이루어져야 한다. 본 논문에서는 멀티미디어 응용을 위한 하부저장 시스템을 구현하기 위해 미국 위스콘신 대학에서 개발한 지속성 객체 시스템인 SHORE를 확장하고자 한다. 텍스트 기반 검색을 위해 역화일 구조를 구현하였으며, 고차원의 특징 벡터의 검색을 위해 X-트리를 통합하였다.

  • PDF

AIS 및 해양공간정보 융합 분석을 통한 선박의 주요 통항로 및 통항영역 연구

  • 엄대용;윤은진;이방희
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2022.11a
    • /
    • pp.325-326
    • /
    • 2022
  • 2020년 AIS 자료와 해양용도구역 정보를 종합해 월별/해역별 주요 선박 통항로를 분석하고 우리나라 연안의 주요 선박 통항로 영역을 유효·비유효 구역으로 구분하여 향후 빅데이터 기반의 통합 항로 예측에 적용하는데 활용하고자 한다. 이 결과를 선박 해양사고정보, 해양에너지, 수산 등의 해양공간계획(MSP) 정보를 추가·분석할 예정이다. 나아가 국가어항을 중심으로 항만별 분석, 화물선·여객선·어선 중심의 선종별 분석 정보로 확대하여 빅데이터 기반의 항로 예측 기술의 입력자료로 활용할 예정이다.

  • PDF

A Study on the Data Modeling for a Noise Management of Construction Field using Spatial Data (공간자료를 이용한 가설현장 소음관리를 위한 자료 모델링에 관한 연구)

  • Song, Jeo;Seo, Jeong Min;Lee, Hyeongah;Lee, Sang Moon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2013.07a
    • /
    • pp.373-374
    • /
    • 2013
  • 대용량 공간DB에 저장된 자료에 대한 접근과 관리에 대한 복잡성을 해결하기 위하여 공간자료와 비공간 자료에 대한 사항들을 구축하고 활용할 필요가 있다. 이에 공간 개체의 공간적 요소와 비공간적 요소를 함께 관리하는 가설현장의 소음관리를 위한 시스템에서도 공간 개체에 대한 데이터의 모델링이 필요하다. 따라서 본 논문에서는 가설현장에서 소음에 따른 피해를 줄이기 위한 방벽 등의 설치를 위해 필요한 소음 시뮬레이션 시스템을 위한 모델링에 관해 연구한 결과를 제시한다.

  • PDF