• Title/Summary/Keyword: 대용자료

Search Result 456, Processing Time 0.027 seconds

Approximate k-Nearest Neighbor Search Algorithms for Content-Based Retrieval of Multimedia Data (대용량 멀티미디어 데이터의 내용-기반 검색을 위한 근사 k-최근접 데이터 탐색 알고리즘)

  • 송광택;심춘보;장재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.256-258
    • /
    • 1998
  • 대용량의 멀티미디어 자료를 기반으로 하는 내용-기반 멀티미디어 검색 시스템에서 k-최근접 탐색 질의는 사용자의 매우 중요한 검색 질의 중에 하나이다. 하지만, 방대한 양의 멀티미디어 데이터베이스를 기반으로하는 경우에는 적중 에러 없는 정확(exact) k-최근접 데이터 탐색을 위해서 상당히 많은 디스크 접근 횟수가 요구된다. 본 논문에서는 X-트리에서의 정확 k-최근접 탐색 질의를 개선하고, 또한 사용자의 빠른 검색 성능을 위해 다소의 적중 에러는 허용한다 하더라도 디스크 접근 횟수를 줄이는 근사(approximate) k-최근접 탐색 알고리즘을 제안한다.

Technology for Searching Massive XML Data with Different Schema (대용량 이종 XML 데이터 검색을 위한 RDBMS기반 인덱싱 기법)

  • 이성진;박영순
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.202-204
    • /
    • 2004
  • 최근 XML은 기업간 데이터 교환의 표준으로 자리잡았다. 기업간 데이터 교환은 필연적으로 대량의 XML형태의 데이터가 로그 형태로 보전되게 된다. W3C에서는 XML자료의 검색을 위하여 XQueryl.0을 발표하고 XML 검색문의 표준화를 제시하였다. 검색운과는 별도로 XML데이터의 저장 모델에 대한 연구 또한 활발히 진행되고 있다. 본 논문에서는 대용량 XML데이터를 RDBMS를 이용하여 저장하고 빠른 검색을 지원 할 수 있는 역 인덱싱 방안을 기초로 검색 성능을 향상시킬 수 있는 방안에 대하여 연구하고 기존 방법과의 비교 실험을 통해 그 효과를 검증하였다.

  • PDF

Development of Linux-Based Web Storage Management System (리눅스 기반의 웹 스토리지 관리 시스템의 개발)

  • 이보라;장현희;박성순
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11b
    • /
    • pp.811-814
    • /
    • 2003
  • 네트워크의 발전과 파일의 대용량화는 웹 스토리지의 개발을 초래했다. 웹 스토리지는 웹 상에 저장 공간을 두어 사용자가 필요로 하는 자료를 저장 및 관리하도록 개발된 시스템이다. 자료를 필요로 하는 위치에서 언제 어느 때나 접근이 가능하다 또한 다른 사람들에게 자신의 자료를 제공하는데 용이하다. 본 논문에서는 자신에게 할당된 웹 스토리지 공간을 사용자가 쉽게 관리하고 웹 스토리지 내의 자료를 다른 사람들에게 제공할 수 있는 시스템을 제안한다.

  • PDF

3-D Vertex Detection Algorithm for Optimization of Scattered Data (분산된 데이터의 최적화를 통한 3차원 특성점 검출 알고리듬)

  • Moon, Seong-Hwan;Jo, Im-Hyeon;Kang, Hun
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1998.03a
    • /
    • pp.139-142
    • /
    • 1998
  • 3차원 공간의 자료는 그 자료의 크기, 처리속도 잡음 및 측정 오차 등의 불규칙성 등의 한계를 가지고 있다. 최근 인터넷과 같은 통신 속도의 증가와 함께 대용량의 자료 교환이 가능하계 되면서 3차원 정보에 대한 연구는 매우 중요한 문제로 대두되고 있는 실정이다. 본 논문에서는 3차원 물체를 표현해 줄 수 있는 특성점(vertex)를 찾는 알고리듬을 제시함으로써 자료의 양을 줄일 수 있는 방법을 제시하고 있다.

  • PDF

Constructing the Compressed Suffix Array via Efficient Implementation of Succinct Representation (Succinct 표현의 효율적인 구현을 통한 압축된 써픽스 배열 생성)

  • Park, Chi-Seong;Jo, Jun-Ha;Kim, Dong-Kyue
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11a
    • /
    • pp.955-957
    • /
    • 2005
  • 대용량의 텍스트에 대해 빠른 패턴 검색의 필요성이 증가함에 따라 써픽스 트리, 써픽스 배열 등의 인덱스 자료구조에 대해 다양한 연구들이 진행되었다. 또한 써픽스 배열을 대용량의 인덱스 자료구조로 사용하기 위해 저장 공간을 O(n log n) 비트 이하로 줄이는 문제에 대한 연구들도 많이 수행되었다. 이들 중 Grossi & Vitter 는 써픽스 배열을 압축하여, 기존의 써픽스 배열보다 작은 저장 공간을 사용할 수 있는 알고리즘을 제안하였다. Grossi & Vitter 알고리즘은 압축된 써픽스 배열에서 실제 써픽스 배열의 정보를 찾기 위하여, succinct 표현에서 기본적으로 사용되는 rank와 select 함수를 필요로 한다. 본 논문은 다양한 rank와 select 알고리즘을 각각 사용하는 압축된 써픽스 배열들의 성능 비교를 통해, succinct 표현의 효율적인 구현이 압축된 써픽스 배열의 성능에 미치는 영향을 실험적으로 보인다.

  • PDF

An large scale single nucleotide polymorphism analysis method using mutual information and MDR (상호정보량과 MDR을 이용한 대용량 단일염기다형성 연관성 분석)

  • Jeong, Hyun-hwan;Wee, Kyubum
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.1392-1394
    • /
    • 2010
  • 단일염기다형성 유전형 자료에 대한 유전자형을 얻어내는 기술(genotyping)이 발달함에 따라 분석해야 하는 SNP의 개수가 수십만 개로 증가하였다. 따라서 기존의 연관성 분석(association study)연구 방법을 그대로 적용시키기는 어렵다. 본 논문에서는 상호정보량(mutual information)과 Multifactor dimensionality reduction을 이용하여 대용량의 SNP 유전형자료를 분석하는 방법을 제안하였고, 이 방법을 toluene diisocyanate-induced asthma에 대해 실험해본 결과 높은 판별력을 보이는 모델을 찾을 수 있었다.

User Interface of Data Processing, Design and Construction Techniques of Traffic Database Supporting Archived data (교통정보 이력자료 분석을 위한 통합 교통 데이터베이스의 설계 및 구축과 자료처리 이용자 인터페이스)

  • Lee, Yoon-Kyung;Lee, Min-Soo;NamGung, Sung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.55-59
    • /
    • 2008
  • 분산되어 있는 여러 운영계 시스템에서 대용량의 교통자료를 가져와 교통정보 이력자료를 분석할 수 있는 단일 통합 교통 데이터베이스를 구축한다. 품질 평가, 오류 판단, 결측보정과 평활화 등의 자료처리 과정을 거친 교통자료는 자료의 신뢰도를 판단하고 활용도를 높일 수 있게 해주며 이용자에게 고속도로 통행료 수납자료, 고속도로 전자통행료 수납자료, 차량검지장치자료, 도로전광표지자료, 돌발상황자료, 기상자료, 차량번호인식장치자료 등에 대한 검색 및 자료 처리 기능을 제공한다.

  • PDF

The Loss and Profit System For View Performance (조회 속도 향상을 고려한 손익 평가 시스템 구현)

  • Kim, Sol-Moi;Kwag, Hee-Kue;Kim, Soo-Hyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.75-78
    • /
    • 2000
  • 정보의 양이 많아지면서 대용량의 자료에서 필요한 자료를 찾는 일의 중요성이 날로 증대되고 있다. 본 논문에서는 100만건 이상의 손익 자료에서 시계열성 매출액, 사원별 매출액 등과 같은 정보의 조회시 조회 속도를 향상시키기 위한 여러 방법들을 고려하여 손익 평가 시스템을 구축하고 앞으로의 발전방향을 알아본다.

  • PDF

Introduction to Concept in Association Rule Mining (연관규칙 마이닝에서의 Concept 개요)

  • ;;R. S. Famakrishna
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.100-102
    • /
    • 2002
  • 데이터 마이닝의 대표적인 기법인 연관규칙 마이닝을 위한 다양만 알고리즘들이 제안되었고, 각 알고리즘에 따른 대용량 데이터에 대한 신속한 탐색을 위한 독특한 자료구조가 제안되었다 각 자료구조의 특성에 따른 알고리즘 성능은 데이터의 패턴에 크게 의존한다. 본 논문에서는 Concept을 형성하는 세가지 대표적인 자료구조인 Hash Tree, Lattice. FP-Tree에 대해 비교 분석해보고, 데이터 패턴에 적합한 효율적인 알고리즘의 설계 위한 framework을 제안한다.

  • PDF