• 제목/요약/키워드: 데이터베이스 압축

검색결과 161건 처리시간 0.03초

데이터베이스 압축 성능 향상을 위한 선택적 압축 전략 (A Selective Compression Strategy for Performance Improvement of Database Compression)

  • 이기훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권9호
    • /
    • pp.371-376
    • /
    • 2015
  • 사물인터넷 (IoT)은 데이터의 양을 상당히 증가시킨다. 데이터베이스 압축은 저장 시스템 비용과 I/O 대역폭을 절약할 수 있기 때문에 빅데이터에 있어서 중요하다. 그러나 데이터베이스 압축은 압축된 페이지에 대한 업데이트로 인해 OLTP와 같은 쓰기 집중적인 워크로드에 대해 낮은 성능을 보일 수 있다. 본 논문에서는 데이터베이스 압축의 성능 향상을 위한 실용적 가이드라인을 제시한다. 특히, 압축 페이지 크기에 의한 계산으로부터 예상되는 공간 절약과 거의 같은 공간 절약을 보이는 테이블들만을 압축하는 SELECTIVE 전략을 제시한다. TPC-C 벤치마크와 MySQL을 이용한 실험을 통해 SELECTIVE 전략이 압축하지 않는 방법에 비해 1.1배 높은 성능을 보이면서 17.3%의 공간을 절약한다는 것을 보였다.

시퀀스 유사도에 기반한 유전체 데이터베이스 압축 및 영향 분석 (The Analysis of Genome Database Compaction based on Sequence Similarity)

  • 권선영;이병한;박승현;조정희;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권4호
    • /
    • pp.250-255
    • /
    • 2017
  • 유전체 데이터의 급증 및 정밀의료 등 응용 분야 확대에 따라 유전체 데이터베이스의 효율적 관리에 대한 중요성이 커지고 있다. 전통적인 압축 기법을 통해 유전체 데이터를 압축할 경우, 압축효과는 크지만, 압축된 상태에서 데이터베이스를 비교하거나 검색하는 등의 작업이 용이하지 않게 된다. 유전체 데이터 분석에 소요되는 시간은 데이터베이스에 존재하는 시퀀스 수에 비례하며, 중복되거나 유사한 시퀀스가 다수 존재한다는 점에 착안하여, 본 논문에서는 유전체 데이터베이스 상에 존재하는 유사 시퀀스를 제거함으로써 전체 데이터베이스 크기를 줄이는 기법을 제안한다. 실험을 통해 시퀀스 유사도 1% 기준으로도 전체의 약 84% 시퀀스가 제거되며, 약 10배 빠른 분류분석이 가능함을 보인다. 또한 큰 폭의 압축효과에도 불구하고, 범주 다양성 및 분류 분석 등에 미치는 변화가 미미함을 확인함으로써, 시퀀스 유사도 기반의 제안 압축 기법이 유전체 데이터베이스 압축에 효과적인 방법임을 제시한다.

XML 기반의 통합 임상정보를 효율적으로 저장하기 위한 XML 압축 기법에 대한 연구 (A Study on XML Compress method for efficient integration and storing of XML-based Clinical Information)

  • 유의혁;정종일;이태헌;신동규;신동일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.71-74
    • /
    • 2005
  • 임상정보 문서는 환자 진료기록뿐만 아니라 처방전, 개인적 유전자정보를 가지고 있다. 이러한 임상 정보 문서는 병원 시스템들간에 교환 및 공유함으로써 양질의 의료서비스를 제공할 수 있다. 이와 관련하여 임상정보의 통합을 위한 기존의 연구들은 각각 HL7 메시지를 XML 문서로 변환하고 XML 기반의 CDA 를 관계형 데이터베이스에 저장하는 연구가 진행되었다. 그러나 관계형 데이터베이스는 문서의 데이터 별 테이블 단위로 생성, 저장된다. 그러나 HL7 과 CDA 는 문서 중심의 XML 문서이기 때문에 관계형 데이터베이스에 저장 시 문서 별 많은 변이가 존재하여 테이블 증가를 갖는다. 따라서 비정규적인 구조에 적합한 데이터베이스를 선택하기 위해 XML 전용 데이터베이스와 관계형 데이터베이스 비교하고 효율적 저장을 위해 압축기법을 제시한다. 압축기법을 적용한 임상 정보 데이터베이스는 대용량 임상정보 문서의 크기를 압축함으로써 문서의 크기를 줄임으로써 데이터베이스의 효율적 저장을 향상시킨다.

  • PDF

데이터베이스 축소기법을 사용한 모바일 임베디드 시스템에서의 모션 캡쳐 기반 애니메이션 (Motion-Capture-Based Animation in Mobile Embedded Systems Using Motion Capture Database Reduction Technique)

  • 한영모
    • 정보처리학회논문지B
    • /
    • 제14B권6호
    • /
    • pp.437-444
    • /
    • 2007
  • 본 논문의 목적은 기존의 모션 캡쳐 기반 애니메이션을 모바일 임베디드 시스템의 적은 메모리와 낮은 계산력에 적합하게 개조하는데 있다. 모바일 임베디드 시스템의 메모리를 효율적으로 사용하기 위한 방안으로서, PC 상에서 모션 캡쳐 데이터베이스를 압축하고, 압축된 모션캡쳐 데이터베이스를 모바일 임베디드 시스템에서 조금씩 압축 해제하고 사용 직후 삭제하는 패러다임을 제안한다. 이러한 목적으로 사용될 모션 캡쳐 데이터베이스 압축 기법으로서, 다항식 정합법을 활용하여 캡쳐된 운동 랜더링 파라미터의 데이터베이스를 축소하는 방법을 제안한다. 그리고 성능향상을 위해서 다항식 정합 함수를 최적화하는 방안도 함께 제안한다. 이렇게 설계된 다항식 정합법에 기반한 데이터 압축 방식을 사용하여, 상용화된 모바일 임베디드 시스템에서 효율적인 모션 캡쳐 기반 애니메이션 제작을 시현한다.

Wavelet 압축 영상에서 PCA를 이용한 얼굴 인식률 비교 (Face recognition rate comparison using Principal Component Analysis in Wavelet compression image)

  • 박장한;남궁재찬
    • 전자공학회논문지CI
    • /
    • 제41권5호
    • /
    • pp.33-40
    • /
    • 2004
  • 본 논문에서는 웨이블릿 압축을 이용하여 얼굴 데이터베이스를 구축하고, 주성분 분석(Principal Component Analysis : PCA) 알고리듬을 이용하여 얼굴 인식률을 비교한다. 일반적인 얼굴인식 방법은 정규화된 크기를 이용하여 데이터베이스를 구축하고, 얼굴 인식을 한다. 제안된 방법은 정규화된 크기(92×112)의 영상을 웨이블릿 압축으로 1단계, 2단계, 3단계로 변환하고 데이터베이스를 구축한다. 입력 영상도 웨이블릿으로 압축하고 PCA 알고리듬으로 얼굴인식 실험을 하였다 실험을 통하여 제안된 방법은 기존 얼굴영상의 정보를 축소할 뿐만 아니라 처리속도도 향상되었다. 또한 제안된 방법은 원본 영상이 99.05%, 1단계 99.05%, 2단계 98.93%, 3단계 98.54% 정도의 인식률을 보였으며, 대량의 얼굴 데이터베이스를 구축하여 얼굴인식을 하는데 가능함을 보였다.

전자도서관에서의 이진 문서영상 서비스 방안 (A Service Strategy of Binary Document Images in Digital Library)

  • 한영미;허봉식;김민환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.154-159
    • /
    • 1998
  • 최근의 전자도서관에서 문서영상 데이터베이스를 구축하여 사용자에게 원하는 정보의 원문을 그대로 서비스하고 있는데, 주로 200 dpi 문서영상에 대해 TIFF 영상포맷에서의 ITU-T T.6 압축방법을 사용하고 있다. 본 연구에서는, 문서영상 데이터베이스의 확장성, 지속성, 효율성 등을 고려하여, 문서 영상의 스캐닝 해상도의 600 dpi가 적당하며, 압축방법은 JBIG이 타당함을 제시하였다. 아울러, 모니터 및 프린터 기반 서비스의 특성을 분석하여 서비스 해상도를 차별화하는 방법인 단계별 서비스 방안을 제시함으로써 JBIG의 단점인 과다한 복구시간 문제를 해결하였다. 대표적인 문서영상들에 대한 실험을 통해, JBIG의 높은 압축율 및 제시된 단계별 서비스 방안의 타당성을 확인하였다.

  • PDF

뇌 영상의 형태적 및 기능적 분석을 위한 의료 영상 데이터베이스 (Medical Image Database for Morphometric and Functional Analysis of Brain Images)

  • 김태우
    • 정보처리학회논문지B
    • /
    • 제8B권2호
    • /
    • pp.164-172
    • /
    • 2001
  • 본 논문에서는 시각화와 공간적, 속성 혼합 쿼리를 수행할 수 있는 관계형 데이터베이스를 설계하고 구현하였다. 쿼리에 사용되는 데이터형은 슬라이스, MPR, 볼륨 렌더링으로 시각화할 수 있으며, 쿼리는 아탈라스를 이용하는 경우와 그렇지 않는 경우를모두 고려하였다. 영상 데이터는 공간충전 곡선으로 공간적으로 클러스트링한 후 무손실 압축하여 데이터베이스에 저장된다. 본 논문은 저장 데이터의 양을 줄이기 위하여 관심영역의 크기에 따라 창의 크기가 변하는 적응적 Hibert 곡선을 제안하였으며, 실험에서 Hibert 곡선의 적용한 데이터보다 약 1.15배 높은 압축율을 보였다. 또한 아틀라스에 대한 뇌종양의 공간적 쿼리 결과를 통하여 본 의료 영상 데이터베이스의 유용성을 보였다.

  • PDF

시공간데이터베이스의 다차원 선택도 추정을 위한 웨이블렛 기반 히스토그램 (Simple Wavelet-based Histogram of Multidimensional Selectivity Estimation for Spatio-temporal Databases)

  • 권정민;신병철;이종연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.34-36
    • /
    • 2005
  • 선택도 추정 기법은 상용 데이터베이스에서 질의 최적화를 위해 많이 사용하고 있다. 그 중 선택도 추정 기법에 가장 많이 사용되고 있는 기법은 히스토그램이다. 최근 시공간 데이터베이스 관련 연구에서 시간$\cdot$공간 데이터베이스의 선택도 추정 기법이 활발하게 이루어지고 있다. 이 히스토그램 추정 기법이 과거에서 현재시점까지 범위 질의 수행을 성공적으로 이루어지고 있지만 대량의 데이터들을 효율적으로 관리하기에는 저장오버헤드가 너무 크다. 본 논문에서는 시공간데이터베이스에서 성공적으로 선택도 추정을 다룬 히스토그램 추정 기법을 보완하여 과거 이력데이터들의 저장을 효율적으로 할 수 있는 압축기법을 제안한다. 현재 객체에 대해서는 기존 연구에서 성공적으로 이루어진 히스토그램 기반 추정 기법을 응용하고 과거 이력데이터에 대해서는 압축기법인 웨이블렛을 응용하여 선택도추정의 오류율과 저장오버헤드의 향상이 기대된다.

  • PDF

MPEG-2 압축 동영상 정보 관리 시스템의 설계 및 구현 (Design and Implementation of MPEG-2 Compressed Video Information Management System)

  • 허진용;김인홍;배종민;강현석
    • 한국정보처리학회논문지
    • /
    • 제5권6호
    • /
    • pp.1431-1440
    • /
    • 1998
  • 동영상 정보는 자료의 양이 방대하고 다양하여 압축된 형태로 저장하고 검색하는 것이 매우 중요하다. 본 논문에서는 동영상 문서의 구조를 추출하고 동영상 스트림의 인데싱에 대한 의미를 부여할 수 있는 일반적인 데이터 모델을 제시하고, 이 모델을 이용하여 MPEG-2로 압축된 동영상 자료를 데이터베이스에 저장하고 검색하는 MPEG-2 압축 동영상 정보 관리 시스템(CVIMS, Compressed Video Information Management System)을 제안한다. CVIMS는 MPEG-2 파일에서 I-프레임들을 추출하고, 그 중에서 키 프레임(대표 이미지)을 선택한 후, 선택된 키 프레임에 대한 축소그림(thumbnail)과 캡션 및 그림 설명 정보를 데이터베이스에 저장한다. 그리고 데이터베이스에 저장된 MPEG-2 동영상을 질의어나 키 프레임을 통해 검색한다.

  • PDF

모바일 압축 데이터 관리 시스템(CDMS)를 위한 데이터 가용 크기 변경 기법 (Technique about Data Capacity Adaptation for the Mobile Compressed Data Management System)

  • 장진근;신영재;이정화;손진현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.107-112
    • /
    • 2007
  • 휴대용 정보기기는 정보의 디지털화로 인해 많아지고 있는 디지털 정보를 처리 및 저장해야 되는 상황이 되었다. 따라서 휴대용 정보기기에서는 무수한 디지털 정보를 효과적으로 관리하기 위해 모바일 DBMS을 사용하게 되었고, 저장장치로는 플래시 메모리를 사용하고 있다. 플래시 메모리는 일반 디스크보다 고비용이기 때문에 데이터를 보다 효율적으로 저장하기 위하여 압축 데이터 관리 시스템(CDMS)과 같은 압축을 사용한 관리도 사용되고 있다. 하지만 압축을 사용하여 저장공간을 효율적으로 사용하기 위한 CDMS의 연구는 데이터베이스 파일 크기를 고정하여 관리하였다. 하지만 이것은 실제사용에 있어서는 실용적이지 못하다. 따라서 본 논문에서는 이러한 CDMS를 보완하여 데이터베이스 파일 크기를 동적으로 변환하는 기법을 제시한다.

  • PDF