• 제목/요약/키워드: 데이타 변환

검색결과 305건 처리시간 0.029초

선택 프레디키트를 포함하는 시간 집계의 효율적 처리 (Efficient Processing of Temporal Aggregation including Selection Predicates)

  • 강성탁;정연돈;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권3호
    • /
    • pp.218-230
    • /
    • 2008
  • 시간지원 데이타베이스 시스템에서의 시간 집계 연산은 일반적인 집계 연산의 확장으로써, 집계의 범위 조건에 '시간'을 포함한다. 시간 집계 연산은 이력 데이타 웨어하우스, 전화 기록 관리(CDR) 등에 유용하다. 본 논문에서는 질의 조건에 여러 개의 선택 프레디키트들을 포함하는 시간 집계 연산을 효율적으로 처리하기 위한 자료 구조인 ITA-tree를 제안하고, 이를 이용한 시간 집계 처리 기법을 제안한다. ITA-tree에서는 레코드의 시간 구간을 T-value라는 하나의 값으로 변환한 후, $B^+$-tree와 비슷하게 이 값을 이용하여 색인을 생성한다. 또한, 많은 레코드가 동일한 T-value 값을 가지게 되는 핫-스팟 문제를 위해 개선된 ITA-tree인 eITA-tree를 제안한다. 본 논문에서는 제안된 기법들의 성능을 분석과 실험을 통해 비교한다.

Trie 구조를 이용한 비디오 인덱스 생성 및 검색 (Video Index Generation and Search using Trie Structure)

  • 현기호;김정엽;박상현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.610-617
    • /
    • 2003
  • 비디오 데이타베이스에서 유사도 정합은 비디오 클러스터링과 비디오 라이브러리 등과 같은 많은 새로운 응용분야에서 중요성이 증가하고 있다. 대용량 데이타베이스에서 효과적인 접근을 제공하기 위하여 다양한 공간과 시간에 대한 특징치를 이용한 비디오 인덱싱 분야의 많은 연구노력이 있어왔다. 그러나 대부분의 기존 방법들은 순차적인 정합방법 또는 메모리 기반의 역 파일 기법 등에 의존하므로 대용량 데이타베이스에는 적합하지 않다. 이러한 문제를 해결하기 위하여 본 논문에서는 효과적이고 스케일 조정가능한 인덱싱 기법을 제안하기 위하여, 문자열 정합을 위해 제안된 trio를 인덱스 구조로 이용하였다. 인덱스 구성을 위하여 윈도우 순서 휴리스틱을 이용하여 각 프레임을 기호 시퀀스로 변환하고, 기호 시퀀스의 집합으로부터 디스크 상주 trio를 구성하였다 질의 처리를 위하여 trio 상에서 깊이-우선 검색과 시간 축분할을 실시하였으며, 제안한 방법의 성능을 검증하기 위하여 실제와 합성 데이터 집합에 대한 실험을 수행하였다. 제안한 방법은 지속적으로 순차적 스캔 방법보다 우수한 성능을 보였고, 성능이득은 대용량 비디오 데이타베이스에서도 유지되었다.

XML 데이타베이스에서 경로-지향 질의처리를 위한 병렬 매치 방법 (A Parallel Match Method for Path-oriented Query Processing in iW- Databases)

  • 박희숙;조우현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.558-566
    • /
    • 2005
  • XML은 인터넷상에서 데이타를 표현하고 교환하기 위한 새로운 표준이다. 본 논문에서는, XML문서에 대한 경로-지향 질의어의 평가를 위한 새로운 접근법에 대하여 기술한다. 본 논문의 접근법에서는, 경로-지향 질의어의 평가속도를 개선하기 위해 경로서명을 이용하는 병렬 매치 인덱싱 구조의 제안과 함께 데이타베이스 안에 저장된 엘리먼트들의 경로서명들과 입력된 질의어의 경로서명 사이에 매치작업을 수행하기 위한 병렬 매치 알고리즘을 설계한다. 먼저, 병렬 매치 구조를 형성하기 위해서는 XML 문서상의 모든 경로서명들에 대한 이진 트라이를 구성한 다음 이들을 병렬 매치 인덱싱 구조로 변환한다. 경로-지향 질의어의 검색 연산을 수행하기 위해 병렬 매치 인덱싱 구조와 병렬 매치 알고리즘을 사용한다. 본 논문에서 제안한 방법에서 알고리즘의 시간 복잡도는 XML 문서내의 경로서명의 수에 대하여 로그값에 비례한다.

웹 정보의 추출 및 통합을 위한 래퍼 시스템 (A Wrapper System for Extraction and Integration of Web Information)

  • 정재목;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권5호
    • /
    • pp.551-559
    • /
    • 2003
  • 이 논문은 웹 정보를 추출하기 위한 래퍼 프로그램을 생성해내기 위한 XWS(XWEET Web-wrapper System)의 데이타 모델과 소프트웨어 개발방법에 대해 설명하고 있다. 다양한 정보 출처에 존재하는 정보에 접근하기 위해서는 원본 데이타를 공통된 데이타 모델로 변환하고 통합해야 된다. XWS 시스템은 XWEET 프로젝트의 부분으로 개발되었다. 우리는 효율적이고 사용하기 쉬운 Perl 프로그램 언어를 사용해서 XWS 시스템을 구현하였다. XWS은 다른 시스템과 구별되는 몇 가지 특징을 가지고 있다. 첫째, HTML 페이지로부터 정보를 추출하기 위해 사용되는 데이타모델과 연산자들은 HTML 문서의 다양한 뷰를 지원할 수 있는 통합된 모델을 사용한다. 둘째, XWS는 사용자가 래퍼 프로그램을 손쉽게 생성해 내기 위한 그래픽 인터페이스 프로그램을 제공한다. 셋째, 객체지향적으로 설계된 고수준의 스크립트 언어를 사용하였다. 또한 논문에서 DBLP 사이트로부터 검색된 논문 정보를 추출하기 위한 자세한 예제를 통해 XWS의 사용법을 보이고 있다.

상이한 구조의 XML문서들에서 경로 질의 처리를 위한 RDBMS기반 역 인덱스 기법 (An RDBMS-based Inverted Index Technique for Path Queries Processing on XML Documents with Different Structures)

  • 민경섭;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권4호
    • /
    • pp.420-428
    • /
    • 2003
  • XML은 웹을 비롯한 모든 문서들을 표현할 수 있는 데이타 중심 표준 언어이다. XML 기반의 여러 문서 개발 도구들의 등장과 이를 이용한 사유 XML 문서의 증가, XML 문서로의 기존 데이타 변환가속화로 인해, 우리는 대량의 서로 상이한 구조로 표현된 XML 문서들을 가지게 되었으며, 이러한 문서 집합으로부터 원하는 정보를 담은 문서를 추출해 내는 것이 중요해 졌다. 하지만, 기존의 XML 문서에 대한 연구들은 한 개의 대규모 XML 문서나 동일한 구조를 가진 문서들에 대한 저장, 검색에 초점이 맞춰져 있거나. 상이한 구조를 지원하더라도, 구조적인 정보를 이용한 빠른 검색을 지원하지 못하는 단점을 가지고 있었다. 이에, 본 논문에서는 상이한 구조를 가진 문서들에 대해서도 빠른 경로 질의를 제공할 수 있도록 지원하기 위한 새로운 기법으로, 관계형 데이타베이스 시스템을 이용한 새로운 역 인덱스를 제안하였다. 우리는 제안된 기법이 기존의 방법에 비해 높은 성능을 보임을 실험을 통해 확인하였다. 특히, 간접 포함 관계를 포함한 모든 진의에서 논은 성능을 제공함으로서, 상이한 구조를 가진 문서들에 대해 적합한 인덱스 구조임을 보여 주었다.

NAND형 플래시메모리를 위한 플래시 압축 계층의 설계 및 성능평가 (Design and Performance Evaluation of a Flash Compression Layer for NAND-type Flash Memory Systems)

  • 임근수;반효경;고건
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권4호
    • /
    • pp.177-185
    • /
    • 2005
  • 최근 휴대용 정보기기의 사용이 급증함에 따라 NAND형 플래시메모리를 시스템의 보조기억장치로 사용하는 사례가 급증하고 있다. 하지만, 전통적인 보조기억장치인 하드디스크에 비해 NAND형 플래시메모리는 단위 공간당 비용이 수십배 가량 높아 저장 공간의 효율적인 관리가 필요하다 저장 공간을 효율적으로 사용하게 하는 대표적인 방법으로 데이타 압축 기법이 있다. 하지만, NAND형 플래시메모리에서는 압축 기법의 적용이 쉽지 않다. 이는 NAND형 플래시메모리가 페이지 단위 입출력만을 지원하여 압축 데이타가 플래시 페이지보다 작은 경우 내부 단편화 현상을 발생시켜 압축의 이득을 심각하게 감쇄시키기 때문이다. 이러한 문제를 해결하기 위해 본 논문에서는 작은 크기의 압축 데이타를 쓰기 버퍼를 통해 그룹화한 후 하나의 플래시 페이지에 저장하는 플래시 압축 계충을 설계하고 성능을 평가한다. 성능평가 결과 제안하는 플래시 압축 계층은 플래시메모리의 저장 공간을 $40\%$ 이상 확장하며 쓰기 대역폭을 크게 개선함을 확인할 수 있었다.

데이타웨어하우스 환경에서의 질의 처리 성능 향상을 위한 캐시 관리자 (A Cache Manager for Enhancing the Performance of Query Evaluation in Data Warehousing Environment)

  • 심준호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권4호
    • /
    • pp.408-419
    • /
    • 2003
  • 데이타웨어하우스는 의사결정시스템의 질의처리에 사용되는데, 통상적으로 의사결정질의의 응답 속도는 OLTP 질의 응답속도에 비해 수십 배 이상 오래 걸린다. 의사결정은 대부분 빠른 시간 안에 이루어지는 것이 필수적이므로 의사결정질의 응답 속도를 단축시키는 기술은 중요하다. 본 논문에서는 기존의 질의결과를 캐싱하여 주어진 질의처리에 이용하는 기법을 제시한다. 이를 위해 먼저 의사결정시스템이 이 기법에 적합한 환경을 가지고 있는지 살펴본다. 그 다음, 임의 형태의 모든 질의를 처리한다는 것은 불가능하므로 우리가 다루는 질의 형태인 정규화형태를 정의한다. 질의가 정규화형태를 따르지 않으면 단순 스트링 매칭을 하고, 정규화된 경우라면 질의스플릿이란 질의 변환 과정과 질의종속그래프를 통해 캐시된 질의결과를 찾은 후 그 결과 위에서 질의를 수행한다. 캐시 관리자는 질의응답시간을 최소화하도록 캐시를 유지해야한다. 이를 위해 질의 수행비용, 질의결과의 크기, 레퍼런스비율, 베이스 테이블의 업데이트비율 및 그에 따른 질의결과 유지비용 등을 고려하여 캐싱하는 동적 캐시효환기법을 제안한다. 제안된 기법은 실험을 통해 그 성능을 검증하였다.

가우시안 가중치 거리지도를 이용한 PET-CT 뇌 영상정합 (Co-registration of PET-CT Brain Images using a Gaussian Weighted Distance Map)

  • 이호;홍헬렌;신영길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권7호
    • /
    • pp.612-624
    • /
    • 2005
  • 본 논문에서는 PET-CT 뇌 영상융합을 위해 가우시안 가중치 거리지도를 이용한 표면기반 영상정합을 제안한다. 제안방법은 중요 세 단계로 표면 특징점 추출, 가우시안 가중치 거리지도 생성, 가중치기반 유사도 평가로 구성된다. 첫째, PET 영상과 CT 영상에서 삼차원 역 영역성장법을 이용하여 머리영역을 분할하고 머리 영역과 같이 분할된 잡음 영역을 영역성장법기반 레이블링을 이용한 영역 크기 비교를 통해 제거한 후 선명화 처리 필터를 적용하여 머리 표면 특징점을 추출한다. 둘째, CT 영상에서 추출한 표면 특징점에 가우시안 가중치 거리지도를 생성하여 큰 변위에서도 최적의 위치로 견고하게 수렴하도록 한다. 셋째, 가중치기반 상호상관관계는 PET 영상에서 추출한 표면 특징점과 대응되는 CT 영상의 가우시안 가중치 거리지도를 이용하여 최적 위치를 탐색한다. 본 논문에서는 제안방법의 정확성과 견고성 검사를 위해 인공데이타를 이용하고, 수행시간과 육안평가를 위해 임상데이타를 이용한다. 정확성 검사는 임의로 변환된 인공데이타에 제안방법을 적용한 후 추출된 최적화 변환벡터와의 오차를 제곱근평균제곱오차를 이용하여 평가한다. 견고성 검사는 큰 변위와 잡음을 가지는 인공데이타에서 가중치기반 상호상관관계가 최적의 위치에서 최대를 이루는지를 평가한다 실험 결과 제안한 표면기반 영상정합이 기존 표면기반 영상정합보다 정확하고 견고하게 수렴됨을 알 수 있다.

디지털 이미지 데이터의 저작권 보호를 위한 디지털 워터마킹 개발에 관한 연구 (A Study on the Development of Digital Watermarking for Copyright Protector of Original Image Data)

  • 조정석;유세근;김종원;최종욱
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.519-523
    • /
    • 1999
  • 본 연구는 디지털 이미지 데이터에 대한 창작자의 저작권 보호 기술인 watermarking 기술을 연구하였다. 저작권 보호를 위한 정보를 invisible watermark로 삽입하였고, watermarking된 칼라 이미지를 데이터 압축, Filtering, cropping 등과 같은 여러가지 외부 공격에 대한 내구성을 실험하였다. invisible watermark를 삽입하기 위하여 변형된 주파수 변환기법을 이용하였으며, 기존의 PRN(pseudo random number) 방법보다 가시성이 뛰어난 이미지 형태의 로고를 삽입하여 저작권에 대한 확증성을 제고하였다.

  • PDF

Web 상에서의 정보검색기법에 관한 고찰

  • 김준오
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1997년도 International Conference MULTIMEDIA DATABASES on INTERNET
    • /
    • pp.270-281
    • /
    • 1997
  • 현재 기업 뿐 아니라 개인에도 정보의 중성이 증대되고 있는 실정이다. 특히, 정보기술의 활용과 빠른 컴퓨팅 환경의 변화 및 인터넷이라는 네트웍을 기반으로 다양한 정보를 접할 수 있게 됨으로써 필요한 정보를 보다 빠르게 검색해야 하는 필요성이 생기게 되었다. 지금까지는 다양하고 방대한 데이터들을 정보의 형태로 가공하여 DB를 중심으로 유용한 정보를 제공하였지만, 이제는 효과적인 정보의 활용을 위해 정보검색의 중요성이 증대되고 있다. 즉, 흩어져 있는 데이터를 정보의 형태로 변환시키는 것보다 그 정보를 효율적이고 빠르게 검색하여 한차원 높은 'Knowledge' 로써의 역할을 하느냐가 중요하게 된것이다. 본 논문에서는 각 정보들의 검색을 위해 사용되고 있는 기존의 검색기법인 SQL-Based 검색, Full text 검색과 새로 소개되고 있는 Parametric 검색에 대해서 고찰하여보고 다양한 정보의 유형에 대해 효과적인 검색을 위한 방안을 제시하고자 한다.

  • PDF