• 제목/요약/키워드: 경로 질의

검색결과 1,765건 처리시간 0.052초

OLAP 환경의 수평적인 테이블에 대한 질의 최적화 방법 (Query Optimization Techniques for Horizontal Tables in OLAP Environment)

  • 신성현;문양세;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.70-72
    • /
    • 2006
  • 데이터 웨어하우스는 방대한 이력 데이터들을 저장하는 저장소이며, 이를 다양한 관점에서 분석하기 위해 OLAP (On-Line Analytical Processing) 연산을 이용한다. 일반적으로 이러한 저장소는 데이터를 저장할 때 많은 열(columns) 을 기반으로 저장하는 와이드(wide) 형태의 테이블로 저장하게 된다. 하지만, 관계형 DBMS에서는 열 수의 제약(MS SQLServer, Oracle 등 열의 수는 1024개임)을 받게 되므로, 그 이상의 열들을 저장할 수 없다. 하지만, 열 기반(이하, 수평 테이블)으로 저장하는 것보다는 관계형 DBMS의 특징을 이용하여 행(row) 기반(이하, 수직 테이블)으로 저장하게 되면 많은 데이터를 효율적으로 저장할 수 있다. 이때, 저장 테이블의 스키마 구조가 변경되므로, 수평 테이블에 대한 질의도 저장된 수직 테이블에 적용 가능하도록 변화시켜야 한다. 또한, 사용자에게 빠른 질의 응답을 제공하기 위해 질의 최적화를 고려하여 실행전락을 세워야 한다. 따라서 본 연구에서는 경험(heuristic)을 근거로 각 연산(프로젝션, 실렉션, 조인 연산)을 위한 질의 트리를 생성하여 질의 최적화에 대한 여러 질의 경로를 고려하고, 다양한 실험을 통해 질의 최적화에 대한 접근 경로들을 분석한다. 이로써, 본 연구의 질의 경로 분석을 기반으로 최적화 실행 계획을 기대해 본다.

  • PDF

도로 네트워크에서 이동 객체의 미래 경로 예측 (Path Prediction of Moving Objects on Road Networks)

  • 김종대;김상욱;원정임
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.437-440
    • /
    • 2006
  • 본 논문에서는 도로 네트워크에서 이동하는 객체들의 미래 경로를 예측하는 방안에 대하여 다룬다. 기존의 대부분 미래 예측 기법들을 유클리드 공간에서 이동하는 객체들을 대상으로 한다. 그러나 텔레매틱스 등 다양한 응용에서 객체들은 도로 네트워크 상에서 이동하는 경우가 많으므로 이를 위한 미래 예측 방법이 요구된다. 본 연구에서는 질의 객체의 현재까지의 이동 궤적과 유사한 경향을 가지는 과거 궤적들을 분석함으로써 이 객체의 미래 경로를 예측하는 기법을 제안한다. 우선, 도로 네트워크의 특성을 미래 경로를 다음과 같이 예측한다. 먼저, 이동 객체 데이터베이스 내의 과거 궤적들을 대상으로 주어진 질의 궤적과 유사한 부분 궤적을 갖는 후보 궤적들을 검색한다. 그 다음, 검색된 후보 궤적들의 현재 위치 이후부터 목적지까지의 이동 경로를 분석함으로써 객체의 미래 이동 경로를 예측한다. 작은 차이를 갖는 이동 경로들을 같은 그룹으로 간주함으로써 경로 예측의 정확성을 높이는 방안을 제안한다.

  • PDF

색인된 XML 문서에서 레벨 정보를 이용한 효과적인 구조 조인 기법 (Efficient Structural Join Technique using the Level Information of Indexed XML Documents)

  • 이윤호;최일환;김종익;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권6호
    • /
    • pp.641-649
    • /
    • 2005
  • 오늘날 인터넷의 발달과 함께 XML이 많이 사용됨에 따라, XML 저장소와 질의 처리에 관한 연구가 활발하게 이뤄지고 있다. XML에서는 경로 질의를 사용하는데, 이러한 경로 질의를 효과적으로 처리하기 위하여 여러 가지 색인 기법들이 연구되었다. 최근에는 구조 조인 기법이 각광을 받고 있다. 구조 조인 기법은 엘리먼트들의 포함 관계를 살펴 질의를 처리한다. 특히 문서 전체에 대한 탐색을 하지 않고 해당하는 엘리먼트들의 역색인 리스트만을 비교하여 질의 처리를 수행하는 장점을 갖는다. 하지만 구조 조인 기법은 실제 질의 결과에 포함되지 않는 불필요한 엘리먼트들도 탐색해야 하는 비효율성을 가진다. 따라서 본 논문에서는 구조 조인 기법의 성능을 개선하는 레벨 구조 조인 기법을 제안한다. 제안하는 기법은 경로 질의 내 엘리먼트 사이의 관계 정보와 XML 문서 내의 엘리먼트들의 레벨 분포 정보를 이용한다. 이를 통해 구조 조인을 수행할 때, 비교되는 역색인 리스트 내의 모든 엘리먼트들이 아닌, 특정 레벨에 해당하는 엘리먼트들만을 이용하여 비교를 수행함으로써 질의 처리의 속도를 향상시킬 수 있다.

시맨틱 웹 데이터의 경로 기반 질의 처리 기법 (The Scheme for Path-based Query Processing on the Semantic Data)

  • 김연희;김지현
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.31-41
    • /
    • 2009
  • 시맨틱 웹에서는 메타데이터와 온톨로지를 이용해 정보 리소스의 개념을 정의하고 의미적 연관성을 표현함으로써 지능적인 정보 검색과 자동화된 웹 서비스의 제공이 가능하다. 이러한 시맨틱 웹의 핵심적인 기능을 구현하기 위해서는 온톨로지와 메타데이터와 같은 시맨틱 웹 데이터를 효율적으로 관리하는 것이 무엇보다 중요하다. 따라서 본 논문에서는 시맨틱 웹 데이터의 의미와 구조적인 특성을 고려하여 보다 정확한 질의 결과의 검색과 효율적인 질의 처리를 지원할 수 있는 인덱스 구조를 제안한다. 특히 시맨틱 웹 데이터의 의미와 구조적인 특성을 그대로 표현하기 위해 그래프 데이터 모델을 이용하고 다양한 질의 형태를 그래프 모델 기반의 경로식으로 처리한다. 본 논문에서 제안한 인덱스는 1차적으로 추출 가능한 구조적 경로 정보는 물론 온톨로지를 이용한 추론을 통해 2차적으로 추출 가능한 구조적 경로 정보에 대한 질의를 처리 대상으로 하여 기존연구들과 차별화하며 시맨틱 웹의 개념을 온전히 반영하는 것을 목표로 한다. 또한 실험적 평가를 통해 본 논문에서 제안한 인덱스 구조가 정확성과 효율성 측면에서 우수하며 시맨틱 웹의 다양한 애플리케이션 개발에 적용 가능함을 보인다.

택시 데이터에 대한 효율적인 Top-K 빈도 검색 (Finding Frequent Route of Taxi Trip Events Based on MapReduce and MongoDB)

  • ;안성아;;정한유;권준호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권9호
    • /
    • pp.347-356
    • /
    • 2015
  • IoT(사물인터넷) 기술의 빠른 개발로 인하여 기존의 택시들은 디스패처와 위치 시스템을 통해 서로 연결되고 있다. 일반적으로 현대의 택시들은 경로 정보를 획득하기 위한 목적으로 GPS(Global Positioning System)를 탑재하고 있다. 택시 운행 데이터들의 경로 빈도를 분석하여, 주어진 질의 시간에 해당하는 빈번한 경로를 찾을 수 있다. 그러나 위치 데이터의 용량이 매우 크고 복잡하기 때문에 택시의 운행 이벤트의 위치 데이터를 분석된 빈도 정보로 변환할 때에 확장성 문제가 발생한다. 이 문제를 해결하기 위하여, NoSQL 데이터베이스에 기반한 택시 운행 데이터에 대한 Top-K 질의 시스템을 제안한다. 첫째, 원시 택시 운행 이벤트를 분석하고 모든 경로들의 빈도 정보를 추출한다. 추출한 경로 정보는 NoSQL 문서-지향 데이터베이스인 MongoDB에 해시 기반의 인덱스 구조로 저장한다. 주로 발생하는 경로에 대한 효율적인 Top-K 질의 처리는 몽고DB의 상에서 이루어진다. 미국 뉴욕시의 실제 택시 운행 데이터를 이용한 실험을 통하여 알고리즘의 효율성을 검증하였다.

다중 정규 경로 질의 처리를 위한 효율적 기법 (An Efficient Technique for Evaluating Queries with Multiple Regular Path Expressions)

  • 정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.449-457
    • /
    • 2001
  • 최근에 XML이 웹 상에서 문서 교환의 표준으로 등장하면서 XML로 표현된 데이터에 대한 질의 처리 분야가 주목받고 있다. 이때 XML 질의는 그래프로 표현된 데이터 그래프에서 특정 정규식으로 도달되는 객체를 찾는 정규 경로 질의 (regular path query)를 기반으로 한다. 그런데 사용자의 다양한 형태의 질의를 처리하기 위해서는 질의에 하나 이상의 정규 식을 가지는 질의의 처리가 필요함에도 기존의 연구 즉, 비정형 데이터 모델 하에서의 부를 이용한 질의 변환(query rewriting)이나, 질의 최적화 기법에서는 주로 단일 정규식으로 이 루어진 질의를 다루었다. 본 논문에서는 이러한 다중 정규식을 가지는 질의의 처리에서 1. 뷰의 몸체에서 질의 몸체로의 변수 매핑을 통한 질의 변환과정과 2. 변환된 질의의 각 조각 (conjunct)의 질의 결과를 효율적으로 구하고 결과를 조합하는 두 단계로 이루어진 효율적 인 질의 처리 기법을 제안한다. 제안하는 질의 변환 알고리즘이 안전성(soundness)을 가짐 을 보이고, 질의 처리 기법이 기존 질의 처리 방식에 비하여 효율적임을 보인다.

  • PDF

웹에서 정규경로 표현식을 포함한 XML 질의의 캐쉬를 이용한 처리 (Cache-Answerability of XML Queries in Regular Path Expressions on the Web)

  • 박정기;강현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.58-60
    • /
    • 2004
  • 웹의 확산과 더불어 웹 페이지 검색의 성능 즉, 빠른 응답시간과 확장성(scalability)은 각 웹 사이트의 절대적 평가 기준이 되었다. 웹 옹용은 일반적으로 불특정 다수를 대상으로 하기 때문에 확장성 또한 주요 성능의 척도가 된다. 이와 같은 웹 사이트 성능을 담보하기 위한 대표적 요소기술이 웹 캐슁이다. 본 논문은 웹 상에서 XML 데이터베이스 기반의 웹 응용(XML database-backed web application)을 위한 응용서버의 XML 캐쉬를 이용하여 주어진 XML 질의를 변환, 처리하는 기법과 구현에 관한 것으로 XPath의 경로표현식 중 가장 중요한 세 가지 기능인 조건을 명시하는 필터 연산자, 부모-자식 관계를 나타내는 경로 연산자(/), 그리고 조상-후손 관계를 나타내는 경로 연산자(//)를 연구 범위로 하였다. [2]에서는 조상-후손 관계를 나타내는 경로 연산자(//)가 없는 경우에 경로표현식으로 주어진 XML 질의를 캐쉬를 이용하여 변환, 처리하는 알고리즘을 제시하였는데 본 논문에서는 [2]의 알고리즘을 확장하여 경로 연간자(//)가 지원되도록 하였다. 조상-후손 경로 연산자(//)로는 정규경로 표현식(regular path expression)을 나타낼 수 있는데 이는 스키마가 불확실한 반구조적 데이터인 XML 데이터에 대한 질의 표현에 유용하다. 제시된 알고리즘에서는 DTD를 이용하여 경로 정보를 얻어 처리함으로써 주어진 질의를 캐쉬와 하부 XML 소스에 대한 질의로 변환하였다. 이 알고리즘을 바탕으로 관계 DBMS를 이용하여 구현된 시스템으로 실제 웹 상에서 성능 실험을 수행하였다. 성능 실험 결과 정규 경로 표현식을 포함하는 XML 질의에 대해서도 웹에서 캐쉬를 이용한 처리가 효율적임을 확인하였다.키는데 목적이 있다.RED에 비해 향상된 성능을 보여주었다.웍스 네트워크상의 다양한 디바이스들간의 네트워크 다양화와 분산화 기능을 얻을 수 있었고, 기존의 고가의 해외 솔루션인 Echelon사의 LonMaker 소프트웨어를 사용하지 않고도 국내의 순수 솔루션인 리눅스 기반의 LonWare 3.0 다중 바인딩 기능을 통해 저 비용으로 홈 네트워크 구성 관리 서버 시스템 개발에 대한 비용을 줄일 수 있다. 기대된다.e 함량이 대체로 높게 나타났다. 점미가 수가용성분에서 goucose대비 용출함량이 고르게 나타나는 경향을 보였고 흑미는 알칼리가용분에서 glucose가 상당량(0.68%) 포함되고 있음을 보여주었고 arabinose(0.68%), xylose(0.05%)도 다른 종류에 비해서 다량 함유한 것으로 나타났다. 흑미는 총식이섬유 함량이 높고 pectic substances, hemicellulose, uronic acid 함량이 높아서 콜레스테롤 저하 등의 효과가 기대되며 고섬유식품으로서 조리 특성 연구가 필요한 것으로 사료된다.리하였다. 얻어진 소견(所見)은 다음과 같았다. 1. 모년령(母年齡), 임신회수(姙娠回數), 임신기간(姙娠其間), 출산시체중등(出産時體重等)의 제요인(諸要因)은 주산기사망(周産基死亡)에 대(對)하여 통계적(統計的)으로 유의(有意)한 영향을 미치고 있어 $25{\sim}29$세(歲)의 연령군에서, 2번째 임신과 2번째의 출산에서 그리고 만삭의 임신 기간에, 출산시체중(出産時體重) $3.50{\sim}3.99kg$사이의 아이에서 그 주산기사망률(周産基死亡率)이 각각 가장 낮았다. 2. 사산(死産)과 초생아사망(初生兒死亡)을 구분(區分)하여 고려해 볼때 사산(死産)은 모성(母性)의 임신력(

  • PDF

경로정보의 중복을 제거한 XML 문서의 저장 및 질의처리 기법 (Storage and Retrieval of XML Documents Without Redundant Path Information)

  • 이혜자;정병수;김대호;이영구
    • 정보처리학회논문지D
    • /
    • 제12D권5호
    • /
    • pp.663-672
    • /
    • 2005
  • 본 논문에서는 대용량 XML 문서를 저장하고 그로부터 원하는 정보를 효율적으로 찾기 위한 방법으로, 경로정보의 중복을 제거하면서 역 인덱스를 함께 이용한 방법을 제안한다. XML 문서는 트리구조에 기반한 노드로 분해되어, 노드 타입에 따라, 루트에서 각 노드까지의 경로정보와 함께 관계형 테이블에 저장된다. 경로정보를 이용한 기존의 U 질의 기법들에서는 모든 엘리먼트 노드들에 대해 경로정보를 저장함에 따라 정보의 양이 증가하여 질의 처리의 성능을 저하시키는 요인이 되고 있다. 제안 방법에서는 경로정보 중 가장 긴 단말 엘리먼트 노드까지의 경로인 단말 엘리먼트 경로(leaf element path)만 저장하고 내부 엘리먼트 노드까지의 경로인 내부 엘리먼트 경로들(internal element paths)은 저장하지 않는다. 단말 엘리먼트 경로만을 대상으로 하여 역 인덱스를 구성함에 따라, 기존의 역 인덱스 이용 기법에 비해 키워드별 포스팅 리스트(posting lists)의 수를 줄이게 된다. 제안 방법에서는 U 문서의 저장과 질의를 위하여 XML 문서에 대한 스키마 정보가 없어도 되며, 관계형 데이터베이스의 어떤 확장도 요구하지 않는다. 실험을 통해 제안 방법은 실험 범위 내에서 기존 기법들에 비해 좋은 성능을 보인다.

접미사 배열을 이용한 JSON 데이터의 경로 기반 검색에 대한 연구 (A Study of Path-based Retrieval for JSON Data Using Suffix Arrays)

  • 김성완
    • 창의정보문화연구
    • /
    • 제7권3호
    • /
    • pp.157-165
    • /
    • 2021
  • 웹, 모바일, IoT 등의 기술을 활용한 다양한 어플리케이션 서비스의 활용과 이에 따른 대용량 데이터 관리의 필요성이 확대됨에 따라 효율적인 데이터 표현 및 교환 방법과 데이터에 대한 질의 처리의 중요성이 증가하고 있다. 간결함을 특징으로 갖는 JSON은 웹 상의 표준 데이터 표현 및 교환 언어인 XML를 대신하여 데이터 교환 및 대용량 데이터 저장의 포맷으로 다양한 영역에서 활용되고 있다. 이는 JSON으로 표현된 대량의 데이터를 효과적으로 접근 및 검색하기 위한 인덱싱 및 질의 처리 기법의 개발이 중요함을 의미한다. 이에 본 논문에서는 계층적 구조를 특징으로 가지는 JSON 데이터를 트리 형태로 모델링 하고 경로 개념을 이용한 인덱싱 및 질의 처리 방안을 제안한다. 특히, 텍스트 검색에서 널리 사용되는 접미사 배열을 활용한 인덱스 구조를 설계하였으며 이를 활용하여 단순 및 복합 경로 기반의 JSON 데이터 질의 처리 방안들을 소개하였다.

정보 검색 기술을 이용한 대규모 이질적인 XML 문서에 대한 효율적인 선형 경로 질의 처리 (Efficient Linear Path Query Processing using Information Retrieval Techniques for Large-Scale Heterogeneous XML Documents)

  • 박영호;한욱신;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.540-552
    • /
    • 2004
  • 본 논문에서는 대규모 이질 XML 문서들에 대한 부분 매치 질의를 효과적으로 처리하는 새로운 방법 XIR-Linear를 제안한다. XPath 질의는 XML 문서를 표현하는 트리 구조에 대한 경로 표현식 (path expression)으로 쓰여진다. 주요한 형태의 XPath 질의는 부분 매치 질의(partial match query)이다. XIR-Linear의 목적은 이질적인 스키마들을 가진 대규모 문서들에 대한 부분 매치 질의를 효과적으로 지원하는 것이다. XIR-Linear는 관계형 테이블을 이용한 스키마-레벨 방법에 기반을 두고, 역 인덱스 (inverted index) 기술을 사용하여 XPath 질의 처리의 효율성을 획기적으로 향상시킨다. 본 방법은 레이블 경로(label path)를 덱스트로 간주하고 레이블 경로 내의 레이블(label)들을 텍스트 내에 있는 키워드(keyword)로 간주한 후, 레이블들을 정보 검색 기술을 이용하여 인덱스 함으로써 전통적인 방법들에서 사용된 스트링 매치(string match) 보다 효율적인 방법으로 질의와 매치되는 레이블 경로들을 찾을 수 있도록 하였다. 성능 평가에서는 인터넷에서 수집한 XML 문서들을 사용하여 기존의 관계형 테이블을 이용하는 XRel, XParent와 비교 실험함으로써, 제안한 방법의 효율성을 입증한다. 실험을 통해 XIR-Linear가 실험 범위 내에서 XRel 이나 XParent에 비해 수십 배 이상 좋은 성능을 보이며, XML 문서 수의 증가함에 따라 더욱 우수하다는 것을 보인다.