• 제목/요약/키워드: 분할 색인

검색결과 1,057건 처리시간 0.028초

PIX: XML문서 검색을 위한 색인 분할 기법 (PIX: Partitioned Index for Keyword Search over XML Documents)

  • 이홍래;이형동;유상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.710-720
    • /
    • 2004
  • 정보 검색의 대상이 XML 문서가 되면서 구조 정보를 이용하는 것과 같은 단순한 텍스트 기반의 검색에서는 어려웠던 일이 가능해졌다. 그러나 문서 단위로 처리하던 정보를 엘리먼트 단위로 상세하게 해야 하므로 처리의 부담이 가중되어 많은 수의 엘리먼트를 효과적으로 처리할 수 있는 알고리즘이 필요하다. 본 논문에서는 결과가 될 가능성이 있는 엘리먼트들끼리 미리 분할 한 후 저장하여 처리 대상이되는 엘리먼트들의 수를 줄이는 역색인 방법을 제안한다. 분할은 특정 레벨을 기준으로 하여 이 레벨에서 공통 선조를 가질 수 있는 가의 여부에 따라 수행한다. 그리고 분할 병합을 통하여 분할하지 않은 것과 동일한 결과를 생성할 수 있도록 하였다. 이는 기존의 XML 문서에 대한 키워드 검색의 성능을 향상시키는 결과를 가져왔고 이를 실험적으로 검증하였다.

이동체를 위한 R-트리 기반 색인에서의 궤적 클러스터링 정책 (Policies of Trajectory Clustering in Index based on R-trees for Moving Objects)

  • 반재훈;김진곤;전봉기;홍봉희
    • 정보처리학회논문지D
    • /
    • 제12D권4호
    • /
    • pp.507-520
    • /
    • 2005
  • 이동체 데이터베이스를 위한 과거 궤적 색인으로 R-tree계열이 많이 사용되었다. 그러나 R-tree계열의 색인은 공간 근접성만을 고려하였기 때문에 동일 궤적을 검색을 할 때 많은 노드 접근이 필요하다. 즉 기존의 이동체 색인들은 공간 근접성과 궤적 연결성이 서로 상반된 특징을 가지므로 함께 고려하지 못했다. 이동체 색인에서 영역 질의의 성능개선을 위해서는 노드 간의 심한 중복과 사장 공간(Dead space)을 줄여야하고, 궤적 질의의 성능 개선을 위해서는 이동체의 궤적 보존이 이루어져야 한다. 이와 같은 요구 조건을 만족하기 위해, 이 논문에서는 R-tree 기반의 색인 구조에서 궤적 클러스터링 정책을 제안한다. 노드 분할 정책에서는 궤적 클러스터링을 위해서 동일 궤적을 그룹화해서 분할하는 공간 축 분할 정책과 공간 활용도를 높이는 시간 축 분할 정책을 제안한다. 또한 비단말 노드의 연결 정보를 저장하여 개선된 복합 질의 알고리즘을 제안하였다. 이 논문에서는 제안한 R-tree기반 색인 구조의 구현 및 성능 평가를 통해서 검색성능이 우수함을 보였다.

그리드 파일을 이용한 메인 메모리 이동체 색인의 설계 (The Design of Moving Objects Index Using the Grid File)

  • 이승일;안경환;홍봉희
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2003년도 추계학술대회
    • /
    • pp.129-134
    • /
    • 2003
  • 이동체란 시간 변화에 따라 연속적으로 위치가 변화하는 객체를 말한다. 이러한 이동체는 기존의 공간 데이터와는 달리 이동체의 위치변경 보고에 따라 지속적인 갱신연산을 발생시키는 특징을 가지고 있다. 이동체의 현재 색인에 있어 트리 기반의 색인 구조는 빈번한 갱신에 대한 색인의 변경 비용이 크므로 부적합하다. 확장 해쉬 기반의 그리드 파일 색인은 갱신연산의 비용이 적고, 그리드를 동적으로 구성하므로 공간 활용도가 높으며 영역 질의에 우수한 장점을 가지고 있다. 그러나 빈번한 갱신연산으로 인하여 해당 색인의 반복적인 분할/합병 비용을 발생시키는 문제점을 가지고 있다. 이 논문에서는 메인 메모리 기반의 그리드 파일을 구성하고, 빈번한 갱신연산에 따른 색인의 반복적인 분할/합병 비용을 제거하기 위한 합병정책을 제안한다. 특히 시간에 따라 해당 이동체의 수가 지역에 따라 변화하므로 이동체의 이동을 고려한 합병정책을 제안한다.

  • PDF

복합명사 분할과 명사구 합성을 이용한 통합 색인 기법 (Integrated Indexing Method using Compound Noun Segmentation and Noun Phrase Synthesis)

  • 원형석;박미화;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.84-95
    • /
    • 2000
  • 본 논문에서는 명사구 색인과 복합명사 분할을 포함한 복합명사 처리를 위해 통계 정보와 자연언어 처리를 제한적으로 이용 가능하게 하는 통합적 색인 기법을 제안한다. 먼저 색인과 검색에서 복합명사 분할 및 합성 모두를 고려한 통합 기법을 제시하고, 이를 위해 통계 정보와 제한적인 자연언어 처리를 모두 이용하는 통합 색인 기법을 제안한다. 먼저 형태소 분석 및 태깅 과정에서 단일어를 색인어로 추출하고 구문분석의 결과에서 명사구를 합성해 낸다. 구문 분석 실패 시에는 형태소 분석 및 태깅의 결과만을 사용하게 된다. 또한 태깅의 결과에서 복합명사를 골라 통계 정보를 이용하여 단일 명사로 분할하고 재합성한다. 분할된 단일 명사와 합성된 명사구는 기존의 단일어로만 이루어진 색인어를 보완하기 위해 색인어로 사용된다. 실험은 한국어 정보검색의 실험 집합인 KTSET 2.0과 KRIST SET을 사용하여 통합색인 기법이 복합명사 처리에 효율적임을 보였다.

  • PDF

이동체의 궤적 및 현재 위치에 대한 시공간 인덱스 (Spatial-Temporal Indexing of Trajectory and Current Position of Moving Object)

  • 박부식;전봉기;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.28-30
    • /
    • 2002
  • 시간에 따라 연속적으로 위치가 변화하는 객체를 이동체라 한다. 기존의 R-Tree를 사용한 이동체 색인에 관한 연구에서는 현재 위치 질의 시 고비용의 연산이 요구되고, 시간축의 값이 증가하는 방향으로 보고되는 이동체의 위치데이터의 특징을 고려한 노드 분할 정책이 제안되지 않았다. 이 논문에서는 이동체의 현재 위치 및 과거 위치에 대한 색인 방법인 CPTR-Tree(Current Position and Trajectory R-Tree)를 제안한다. 특히, 제안 방법에서 이동체의 현재 위치에 대한 공간차원의 PMBR(Point MBR)을 유지함으로써, 현재 위치 질의 처리시 불필요한 노드 접근 횟수를 줄일 수 있어 성능향상을 할 수 있다. 그리고, 시간축의 값이 증가하는 형태로 보고되는 이동체 위치 데이터의 특징을 고려하여 시간축 분할시 SP(Split Parameter) 분할 방법을 제공함으로써 노드 공간 활용률을 높여 색인의 크기를 줄이고, 공간축 분할시 노드 겹침을 줄이는 동적 클리핑 분할 정책을 제시하여 이동체 과거 위치 검색 효율을 높인다.

  • PDF

이동 객체 데이타베이스에서 KDB-tree의 동적 분할 정책 (The Dynamic Split Policy of the KDB-Tree in Moving Objects Databases)

  • 임덕성;이창헌;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권4호
    • /
    • pp.396-408
    • /
    • 2006
  • 시간의 흐름에 따라 누적되는 대용량의 과거 위치를 관리하는 이동 객체 데이타베이스에서 이동 객체의 과거 위치를 효율적으로 검색하기 위해서는 이동 객체의 특성을 고려한 색인 구조가 필요하다. 그러나, 영역 질의 성능이 우수한 다차원 색인인 KDB-tree를 이동 객체 데이타베이스에 적용할 경우 시간 도메인이 증가하는 이동 객체 데이타베이스의 특성으로 인해 공간 도메인 가중 분할이 발생한다. 공간 도메인 가중 분할은 하나의 노드가 차지하는 MBR의 공간 영역이 분할 횟수에 반비례하게 감소되어 시공 간 영역 질의 처리시 색인의 검색 비용을 증가시키는 문제가 있다. 이 논문에서는 이동 객체 데이타베이스에서 시공간 영역 질의를 효율적으로 처리하기 위한 KDB-tree의 동적 분할 정책을 제안한다. 동적 분할 정책은 공간 우선 분할 방법을 적용하는 분할 도메인 선정 방법과 포인터 페이지에서 공간 활용도를 최대화시킬 수 있는 최근 시간 분할 정책, 영역 페이지에서 적용되는 최후 시간 분할 정책으로 구성된다. 제안한 동적 분할 정책의 성능을 평가하기 위해 3DR-tree, MV3R-tree, KDB-tree와의 성능을 비교한다. 영역 질의를 위한 성능 평가에서 동적 분할 정책을 적용한 MKDB-tree는 기존 색인에 비해 평균 30% 이상의 노드 접근 회수를 감소시킨다.

내용기반 비디오 색인 및 검색을 위한 음성인식기술 이용에 관한 연구 (A Study on the Use of Speech Recognition Technology for Content-based Video Indexing and Retrieval)

  • 손종목;배건성;강경옥;김재곤
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.16-20
    • /
    • 2001
  • 비디오 프로그램 색인 및 검색에 있어서 비디오 프로그램을 의미 있는 부분으로 분할하는 것, 즉 내용기반 비디오 프로그램 분할은 중요하다. 본 논문에서는 내용기반 비디오 프로그램 분할을 위해 음성인식기술을 이용하는 새로운 방법을 제안한다. 제안한 방법은 음성신호와 캡션 (Closed Caption)의 정확한 동기를 위해 음성인식 기법을 사용한다. 실험을 통하여 내용기반 비디오 프로그램 분할을 위해 제안한 방법의 가능성을 확인하였다.

  • PDF

영역 모니터링 질의 처리를 위한 공간 분할 기법 (A Spatial Split Method for Processing of Region Monitoring Queries)

  • 정재우;정하림;김응모
    • 인터넷정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.67-76
    • /
    • 2018
  • 본 논문은 영역 모니터링 질의를 효율적으로 처리하는 기법에 대해서 다룬다. 기존의 영역 모니터링 질의 처리를 위해서 사용된 중앙 집중식 기법은 이동 객체가 서버에 주기적으로 자신의 위치 업데이트를 전송하고, 서버가 질의 결과를 지속적으로 업데이트 한다고 가정한다. 그러나 이러한 가정은 많은 양의 위치 데이터 전송으로 인해 시스템 성능을 크게 저하시킨다. 최근, 영역 모니터링 질의 처리를 위한 몇 가지 분산 기법들이 제안되었다. 분산 기법에서 서버는 각 이동 객체에게 I) 작업 공간의 서브 공간인 상주 도메인과 ii) 몇 개의 인접 질의 영역을 할당한다. 각 이동 객체는 상주 도메인을 벗어나거나 질의 영역의 경계를 가로지를 경우에만 서버에게 자신의 위치를 전송한다. 상주 도메인 및 인접 질의 영역을 이동 객체에 할당하기 위해서 서버는 작업 공간을 반복적으로 동일하게 반으로 분할하여 생성되는 질의 색인 구조를 사용한다. 하지만 이와 같은 색인 구조는 불필요한 분할이 발생하게 되므로 시스템의 성능 저하를 발생시킨다. 본 논문에서는 불필요한 분할을 줄이기 위해서 적응 분할 기법을 제안한다. 적응 분할 기법은 I) 질의 영역과 결과 서브 공간의 공간적 관계와 ii) 질의 영역의 분포를 고려하여 동적으로 작업 공간을 분할한다. 본 논문에서는 기존의 색인 구조인 QR-tree에 본 논문에서 제안한 새로운 분할 기법을 적용하였으며, 시뮬레이션을 통해 제안 된 분할 기법의 효율성을 검증했다.

TPKDB 트리 : 이동 객체의 효과적인 미래 위치 검색을 위한 색인구조 (TPKDB-tree : An Index Structure for Efficient Retrieval of Future Positions of Moving Objects)

  • 서동민;복경수;유재수;이병엽
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.624-640
    • /
    • 2004
  • 최근 위치 기반 기술에 대한 활용이 증가하면서 이동 객체를 효율적으로 관리하기 위한 색인구조의 필요성이 증가하고 있다. 본 논문에서는 미래 위치 검색 및 갱신 비용을 최소화하기 위한 새로운 시공간 색인 구조를 제안한다. 제안하는 색인 구조는 갱신 비용을 최소화하기 위해 이동 객체의 현재 위치를 직접 접근하기 위한 보조 색인 구조와 공간 분할 기반의 KDB-트리를 결합한 색인 구조이다. 제안하는 색인 구조에서는 이동 객체의 미래 위치 검색 및 갱신 비용을 줄이기 위해 KDB-트리의 중간 노드에 시간에 대한 파라미터를 유지한다. 또한 제안하는 색인 구조에서는 공간활용도 및 검색 효율을 극대화하기 위한 새로운 갱신 및 분할 기법을 제안한다. 제안하는 색인 구조의 우수성을 입증하기 위해 다양한 실험을 통해 성능 평가를 수행한다.

전자태그 객체의 추적을 위한 간격 R-트리의 분할 정책 (Spliting polios of interval R-Trees for tracking RFID tag objects)

  • 이세호;안성우;홍봉희;반재훈;임덕성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.40-42
    • /
    • 2005
  • RFID(Radio Frequency Identification)는 자동 인식 데이터 수집 장치의 한 분야로써 GPS장치를 장착한 차량과 같이, RFID 태그(전자태그)를 상품에 부착하여 인식, 추적할 수 있다. 이러한 전자태그 객체는 시간에 따라 경로 정보가 누적되는 이동체와 유사한 특성을 가진다. 그러나 기존의 이동체 색인과 달리 태그 객체의 위치는 판독기의 위치로 인식되며 위치보고가 판독기의 인식영역 안에서만 이루어지므로 보고 주기를 예측할 수 없다. 기존의 이동체 색인에서 전자태그의 특성을 표현하기 힘들기 때문에 전자태그의 특성을 고려란 색인이 필요하게 되었다. 최근 전자태그의 특성을 고려한 색인인 TPIR-Tree(Time parameterized Interval R-Tree)가 발표되었다. 그러나 이 색인은 기존 공간 색인에서의 균등분할 기법을 사용하여 위치보고가 시간의 순서를 가지는 전자태그의 특성을 고려하지 못하여 과거노드의 저장효율이 좋지 못하다. 이 논문에서는 TPIR-Tree의 저장효율 및 검색 성능 향상을 위해서 시간의 순서에 따라 위치를 보고하는 전자태그 객체의 특성을 고려하여 분할축 선정 기법 및 시간축 분할시 비균등 분할정책을 제안한다.

  • PDF