• Title/Summary/Keyword: 정보 검색 비용

Search Result 519, Processing Time 0.028 seconds

Design and Algorithm Implementation of a Distributed Information Retrieval System using Sequential Transferring Method(STM) (순차적 전달방식(STM)을 이용한 분산정보검색시스템의 설계 및 알고리즘 구현)

  • Yoon, Hee-Byung;Kim, Yong-Han;Kim, Hwa-Soo
    • The KIPS Transactions:PartB
    • /
    • v.11B no.5
    • /
    • pp.603-610
    • /
    • 2004
  • The distributed Information Retrieval System centrally controlled by mediator or meta search engine result in congestion of heavy traffic and int he problem of increment of cost for the reason of the design of complicated algorithm for central control and installation of hardware. So to figure out this problem, the way is needed that has independent retrieval functionality and can cooperate each other without dependency. In this paper, we overview a few works involved in distributed information retrieval system, then, implement algorithm and design the frame-work of distributed information retrieval system using sequential transferring method(STM) including multiple information retrieval system separated from central control. For this first of all, we present a web partition policy which devide and manage web logically and we present the sequential query processing way by means of illustration through changing numbered information retrieval system. Then, we also present 3-layered structure of framework and function and module of each layer suitable for information retrieval system. Last of ail, for effective implementation of STM algorithm we analysis module structure and present description of pseudocode of this, and show that the proposed STM algorithm works smoothly by demonstration of sequential query transfer process between servers.

Operations And Assignments Of Multidimensional Nested Element Indexs For XML Databases (XML 데이터베이스를 위한 다차원 중포 엘리먼트 색인구조의 운용과 할당)

  • Lee, Jung-A;Lee, Jong-Hak
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.401-404
    • /
    • 2006
  • 최근 XML 데이터베이스는 웹의 발전과 더불어 광범위한 인터넷의 자원 공유에 크게 기여하고 있다. XML로 작성된 문서를 저장하고 검색하기 위해 XML 문서의 저장, 질의언어, 질의처리 등에 대한 분야가 활발히 연구되고 있다. 특히 그 중 질의처리의 처리비용을 줄이기 위한 데이터 질의 최적화 기법에 관한 연구가 중요한 과제이다. 증포된 엘리먼트에 대한 기존의 색인기법들은 일차원 색인구조를 이용함으로써 XML Schema가 가지는 타입상속 개념을 고려한 XML 질의들에 대한 처리를 효율적으로 지원하지 못하는 문제점을 가지고 있다. 따라서 본 논문에서는 XML Schema가 가지는 타입상속 개념을 고려한 XML 질의들에 대한 처리를 효율적으로 지원할 수 있는 다차원 증포 엘리먼트 색인구조와 다차원 경로 엘리먼트 색인구조의 운용법을 제시한다. 또한 효과적인 질의 처리를 하기 위한 XML 데이터베이스 색인구조의 유지비용을 줄이기 위하여 저장 공간 및 갱신 유지 비용을 최소화할 수 있는 효과적인 색인할당 방법을 제시한다.

  • PDF

Query Indexing Technique for Processing Stream Data (스트림 데이터 처리를 위한 질의 색인 기법)

  • Lee, Dong-Gyu;Chung, Jae-Du;Lee, Yang-Koo;Jung, Young-Jin;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.381-384
    • /
    • 2006
  • 센서 네트워크 환경에서 스트림 데이터를 모니터링 하기 위해서는 스트림 데이터에 대한 연속적인 질의들을 효과적으로 처리하는 것이 필요하다. 이러한 연속적인 질의를 빠르게 검색하고 처리하기 위하여 낮은 저장 비용과 빠른 탐색 성능을 가진 질의 색인 기법이 많이 활용되고 있다. 기존 연구들은 사전에 삽입될 Interval 을 알고 트리를 구성하므로 동적인 삽입, 삭제가 불가능하거나 삽입된 Interval 수와 Interval 의 범위에 따라 높은 저장 비용이나 상대적으로 느린 탐색 속도를 보인다. 따라서 이 논문에서는 연속적인 질의 처리를 효율적으로 하기 위하여 Hashed Multiple Lists 를 제안한다. 제안된 기법은 빠른 선형 탐색 성능과 낮은 저장 비용을 요구하며 삽입, 삭제가 용이하고 다양한 범위를 표현할 수 있는 장점이 있다. 제안된 색인 기법은 센서 네트워크를 응용한 시스템과 상황 인식 시스템 등에서 연속적인 질의를 처리하는데 활용할 수 있다.

  • PDF

Cache-Conscious LUR-tree in Main Memory (메인메모리에서 캐시를 고려한 LUR-tree)

  • 이현진;장용일;박순영;오영환;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.52-54
    • /
    • 2004
  • 이동객체의 위치 정보는 데이터의 양이 방대하고, 객체의 위치가 변경될 매마다 계속적인 갱신연산이 요구되어진다. 이러한 갱신 연산에서 디스크 접근비용을 최소화하기 위해 최근 Lazy Update R-tree(LUR-tree)가 제안되었다. 그러나 디스크 기반의 색인은 검색 및 갱신 연산의 실시간 처리를 보장할 수 없기 때문에 메인 메모리에서 이동객체의 위치 정보를 유지하는 것이 필요하다. 본 논문에서는 디스크 기반의 LUR-tree를 MBR 압축을 통해 캐시에 최적화되도록 변형한 색인기법을 제안한다. MBR 압축기법은 부모 노드로의 상대적 위치로 표현된 엔트리의 MBR을 변환함수를 통해 2,4,8 바이트의 정수로 변환한다. 제안된 색인은 변환된 MBR의 크기에 따라 엔트리를 동적 할당함으로써, 상위노드에서는 키 비교 회수를 줄이고, 단말 노드로 갈수록 키 비교 횟수는 늘어나지만, 캐시 미스를 줄일 수 있다는 장점으로 인해 검색 및 갱신 성능을 전체적으로 향상시킨다

  • PDF

Log Indexing for Consistency Control of Cached Spatial Data of Mobile Clients (모바일 클라이언트에 캐쉬된 공간 데이타의 일관성 제어를 위한 로그 인덱싱)

  • 차지태;안경환;전봉기;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.178-180
    • /
    • 2002
  • 모바일 클라이언트(Mobile Client, MC) - 서버 환경에서 캐쉬된 공간 데이타는 용량과 가용성이 크고 긴단절을 가지는 특징이 있다. 이러한 긴 단절을 거친 MC의 일관성 제어시 캐쉬된 데이타 전체가 무효화되어 재전송 하는 것은 비효율적이므로 서버는 변경된 객체 정보를 로그로 기록하여, 캐쉬된 영역에 속하는 최근 변경 정보만을 전송하는 것이 필요하다. 또한 일반적으로 로그의 순차 검색과 불필요한 로그의 누적으로 인해 일관성 제어시 통신 비용이 증가하게 되므로, 서버의 로그 검색 시간과 전송량을 최소화 하기위한 기법이 필요하다. 이를 위해 본 논문에서는 로그를 이용안 공간 로그 인덱스(Spatial Log Index, SLI) 기법과 공간 로그 관리(Spatial Log Management, SLM) 기법을 제시하고 있다.

  • PDF

Unicode based Classics Archive Management System (Unicode 기반 고전문서 편찬 관리시스템)

  • 최윤수;진두석;안성수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.115-117
    • /
    • 2002
  • 고전문서는 우리 가 상상할 수 없을 만큼의 문화와 지식의 깊이를 지니고 있다. 이러한 문화와 지식을 바탕으로 새로운 지식을 창출해내기 위한 고전문서의 전산화 작업은 필수적인 과제이다. 따라서, 최근 대규모의 고전문서 전산화 작업이 많이 진행되고 있다. 이러한 수백만 혹은 수천만 페이지에 달하는 대규모 고전문서 전산화 작업에서 가장 어렵고 비용이 많이 소요되는 분야는 고전문서의 의미적 특징을 최대한 손상시키지 않고 데이터베이스를 구축하는 일이다. 그러므로 본 논문에서는 고전문서의 특성을 고려하여 데이터베이스를 구축하고 관리할 수 있는 고전문서 편찬 관리시스템에 대하여 소개한다. 특히 고전문서 전산화에 반드시 필요한 확장 한자의 입력 및 검색기능과 문서의 전후관계를 고러만 문서 구조정보의 처리, 그리고 이러한 모든 기능을 효율적으로 수행하기 위한 정보검색 시스템에 대하여 소개한다.

  • PDF

A More Efficient TPR*-Tree with Cooling-down Nodes (쿨링다운 노드를 사용한 TPR*-트리 효율화 기법)

  • Lim, Sung-Chae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06b
    • /
    • pp.332-335
    • /
    • 2011
  • GPS 칩을 내장한 다양한 이동 통신 기기의 사용으로 위치 정보를 이용한 응용이 점차 확산될 전망이다. 위치 정보를 기반으로 한 응용 시스템에서는 다수 이동 객체의 위치 정보를 실시간으로 기록하고, 미래 시점의 객체 위치를 추정할 수 있어야 한다. 이런 요구에 따라 효과적인 이동 객체 색인에 고안된 기법이 TPR*-트리이다. 하지만 TPR*-트리는 고정 위치 색인에 최적화된 R-트리에 기본을 두었기 때문에 갱신 비용이 매우 커질 수 있다는 문제가 있다. R-트리에서는 갱신 연산이 빈번하지 않을 수 있지만 TPR*-트리의 경우는 이동 객체가 속도를 변화시킬 때마다 갱신 연산이 요구되기 때문에 상대적으로 매우 큰 갱신 비용이 발생할 수 있다. 이런 문제점을 부분적으로 해결하기 위해 본 논문에서는 쿨링다운 노드를 사용한 TPR*-트리를 제안한다. 제안된 트리는 트리의 상위 계층에 일부 이동 객체를 버퍼링함으로써 갱신 연산을 최소화 할 수 있다. 또한 지나친 사장 영역(dead space)의 확대를 방지함으로써 검색 성능 저하를 효과적으로 줄일 수 있다.

CPU Power Management on Cluster Systems (클러스터 시스템상에서의 CPU 전원 관리)

  • Oh, Soo-Cheol;Kim, Seong-Woon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.553-555
    • /
    • 2007
  • 클러스터 시스템은 가격대 성능비의 효율성 때문에 다양한 분야에서 활용되고 있으며, 구축 규모도 급속히 증가하고 있다. 특히, 인터넷을 통한 정보 검색 및 공유가 활발하게 이루어지면서, 정보를 수집, 가공 및 제공하는 대형 포털들의 규모가 급속히 증가하고 있다. 포털들은 대량의 정보를 서비스하기 위해서 대규모의 클러스터 시스템을 운영하고 있으며, 이러한 시스템을 유지 관리하는 것은 커다란 문제점중의 하나이다. 대규모 클러스터 시스템의 운영 비용중에서 전력비용이 상당히 큰 부분을 차지하고 있으며, 이를 감소시키려는 다양한 시도가 진행되고 있다. 본 논문에서는 클러스터 시스템의 전력사용량을 감소시키기 위해서 CPU 의 전력을 효율적으로 관리하는 있는 관리 메커니즘을 제안한다.

A Hash based R-Tree for Fast Search of Mass Spatial Data (대용량 공간 데이터의 빠른 검색을 위한 해시 기반 R-Tree)

  • Kang, Hong-Koo;Kim, Joung-Joon;Shin, In-Su;Han, Ki-Joon
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2008.10a
    • /
    • pp.82-89
    • /
    • 2008
  • 최근, GIS 분야에서 RFID와 GPS 센서 같은 위치 및 공간 데이타를 포함하는 다양한 GeoSensor의 활용으로 수집되는 공간 데이타가 크게 증가하면서, 대용량 공간 데이타의 빠른 처리를 위한 공간 인덱스의 중요성이 높아지고 있다. 특히, 대표적인 공간 인덱스인 R-Tree를 기반으로 검색 성능을 높이기 위한 연구가 활발히 진행되고 있다. 그러나, 기존 연구는 R-Tree에서 노드의 MBR 간의 겹침이나 트리 높이를 어느 정도 줄임으로써 다소 검색 성능을 향상시켰지만, 트리 검색에서 발생하는 불필요한 노드 접근 비용 문제를 효율적으로 해결하지 못하고 있다. 본 논문에서는 이러한 문제를 해결하고 R-Tree에서 대용량 공간 데이타의 빠른 검색을 제공하는 인덱스인 HR-Tree(Hash based R-Tree)를 제시한다. HR-Tree는 트리 검색 없이 R-Tree 리프 노드를 직접 접근할 수 있는 해시 테이블을 이용함으로써 R-Tree의 검색 성능을 높인다. 해시 테이블은 데이타 영역을 차원에 따라 반복적으로 분할한 Partition과 대응되는 R-Tree 리프 노드의 MBR과 포인터들로 구성된다. 각 Partition은 생성 과정에서 고유의 식별 코드를 갖기 때문에 Partition 코드가 주어지면 해시 테이블에서 해당 레코드를 쉽게 접근할 수 있다. 또한, HR-Tree는 R-Tree구조의 변경없이 다양한 R-Tree 변형 구조에 쉽게 적용할 수 있는 장점이 있다. 마지막으로 실험을 통하여 HR-Tree의 우수성을 입증하였다.

  • PDF

Searching for Variants Using Trie-Index (트라이 인덱스를 이용한 이형태 검색)

  • Park, In-Cheol
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.10 no.8
    • /
    • pp.1986-1992
    • /
    • 2009
  • A user often searches a data by inputting a variant such as the abbreviation or substring of a word, or a misspelled word. The simple approach to the searching for variants is to build a variants dictionary. However, it entails enormous cost and time and can not handle variants by misspelling. Approximate searching, searching by approximate string matching, is a good approach to the searching. A problem in the approach is that it cannot handle variants by abbreviations. This paper propose a method for searching various variants including abbreviations and misspelled words, by using the trie indexing. First, this paper shows a variant matching method with the calculation of path weighted-metric. In addition, it provides variant searching algorithm to reduce the search time.