• 제목/요약/키워드: 정보 검색 비용

검색결과 518건 처리시간 0.03초

분산 환경에서 통합 XQuery 질의 처리를 위한 조인과 통신비용에 대한 연구 (A Study of Join and Communication Cost for processing Integrated XQuery queries over Distributed Environment)

  • 최성일;박종현;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.59-63
    • /
    • 2007
  • XML은 웹 상에서 정보교환의 표준이며, 이종의 데이터를 보유하고 있는 지역 시스템들은 XML View를 이용하여 정보를 공개한다. 사용자는 XML을 위한 표준 질의어인 XQuery를 사용하여 분산된 XML View들을 대상으로 통합 XQuery질의를 생성할 수 있다. 이렇게 생성된 통합 XQuery질의는 자연스럽게 다른 지역시스템들 사이의 조인을 포함 할 수 있다. 조인은 비용이 많이 드는 연산자이므로 조인을 효율적으로 처리하는 것은 전체 질의의 성능에 큰 영향을 준다. 그러므로 조인을 효율적으로 처리하기 위한 비용을 결정하는 연구가 중요하다고 할 수 있다. SQL에서는 이와 같은 연구들이 많이 존재하며, 분산 환경에서의 조인을 효율적으로 처리하기 위해 크게 두 가지 비용을 고려한다. 그 중 하나는 지역시스템 내에서 조인을 처리하는 조인비용이며, 나머지 하나는 조인을 수행하기 위하여 다른 지역시스템으로 데이터를 전송하는 통신비용이다. 이 두 비용은 분산 조인을 처리하기 위한 중요한 요소이므로[6,7,8] 이를 측정하는 것은 통합 질의 처리를 위해서 필요한 연구라 할 수 있다. 그러나 테이블 구조의 데이터를 검색하기 위한 SQL 의 방법들을 구조적인 XML 데이터를 검색하기 위한 XQuery질의를 위해서 그대로 사용하는 것은 어려운 일이다. 본 논문에서는 분산 환경에서 통합 XQuery질의의 조인을 효율적으로 처리하기 위해 조인비용과 통신비용을 측정하는 방법을 제안한다. 본 논문의 기여는 앞서 기술한 문제점을 해결하여, XQuery 질의의 조인을 효율적으로 처리하기 위한 비용을 측정할 수 있도록 한다.

  • PDF

효율적인 P2P 기반 파일 검색 알고리즘 설계 (Design of Efficient P2P Based File Search Algorithm)

  • 백승재;안진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.454-456
    • /
    • 2005
  • 최근에 파일 공유 애플리케이션을 개발하는데 있어 클라이언트-서버(client-sewer) 모델의 문제점을 해결하기 위해 피어-투-피어(peer-to-peer) 모델이 각광 받고 있다. 대표적일 P2P 기반 파일 공유 시스템으로 넵스터, 그누텔라등이 있다. 그러나 이 시스템들은 각각 중앙 집중적 제어, 혹은 브로드캐스팅에 의한 과도한 네트워크 트래픽 발생 등 확장성 문제를 발생시킨다. 이런 문제점을 해결하기 위해 울트라피어 및 동적 라우팅 기법을 사용하지만 여전히 rare 파일에 대한 높은 응답시간과 검색의 낮은 신뢰성 문제점들을 해결할 수 없다. 본 논문에서는 popular 파일과 rare 파일에 대한 검색을 구분하여 popular 파일을 기존의 그누텔라 검색 방법을 사용하고 rare 파일 검색을 제안하는 새로운 DHT 알고리즘을 사용하도록 한다. 특히 제안하는 DHT 알고리즘은 기존의 DHT 알고리즘들과 달리 일반 노드가 아닌 울트라피어들만으로 구성함으로서 검색 비용, 노드 조인과 리브 비용, 핑거 테이블의 엔트리 수를 매우 줄임으로서 효과적이고 확장적이라 할 수 있다.

  • PDF

비트맵 필터를 이용한 효율적인 유사 문자열 검색 기법 (Efficient Approximate String Searches using Bitmap Filter)

  • 권인택;김종익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1298-1301
    • /
    • 2011
  • 텍스트 데이터는 표현 방식의 차이, 타이핑 오류 등을 포함하고 있어 정확히 일치하는 검색으로는 유용한 정보를 얻기 어렵다. 따라서 유사도 기반 검색 방법이 많이 연구되고 있으며 효율적인 유사도 기반 검색을 위해 텍스트 데이터에 대한 역 리스트를 구성한다. 그리고 이를 병합하여 질의와 일정 기준 이상 유사한 데이터를 찾는다. 본 논문에서는 역 리스트 병합 과정에서 역 리스트의 탐색 비용을 줄이기 위해 비트맵 필터를 사용하는 기법을 제안한다. 비트맵 필터를 사용하여 역 리스트의 탐색 여부를 결정하여 불필요한 역 리스트 탐색을 회피함으로써 역 리스트 병합 비용을 줄인다. 실험을 통하여 제안된 기법이 기존의 연구에서 제안된 역 리스트 병합 알고리즘의 성능을 30~40% 정도 개선함을 보인다.

데이터 생성의미를 활용한 정보공유구조의 효과성 비교 연구 (An Evaluation of an Information Sharing Workflow Using Data Provenance Semantics)

  • 이춘열
    • 디지털융복합연구
    • /
    • 제11권6호
    • /
    • pp.175-185
    • /
    • 2013
  • 본 연구는 효과적인 정보공유를 위한 방안으로서 생성의미종속성을 소개하고, 데이터의 생성의미에 대한 이해가 정보공유에 미치는 영향을 측정하는 정보공유비용모형을 제시한다. 정보공유비용모형은 복수의 사용자집단 또는 부서들 사이에서 데이터의 생성의미 차이로 인한 정보공유 오류비용을 측정한다. 정보공유 오류비용은 정보공유오류의 발생확률과 비용에 의하여 결정되는데, 오류 발생확률은 사용자집단들 사이의 생성의미 차이를 나타내는 정보공유 거리로 측정된다. 본 연구는 대표적인 정보공유아키텍처인 부서별 데이터관리구조, 허브형 구조, 계층형 구조, 독립형 구조를 대상으로 정보공유비용을 측정함으로써 정보공유구조가 정보공유에 미치는 영향을 분석하였다. 정보공유비용의 관점에서 허브형이 가장 우수한 것으로 분석되었다. 그러나 데이터의 생성의미에 대한 표준화가 이루어지지 않을 경우, 허브형 정보공유구조는 부서별 데이터관리구조와 같은 특성을 보였다. 그리고 모든 정보공유구조가 독립형 구조보다 낮은 정보공유비용을 보임으로써 비록 표준화가 이루어지지 않아도 데이터를 공유하는 것이 공유하지 않는 경우보다 우수한 것으로 분석되었다.

BTI 사전 색인을 이용한 유사단어 검색 (A method for similar-word retrival based on BTI dictionary indexing mechanism)

  • 정연수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.291-296
    • /
    • 1994
  • 유사단어의 추정에 있어서 사전 검색에 드는 비용, 즉 사전탐색 횟수는 효율성의 문제와 직결된다. 본 논문에서는 BTI 사전 색인을 이용하여 한 글자의 변형요소가 있는 유사단어들을 효율적으로 거색하는 방법을 제안한다. BTI 방식은 정방향, 역방향 표제어를 모두 저장하는 방법이다. BTI 방식으로 사전 표제어를 색인하여 표제어에 대한 사전 탐색 도중에 사전에 존재하는 prefix와 postifix를 모두 검색할 수 있다. 이러한 정보를 이용하면 유사 단어에 대한 정확한 변형 위치를 결정할 수 있다. BTI 사전 색인은 사전 표제어에 대한 정보없이 유사단어를 추정한 후에 사전 검색을 통하여 확인하는 방법보다 사전 검색에 드는 비용이 적다. 추가적으로 유사단어 후보들에 대한 우선 순위를 정하기 위하여 corpus에서 추출한 각 표제어의 발견 빈도를 이용하였다.

  • PDF

효과적인 차량 검색을 위한 이동 객체 색인 기법 (A Moving Object Index Technique to Effectively Search Vehicles)

  • 정영진;최현미;류근호
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2003년도 추계학술대회
    • /
    • pp.163-168
    • /
    • 2003
  • 현실 세계에서 자동차, 비행기, 태풍의 이동 등과 같이 시간에 따라 연속적으로 위치 및 모양이 변화하는 객체를 이동 객체라 한다. 이와 같은 이동 객체 정보를 다루기 위해서는 연속적으로 변화하는 정보를 저장해야 하며, 이로 인해 대용량 정보를 효과적으로 다루기 위한 색인이 필요하다. 특히, LBS를 제공을 위한 GPS 환경에서의 차량 관리 시스템 등에서는 이동 객체 관리를 위해 빠른 검색을 필요로 한다. 그리고, 기존의 이동 객체 색인은 대부분 R-트리의 구조를 가지기 때문에, 데드 스페이스 및 오버랩 등 R-트리의 문제점을 갖게 되고, 고려하는 초점에 따라 이 문제가 더 커진다. 따라서, 이 논문에서는 PDA를 활용한 차량 추적 시스템을 개발하고, R-트리의 문제점을 해결하기 위한 MP-트리 노드 연산 기법을 제안한다. 제안된 노드 연산 기법은 하위 노드의 경계 정보를 순서대로 저장함으로써, 데드 스페이스 및 오버랩으로 인한 불필요한 검색 비용과 분할 비용을 줄이고, 특정 시점 질의 및 시공간 범위 질의를 효과적으로 처리한다. 기존 이동 객체 색인과 비교한 실험으로부터 이동 객체 질의 처리 및 공간 활용에 대해 노드 연산이 유용하게 쓰임을 확인하였다.

  • PDF

클러스터 P2P 네트워크에서의 최적 슈퍼피어 개수 (Optimal Number of Super-peers in Clustered P2P Networks)

  • 김성희;김주균;이상규;이준수
    • 정보처리학회논문지C
    • /
    • 제13C권4호
    • /
    • pp.481-490
    • /
    • 2006
  • 슈퍼피어 기반 P2P 네트워크는 전체 네트워크를 여러 개의 작은 서브 네트워크로 클러스터링하고 각 클러스터를 해당 그룹에 속한 노드들에 대한 정보를 가지고 있는 슈퍼피어라는 특정 노드가 관리하는 네트워크 모델로써 검색의 효율성과 네트워크 부하가 적다는 이점을 가지고 있다. 본 논문은 슈퍼피어기반 P2P네트워크에서 먼저 피어들의 정보검색, 새로운 노드 가입, 정보갱신 동의 동작으로 발생하는 메시지의 양을 기반으로 한 트래픽 비용을 클러스터 내의 비용과 슈퍼피어 간의 비용으로 측정하고, 이 두 비용을 바탕으로 다양한 네트워크 크기에 따라 트래픽 비용을 최소화할 수 있는 슈퍼피어의 개수를 제시한다.

객체의 순환적 위치속성을 고려한 최대근접질의의 처리방법 (The Processing Method of Nearest Neighbor Queries Considering a Circular Location Property of Object)

  • 선휘준
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권4호
    • /
    • pp.85-88
    • /
    • 2009
  • 멀티미디어 시스템에서 최대근접질의는 매우 빈번히 발생하며, 다른 유형의 공간질의에 비하여 처리비용이 많이 요구된다. 최대근접질의의 처리비용을 최적화하기 위해서는 색인에서 검색되는 노드의 수와 연산시간을 최소화할 수 있는 검색거리 측도가 필요하다. 또한 최대근접질의에 따른 검색 노드들을 정확히 선택하기 위해서는 객체들의 순환적 위치 속성을 고려해야 한다. 본 논문은 순환도메인을 갖는 검색공간에서 객체의 순환적 위치속성을 고려한 최대근접질의 처리방법을 제안하고 그 특성을 보인다. 제안한 방법은 최대근접질의의 처리비용을 최적화하기 위한 검색거리 측도인 순환최소거리와 순환최적거리를 사용한다.

  • PDF

EZW변환과 형태, 질감 내용기반 영상검색 (Content-based Image Retrieval Using EZW, Texture and shape)

  • 전이복;전도홍
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.412-415
    • /
    • 2003
  • 본 논문에서는 영상 검색에 있어서 객체의 특징치를 추출하는데 많은 시간과 비용이 따르므로 수행속도를 향상시키기 위해 영상의 공간적인 정보를 이용한 영상의 압축을 이용하는 내용기반 영상 검색을 제안하고자 한다. 압축 성능이 뛰어나며 영상의 위치 정보와 주파수 정보를 가지는 EZW(Embedded Zerotree Wavelet)알고리즘을 이용하여 영상을 김색하는 방안으로 EZW 변환 후 얻어지는 저 대역 부 밴드에서의 공간적인 특성을 고려한 특징 값을 이용하여 정지영상의 대표 특징들을 형태와 질감으로 빠르게 영상 검색하고자 한다.

  • PDF

IT 업체정보검색시스템에서 동의어 처리 기법

  • 강옥선;이현철;조완섭
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2001년도 춘계학술대회 E-Business 활성화를 위한 첨단 정보기술
    • /
    • pp.105-106
    • /
    • 2001
  • 일반적인 정보 검색은 색인어를 통해 이루어지는데 이런 경우 사용자는 정보를 검색하기 위해 데이터베이스에 저장된 정보들이 가지고 있는 색인어를 정확하게 입력해야 한다. 그러나 일반 사용자가 색인어를 정확하게 입력하기는 어렵고, 특히 찾고자 하는 분야가 전문 분야에서 사용되는 용어일 때는 더욱 그러하다. 이럴 때 시소러스와 같은 지식구조를 이용해서 색인어를 탐색하여 검색의 효율을 높일 수 있다. 최근 들어 정보기술 분야의 연구가 활발함에 따라 정보자로의 생산이 급격히 증가하고 이를 관련 주제 분야의 연구정보로 활용하는 경우가 증가하고 있다. 따라서 IT 분야의 정보를 관리할 수 있는 시스템의 개발이 시급하다. 또한 IT 분야와 같은 전문분야일 때 검색 시스템에서 사용할 용어의 관리에 대한 연구의 필요성이 증가하고 있다. 본 논문에서는 IT분야의 정보를 검색할 수 있는 IT 업체정보검색시스템에서 정보 검색시에 생기는 용어간의 불일치 문제를 해결하고, 각 용어들간의 계층 관계를 나타내어 정보 검색시 검색어의 확장을 도울 수 있는 용어 관리 시스템의 구조를 제안하고 그에 대한 검색 알고리즘을 제시한다. 제안된 구조는 사용자의 검색어에 대한 동의어 관계나 상위어, 하위어 등의 계층 관계를 파악하여 검색의 범위에 추가함으로써 검색 효율을 높일 수 있다. 또한 새로운 용어의 생성이나 삭제와 같은 연산이 발생했을 때 시스템을 동적으로 확장할 수 있도록 구현하였다. 제안된 시스템은 단어간의 계층 구조를 효율적으로 검색하기 위하여 객체-관계형 데이터베이스를 사용하였다. 또한 메모리 상주 DBMS를 사용하여 많은 사용자들이 동시에 접근하는 환경에서도 빠른 검색 성능을 유지할 수 있도록 하였다. 제시된 방법은 정보기술 분야뿐만 아니라 다른 전문용어 분야의 연구로도 그 범위를 확장 할 수 있다.자기자본비용의 조합인 기회자본비용으로 할인함으로써 현재의 기업가치를 구할 수 있기 때문이다. 이처럼 기업이 영업활동이나 투자활동을 통해 현금을 창출하고 소비하는 경향은 해당 비즈니스 모델의 성격을 규정하는 자료도로 이용될 수 있다. 또한 최근 인터넷기업들의 부도가 발생하고 있는데, 기업의 부실원인이 어떤 것이든 사회전체의 생산력의 감소, 실업의 증가, 채권자 및 주주의 부의 감소, 심리적 불안으로 인한 경제활동의 위축, 기업 노하우의 소멸, 대외적 신용도의 하락 등과 같은 사회적·경제적 파급효과는 대단히 크다. 이상과 같은 기업부실의 효과를 고려할 때 부실기업을 미리 예측하는 일종의 조기경보장치를 갖는다는 것은 중요한 일이다. 현금흐름정보를 이용하여 기업의 부실을 예측하면 기업의 부실징후를 파악하는데 그치지 않고 부실의 원인을 파악하고 이에 대한 대응 전략을 수립하며 그 결과를 측정하는데 활용될 수도 있다. 따라서 본 연구에서는 기업의 부도예측 정보 중 현금흐름정보를 통하여 '인터넷기업의 미래 현금흐름측정, 부도예측신호효과, 부실원인파악, 비즈니스 모델의 성격규정 등을 할 수 있는가'를 검증하려고 한다. 협력체계 확립, ${\circled}3$ 전문인력 확보 및 인력구성 조정, 그리고 ${\circled}4$ 방문보건사업의 강화 등이다., 대사(代謝)와 관계(關係)있음을 시사(示唆)해 주고 있다.ble nutrient (TDN) was highest in booting stage (59.7%); however no significant difference was found among other stages. The concentrations of Ca and P were not different among mature stages. Accordi

  • PDF