• Title/Summary/Keyword: 정보 검색 비용

Search Result 519, Processing Time 0.03 seconds

An Efficient Replication Strategy in Unstructured Peer-to-Peer Networks (비구조적인 피어-투-피어 네트워크상에서 효율적인 복제 기법)

  • Choi Wu-Rak;Lee Moon-Soo;Park Sung-Yong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06d
    • /
    • pp.271-273
    • /
    • 2006
  • 초기의 비구조적인 피어-투-피어 방식은 플러딩(flooding) 방식의 검색 기법을 사용하는데, 이 기법은 통신비용이 매우 많이 소요되어 비효율적이다. 따라서 효율적인 검색 기법으로 임의 경로(random walk) 검색 방식이 제안되었다. 이 검색 기법은 메시지가 임의로 노드를 이동하기 때문에, 검색의 성공률이 낮다. 이를 보완하기 위하여 효율적인 복제기법이 요구된다. 현재 나와 있는 복제 기법은 여러 방법이 있으나, 모두 통신에 고비용을 요구한다. 따라서 복제 기법에서는 통신비용을 최소화하는 효율적인 복제 기법이 필요하다. 본 논문에서는 캐시를 사용하여 직접적인 데이터 통신비용을 최대로 줄이는 한편, 복제를 질의가 많이 도착하는 곳에 위치시켜 검색률의 저하를 막고, 잘못된 캐시 관리 기법을 통해 동적인 환경에서도 잘못된 캐시로 인한 검색의 실패를 최소할 수 있는 기법을 제안한다.

  • PDF

Indexing Mechanism for Efficient Semantic Query Processing (효율적인 시멘틱 질의 처리를 위한 인덱싱 기법)

  • Kim Hak-Soo;Cha Hyun-Seok;Son Jin-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.97-100
    • /
    • 2006
  • RDF 는 트리플의 집합으로서 그래프 데이터 모델로 표현되며, 사용자는 RDF 그래프 모델로부터 정보를 검색하기 위해 시멘틱 질의 언어를 사용한다. 그러나 이러한 접근 방식은 최악의 경우 전체 그래프 데이터 모델을 검색해야 되는 문제점이 발생한다. 이에 따라 최근의 연구에서는 시멘틱 질의를 효율적으로 처리하기 위해서 인덱스를 사용한다. 시멘틱 질의 언어(RDQL, SPARQL)의 핵심은 RDF 트리플에 대한 패턴을 기술함으로써 원하는 트리플 정보를 검색할 수 있게 하는 것이다. 따라서, 기존의 인덱스는 단일 트리플을 효율적으로 검색하는 데 초점을 둔다. 거라나 트리플 패턴의 집합으로 질의가 표현될 경우에는 트리플 패턴 사이의 상관관계 때문에 조인비용이 많이 발생하는 문제점이 있다. 본 논문에서는 조인 비용이 발생되는 문제점을 해결하기 위한 인덱싱 기법을 제안한다. RDF 그래프 모델에서 유지해야 할 정보를 줄이기 위해서 RDF 그래프 모델에 존재하는 유사한 서브 그래프를 하나의 서브 그래프로 병합한다. 병합절차를 마친 여러 서브 그래프에 존재하는 모든 경로를 인덱스에 유지 함으로써 조인 비용을 제거한다.

  • PDF

The Efficient Design and Implementation of The B-Tree on Flash Memory (플래시 메모리 상에서 효율적인 B-트리 설계 및 구현)

  • Nam Junghyun;Park Dong-Joo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.55-57
    • /
    • 2005
  • 최근 들어 PDA, 스마트카드, 휴대폰, MP3 플레이어 등과 같은 이동 컴퓨팅 장치의 데이터 저장소로 플래시 메모리를 많이 사용하고 있다. 이런 이동 컴퓨팅 장치의 데이터를 효율적으로 삽입$\cdot$삭제$\cdot$검색하기 위한 색인기법이 필요하다. 기존연구에서는 BFTL(B-Tree Flash Translation Layer)기법을 사용하여 플래시 메모리 상에 B-트리 구축 시 쓰기연산을 감소시켜 비용을 줄였지만, B-트리 검색비용과 하드웨어 구성비용이 증가한다는 단점을 가지고 있다. 본 논문에서는 기존 연구의 문제점을 개선하고 효율적으로 플래시 메모리상에 B-트리를 구현하기위해 BOF(B-Tree On Flash Memory)기법을 제안한다. 이 기법을 통해 BFTL 기법에 근접하는 구축비용을 얻을 수 있을 뿐만 아니라 상당한 검색비용을 줄일 수 있다. 또한 하드웨어적 비용도 고려하여 저비용으로 B-트리를 구현하였다.

  • PDF

지능형 전자상거래를 위한 온톨로지의 효율적인 생성

  • Kim, Tae-Seok;Yang, Jin-Hyeok;Lee, Ji-Hong;Son, Jong-Su;Jeong, In-Jeong
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2005.11a
    • /
    • pp.273-279
    • /
    • 2005
  • 월드와이드웹 (WWW) 기반의 전자상거래는 주로 데이터베이스를 기반으로 서비스를 제공하고 있다. 그러나 월드와이드웹 기반의 전자상거래는 단순 키워드 검색에만 의존하고 있다. 이러한 검색은 데이터베이스 자체로는 의미적인 정보를 효과적으로 처리하기에는 많은 문제점이 있다. 1999년 말에 의미적인 정보를 효과적으로 처리하기 할 수 있는 시맨틱 웹 이 제안되었다. 시맨틱 웹은 의미적인 정보를 담고 있는 지식베이스(Knowledge Bases)인 온톨로지를 기반으로 하고 있다. 그러나 온툴로지의 생성은 많은 부분을 휴리스틱에 의존하고 있기 때문에 많은 시간과 비용이 소비된다. 따라서 우리는 이와 같은 문제를 해결하기 위하여 데이터베이스에서 온톨로지를 생성하는 방법을 제안한다. 데이터베이스는 도메인을 잘 나타내고 있는 정보의 저장소이므로 데이터베이스로부터의 온톨로지 생성은 분석, 설계 등의 사전 작업이 필요하지 않아 시간과 비용의 소비를 줄 일 수 있는 장점이 있다. 우리는 데이터베이스에서 스키마를 추출, 뼈대그래프$^{1}$ 를 생성하고 개념그래프로 확장하여 도메인을 잘 나타낼 수 있는 온톨로지를 생성하는 알고리즘을 제안하고 제안된 알고리즘을 통하여 온톨로지를 생성을 함으로서 제안된 생성 방법을 검증한다. 제안한 방법으로 생성된 온톨로지는 단순 키워드 검색에서 의미적인 검색을 할 수 있는 시맨틱 웹 서비스의 기반이 되므로 의미적 검색이 가능한 전자상거래 서비스를 구축하는데 시간과 비용의 소비를 줄임으로 차세대 전자상거래의 초석이 된다.

  • PDF

The Role of Information Search Cost on Seller's Disclosure of Negative Information (정보 검색 비용이 판매자의 부정적 정보 공개에 미치는 영향에 대한 연구)

  • Huh, Seung
    • Journal of Convergence for Information Technology
    • /
    • v.11 no.4
    • /
    • pp.230-241
    • /
    • 2021
  • This study has attempted to provide an important understanding about the information asymmetry in markets through empirical analysis on how the disclosure of low quality can increase demand even in the short run. More specifically, this study has extended the previous findings from the related literature by considering the effect of information search cost and providing empirical evidences about the effect of voluntary disclosure of low quality, using an experimental method with purchase scenarios. The results from our analysis show that reduced perceived risk have an important effect on sharing negative information, while the effect of information search cost is minimal. We also explain the circumstances whereby the information disclosure of a seller with low-quality product can enhance not only the seller's profitability but also customers' welfare by increasing the market demand and the demand for the seller claiming high quality.

Efficient Approximate String Searches with Inverted Lists through Search Range Reduction (효율적인 유사문자열 검색을 위한 역리스트 탐색 기법)

  • Lee, Eun-Seok;Kim, Jong-Ik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1310-1313
    • /
    • 2011
  • 유사문자열 검색이란 문자열 집합에서 주어진 문자열과 유사한 문자열들을 검색하는 것으로 정보검색, 데이터 클리닝 등의 분야에서 활용되고 있다. 효율적인 유사문자열 검색을 위해 사전에 문자열 집합에 대한 역리스트를 구성하고 문자열이 주어졌을 때, 주어진 문자열에 관련된 역리스트를 병합하여 유사도 기준을 만족하는 문자열을 찾는다. 이때 비용을 줄이기 위해 일부의 역리스트만 병합하고 나머지 역리스트에 대해서는 이진탐색을 하는 방법이 있다. 본 논문에서는 역리스트를 이진탐색할 때, 불필요한 탐색구간을 제거하여 역리스트 탐색 비용을 줄이는 방법을 제안한다.

[ $TPIR^{*}$ ]-Tree for tracing RFID tags (RFID 태그 추적을 위한 $TPIR^{*}$-Tree)

  • Lee, Se-Ho;Ahn, Sung-Woo;Hong, Bong-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.22-24
    • /
    • 2005
  • RFID 시스템은 전자태그를 상품에 부착하여 리더를 통해 태그를 인식함으로써 상품의 정보 및 위치정보를 추적할 수 있다. 태그 객체의 위치정보는 시간에 따라 궤적 정보가 누적되는 이동체와 유사한 특성을 가지지만 이동체의 위치와 달리 태그의 위치는 리더의 위치로 인식되며 위치보고가 리더의 인식영역 안에서만 이루어지므로 시간축에 평행한 interval의 형태를 나타난다. 태그가 리더의 인식영역에 들어와 나가지 않으면 궤적이 완성되지 않아 리더에 머물고 있는 태그의 궤적을 표현할 수 없으므로 질의 시 이러한 태그를 검색할 수 없다. 시공간 이동체 색인에서는 이러한 태그의 특성을 표현하기 힘들기 때문에 태그의 특성을 고려한 색인이 필요하게 되었다. TPIR-Tree(Time Parameterized Interval R-tree)는 시간 매개변수 간격으로 태그의 interval을 정의하여 리더안에 머무는 태그의 interval을 표현할 수 있다. 그러나 각 interval이 시공간적으로 연결되어 있지 않아 색인 상에서 태그의 궤적을 검색하는 것은 매우 높은 검색 비용을 가지는 단점이 있다. 이 논문에서는 태그 궤적 검색 시 TPIR-Tree의 높은 검색 비용문제를 해결한 $TPIR^{*}$-Tree를 제안한다. 제안된 $TPIR^{*}$-Tree는 색인에서 태그의 궤적 정보를 유지할 수 있도록 하기 위해서 시간적으로 연결되지 않은 각 interval을 연결하기 위한 기법을 제시하고 있다. 또한. interval을 색인에 삽입할 때 연결정보를 유지하기 위해 이전 interval을 효율적으로 검색할 수 있는 방법을 제시하고 있다.

  • PDF

Detection of Keysound for Indexing ana Retrieval of Multimedia information (멀티미디어 정보의 색인 및 검색을 위한 핵심 사운드 검출)

  • 이용주;배건성
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.759-762
    • /
    • 2000
  • 멀티미디어 정보의 보다 효율적인 검색을 위해서는 비디오 요약정보의 생성 및 색인 작업이 필요하며, 이러한 요약정보를 만들기 위해서는 많은 시간과 비용이 소요된다. 스포츠 비디오 프로그램의 요약정보를 만들 때 오디오 신호를 이용하여 주요 장면을 검출할 경우 이러한 시간과 비용을 줄일 수 있다. 본 연구에서는 축구경기 비디오에서 주요장면을 나타내는 핵심 사운드로 주심의 호르라기 소리 및 아나운서의 "슛" 음성을 정의하고 이를 오디오 신호에서 검출하는 방법에 대해 연구하였다.

  • PDF

Disproportional Enlargement Policy for Indices of RFID Tag Data (RFID 태그 데이터의 색인을 위한 불균형 확장 정책)

  • Kim, Gi-Hong;Ahn, Sung-Woo;Hong, Bong-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.421-424
    • /
    • 2006
  • RFID 시스템에서 태그를 부착한 객체의 위치를 추적하는 응용이 중요하며 태그 위치를 추적하기 위한 질의를 효율적으로 처리하기 위해서는 태그 궤적의 저장 및 검색을 빠르게 처리 할 수 있는 색인이 필요하다. 기존의 시공간 기반 이동체 색인과는 달리 태그 위치 색인은 태그 식별자(tid), 리더 식별자(rid), 시간(time)을 도메인으로 가진다. RFID 환경에서는 태그 위치 색인의 rid 와 tid 도메인의 크기가 크고 한쪽 도메인으로 불균등한 영역 질의의 발생이 빈번하다. 따라서, 최소 면적 확장 정책에 따른 기존의 이동체 색인의 삽입 기법을 태그 위치 색인에 그대로 적용했을 경우 질의 영역과 생성된 노드 간의 겹침이 심하게 되어 색인 검색 비용이 증가하는 문제가 발생한다. 논문에서는 R$^{\ast}$-tree 의 삽입 정책을 따르는 태그 위치 색인의 삽입 방법으로 불균형 확장 정책을 제안한다. 제안한 삽입 정책은 둘레길이에 가중치를 부여하는 방법이며 이러한 정책을 사용함으로써 불균등한 질의 영역으로 인해 발생하는 질의 영역과 노드간의 중첩을 최소화하여 검색 시 노드 접근 횟수를 줄인다. 또한 실험을 통하여 기존 삽입 방법인 최소 면적 확장 정책의 삽입 비용과 검색 비용을 비교하였으며 그 결과 불균등한 질의 영역을 가지는 RFID 환경에서 삽입 및 검색 비용을 줄여 성능을 향상시켰다.

  • PDF

A Study of Join and Communication Cost for processing Integrated XQuery queries over Distributed Environment (분산 환경에서 통합 XQuery 질의 처리를 위한 조인과 통신비용에 대한 연구)

  • Choi, Seong-Il;Park, Jong-Hyun;Kang, Ji-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.59-63
    • /
    • 2007
  • XML은 웹 상에서 정보교환의 표준이며, 이종의 데이터를 보유하고 있는 지역 시스템들은 XML View를 이용하여 정보를 공개한다. 사용자는 XML을 위한 표준 질의어인 XQuery를 사용하여 분산된 XML View들을 대상으로 통합 XQuery질의를 생성할 수 있다. 이렇게 생성된 통합 XQuery질의는 자연스럽게 다른 지역시스템들 사이의 조인을 포함 할 수 있다. 조인은 비용이 많이 드는 연산자이므로 조인을 효율적으로 처리하는 것은 전체 질의의 성능에 큰 영향을 준다. 그러므로 조인을 효율적으로 처리하기 위한 비용을 결정하는 연구가 중요하다고 할 수 있다. SQL에서는 이와 같은 연구들이 많이 존재하며, 분산 환경에서의 조인을 효율적으로 처리하기 위해 크게 두 가지 비용을 고려한다. 그 중 하나는 지역시스템 내에서 조인을 처리하는 조인비용이며, 나머지 하나는 조인을 수행하기 위하여 다른 지역시스템으로 데이터를 전송하는 통신비용이다. 이 두 비용은 분산 조인을 처리하기 위한 중요한 요소이므로[6,7,8] 이를 측정하는 것은 통합 질의 처리를 위해서 필요한 연구라 할 수 있다. 그러나 테이블 구조의 데이터를 검색하기 위한 SQL 의 방법들을 구조적인 XML 데이터를 검색하기 위한 XQuery질의를 위해서 그대로 사용하는 것은 어려운 일이다. 본 논문에서는 분산 환경에서 통합 XQuery질의의 조인을 효율적으로 처리하기 위해 조인비용과 통신비용을 측정하는 방법을 제안한다. 본 논문의 기여는 앞서 기술한 문제점을 해결하여, XQuery 질의의 조인을 효율적으로 처리하기 위한 비용을 측정할 수 있도록 한다.

  • PDF