• 제목/요약/키워드: 질의 재구성

검색결과 235건 처리시간 0.034초

질의 재구성 알고리즘의 검색성능을 측정하기 위한 새로운 평가 방법의 개발 (Development of New Retieval Performance Measures for Query Reformulation Algorithms)

  • 김남호
    • 한국정보처리학회논문지
    • /
    • 제4권4호
    • /
    • pp.963-972
    • /
    • 1997
  • 정보 검색에서 대부분의 질의 재구성 알고리즘들은 초기 입력 문서나 피드백 문을 이용 하여 질의를 재구성하므로, 질의 재구성 알고리즘의 검색 성능은 입력되는 문서들의 질 에 따라 달라진다. 본 연구에서는 질의 재구성 알고리즘의 입력 문서에 대한 성능 감도를 새로운 검색성능 평가방법을 개발하여 분석하였다. 또한 CIRA라고 불리는 새로운 평가기준을 개발하여 질의 재구성 사이의 성능 변화추이를 분석하였다. 세가지의 질의 재구성 알고리즘(질의나무 (query tree), DNF 방법, Dillon 방법)의 감도와 성능변화를 테시트 세트인 CACM, CISI, Medlars 상에서 분석하였다. 세 실험에서 질의나무가 가장 작은 CIRA를 취득했으며, 감도 분석에서는 비록 다른 알고리즘과 차이는 적으나 가장 높은감도를 나타냈다.

  • PDF

스트림 질의의 동적 최적화를 위한 질의 계획 재구성 기법 (Query Plan Reordering Techinque for Dynamic Optimization of Stream Queries)

  • 이원근;이상돈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.716-718
    • /
    • 2003
  • 최근 들어 데이터가 연속적으로 생성되므로 인해 디스크에 저장된 형태로 모델링되기 어려운 특성을 갖는 데이터 응용환경에 대한 관심이 증대하고 있다. 스트림 데이터를 대상으로 이루어지는 스트림 질의는 저장된 릴레이션 내의 데이터를 대상으로 한번 적용되고 마는 기존의 데이터 응용에서와는 달리, 한번 등록이 되면 계속적으로 입력 데이터 스트림을 감시하다가 질의를 만족시키는 투플이 발생될 때마다 결과를 출력하는 연속성을 갖는다. 이러한 데이터 스트림 처리 시스템에서 성능 향상을 위한 질의 계획 최적화에 대한 연구가 이루어지고 있으며, 이를 위한 하나의 방법으로 현재 사용중인 질의 계획에서 질의 계획의 일부를 재구성하기 위해서 최적화 대상 질의 계획으로의 입력을 중단하고 최적화된 새로운 질의 계획으로 바꾸어 임시 저장된 데이터를 새로운 질의 계획에 입력하는 방법이 이용되고 있다. 그러나 이 방법을 사용하는 경우 입력 데이터 버퍼링을 위한 저장공간에 대한 비용이 증가하고. 부정확한 갑을 산출을 유발할 수 있는 등 몇 가지 문제점을 안고 있다. 본 논문에서는 이러한 문제를 해결하기 위하여 최적화 대상이 되는 질의 계획을 일시적으로 중복시켜 최적화가 진행되고 있는 과정 중에도 기존의 질의 계획이 입력 스트림을 계속 처리하고, 최적화된 새로운 질의 계획으로 입력 스트림을 처리하도록 하는 일시 중복을 이용한 동적 질의 계획 재구성 기법을 제시하였다.

  • PDF

이미지 검색 과정에 나타난 질의 전환 및 재구성 패턴에 관한 연구 (Examining Categorical Transition and Query Reformulation Patterns in Image Search Process)

  • 정은경;윤정원
    • 정보관리학회지
    • /
    • 제27권2호
    • /
    • pp.37-60
    • /
    • 2010
  • 이 연구는 이미지 특성 범주와 관련하여 질의 재구성 패턴을 탐색하고자 하였다. 이러한 연구 목적을 수행하기 위해서 Excite 웹검색 엔진 로그 데이터가 사용되었으며, 총 592 세션과 2,445 질의어가 분석되었다. 데이터 분석은 Batley의 정보 형태 구분과 선행 연구에서 밝혀진 팻싯과 서브팻싯을 활용하여 수행되었다. 분석결과는 두가지 형태로 구분하여 제시되었다. 첫째, 질의 재구성에 관한 분석결과이다. 질의 분석 결과, 가장 많은 부분을 차지하는 범주는 특정어(specific)와 지칭어(nameable)이며, 이러한 경향은 다양한 정보 탐색 단계에서도 지속적으로 나타났다. 둘째, 질의 재구성 패턴과 관려하여, 평행이동이 가장 많이 나타났으며, 이러한 경향은 최초 혹은 직전 질의 범주에 따라 근소한 차이를 보였다. 범주 전환 분석에서는 높은 비율(60%-80%)로 검색 질의의 범주가 지속적으로 동일한 범주에 머무르는 경향을 밝혀내었다. 이러한 결과는 이미지 검색 시스템 설계와 구현에 있어서, 이용자의 질의 선정 과정에 도움을 제공하고 효과적인 시소러스 구축 등에 활용될 수 있을 것으로 기대된다.

클러스터링 데이터베이스에서 온라인 확장을 고려한 $CSB^+$ 트리 색인의 온라인 재구성 기법 (Online Scaling Consious Online Reorganization of $CSB^+$ tree Index in a Database Cluster)

  • 심태정;이충호;이순조;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.196-198
    • /
    • 2002
  • 클러스터링 데이터베이스는 높은 가용성과 확장성을 갖으며, 예상치 못한 클라이언트 질의의 증가나 질의 패턴의 변경에 따른 작업부하의 편중에 효율적으로 대처할 수 있는 구조이다. 특히 온라인 확장 기법은 트랜잭션 처리를 중지하지 않고 새로운 노드를 클러스터에 추가하여 데이터를 재구성함으로써 임의의 노드에 질의가 집중되는 문제를 해결할 수 있다. 정적으로 구성된 시스템만으로는 두 대 이상의 서버에 작업량이 집중될 경우 재배치 시 서버 간의 데이터 이동의 반복 현상이 발생되며. 이로 인해 네트웍의 부하와 함께 실시간 트랜적션의 처리에 있어서 응답 시간이 지연되는 문제점이 발생한다. 따라서 본 논문에서는 데이터 이동의 반복 현상을 해결하기 위해 클러스터링 데이터베이스에서 온라인 확장을 고려한 CSB+ 트리 색인의 온라인 재구성 기법을 제안한다. 제안된 기법은 온라인 확장을 통한 동구 노드의 확장으로 데이터 이동의 반복을 막고 새롭게 추가된 노드를 통해 빠르고 효율적인 데이터의 분산을 수행한다 또한 각 시스템의 내부를 CS$B^{+}$ 트리로 구성하여 데이터의 재주성시에도 실시간 트랜잭션에 대한 빠른 응답 시간을 보장한다.

  • PDF

효율적인 센서 네트워크 관리를 위한 다중 연속 질의의 유사성 최소화 (Minimizing the Similarity of Multiple Continuous Queries for the Efficient Sensor Network Management)

  • 조명현;손진현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.7-9
    • /
    • 2004
  • 센서 네트워크의 급속한 성장에 따라 센서 네트워크의 효율적 관리를 위한 다양한 연구가 진행 중이다. 특히, 센서의 저 전력을 위한 다양한 기술들이 개발되고 있다. 본 논문은 센서에 전해지는 다중 연속 질의의 중복 성을 제거함으로써, 센서 네트워크의 효율적 관리를 제공할 수 있는 방법을 제안한다. 다중 연속 질의는 두 가지 단계로 최적화가 이루어진다. 먼저, 다중 연속 질의의 시간 속성 중복을 제거하기 위해 B+tree를 이용해 그룹 핑된다. 그룹 핑된 다중 연속 질의들은 연관 속성의 중복 여부 판단을 통해, 중복 성을 제거하여 재구성 된다. 그러므로 재구성된 다중 연속 질의가 센서 노드에 전해지게 되면, 센서는 중복된 결과를 전송하지 않기 때문에 센서 노드의 불필요한 전력을 낭비하지 않게 된다.

  • PDF

의미 정보와 실체뷰를 활용한 효율적 질의 재구성 기법 (An Efficient Query Rewriting Technique Utilizing Semantic Information and Materialized Views)

  • 장재영
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.661-670
    • /
    • 2003
  • 실체뷰는 뷰의 연산 결과를 미리 저장한 형태로서 질의 성능을 향상시키기 위해 질의 처리과정에 활용될 수 있다. 주어진 질의를 처리하는데 있어서 어떠한 실체뷰를 어떻게 이용할 것인가는 쉽게 해결될 수 있는 문제가 아니며 지금까지도 많은 연구가 이루어지고 있다. 질의를 처리하는데 실체뷰가 이용가능한가의 여부는 주어진 질의와 실체뷰간의 관계에 따라 결정된다. 본 논문에서는 질의처리에 실체뷰를 활용하는 새로운 방법을 제안한다. 우선 기존의 질의와 실체뷰간의 문법적 관계를 확장하여 의미적 관계를 이용한 활용 방안을 제시한다. 또한 원래의 질의에는 포함되지 않는 릴레이션을 갖는 실체뷰의 활용 방안에 대해서도 논의한다. 이를 위해 본 논문에서는 실체뷰의 활용을 위한 조건들을 제시하고 이 조건들을 검증하고 질의를 재구성하는 알고리즘을 제시한다.

분산 CUBIRD 상에서 세타 조인 및 중첩 SQL 병렬 질의처리를 지원하는 질의 재구성 기법 (Query Reorganization Scheme supporting Parallel Query Processing of Theta Join and Nested SQL on Distributed CUBRID)

  • 양현식;김형진;장재우
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2014년도 추계 종합학술대회 논문집
    • /
    • pp.37-38
    • /
    • 2014
  • 최근 SNS의 발전으로 인해 데이터의 양이 급격히 증가하였으며, 이에 따라 빅데이터 처리를 위한 분산 DBMS 기반 질의 처리 연구가 활발히 진행되고 있다. 이를 위해 CUBRID는 CUBRID Shard 서비스를 통해 데이터베이스를 shard 단위로 수평 분할하여 각기 다른 물리 노드에 데이터를 분산 저장하도록 지원한다. 그러나 CUBRID Shard는 shard간 데이터가 독립적으로 관리되기 때문에 세타 조인 및 중첩 질의와 같이 다수 서버에서의 테이블 참조가 필요한 질의는 처리가 불가능하다. 따라서 본 논문에서는 분산 CUBRID 상에서 세타 조인 및 중첩 SQL를 지원하는 질의 재구성 기법을 제안한다.

  • PDF

대두유로부터 Lipase를 이용한 재구성 지질의 합성 및 특성 (Lipase-Catalyzed Synthesis of Structured Lipids with Capric and Conjugated Linoleic Acid in a Stirred-Batch Type Reactor)

  • 신정아;이기택
    • 한국식품영양과학회지
    • /
    • 제33권7호
    • /
    • pp.1175-1179
    • /
    • 2004
  • Scale-up하기 위하여 24시간동안 1:2:2의 몰 비율로 stirred-batch type reactor에서 합성된 재구성지질은 capric acid와 CLA를 각각 4.9 mol%와 4.1 mot% 함유하였다. 기능성 지방산인 capric acid와 CLA는 주로 TAG의 sn-1,3 position에 분포하였고, sn-2 position에는 linoleic acid가 대부분을 차지하였다. 재구성지질과 대두유의 요오드가는 각각 126와 114이었고, 비누화가는 각각 190과 194로 측정됨으로써, 재구성 지질의 TAG에서 capric acid의 함유를 확인할 수 있었다. 대두유와 재구성지질의 tocopherol함량은 각각 74.6 mg/100 g과 18.2 mg/100 g으로, 재구성지질의 tocopherol 함량은 대두유보다 약 76% 감소하였다. 색도분석 결과, 재구성 지질과 대두유간에 백색도(L*)와 적색도(a*)에서는 유의적 차이가 없었으나(p<0.05),황색도(b*)에서 재구성지질이 대두유보다 좀더 yellowness를 보이며 유의적 차이를 보였다. (p<0.05). Reversed-phase HPLC 분석 결과, 재구성지 질에서 capric acid를 함유하고 있는 TAG형태의 partition number (PN)는 25∼37로 약 12.57 area%이었음을 확인하였다. 대두유의 주된 crystallization peak는 -57.86$^{\circ}C$C이었으나, capric acid를 4.9 mol% 함유하고 있는 재구성지질의 crystallization peak는 -52.78$^{\circ}C$로 대두유보다 결정화가 좀더 고온에서 일어났다.

테이블에 할당된 질의 재구성을 통한 테이블 검색 데이터셋 구축 방법 (Method of constructing a table search dataset by reconstructing queries assigned to tables)

  • 이주상;정근영;선주오;정석원;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.634-638
    • /
    • 2022
  • 테이블은 행과 열로 이루어진 데이터 집합으로, 핵심 정보를 효율적으로 저장하고 표현하기 위해 널리 사용된다. 테이블을 활용하는 다양한 연구 중에서도 테이블 검색은 다른 테이블 관련 연구의 선행 모듈로서 기능하기 때문에 특히 중요하다. 그러나 테이블 검색을 위한 한국어 데이터셋이 전무하여 이에 관한 연구를 수행하기 어렵다. 본 논문은 이러한 문제를 해결하고자 공개된 테이블 질의응답 데이터셋으로부터 테이블에 할당된 질의를 재구성하는 방법을 통해 테이블 검색 데이터셋을 구축한다. 추가로, 검증 모델을 통해 구축된 데이터셋의 유효성을 확인한다.

  • PDF

유비쿼터스 환경에서 실시간 센서 데이터를 위한 XML 질의언어 처리 엔진 (An XQuery Processing Engine for Real-Time Sensor Data in Ubiquitous Environments)

  • 임형준;김재훈;이규철
    • 한국전자거래학회지
    • /
    • 제15권4호
    • /
    • pp.1-19
    • /
    • 2010
  • 최근에 유비쿼터스나 전자상거래와 같은 환경에서 발생하는 실시간 데이터를 처리해야 하는 요구가 늘어나고 있다. 유비쿼터스 환경에서 사용되는 센서 데이터는 그 크기가 작고 XML 문서로 표현 되어 있으며 대량으로 발생하는 특징이 있다. 이러한 대량의 센서 데이터를 처리하기 위한 효율적인 방법이 요구되고 있다. 센서 데이터에 대한 XML 질의언어(XQuery)는 주로 센서 데이터가 발생한 센서의 식별자나 표현하고자 하는 정보를 얻어오는 것과 사용자의 편의를 위한 결과 재구성으로 분류된다. 기존의 XML 질의언어 엔진들은 센서 데이터를 일괄적으로 처리하기 위한 효율적인 방법을 가지고 있지 않다. 본 논문에서는 대량의 센서 데이터들을 실시간으로 처리하기 위하여 역 경로 요약을 이용한 가지 질의(Twig Query) 처리 기법을 적용하였다. 또한, 재구성(Restructuring) 일괄 처리 기법을 개발하여 적용하였다. XMark와 RFID EPC 데이터를 이용한 성능 측정을 하고 MonetDB/XQuery와 Oracle Berkeley DB XML과의 비교 분석을 수행하였다.