• 제목/요약/키워드: Search queries

검색결과 317건 처리시간 0.025초

멀티미디어 데이터베이스 시스템에서 최대거리를 이용한 K-최대근접질의 처리 방법 (The Method to Process Nearest Neighbor Queries using Maximun Distance in Multimedia Database Systems)

  • 선휘준;신성철
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권9호
    • /
    • pp.1025-1030
    • /
    • 2004
  • 멀티미디어 데이타베이스 시스템에서 k-최대근접질의는 매우 빈번히 발생하며, 다른유형의 공간질의에 비하여 처리비용이 많이 요구된다. K-최대근접질의의 처리비용을 최적화하기 위해서는 색인에서 검색되는 노드의 수와 연산시간을 최소화할 수 있어야한다. 본 논문에서는 최적검색거리[1]의 연산시간을 줄일 수 있는 새로운 검색거리를 제안하고 그 특성을 보인다.

  • PDF

탐색결과에 근거한 자연어질의 자동확장 및 응용에 관한 연구 고찰 (The Pragmatics of Automatic Query Expansion Based on Search Results of Natural Language Queries)

  • 노정순
    • 정보관리학회지
    • /
    • 제16권2호
    • /
    • pp.49-80
    • /
    • 1999
  • 본 연구는 자연어 비불리언 탐색에서 탐색결과에 근거하여 질의를 수정, 확장, 결합하여 검색효과를 향상시키는 시스템들을 개념모델별로 성능을 고찰하고, 성능에 영향을 끼치는 요소들을 분석하여, 이론적인 개념의 틀을 제시하였다. 용어의 가중치기법, 문헌의 순위화방법, 용어선정알고리즘, 질의확장에 사용된 문헌수와 용어수, 적합성판정정보의 출처 및 척도, 배움표본의 크기, 부적합문헌정보의 사용여부, 용어확장방법, 질의의 크기, DB의 종류와 크기 등에 의해 영향을 받는 것으로 분석되었다.

  • PDF

데이터마이닝기법을 이용한 검색엔진의 검색효율성 측정에 관한 연구 (A Study on the Retrieval Effectiveness in the Search Engines Using Data Mining Techiniques)

  • 김성희;이수연
    • 한국도서관정보학회지
    • /
    • 제31권4호
    • /
    • pp.191-212
    • /
    • 2000
  • 본 연구에서는 데이터마이닝 기법을 이용한 검색엔진인, Northernlight와 Google과 일반메타탐색엔진인 Metacrawler를 정도률, 제현률을 기준으로 검색효율성을 측정하였다. 분석결과 데이터마이닝 기법을 이용한 검색엔진이 일반검색엔진에 비해 검색효율성이 높은 것으로 나타났다. 따라서, 데이터마이닝 기법을 이용한 검색엔진이 앞으로 검색효율성을 높이는데 기여를 할 수 있을 것으로 기대된다.

  • PDF

Forecasting Housing Demand with Big Data

  • Kim, Han Been;Kim, Seong Do;Song, Su Jin;Shin, Do Hyoung
    • 국제학술발표논문집
    • /
    • The 6th International Conference on Construction Engineering and Project Management
    • /
    • pp.44-48
    • /
    • 2015
  • Housing price is a key indicator of housing demand. Actual Transaction Price Index of Apartment (ATPIA) released by Korea Appraisal Board is useful to understand the current level of housing price, but it does not forecast future prices. Big data such as the frequency of internet search queries is more accessible and faster than ever. Forecasting future housing demand through big data will be very helpful in housing market. The objective of this study is to develop a forecasting model of ATPIA as a part of forecasting housing demand. For forecasting, a concept of time shift was applied in the model. As a result, the forecasting model with the time shift of 5 months shows the highest coefficient of determination, thus selected as the optimal model. The mean error rate is 2.95% which is a quite promising result.

  • PDF

웹검색 행태 연구 - 사용자가 스스로 쿼리를 뭉치는 방법으로 - (Web Search Behavior Analysis Based on the Self-bundling Query Method)

  • 이중식
    • 한국문헌정보학회지
    • /
    • 제45권2호
    • /
    • pp.209-228
    • /
    • 2011
  • 검색이 편재화 되고 있다. 사용자들은 PC를 너머 스마트폰과 스마트TV에서도 검색을 일상적으로 사용하고 있다. 따라서 사용자의 검색행태도 진화 중이다. 하지만 검색행태 연구는 서버의 트랜잭션 로그(transaction log)를 기반으로 하거나 사용자 로그(user log)를 관찰하는 경우에도 개별 쿼리(query instance)를 분석단위로 삼기에 여러 매체와 여러 시간을 가로지르는 검색 행태를 분석하기에 부족하다. 본 연구에서는 사용자가 직접 덩어리 지운 쿼리 뭉치(bundled query)를 살펴보아 시간과 매체를 가로지르며 궁금증을 해결해 나가는 사용자의 검색행동을 분석해 보았다. 연구를 위해 사용자 PC에 웹로그 캐처를 설치하고, 취합된 웹검색 기록을 사용자들이 직접 덩어리 지워 같은 궁금증을 가진 뭉치를 만들도록 하였다. 또한 각 뭉치에 대한 설문을 통해 검색의 동기, 계기, 만족도 및 검색 후 활동을 조사하였다. 사용자에 의해 만들어진 뭉치는 전화 인터뷰를 통해 검증하였고 맥락을 확인하였다. 뭉치를 통한 인터뷰는 검색 당시의 기억을 떠올리는 힌트로 작용하여 사용자의 검색 회상을 생생하게 하였다. 분석 결과 사용자들은 하루에 평균 4.75개의 검색 뭉치를 발생시키고, 각각의 검색 뭉치는 평균 2.75개의 쿼리로 구성되어 있음을 확인할 수 있었다. 또한 뭉치 내 쿼리의 발전을 '쿼리의 정교화'와 '주제의 정교화'라는 상위 범주 아래 9개의 패턴으로 확인하였다.

질의기반 사용자 프로파일을 이용하는 개인화 웹 검색 (Personalized Web Search using Query based User Profile)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제17권2호
    • /
    • pp.690-696
    • /
    • 2016
  • 사용자 입력 질의와 웹 문서에 포함된 단어들의 형태적 일치를 검사하여 관련 문서를 검색하는 검색엔진은 사용자의 개인별 관심 분야를 반영하는 검색 결과를 생성하기 어렵다. 본 논문에서는 개인별 관심사를 파악하여 질의 의도에 적합한 내용의 문서를 검색하는 개인화된 웹 검색 방법을 제안한다. 개인화 검색의 성능은 사용자의 개인적 관심사를 정확하게 표현하는 우수한 사용자 프로파일을 생성하는 전략에 좌우된다. 본 연구에서 개인 프로파일은 사용자가 최근 입력한 질의어들과 검색에서 클릭했던 문서들에 나타나는 주제어들이 출현 빈도를 반영한 가중치와 함께 등록된 데이터베이스이다. 특히 중의적 질의어의 정확한 의미를 결정하기 위해 워드넷을 기반으로 프로파일에 등록된 단어들과 의미 유사도를 계산한다. 기존 웹 검색 시스템의 사용자 측에 질의확장 모듈과 순위재계산 모듈을 추가하는 확장모듈을 구축하여 비교 실험하였으며, 본 연구의 방법을 적용한 개인화 웹 검색의 결과는 특히 10위 이내 상위의 결과 문서들에 대해 92%의 정확률과 82%의 재현율을 보여 향상된 성능을 검증하였다.

사용자 개인 프로파일을 이용한 개인화 검색 기법 (Personalized Search Technique using Users' Personal Profiles)

  • 윤성희
    • 한국전자통신학회논문지
    • /
    • 제14권3호
    • /
    • pp.587-594
    • /
    • 2019
  • 본 논문은 사용자의 검색 의도와 개별 관심을 반영한 순위화된 검색 결과 문서를 제공하는 개인화 검색 기법을 제안한다. 개인화 검색에서는 사용자의 개별 관심사와 선호도를 정확하게 판별하기 위한 사용자 프로파일을 생성하는 기술이 개인화 검색의 성능을 좌우한다. 개인 프로파일은 사용자의 최근 입력 질의어들과 검색과정에서 참조했던 문서들에 나타나는 주제어들의 가중치와 빈도가 기록된 데이터 집합이다. 사용자 프로파일은 웹 검색에 앞서 사용자의 입력 질의어를 개인화된 질의어들로 확장하기 위해 사용된다. 중의적 질의어의 정확한 의미를 결정하기 위해서 워드넷을 사용하여 프로파일에 등록된 단어들과 의미 유사도를 계산한다. 검색 시스템의 사용자 측에 질의확장 모듈과 순위 재계산 모듈을 확장모듈로 구축하여 진행한 실험에서 개인화 검색 기술을 적용한 실험 결과가 상위문서들에 대해서 정확률과 재현률이 크게 향상된 성능을 보이고 있다.

R-tree에서 위치 기반 질의를 지원하기 위한 동적 셀 레벨링 (Dynamic Cell Leveling to Support Location Based Queries in R-trees)

  • 정연욱;구경이;김유성
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권2호
    • /
    • pp.23-37
    • /
    • 2004
  • 최근 GPS기능을 탑재한 휴대폰 PDA등의 모바일 장치를 사용하여 위치 기반 서비스를 이용하는 사용자가 급증하고 있다. 이에 위치 정보를 지닌 공간 데이타를 저장하고 관리하는 대용량의 공간 데이타베이스는 사용자의 다양한 질의 조건과 빠른 검색을 가능하게 하기 위한 색인이 필요하며 대표적인 색인 기법으로는 R-tree가 널리 사용되고 있다. 기존의 R-tree를 이용한 검색은 질의 영역과 관계없는 공간 데이타까지 검색하여 불필요한 입출력을 유발하기 때문에 응답시간이 늦어진다. 본 논문에서는 공간 데이타가 위치 기반 질의를 지원하기 위해 자신이 속한 노드의 전체(Union) MBR 영역에 따라 동적으로 셀 레벨 값을 구성하는 CLR-트리(Cell Leveling R-tree)를 제안한다. 또한, CLR-트리에서의 새로운 공간 데이타의 삽입, 분할, 삭제, 검색 알고리즘을 제안한다. 제안된 CLR-트리에서는 위치 기반 질의 시 사용자 질의 영역의 셀 레벨 값과 공간 데이타의 셀 레벨 값을 비교하여, 겹치지 않는 셀에 대해서는 검색 대상으로부터 제거하고 연관된 셀만을 검색하기 때문에 빠른 응답시간을 제공한다. 디스크 입출력 실험에서 CLR-트리가 기존 R-tree보다 디스크 접근 수를 $5{\sim}20%$ 감소시켜 사용자의 위치 기반 질의에 대해 빠르게 처리함을 알 수 있었다.

  • PDF

다중 키워드 검색에 적합한 동등조인 연산 결과의 동적 관리 기법 (Dynamic Management of Equi-Join Results for Multi-Keyword Searches)

  • 임성채
    • 정보처리학회논문지A
    • /
    • 제17A권5호
    • /
    • pp.229-236
    • /
    • 2010
  • 인터넷이나 기업체 안에서 생성되는 문서의 수가 빠르게 증가하고 있고 이에 따라 효율적인 문서 검색 서비스의 중요성도 함께 커지고 있다. 이런 검색 환경에서 사용자의 검색 질의를 미리 예측할 수 없기 때문에 문서 내의 키워드를 자동 추출하여 색인어로 사용하는 전문검색(full-text search)이 일반적으로 적용된다. 전문검색을 위해 생성된 색인 파일의 크기는 문서 수 증가로 대용량화 되고, 이런 대용량 색인에 대한 다중 키워드 질의 처리에는 과도한 디스크 비용이 초래될 수 있다. 논문에서는 이런 비용 문제를 해결하기 위해 대용량 문서의 전문검색 시스템에서 다중 키워드 질의를 효율적으로 처리할 수 있게 하는 색인 파일 구조 및 관리 기법을 제안한다. 제안된 방법은 다중 키워드 검색에 적합한 것으로 알려진 역파일을 기본 색인 구조로 하며, 질의 처리의 조인 연산과 랭킹 연산에 적합하도록 색인 파일을 계층화한다. 이를 바탕으로 다중 키워드 질의를 구성할 확률이 높은 키워드 쌍에 대한 조인 연산 결과를 주기억장치 공간에 동적으로 저장함으로써 디스크 사용량을 크게 줄일 수 있다. 논문에서는 제안된 기법의 우수성을 보이기 위해 디스크 비용 모델에 기반한 성능 비교도 수행한다.