• 제목/요약/키워드: Top-k 검색

검색결과 86건 처리시간 0.025초

다양한 접근점 기반의 한국화 검색 인터페이스에 관한 연구 (The Access-Enhanced Search Interface Design for Korean Paintings)

  • 서은경;이원경
    • 정보관리학회지
    • /
    • 제25권2호
    • /
    • pp.25-48
    • /
    • 2008
  • 본 연구는 디지털 콘텐츠로 변환된 한국화 이미지를 이용자가 원하는 접근점을 이용하여 특정적으로 검색할 수 있으며 동시에 한국화만이 지니는 형태적 또는 소재적 특징을 이용하여 폭넓게 브라우징 할 수 있도록 하는 한국화 검색 인터페이스를 설계하였다. 이를 위해서는 먼저 한국화를 설명하기 적합한 상세한 한국화 기술요소 세트(26개의 핵심요소와 172개의 하위 속성요소)를 2차에 걸친 실무자 및 전문가의 검토를 걸쳐 구축하였다. 다음으로, 이용자가 선호하는 한국화검색 접근점을 파악하기 위하여 전공자와 일반이용자로 구성된 300명에게 26개의 기술요소의 검색접근점 선호도에 대한 설문 조사하였다. 설문조사결과를 바탕으로 전공자와 일반이용자가 접근점으로 가장 선호하는 각각의 15개 기술요소를 선정하였다. 마지막으로, 이를 기반으로 전문가와 일반인을 위한 한국화검색 인터페이스와 디스플레이 인터페이스를 제안하였다. 이와 같은 이용자 중심의 검색이 가능한 플랫폼을 제공함으로서 이용자의 이미지 검색 만족도를 높일 수 있을 것으로 본다.

아웃소싱 암호화 데이터에 대한 효율적인 Top-k 질의 처리 알고리즘 (An Efficient Top-k Query Processing Algorithm over Encrypted Outsourced-Data in the Cloud)

  • 김종욱;서영균
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권12호
    • /
    • pp.543-548
    • /
    • 2015
  • 최근 다양한 분야에서 생산되는 데이터의 양이 폭발적으로 증가함에 따라 사용자가 가장 관심 있어 하는 몇 개의 데이터를 검색하는 top-k 질의에 대한 관심이 고조되고 있다. Top-k 질의는 사용자의 점수 함수를 이용하여, 사용자가 원하는 모든 조건을 만족시키는 데이터들 중에서 최상위 (또는 최하위) 점수를 가지는 k개의 데이터를 사용자에게 반환한다. 최근 들어 클라우드 컴퓨팅 서비스의 대중화로 인하여 사용자의 대용량 데이터를 클라우드에 아웃소싱하여 경제적으로 저장 및 관리하는 데이터 아웃소싱이 크게 주목받고 있다. 그러나 데이터 아웃소싱으로 인하여 사용자의 민감한 데이터가 클라우드 서비스 제공자에게 노출될 수 있다는 위험이 존재하며, 이러한 문제를 방지하기 위해서는 사용자의 민감한 데이터를 암호화하여 클라우드에 저장하는 것이 필수적으로 요구된다. 본 논문은 클라우드 컴퓨팅 환경에서 암호화된 데이터에 대한 top-k 질의를 효율적으로 처리하는 알고리즘을 제안한다. 제안되는 알고리즘은 순서보존 암호화 기법을 이용하여, 암호화된 데이터만을 대상으로 top-k 질의 결과에 포함되지 않을 것으로 예상되는 중간 결과들을 클라우드 내에서 미리 제거함으로써 효율적인 top-k 질의 처리가 가능하게 한다. 논문의 실험 결과는 제안된 top-k 질의 처리 알고리즘이 단순 방법과 비교하여 사용자 시스템의 부하를 10배~10000배 줄일 수 있음을 증명한다.

Desk top 검색도구를 이용한 개인정보의 효율적 관리 방안에 관한 연구 : 디지털 정보자료를 중심으로 (A Study on the Effective Management of Personal Digital Depository by Using Desktop Search Tools)

  • 이현주;이응봉
    • 정보관리연구
    • /
    • 제36권2호
    • /
    • pp.25-44
    • /
    • 2005
  • 정보의 홍수 속에서 개인이 생산하고 활용하고 있는 개인정보도 마찬가지로 스스로 찾기 어려울 만큼 그 정보량이 거대해지고 그 형태가 다양해지고 있다. 따라서 개인정보의 효율적 관리는 필수 불가결한 사항이 되었다. 이에 본 연구에서는 개인 컴퓨터의 디지털 정보자료를 중심으로 한 개인 정보의 효율적 관리방안으로서 Desktop 검색도구의 활용을 제안하였고, Desktop 검색도구의 주요 특성과 성능에 대한 비교 분석을 통해 문제점 및 개선방안을 제시하였다.

정보 검색 과제별 동적 검색 랭킹 모델 구현 및 검증: 사용자 중심 적합성 판단 모형 평가를 중심으로 (Implementation and Verification of Dynamic Search Ranking Model for Information Search Tasks: The Evaluation of Users' Relevance Judgement Model)

  • 박정아;손영우
    • 감성과학
    • /
    • 제15권3호
    • /
    • pp.367-380
    • /
    • 2012
  • 본 연구는 정보 검색 과제별 주요 적합성 판단 기준을 실제 정보 검색 시스템으로 구현해 보고 사용자 평가를 통해 그 효과를 검증해 보고자 하였다. 이를 위해, 사용자 적합성 판단 기준들을 정보 검색 시스템에서 적합성을 결정하는 검색 랭킹 모델의 랭킹 요소들로 적용하였다. 그리고 정보 검색 과제별 차이가 있는 동적 검색 랭킹 모델과 차이가 없는 정적 검색 랭킹 모델을 시스템으로 구현하였고, 이에 대한 사용자 평가를 진행하여 비교해 보았다. 총 45명의 참가자가 실험에 참여하였고, 정보 검색 과제별 차이가 있는 동적 검색 랭킹 모델과 차이가 없는 정적 검색 랭킹 모델이 적용된 각각의 검색 시스템에서 3개의 검색 과제를 수행하였다. 3개의 정보 검색 과제로는 사실 검색 과제, 문제 해결 검색 과제, 의사 결정 검색 과제가 사용되었다. 각 참가자는 검색 결과 첫 페이지 상위 5 개의 검색 결과에 대해 적합성 정도를 7 점 척도로 평가하였다. 그 결과, 사용자는 전반적으로 모든 검색어에 동일하게 반응하는 정적 검색 랭킹 모델을 적용한 시스템보다 정보 검색 과제별로 사용자 적합성 판단기준의 변화에 따라 랭킹 요소 가중치를 달리한 동적 검색 랭킹 모델을 더 높이 평가하는 것을 확인할 수 있었다. 본 연구는 이를 통해, 정보 검색 과제를 고려한 정보 검색 시스템 디자인의 필요성과 함께, 사용자 중심 적합성 판단 모형 연구 결과를 실제 정보 검색 시스템으로 구현하여 평가함으로써 사용자 중심 적합성 연구 결과의 타당성을 검증하였다는 점, 그리고 사용자 연구 접목을 통한 시스템 개선의 중요성을 강조하였다는 점에서 의의를 가진다.

  • PDF

Random Forest 분류기와 Bag-of-Feature 특징 히스토그램을 이용한 의료영상 자동 분류 및 검색 (Medical Image Classification and Retrieval Using BoF Feature Histogram with Random Forest Classifier)

  • 손정은;고병철;남재열
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권4호
    • /
    • pp.273-280
    • /
    • 2013
  • 본 논문에서는 의료영상의 특성을 반영하여 픽셀 그래디언트의 방향 값을 특징으로 하는 OCS-LBP (Oriented Center Symmetric Local Binary Patterns) 특징을 개발하고 BoF(Bag-of-Feature)와 Random Forest 분류기를 이용한 영상 검색 방법을 제안한다. 학습영상에서 추출된 특징 값은 code book 으로 군집화 되고, 각 영상들은 code book을 통해 의미 있는 새로운 차원인 BoF특징으로 변환된다. 이렇게 추출된 BoF특징은 Random Forest 분류기에 적용되고 학습된 분류기에 의해 유사한 특성을 갖는 N개의 클래스별로 분류되게 된다. 질의 영상이 입력되면 동일한 OCS-LBP특징이 추출되고 code book을 통해 BoF특징이 추출된다. 전통적인 내용기반 영상검색과는 다르게, 본 논문에서는 질의 영상에서 추출된 BoF특징이 학습된 Random Forest에 적용되어 가장 유사한 K-근접 이웃 (K-nearest neighbor) 클래스들을 선택하고 선택된 클래스들에 포함된 영상들에 대해서만 질의 영상과의 BoF 유사도 측정을 통해 최종 유사한 영상을 검색하게 된다. 실험결과에서 본 논문에서 제안하는 방법은 빠르고 우수한 검색 성능을 보여 주었다.

실시간 검색어 연관 분석을 통한 핵심 이슈 선정 (Selecting a key issue through association analysis of realtime search words)

  • 정민영
    • 디지털융복합연구
    • /
    • 제13권12호
    • /
    • pp.161-169
    • /
    • 2015
  • 포털 사이트의 실시간 검색어는 현재 관심이 급상승하고 있는 이슈를 보여주기 위해 주로 검색횟수가 많은 순서에 따라 몇 초 간격으로 제공되고 있다. 그렇지만 너무 짧은 시간 내에 순위가 바뀌는 실시간 검색어의 특성 때문에 하루의 핵심 이슈를 비켜가는 문제가 발생한다. 본 논문에서 이러한 문제를 보완하기 위해 검색어들 사이의 연관 분석을 통하여 검색어들이 관련된 핵심 이슈를 도출하는 방법을 제안하고자 한다. 이를 위해 먼저 실시간 검색어를 순위와 상대적 관심도를 기반으로 점수화하여 집단별 기술통계를 통해 최상위 10개의 검색어를 도출한다. 그 다음으로 지지도와 신뢰도를 기반으로 연관 규칙을 추출하고 이를 가시화하는 그래프 결과를 바탕으로 핵심 이슈를 선정한다. 실험 결과는 단일 최상위 실시간 검색어보다 연관분석을 통해 높은 점수로 선정된 핵심 이슈가 더 큰 의미를 갖는다는 것을 보여준다.

질의기반 사용자 프로파일을 이용하는 개인화 웹 검색 (Personalized Web Search using Query based User Profile)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제17권2호
    • /
    • pp.690-696
    • /
    • 2016
  • 사용자 입력 질의와 웹 문서에 포함된 단어들의 형태적 일치를 검사하여 관련 문서를 검색하는 검색엔진은 사용자의 개인별 관심 분야를 반영하는 검색 결과를 생성하기 어렵다. 본 논문에서는 개인별 관심사를 파악하여 질의 의도에 적합한 내용의 문서를 검색하는 개인화된 웹 검색 방법을 제안한다. 개인화 검색의 성능은 사용자의 개인적 관심사를 정확하게 표현하는 우수한 사용자 프로파일을 생성하는 전략에 좌우된다. 본 연구에서 개인 프로파일은 사용자가 최근 입력한 질의어들과 검색에서 클릭했던 문서들에 나타나는 주제어들이 출현 빈도를 반영한 가중치와 함께 등록된 데이터베이스이다. 특히 중의적 질의어의 정확한 의미를 결정하기 위해 워드넷을 기반으로 프로파일에 등록된 단어들과 의미 유사도를 계산한다. 기존 웹 검색 시스템의 사용자 측에 질의확장 모듈과 순위재계산 모듈을 추가하는 확장모듈을 구축하여 비교 실험하였으며, 본 연구의 방법을 적용한 개인화 웹 검색의 결과는 특히 10위 이내 상위의 결과 문서들에 대해 92%의 정확률과 82%의 재현율을 보여 향상된 성능을 검증하였다.

이용자들의 PC 검색 행태와 모바일 검색 행태 비교: 1300K 로그 분석을 중심으로 (A Comparison of User Search Behavior on PC and Mobile Phone: A Log Analysis of 1300K Site)

  • 박소연;조기훈;최기린
    • 정보관리학회지
    • /
    • 제34권3호
    • /
    • pp.89-107
    • /
    • 2017
  • 본 연구에서는 국내 대표적 쇼핑 검색 사이트인 1300K 이용자들의 PC와 모바일 검색 행태를 비교, 분석하였다. 이를 위하여 1300K에서 2016년 4월 한 달 동안 생성된 검색 로그를 수집, 분석하였다. 연구 결과, 모바일에서 발생한 세션 수가 PC에서 발생한 세션 수보다 약간 많았으며, PC에서는 이용자들이 질의 검색 방식보다 디렉토리 브라우징을 약간 더 많이 수행하는 반면, 모바일에서는 디렉토리 브라우징보다 질의 검색을 2배이상 더 많이 수행하는 것으로 나타났다. 제품 정보 클릭은 PC에서 더 빈번하게 발생하는 반면, 장바구니 담기, 제품 주문하기와 같은 주요 의사 결정은 모바일에서 더 빈번하게 발생하는 것으로 나타났다. 이용자들이 PC와 모바일에서 검색하는 인기 질의들은 다수 중복되었으며, 이용자들이 PC와 모바일에서 브라우징하는 인기 카테고리들 역시 다수 중복되었다. 또한 PC보다 모바일에서 특정 인기 질의 및 카테고리에 대한 쏠림현상이 매우 강한 것으로 나타났다. 전반적으로 모바일 상에서의 검색 행태가 더 단순하고 수동적이며, 집중현상이 큰 것으로 나타났다. 본 연구의 결과는 향후 매체별로 차별화된 검색 서비스의 개선 및 개발에 활용될 수 있을 것으로 기대된다.

대규모 범죄 수사 기록을 활용한 온톨로지 기반 분석 서비스 구현 (Implementation of Ontology-based Analytics Service by Exploiting Massive Crime Investigation Records)

  • 고건우;김선우;박성진;노윤주;최성필
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.477-481
    • /
    • 2018
  • 본 논문은 범죄 수사 기록 문서로부터 추출한 정보를 트리플로 구성하여 특정 분야의 온톨로지를 구축하고, 더 나아가 온톨로지 기반의 검색 서비스를 구현하는 일련의 과정을 설명한다. 특히 비정형 데이터로 부터 얻어낸 정보를 통해 온톨로지를 구축하고, 이를 토대로 실제 사용할 수 있는 레벨의 서비스를 구현하는 것이 특징이다. 서비스의 성능을 확인하기 위하여 사건 검색에 대한 정확도 측정 방법 중 하나인 Top-K 방식의 정확도 측정 실험을 수행하였으며, 실험 결과 완전 일치 실험에서는 약 93.52%, 유사 필드 활용 실험에서는 약 88.91%의 결과를 얻어낼 수 있었다.

  • PDF

대규모 범죄 수사기록을 활용한 온톨로지 기반 서비스 구현 - 침입 절도 범죄 분야를 중심으로 - (Implementation of Ontology-based Service by Exploiting Massive Crime Investigation Records: Focusing on Intrusion Theft)

  • 고건우;김선우;박성진;노윤주;최성필
    • 한국문헌정보학회지
    • /
    • 제53권1호
    • /
    • pp.57-81
    • /
    • 2019
  • 온톨로지는 특정 분야의 특정 지식과 관련된 용어 및 용어 사이의 관계를 정의하는 복합 구조 사전이다. 국내외로 다양한 온톨로지 구축의 시도가 있었으나 대규모의 범죄 수사기록을 온톨로지로 구축하고 이를 통한 서비스를 구현한 사례는 존재하지 않았다. 따라서 본 논문은 비정형 데이터인 범죄 수사기록 문서 중 침입 절도 분야로부터 추출한 정보를 통해 온톨로지를 구축하고, 온톨로지 기반의 검색 서비스와 범행 장소 추천 서비스를 구현하는 과정을 설명한다. 검색 서비스의 성능을 파악하기 위하여 사건 검색에 대한 정확도 측정 방법 중 하나인 Top-K 방식의 정확도 측정을 실험하였고, 실험 집합에 대하여 최대 93.52%의 정확도를 얻었다. 또한, 범행 장소 추천 서비스의 성능을 파악하기 위한 실험 결과, 실험 데이터셋의 전체에 대해 적합한 단서 필드 조합을 얻어냈으며, F1-measure 76.19%의 성능으로 데이터베이스 내의 범행 장소 필드 정보를 교정할 수 있음을 확인하였다.