• Title/Summary/Keyword: 데이터 검색

검색결과 3,727건 처리시간 0.042초

토픽모델링 및 주성분 분석 기반 검색 질의 유형 분류 연구 (A Study on Search Query Topics and Types using Topic Modeling and Principal Components Analysis)

  • 강현아;임희석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권6호
    • /
    • pp.223-234
    • /
    • 2021
  • 4차 산업 혁명 시대의 도래에 따라 쇼핑의 행태는 더욱 빠르게 오프라인에서 온라인으로 이동하고 있다. 온라인 쇼핑에서 고객의 정보요구를 가장 집약적으로 보여주는 것이 바로 검색 질의이다. 하지만 검색 분야에서도 검색 질의 관련 연구 사례는 많지 않으며 대부분의 검색 질의 연구 분야 선행 연구들은 연구자의 정성적인 판단에 근거하여 제한적인 주제와 데이터 기반으로 연구되어 왔다. 이에 본 연구는 검색 질의 연구 분야에 기계학습을 적용하여 검색 질의와 검색 이후 이용자가 조회한 문서명 로그를 기반으로 토픽모델링 수행 후 검색 질의 주제를 정의함으로써 데이터 기반의 정량적 방법론으로 15개의 검색 질의 주제 유형을 정의하였다. 또한 기존 검색어 자체만을 보고 판단하던 주제 유형에서 나아가 검색 행동특성을 반영한 유형을 정의하기 위하여 주성분 분석을 통해 주요 변수를 추출 후 각 주제별 검색 행동특성을 분석함으로써 검색 탐색 활성도, 상품 관여도에 따른 4가지의 새로운 검색 질의 유형 분류체계를 제시하였다. 본 연구결과는 효과적인 검색서비스 구축 및 검색 시스템 개발에 기여할 것으로 기대된다.

XQuery 작성기 설계 및 구현

  • 김태권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.22-24
    • /
    • 2004
  • XML은 관계형 데이터는 물론 구조화 또는 반구조화 된 데이터를 효과적으로 조직화하여 표현할 수가 있다. XQuery는 구조화된 XML 데이터를 대상으로 필요한 정보를 검색하는 질의어이다. 평면적인 테이블 형태의 SQL과는 달리 XQuery는 데이터의 내부구조 정보 없이는 질의어를 작성하는데 어려움이 따른다. 이 논문은 내부적으로 구조화된 XML데이터에서 필요한 정보를 검색하는 검색언어 XQuery질의를 효과적으로 작성할 수 있도록 질의 대상이 되는 XML 데이터 구조를 트리 형태로 보여주고, 필요한 경로식을 효과적으로 지정함으로써 질의어를 보다 쉽게 작성하도록 도와주는 XQuery 작성기를 설계하고 구현한다.

  • PDF

검색 속도와 메모리 효율 최적화를 위한 메타데이터 기반 데이터 구조 분석 (Metadata-Based Data Structure Analysis to Optimize Search Speed and Memory Efficiency)

  • 김세연;임영훈
    • 정보처리학회 논문지
    • /
    • 제13권7호
    • /
    • pp.311-318
    • /
    • 2024
  • 인공지능과 인터넷의 발전으로 인한 데이터의 증가로 데이터 관리의 중요성이 부각되고 있는 상황에서, 데이터 검색과 메모리 공간의 효율적 활용이 매우 중요한 시대가 도래하였다. 본 연구에서는 메타데이터를 기반으로 데이터 구조를 분석하여 검색 속도와 메모리 효율을 최적화하는 방안을 연구한다. 연구방법으로는 사진 이미지의 메타데이터를 활용하여 배열, 연결리스트, 딕셔너리, 이진 트리, 그래프의 데이터 구조에 대한 성능을 시간적, 공간적 복잡도를 중심으로 비교하고 분석하였다. 실험을 통해 대규모의 이미지 데이터를 다루는 상황에서 딕셔너리 구조는 수집속도에서, 그래프 구조는 검색 속도에서 가장 우수한 성능을 보여주는 것을 확인할 수 있었다. 본 논문의 결과는 이미지 데이터 검색 속도와 메모리 효율을 최적화하기 위한 데이터 구조를 선택하는데 실용적인 가이드라인을 제시할 것으로 기대한다.

방송프로그램 내용과 연동된 검색 키워드를 활용하는 MHP 기반의 검색 데이터 서비스 (An MHP-based Searching Data Service using the Keywords based on the Content of a Broadcasting Program)

  • 고광일
    • 융합보안논문지
    • /
    • 제12권6호
    • /
    • pp.19-24
    • /
    • 2012
  • 디지털방송의 데이터 서비스는 방송 통신 융합 서비스의 총아로 초기에 관련 산업계의 새로운 수익모델 창출의 기대를 받아왔지만 현재까지 대중적 인지도를 높일 킬러 서비스의 부재로 그 기대에 부응하지 못하고 있다. 검색 엔진들이 발전함에 따라 현대인들의 지적 호기심을 충족시키는 가장 일반화된 활동으로 자리매김을 하고 있는 인터넷 검색 활동은 방송프로그램 시청 중에도 활발히 발생한다는 점을 고려할 때 시청자들 사이에 대중적인 데이터 서비스로 발전할 수 있다. 이에 따라 본 논문은 시청자들의 시청 행태에 적합한 데이터 서비스의 조건을 만족하고 방송프로그램의 내용을 기반으로 검색 활동을 수행할 수 있는 MHP 기반의 검색 데이터 서비스를 제안한다. 본 검색 데이터 서비스는 검색 키워드 생성 단계와 검색 수행 단계를 나눔으로써 시청자들의 방송프로그램 시청을 최대한 저해하지 않도록 기획되었으며 방송프로그램의 시간구간 별 내용을 기반으로 검색 키워드들을 생성하도록 하여 방송프로그램과의 연동성을 최대화 하였다.

멀티미디어 텍스트 데이터 검색을 위한 접근기법 연구 (A Study on Access Control of the Multimedia Text Data Retrieval)

  • 양창호;정윤기;이배호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.95-98
    • /
    • 2003
  • 컴퓨터와 통신의 급속한 발전으로 인하여 하루에도 수십 기가바이트의 정보가 매일매일 업데이트 되고 있다. 하지만 이러한 유용한 정보의 증가에도 불구하고 우리가 사용의 어려움과 검색시간이 길어진다면 엄청난 정보의 낭비를 초래할 것이다. 멀티미디어 정보에 대한 접근을 데이터의 특성상 매우 신속해야 하므로 검색시간 또한 최소화되어야 한다. 하지만 대용량의 멀티미디어 데이터베이스에서 데이터 접근은 막대한 시간을 낭비할 소지가 다분하다. 멀티미디어 데이터 접근은 데이터베이스를 구성하는 여러 미디어에 대해 생성되는 메타데이터에 기본을 둔다. 또한 사용되는 인덱스 구조는 미디어, 메타데이터, 질의 형식에 기반을 두고 생성된다. 즉 인덱싱의 기법에 따라 탁월한 검색성능의 향상을 보일 수 있다. 본 논문에서는 멀티미디어 데이터 중 텍스트 데이터 접근에 이용 가능한 여러 가지 인덱싱 기법들을 살펴보고 그에 따른 적용방법들을 제안한다.

  • PDF

MPEG-7 기반의 의료영상 검색시스템 개발 (Developing a Medical Image Retrieval System Based on MPEG-7)

  • 주경수;고영승
    • 한국멀티미디어학회논문지
    • /
    • 제8권8호
    • /
    • pp.1032-1041
    • /
    • 2005
  • 현재 병원에서 사용 중인 PACS나 의료영상을 공유하기 위한 시스템들은 원하는 이미지를 검색할 때 환자에 대한 정보 등의 상위-레벨 메타데이터만을 사용한다. 이러한 검색은 환자에 대한 정화한 정보를 알고 있어야 검색이 가능하다는 단점이 있다. 의료영상 검색을 좀 더 효율적으로 수행하기 위하여 본 논문에서 개발한 시스템에는 현재 사용되고 있는 DICOM 기반의 상위-레벨 메타데이터들을 이용한 키워드 검색기능 이외에도 MPEG-7 기반의 하위-레벨 메타데이터들을 이용한 유사성 검색을 추가하였다. 그리고 두 가지 메타데이터들을 통합한 것을 검색조건으로 이용함으로써 보다 다양한 방법으로 의료영상 검색을 수행 할 수 있도록 하였다.

  • PDF

BERT Sparse: BERT를 활용한 키워드 기반 실시간 문서 검색 (BERT Sparse: Keyword-based Document Retrieval using BERT in Real time)

  • 김영민;임승영;유인국;박소윤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2020
  • 문서 검색은 오래 연구되어 온 자연어 처리의 중요한 분야 중 하나이다. 기존의 키워드 기반 검색 알고리즘 중 하나인 BM25는 성능에 명확한 한계가 있고, 딥러닝을 활용한 의미 기반 검색 알고리즘의 경우 문서가 압축되어 벡터로 변환되는 과정에서 정보의 손실이 생기는 문제가 있다. 이에 우리는 BERT Sparse라는 새로운 문서 검색 모델을 제안한다. BERT Sparse는 쿼리에 포함된 키워드를 활용하여 문서를 매칭하지만, 문서를 인코딩할 때는 BERT를 활용하여 쿼리의 문맥과 의미까지 반영할 수 있도록 고안하여, 기존 키워드 기반 검색 알고리즘의 한계를 극복하고자 하였다. BERT Sparse의 검색 속도는 BM25와 같은 키워드 기반 모델과 유사하여 실시간 서비스가 가능한 수준이며, 성능은 Recall@5 기준 93.87%로, BM25 알고리즘 검색 성능 대비 19% 뛰어나다. 최종적으로 BERT Sparse를 MRC 모델과 결합하여 open domain QA환경에서도 F1 score 81.87%를 얻었다.

  • PDF

시멘틱 웹 환경에서의 개인화 검색 (Personalized Search Service in Semantic Web)

  • 김제민;박영택
    • 정보처리학회논문지B
    • /
    • 제13B권5호
    • /
    • pp.533-540
    • /
    • 2006
  • 웹에 분산된 모든 윈 페이지는 구조가 서로 다르다. 시멘틱 웹 환경은 이형적인 구조를 갖는 웹 페이지들의 메타데이터 바탕으로 시멘틱 검색이 가능하다. 그러나 일반적으로 사용자의 요구에 따른 시멘틱 김색은 상황에 따라 엄청난 수의 검색 결과를 내놓는다. 따라서 검색 결과에 대해 각 사용자에 맞는 검색 결과 순위를 적용할 필요가 있다. Culture Finder는 시멘틱 웹 검색 에이전트들이 개인화 된 문화 정보를 검색할 수 있도록 도움을 준다. Culture Finder는 웹에 존재하는 각 웹 페이지에 대한 메타 데이터를 작성하고, 시멘틱 검색을 이행하며 사용자 프로파일을 기반으로 삼아 검색 결과에 대한 순위 점수를 계산한다. Culture Finder에는 개인화 된 시멘틱 검색을 효율적으로 실행하기 위해 중요한 5가지 기법이 적용되었다. 사용자의 검색 행위로부터 사용자 프로파일을 생성하기 위한 기계 학습기법, 시멘틱 웹 검색 에이전트를 위한 효율적인 시멘틱 검색 기법, 사용자 질의의 효과적인 파악을 위한 질의 분석 기법, 각 사용자에게 적합한 검색 결과를 제공하기 위한 순위 적용 기술, 메타데이터를 생성하기 위한 상위 온톨로지 표현 방법, 본 논문에서는 Culture Finder의 구조를 통해서 시멘틱 개인화 검색에 대한 기법을 제안한다.

얼굴에 의한 질의' 환경을 위한 검색 시스템 (Retrieval System for Query-by-face environment)

  • 고병철;안준한;이해성;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.356-358
    • /
    • 1999
  • 최근 몇 년 동안 멀티미디어 정보의 급격한 증가와 더불어, 사용자에게 다양한 형태의 검색 환경 제공하기 위한 연구들이 꾸준히 이루어지고 있지만, '얼굴에 의한 질의(Query-by-face)'에 대한 연구는 다른 검색 방법에 비해 상대적으로 미약한 편이다. 얼굴 검색은 일반적인 내용기반 검색 분야에 비해 어려운 분야로 현재 대부분의 얼굴 인식 및 검색 시스템들은 일정한 배경 및 조명, 동일한 얼굴 크기를 갖는 한정된 형태의 데이터만을 사용한다. 본 논문에서는 영화 비디오로부터 추출된 대표 프레임 중 사용자가 원하는 등장 인물을 찾기 위한 기술 개발을 위해 비디오 영상으로부터 얼굴을 검출하고 인식하는 방법을 제안한다. 기존의 방법들은 실험 영상이 제한되어 있다거나 인식의 정확성을 위해 몇 개의 부수적인 얼굴 데이터를 별도로 보관해야만 했지만 본 논문에서는 배경과 두드러진 특징을 갖는 얼굴 색을 이용하여 얼굴 영역 검출 속도를 향상시키고, 웨이블릿 변환과 하우스돌프 거리(Haudorff distance)를 이용하여 별도의 데이터가 필요없이 얼굴을 인식이 가능한 시스템을 설계하였다. 또한, 영화 비디오 및 뉴스, 인터뷰 비디오 등 다양한 형태의 배경 및 조명, 크기 변화를 갖는 데이터에 대한 실험결과를 통해 본 논문에서 제안하는 방법에 대한 성능 평가 실시하였다.

  • PDF

디지털 음악정보 검색 시스템의 설계 (Design of a Retrieval System for Digital Music Information)

  • 지정규;오해석
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1997년도 International Conference MULTIMEDIA DATABASES on INTERNET
    • /
    • pp.425-437
    • /
    • 1997
  • 본 논문은 디지털 도서관에서 임의의 음악정보를 효율적으로 검색하기 위한 시스템을 제안한다. 종래의 전형적인 음악정보 검색 항목인 제목이나 작곡자 또는 주제를 입력하는 것이 아니라, 사용자가 음악 데이터베이스로부터 검색하고자 하는 음악의 일부를 마이크를 통해서 노래한다. 그러면 입력된 선율에 대한 음 신호를 처리하여 음표정보를 인식하고, 이를 바탕으로 음정곡선을 생성하여 이를 탐색 패턴으로 사용한다. 동요를 대상으로 하여 음악 데이터베이스를 생성할 때는 각각의 곡에서 추출한 음정곡선을 이용하여 색인과 메타 데이터를 생성하는데, 색인은 유사 탐색을 용이하게 하기 위해서 Trie 구조를 사용한다. 탐색패턴을 이용해서 메타 데이터를 탐색할 때는 동적 프로그래밍 방법을 이용하여 유사 탐색을 함으로써 노래의 어느 마리를 부르더라도 쉽게 후보곡을 검색할 수 있도록 한다. 통상음악의 첫째 동기를 부르는 경우가 많기 때문에 첫째 악절로 구성한 색인을 먼저 탐색토록하고, 색인에서 탐색을 실패한 경우(음악의 첫째 동기 이후를 부른 경우)에 메타 데이터를 이용한 유사 음표열 탐색을 하도록 하여 효율적인 검색이 되도록 하였다.

  • PDF