• 제목/요약/키워드: 검색기

검색결과 1,064건 처리시간 0.033초

토픽모델링과 주성분 분석을 활용한 온라인 쇼핑 검색 질의 유형 분류 (A Study on the Types of Online Shopping Queries using Topic Modeling and Principal Components Analysis)

  • 강현아;임희석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.765-768
    • /
    • 2020
  • 검색 질의 연구 분야의 대부분 선행 연구는 검색 질의 주제 분류에 집중되어 있으며 질의 자체에 대한 연구자의 정성적인 판단으로 분석되었다. 이는 검색 이후 클릭 된 문서를 고려하지 않고 진행되었다는 점과 분석 주제 및 활용 데이터가 제한적이라는 것에 한계가 있다. 이에 본 연구는 국내 대형 온라인쇼핑몰의 1년간의 검색로그를 활용하여 검색 질의와 검색 이후 조회한 문서명 정보를 기반으로 토픽모델링을 수행하여 검색 질의 주제를 정의하였다. 또한 검색 행동특성에 따른 주제별 성격을 정의하기 위하여 주성분 분석을 통해 주요 변수 추출 후 각 주제별 검색 행동특성을 분석하였다. 본 연구 결과는 효과적인 검색 서비스 구축 및 검색 시스템 개발에 기여 할 것으로 기대된다. 향후 연구로는 텍스트 분류기 모델링 실험을 통해 자동 분류 시스템을 구현할 수 있을 것이다.

이미지 검색기를 통한 랜드마크 인식 (Landmark recognition through image searcher)

  • 김기덕;이근후
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.313-315
    • /
    • 2024
  • 본 논문에서는 이미지 검색기를 통한 랜드마크 인식 방법을 제안한다. 특정 랜드마크 데이터세트에서 라벨링을 하지 않은 비지도 학습을 통해서 이미지에서 랜드마크의 클래스 분류를 위한 특징을 추출한다. 학습된 모델을 랜드마크 데이터세트인 Paris6k 데이터세트와 Oxford5k 데이터세트에 적용하여 랜드마크 인식 정확도를 확인하였다. 성능과 속도를 강화하기 위해 이미지 특징 추출 모델로 ResNet 대신에 YOLO에서 사용된 CSPDarknet-53을 사용하여 모델의 크기를 줄이고 랜드마크 인식 정확도를 높였다. 그리고 모델로부터 추출된 특징의 수를 줄여 이미지 검색 시 소요되는 시간을 감소시켰다. 학습된 모델로 rOxford5k 데이터 세트에 적용 시 mAP 80.37, rParis6k에서 mAP 89.07을 얻었다.

  • PDF

메타데이터 정보를 이용한 분산 KRISTAL-2002 시스템의 통합 검색 시스템 개발 (Development of an Integrated Retrieval System on Distributed KRISTAL-2002 Systems with Metadata Information)

  • 최귀자;김재곤;서정현;조한형;이민호;정창후;박동인;남영광
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.135-150
    • /
    • 2005
  • 본 논문에서는 메타데이터fmf 이용하여 분산된 KRISTAL-2002 기반의 시스템을 통합 검색하는 정보검색시스템의 구현 방법을 제안한다. 이 시스템은 서로 다른 분야에서 사용되고 있는 기개발된 정보검색시스템을 통한 검색하거나, 같은 분야의 시스템이라도 스키마가 다를 경우에 이를 사용자가 마치 하나의 시스템에서 검색하는 것과 같은 통합검색을 수행할 수 있도록 해준다. 본 시스템은 통합메타데이터베이스와 원천서버간의 스키마 매핑을 지원하는 원천서버관리기, 메타데이터를 등록하고 원천서버의 정보와 통합 메타데이터간의 매핑을 관리하고 지원하는 통합메타데이터 관리기, 통합검색을 위한 사용자 신의를 각 원천서버에 적합한 질의로 생성하여 처리하는 분산질의 처리기, 검색된 결과를 통합하여 사용자 화면으로 출력하기 위해 HTML 문서로 변환하는 분산 데이터 셋 관리기, 그리고 통합검색을 위한 통합검색 엔진으로 구성되어 있다. 통합메타데이터는 본 시스템의 일부분인 메타데이터 등록기를 이용하여 ISO/IEC 11179에서 정의된 표준화된 절차고 등록되었다고 가정하여 사용하였다. 사용자는 하나의 통합시스템에서 검색하는 것과 같이 통합검색 화면에서 검색대상 시스템을 선정하고 기본검색과 상세검색을 수행하며, 분야별 혹은 기관별로 검색하고 결과를 볼 수 있도록 하였다. 본 시스템은 KRISTAL-2002 시스템을 기반으로 Visual C++와 C++ CGI를 이용하여 리눅스 상에서 개발되었으며 6개의 서로 다른 데이터베이스fmf 이용하여 실험, 검증하였다.

증강된 질문을 이용한 RoBERTa 기반 Dense Passage Retrieval (Dense Retrieval using Pretrained RoBERTa with Augmented Query)

  • 박준범;홍범석;최원석;한영섭;전병기;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.141-145
    • /
    • 2022
  • 다중 문서 기반 대화 시스템에서 응답 시스템은 올바른 답변을 생성하기 위해서 여러 개의 문서 중 질문과 가장 관련 있는 문서를 검색하는 것부터 시작해야 한다. DialDoc 2022 Shared Task[1]를 비롯한 최근의 연구들은 대화 시스템의 문서 검색 과정을 위해 Dense Passage Retrieval(DPR)[2] 모델을 사용하고 있으며 검색기의 성능 개선을 위해 Re-ranking과 Hard negative sampling 같은 방법들이 연구되고 있다. 본 논문에서는 문서에 기반하는 대화 데이터의 양이 적거나 제한될 경우, 주어진 데이터를 효율적으로 활용해 보고자 검색기를 생성 모델을 이용하여 문서의 엔티티를 기반으로 질문을 생성하고 기존 데이터에 증강하는 방법을 제시했으며 실험의 결과로 MRR metric의 경우 0.96 ~ 1.56의 성능 향상을, R@1 metric의 경우 1.2 ~ 1.57의 성능 향상을 확인하였다.

  • PDF

음성 언어 자료 확보를 위한 Workbench의 설계 및 구현 (Design and implementation of workbench for spoken language data acquisition)

  • 김태환
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.375-379
    • /
    • 1998
  • 음성 언어 자료의 확보 및 활용을 위해서는 다양한 소프트웨어의 도움이 필요하다. 본 논문에서는 본 연구실에서 설계 및 개발한 PC용 Workbench에 대하여 기술한다. Workbench는 음성 언어 자료의 확보를 위한 텍스트 처리 모듈들과 음성 데이터의 처리를 위한 신호처리 모듈들로 구성되어 있다. Workbench에 포함된 모듈로는 텍스트를 자동 읽기 변환하는 철자 음운 변환기, 발성 목록 선정 모듈, 끝점 검출기를 이용한 음성 데이터 편집 모듈, 끝점 검출기를 이용한 음성 데이터 편집 모듈, 다단계 레이블링 시스템, 텍스트에서 원하는 음운 환경을 포함하고 있는 문자열을 다양한 조건으로 검색할 수 있는 음운 환경 검색기를 포함하고 있다.

  • PDF

음성 데이터베이스로부터의 효율적인 색인데이터베이스 구축과 정보검색 (The Extraction of Effective Index Database from Voice Database and Information Retrieval)

  • 박미성
    • 한국도서관정보학회지
    • /
    • 제35권3호
    • /
    • pp.271-291
    • /
    • 2004
  • 전자도서관과 같은 정보제공원은 이미지, 음성, 동영상 등과 같은 비정형 멀티미디어 데이터 서비스에 대한 요구를 받고 있다. 그리하여 본 연구에서는 음성 처리를 위해 어절생성기, 음절복원기, 형태소분석기, 교정기를 제안하였다. 제안한 음성처리 기술로 음성데이터베이스를 텍스트데이터베이스로 변환 한후 텍스트데이터베이스로부터 색인데이터베이스를 추출하였다. 그리고 추출한 색인데이터베이스로 텍스트와 음성의 내용기반정보검색에 활용할 수 있음을 보이기 위해 정보검색모델을 제안하였다.

  • PDF

높은 자릿수 나눗셈 연산기에서의 영역변환상수를 위한 검색테이블 설계 및 구현 (Design and Implementation of Lok-up Table for Pre-scaling in Very-High Radix Divider)

  • 이병석;송문식;이정아
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.3-5
    • /
    • 1999
  • 나눗셈 알고리즘은 다른 덧셈이나 곱셈 알고리즘에 비해 복잡하고, 수행 빈도수가 적다는 이유로 그동안 고속 나눗셈의 하드웨어 연구는 활발하지 않았다. 그러나 멀티미디어의 발전 및 고성능의 그래픽 랜더링을 위한 보다 빠른 부동소수점연산기(FPU)가 필요하게 되었으며, 이에 따라서 고속의 나눗셈 연산기의 필요성이 증가하게 되었다. 특히, 전체의 수행 시간 향상을 위해서라도 고속 나눗셈 연산기의 중용성은 더욱 부각되고 있다. 그러나 고속 나눗셈 연산기는 연산 속도와 크기라는 서로 상반되는 요소를 가지고 있다. 즉, 연산 속도가 빠르면 크기는 늘어나고, 크기를 줄이면 연산 속도는 늦어지게 된다. 본 논문은 높은 자릿수(Very-High Radix) 나눗셈 알고리즘에서 영역변환상수를 구하는 방법으로 연산이 아닌 검색테이블(Look-up Table)을 이용한다. 그리고 검색테이블의 크기를 줄이는 방법으로 영역변환상수의 범위 분석 및 캐리 저장형을 이용한 검색테이블 분할 방법을 이용하였다. 전체적으로는 영역변환상수를 구하는 연산주기가 필요없게 되므로 나눗셈 연산기의 영역 크기의 변화가 적으면서 연산 속도는 빨라졌음을 알 수 있다.

  • PDF

XML기반 ADL 모델 관리기 설계 및 구현 (The Design and Implementation of XML Based ADL Model Management)

  • 조용한;강미나;승현우;전태웅
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.1-3
    • /
    • 2005
  • 최근 소프트웨어 재사용과 소프트웨어의 응용범위가 넓어짐에 따라 잘 정의된 아키텍처를 기반으로 개발된 컴포넌트 소프트웨어 개발(CBD . Component-Based Development)방식의 채택이 빠르게 확산되고 있다. 이러한 컴포넌트 소프트웨어 개발 방식이 빠르게 확산되면서 아키텍처를 정확하게 기술, 분석, 정제할 수 있는 능력 또한 점차 중요시 되고 있다. 아키텍처를 정확하게 기술, 분석 정제하기 위해서는 아키텍처 기술 언어(ADL)의 사용이 필요하다. 또한 ADL로 기술된 모델 정보들을 서로 다른 ADL지원도구들이 공유할 수 있도록 ADL 모델 관리기의 개발이 필요하다. 본 논문에서는 ADL 모델 관리기의 구성요소를 기술하여. ADL 모델 정보를 XML형태로 변환하는 변환기의 변환 과정을 설명하고, XML 형태로 변환된 ADL 모델 정보들을 저장하는 저장소 구조를 각각 기술하고, 검색기의 검색 과정 및 검색 결과를 보여준다.

  • PDF

XML & 구조문서 정보 검색

  • 조영환;이상기
    • 디지털콘텐츠
    • /
    • 6호통권73호
    • /
    • pp.106-109
    • /
    • 1999
  • 한국정보검색위원회에서는 위원간의 의욕 고취와 새로운 검색 및 데이터베이스 관련기술 보급을 위해 매월 연구발표회를 개최하고 있다. 본 코너에서는 주제논문을 게재함으로써 정보검색과 관련된 정보를 제공하기 위해 마련된 것이다.

  • PDF

컨테이너 검사 효율 극대화를 위한 화질 향상 기법 연구 (A Study on Technique for Image Quality Enhancement to Maximize Container Inspection Efficiency)

  • 이창호;신지혜;김장오;정영진;민병인
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제40권4호
    • /
    • pp.639-646
    • /
    • 2017
  • 본 연구에서는 컨테이너 엑스선 검색기의 노후화, 검출 감지기(Sensor) 불량으로 발생되는 검색영상의 잡음(Noise)을 줄이기 위한 알고리즘을 제시고 MATLAB 툴박스에 이를 적용하여 컨테이너 검색영상의 화질(Image Quality)을 개선하고자 하였다. 검색영상은 일반적인 컨테이너 검색기 작동 점검을 위한 일일 점검영상을 활용하였으며 일일점검영상의 수평 영상과 수직 영상을 기준으로 잡음(Noise)을 디지털 방사선 영상에서 가장 기본으로 사용되는 잡음평가 방법인 제곱평균제곱근(Root Mean Square; RMS)으로 평가하였다. 또한 개선된 알고리즘을 실제 컨테이너검색영상에 적용하여 일일 점검영상과 실제 컨테이너 검색영상의 화질을 평가하였다. 그 결과 제곱평균제곱근이 일일 점검영상에서는 수평 영상에서 원본 영상 대비 평균 13.5%, 수직 영상에서는 원본 영상 대비 평균 18.2% 가 낮은 결과치를 나타내었다. 또한 실제 컨테이너 검색영상에서는 수평 영상에서 원본 영상 대비 평균 13.4%, 수직 영상에서는 원본 영상 대비 19.1%가 낮은 결과치를 나타내었다. 이는 영상의 화질개선을 객관적, 시각적으로 확인할 수 있었으며 관세청의 컨테이너 검색영상 판독 업무에 큰 도움이 될 것이라 사료된다.