• 제목/요약/키워드: 분류별 검색

검색결과 310건 처리시간 0.037초

개인화 검색시스템 평가에 관한 연구 (A Study of Personalized Retrieval System Evaluation)

  • 김광영;최호섭;진두석;김진숙
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.39-42
    • /
    • 2010
  • 본 논문에서는 주제별 분류기반의 개인화 검색시스템의 평가를 위해서 기존의 한글 정보 검색시스템 평가를 위해서 사용하는 한글 테스트 컬렉션(HANTEC v2.0)을 사용하였다. 주제별 분류기반의 개인화 검색 시스템의 평가를 위해서 첫째, 한글 테스트 컬렉션을 한국일보-40075 문서분류 테스트 컬렉션을 이용하여 주제별 분류를 수행 하였다. 둘째, 한국일보-40075 문서분류 테스트 컬렉션의 분류 체계에 다라 한글 테스트 컬렉션의 문서들을 kNN 분류기를 이용하여 분류를 수행하였다. 마지막으로 구축된 컬렉션을 이용하여 주제별 분류기반의 개인화 검색시스템의 성능 평가를 수행하였다.

  • PDF

효율적인 데이터 관리를 위한 내용기반 뉴스 비디오 검색 시스템 구현 (Implementation of Content-based News Video Retrieval System for Efficient Video Data Management)

  • 남윤성;양동일;배종식;최형진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.755-758
    • /
    • 2005
  • 뉴스 데이터를 구조적으로 분할하고 의미적으로 분류하여 내용별로 세분화하여 검색하는 방법을 제안한다. 구조적 분할은 공간 밝기 분포와 명암도의 불연속성 그리고 시간적인 관계 등 프레임간의 상관 정보를 이용하여 장면을 분할한다. 의미적 분류는 키 프레임에서 추출된 특징 정보를 사전 지식 정보와 비교하여 뉴스 비디오의 세부 내용을 기사별로 분류한다. 뉴스의 진행이 앵커 프레임을 중심으로 주기적으로 반복된다는 특징을 이용하여 앵커 장면과 비 앵커 장면으로 기사를 분류한다. 비 앵커 장면은 연설장면, 인터뷰장면, 일반 장면으로 세분화하고 기사별로 분류하여 검색하도록 한다. 또한 뉴스 아이콘에 의한 요약 검색 기능 그리고 자막 통합 처리에 의한 자막 검색을 하여 뉴스 비디오를 내용별로 분류하고 인덱싱하여 신속하게 뉴스 비디오를 검색할 수 있도록 설계한다.

  • PDF

색깔과 질감을 이용한 영역별 영상 검색 (Regional Image Retrieval by using Color and Texture)

  • 곽정원;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2000년도 정기총회 및 학술대회
    • /
    • pp.137-142
    • /
    • 2000
  • 많은 정보를 포함하고 있는 영상 자료에서 빠른 검색과 분류를 위해서 색깔이나 질감 등의 특징을 나타내는 기술자가 필요하다. 또한 한 영상 안에서도 각 영역별로 다른 특징을 나타내고 있기 때문에 영역별 검색과 분류를 위한 영역 단위의 특징 추출이 중요하다. 본 논문에서는 색깔 특징으로 영역화된 영상의 각 영역에서 색깔 특징 벡터와 질감 특징 벡터를 추출하고 추출된 특징 벡터를 다른 영역에서 추출된 특징 벡터와의 거리를 이용하여 비슷한 특징을 보이는 영역을 검색한다. 기존의 전체 영상의 색깔이나 질감 어느 하나만을 이용한 검색과 달리 이러한 특징을 공간적 위치와 색깔, 질감을 조합하여 검색함으로써 보다 만족스러운 검색 결과를 얻을 수 있다.

  • PDF

토픽모델링과 주성분 분석을 활용한 온라인 쇼핑 검색 질의 유형 분류 (A Study on the Types of Online Shopping Queries using Topic Modeling and Principal Components Analysis)

  • 강현아;임희석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.765-768
    • /
    • 2020
  • 검색 질의 연구 분야의 대부분 선행 연구는 검색 질의 주제 분류에 집중되어 있으며 질의 자체에 대한 연구자의 정성적인 판단으로 분석되었다. 이는 검색 이후 클릭 된 문서를 고려하지 않고 진행되었다는 점과 분석 주제 및 활용 데이터가 제한적이라는 것에 한계가 있다. 이에 본 연구는 국내 대형 온라인쇼핑몰의 1년간의 검색로그를 활용하여 검색 질의와 검색 이후 조회한 문서명 정보를 기반으로 토픽모델링을 수행하여 검색 질의 주제를 정의하였다. 또한 검색 행동특성에 따른 주제별 성격을 정의하기 위하여 주성분 분석을 통해 주요 변수 추출 후 각 주제별 검색 행동특성을 분석하였다. 본 연구 결과는 효과적인 검색 서비스 구축 및 검색 시스템 개발에 기여 할 것으로 기대된다. 향후 연구로는 텍스트 분류기 모델링 실험을 통해 자동 분류 시스템을 구현할 수 있을 것이다.

초등학생용 주제별 검색을 위한 효율적인 카테고리 분류 방법 (A Study on the Classification Scheme for the Design of Directory Kids Search Engines)

  • 정부현;김갑수
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2004년도 하계학술대회
    • /
    • pp.577-586
    • /
    • 2004
  • 인터넷을 통해 전달되는 교육자료의 양은 나날이 증가하고 있지만 정보 생산자들이 일정한 표준 없이 자의적인 기준에 의해 정보를 분류하여 구성하기 때문에 이용자가 필요한 정보를 정확하게 찾아내기란 매우 어려운 실정이다. 따라서 털 연구는 국내 주제별 검색엔진인 Yahoo Korea와 Naver, Hanmir, Empas의 초등학생용 검색엔진의 분류체계를 비교 분석하여 주제별 검색을 위한 효율적인 카테고리 분류 방법을 제시함으로써 정보접근에 익숙하지 않은 초등학생에게 쉽게, 빠르게, 정확하게 교육자료에 접근할 수 있는 분류체계를 제시하고자 한다.

  • PDF

동적분류에 의한 주제별 웹 검색엔진의 설계 및 구현 (Design and Implementation of Web Directory Engine Using Dynamic Category Hierarchy)

  • 최범기;박선;박태수;송재원;이주홍
    • 인터넷정보학회논문지
    • /
    • 제7권2호
    • /
    • pp.71-80
    • /
    • 2006
  • 웹 검색엔진의 검색방법에는 키워드검색방법과 주제별검색방법이 있다. 키워드검색은 재현율(recoil)이 높지만 검색결과가 너무 많이 나오기 때문에 원하는 검색결과를 찾는 것이 어렵다. 주제별검색 역시 찾는 문서의 해당 주제가 모호하거나 주제를 정확하게 알지 못하면 문서를 찾지 못하는 경우가 있다. 즉, 검색결과의 정확율(precision)는 높으나 재현율이 떨어진다. 본 논문은 주제별검색의 문제점을 해결하기 위해서 주제와 키워드간의 관계를 퍼지논리로 정량적으로 계산하고, 이를 바탕으로 주제간의 함의(implication)관계를 유도하여 동적인 분류체계를 구성하는 새로운 웹 검색엔진을 설계하고 구현하였다. 구현된 검색엔진은 분류간의 함의관계를 유사한 하위주제로서 간주함으로써 주제별검색 결과의 재현율을 높일 수 있다.

  • PDF

데이터베이스 표준분류 및 정보검색 표준안을 위한 기초연구

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 3호통권10호
    • /
    • pp.84-94
    • /
    • 1994
  • 센터내 DB표준화분과위원회 DB표준분류 실무작업반은 지난 93년도 하반기에 데이터베이스 표준분류를 위한 연구를 수행했다. 그간 실무작업반에서는 데이터베이스 분류에 관한 자료의 수집 및 비교분석, 데이터베이스의 제작기관, 주제분야별, 가공형태별, 표현형태별, 언어별, 가공완성도 및 갱신주기별, 검색방식별, 제공매체별, 용도별체계화 등 데이터베이스 표준분류안을 마련했는데 본지에서는 연구결과를 중심으로 그 내용을 정리, 요약한다.

  • PDF

영역별 분류체계에 기반한 EJB 컴포넌트 관리 시스템 (EJB component management systems based on the domain classification schema)

  • 염연희;서동수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.463-465
    • /
    • 2000
  • 컴포넌트 기반 개발 방법이 보급됨에 따라 개발자들은 사용 가능한 컴포넌트들로부터 필요한 컴포넌트를 선별하는데 많은 노력과 시간을 투자한다. 컴포넌트 집합을 보다 효율적으로 관리하기 위해서는 영역별로 분류하는 작업과 컴포넌트를 등록, 관리, 검색하는 작업이 필요하다. 본 논문에서는 영역별 분류를 기반으로 EJB 컴포넌트를 명세하며, 이를 등록, 검색, 관리할 수 있는 컴포넌트 관리 시스템을 구현하였다. 컴포넌트 명세는 현재 구현되어진 EJB 컴포넌트를 수용할 수 있도록 UML 기반의 명세방식으로 사용자가 필요로 하는 정보를 제공할 수 있도록 정의하였다.

  • PDF

객체 추출 및 객체별 그룹핑을 이용한 영상검색 결과의 단계적 서비스 방안 (A Scheme for Progressive Service of Retrieved Images based on Object Extraction and Grouping)

  • 박창민;김성영;김민환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.180-185
    • /
    • 2002
  • 본 논문에서는 키워드를 입력해 검색된 영상들을 유사한 특징을 갖는 소수의 그룹으로 그룹핑하고 각 그룹을 대표하는 대표영상을 추출하여 우선적으로 사용자에게 보여주고 필요에 따라 나머지 영상들을 단계적으로 서비스할 수 있는 방안을 제시한다. 영상 그룹핑을 위한 각 영상의 특징은 영상에 포함된 중심 객체를 사용하여 추출한다. 이를 위해 검색 키워드는 객체와 연관성이 있는 단어로 제한하여 영상을 검색하며 검색된 영상으로부터 중심 객체를 추출할 수 있는 객체 추출 방법을 활용하였다. 각 영상으로부터 추출된 중심 객체에 대한 특징 벡터는 칼라 분포를 이용한다. 영상 그룹핑은 칼라분포로 표현되는 특징공간에서의 밀집도를 조사하여 높은 밀도로 모여있는 영역별로 추출하여 동일한 그룹으로 분류하였다. 대표 영상은 분류된 그룹에서 가장 밀집도가 높은 영상으로 선택된다. 한편, 얼굴이 포함된 영상은 사전에 따로 분류하고 얼굴 크기 및 얼굴 수에 따라 영상을 그룹핑하여 각 그룹에 대한 대표 영상을 선정한다. 본 연구에서 제안한 방법은 사용자에게 모든 검색 결과를 일괄적으로 보여주는 것에 비해 보다 빠른 시간 내에 사용자가 원하는 영상을 편리하면서도 효과적으로 확인할 수 있는 방법을 제공해 줄 수 있을 것으로 기대한다.

  • PDF

사용자 검색 의도 추출을 위한 검색로그 분석 (Search Log Analysis for Extract User's Search Intention)

  • 지혜성;류기곤;임희석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.376-379
    • /
    • 2011
  • 본 연구에서는 사용자 검색로그를 분석하여 사용자의 검색 목적에 따라 분류하고 그 안에 내제되어 있는 사용자의 검색 의도를 찾고자 하였다. 분석은 질의어 110개에 대한 검색로그를 기반으로 검색 목적에 따라 Navigational, Informational, Transactional로 분류하였다. 또한, 질의어를 카테고리별로 분류하였으며 각 결과를 가지고 사용자 검색 의도가 내제되었는지에 대하여 분석하였다. 분석 결과 각 질의어에 따른 검색 목적에 따라서 분포는 다르지만 검색 목적에 따른 검색 의도가 3가지 모두 내제되어 있음을 알 수 있었다. 또한, Informational의 경우에는 질의어에 대한 서로 다른 정보가 나타났으며, 질의어 안에서 사용자의 검색 의도가 나타남을 확인할 수 있었다.