• 제목/요약/키워드: 분류검색

검색결과 1,722건 처리시간 0.026초

키워드 중심 학술정보서비스 개선 연구 - NDSL 추천 및 분류를 중심으로 - (An Improvement study in Keyword-centralized academic information service - Based on Recommendation and Classification in NDSL -)

  • 김선겸;김완종;이태석;배수영
    • 한국도서관정보학회지
    • /
    • 제49권4호
    • /
    • pp.265-294
    • /
    • 2018
  • 최근 정보의 폭발적인 증가로 인해 사용자에게 적합한 정보를 제공하기 위한 정보의 필터링이 매우 중요시 되고 있다. 한국과학기술정보연구원에서 운영하고 있는 학술정보서비스인 NDSL은 방대한 자료를 보유함에도 불구하고 사용자들은 검색 외에 자료 획득이 쉽지가 않다. 본 논문은 사용자에게 적합한 정보를 제공하기 위하여 키워드 특성을 활용한 서비스인 PIN(Profiling service In NDSL)을 제안한다. PIN은 키워드만을 가지고 검색하는 것이 아닌 사용자 본인 및 유사 사용자가 등록한 관심 키워드, 동시이용 키워드, 검색 키워드로 분석된 워드 클라우드를 제공하고 이를 통하여 사용자에게 맞춤형 논문, 보고서, 특허, 동향의 콘텐츠를 추천한다. 또한 콘텐츠를 보다 쉽게 접근하기 위하여 중복분류가 가능한 학술연구분류체계 기반 분류를 제공한다. 이를 검증하기 위해 NDSL의 축적된 2016년도의 국내논문의 데이터를 기반으로 분류별로 키워드를 추출하고 이를 통해 매칭 기반의 분류 모델을 만든 후 트레이닝 및 테스트를 거쳐 결과를 도출한다.

공공도서관 영유아실 자료조직 실태분석에 관한 연구: J시 시립도서관의 배가를 중심으로 (A Study on Resource Organization in Infants & Young Children's Sections in Public Libraries: Focusing on the Arrangement of Library Materials in J City's Municipal Libraries)

  • 형은영;김수정
    • 정보관리학회지
    • /
    • 제33권3호
    • /
    • pp.85-106
    • /
    • 2016
  • 본 연구는 영유아 도서의 자료조직 실태를 파악하기 위하여 J시에 소재한 8개 시립도서관 영유아실을 대상으로 자료조직 현황과 문제점을 분석하고 이를 토대로 개선방안을 제시하였다. 조사방법은 분석대상 도서관의 어린이실 담당 사서 8명, 영유아실을 방문한 부모 25명을 대상으로 인터뷰를 실시하였다. 조사 결과, 모든 도서관에서 KDC를 적용하여 분류하고 있었으나 배가는 분류체계와는 달리 출판사명의 자모순 배가를 실시하고 있었다. 이러한 출판사별 배가 방식은 사서 측면에서는 정리의 편리성이 높은 것으로 평가되었으나 이용자들은 분류체계와 배가의 이원화로 인해 자료 검색의 어려움을 겪고 있는 것으로 조사되었다. 또한, 온라인검색목록시스템의 검색 결과에 도서 위치에 대한 정확하고 충분한 정보가 제공되지 않는 경우가 많았다. 이러한 결과를 바탕으로 본 연구는 (1) KDC를 유지하되 배가 방식을 청구기호 순으로 전환하는 방안과 (2) 새로운 영유아용 분류표를 개발하는 두 가지 개선방안을 제안하였다.

한글문서 분류용으로 이용할 복합어로 구성된 분야연상어의 추출법 (An Extraction Algorithm of Compound Field-associated Terms for Korean Document Classifications)

  • 이상곤
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권7호
    • /
    • pp.636-649
    • /
    • 2005
  • 분야연상어는 어휘자체가 분야정보를 가지므로 인간이 분야를 인지할 때와 유사하게 문서의 분야를 판단한다. 한국어의 경우 180분야로 분류된 약 IS,000개의 문서뱅크를 수집하여 구축 $\cdot$실험한 결과 88,782개의 단일 분야연상어가 8,405개로 전체의 약 9$\%$로 압축되며, 재현율 0.77 이상(평균 0.85), 정확률 0.90 이상(평균 0.94)의 높은 추출 정밀도를 얻었다. 구축한 분야연상어를 문서분류의 초기결정에 적용하여 인간에 의한 분야결정과 비교한 결과 약 90$\%$이상의 정답률을 얻었다. 연구결과를 문서분류의 초기단계에 관한 기초연구로 이용하고, 다언어(multilingual) 간의 문서검색에 적용하여 다국어 정보검색에 대한 기초 연구로 이용할 수 있다.

A motion classification and retrieval system in baseball sports video using Convolutional Neural Network model

  • Park, Jun-Young;Kim, Jae-Seung;Woo, Yong-Tae
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권8호
    • /
    • pp.31-37
    • /
    • 2021
  • 본 연구에서는 CNN(Convolution Neural Network) 모델을 이용하여 야구 경기 영상에서 투구나 스윙과 같은 특정 영상이 출현하는 장면을 자동으로 분류하여 효과적으로 검색하는 방법을 제안한다. 또한, 특정 동작의 분류 결과와 경기 기록을 연계한 영상 장면 검색시스템을 제안한다. 제안 시스템의 효율성을 검정하기 위하여 2018년부터 2019년까지 진행된 한국프로야구 경기 영상을 대상으로 특정 장면별로 분류하는 실험을 진행하였다. 야구 경기 영상에서 투구 장면을 분류하는 실험에서는 경기별로 약 90%의 정확도를 보였다. 그리고 경기 영상 내에 포함된 스코어보드를 추출하여 경기 기록과 연계하는 영상 장면 검색 실험에서는 경기별로 약 80% 정도의 정확도를 보였다. 본 연구 결과는 한국프로야구 경기에서 과거 경기 영상을 체계적으로 분석하여 경기력 향상을 위한 전략 수립을 위하여 효과적으로 사용할 수 있으리라 기대한다.

딥 러닝 기반의 전이 학습을 이용한 이미지 분류에 관한 연구 ( A Study on Image Classification using Deep Learning-Based Transfer Learning)

  • 서정희
    • 한국전자통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.413-420
    • /
    • 2023
  • 오래전부터 연구자들은 CBIR에 대한 많은 연구로 인해 이미지 검색 분야에 우수한 결과를 제시하였다. 그러나 이미지에 대한 이러한 검색 결과와 사람이 인식하는 결과 사이에 의미적 격차는 여전히 존재한다. 적은 수의 이미지를 사용하여 사람이 인식하는 수준의 이미지를 분류하는 것은 아직까지 어려운 문제이다. 따라서 본 논문은 이미지 검색에서 사람과 검색 시스템의 이미지의 의미적 격차를 최소화하기 위해 딥 러닝 기반의 전이 학습을 이용한 이미지 분류 모델을 제안한다. 실험 결과, 학습 모델의 손실률은 0.2451%, 정확도는 0.8922%로 제안한 이미지 분류 방법의 구현은 원하는 목표를 달성할 수 있었다. 그리고 딥 러닝에서 CNN의 전이 학습 모델 방법이 새로운 데이터를 추가하여 이미지 데이터베이스를 구축하는데 효과적인 결과를 확인할 수 있었다.

감정요소를 사용한 정보검색에 관한 연구 (A Study of using Emotional Features for Information Retrieval Systems)

  • 김명관;박영택
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.579-586
    • /
    • 2003
  • 감정요소를 사용한 정보검색시스템은 감정에 기반한 정보검색을 수행하기 위하여 감정시소러스를 구성하였으며 이를 사용한 감정요소추출기를 구현하였다. 감정요소추출기는 기본 5가지 감정 요소를 해당 문서에서 추출하여 문서를 벡터화시킨다. 벡터화시킨 문서들은 k-nearest neighbor, 단순 베이지안 및 상관계수기법을 사용한 2단계 투표방식을 통해 학습하고 분류하였다. 실험결과 분류 방식과 K-means를 이용한 클러스터링에서 감정요소에 기반한 방식이 더 우수하다는 결과와 5,000 단어 미만의 문서 검색에 감정기반 검색이 유리하다는 것을 보였다.

Wavelet 변환 영역에서 칼라 정보와 GLCM 및 방향성을 이용한 영상 검색 (Image Retrieval Using Color feature and GLCM and Direction in Wavelet Transform Domain)

  • 이정봉
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 춘계종합학술대회
    • /
    • pp.585-589
    • /
    • 2002
  • 본 논문에서는 효과적인 특징 추출을 기반으로 한 계층적인 검색 시스템을 제안한다. 조명 변화 및 영상의 이동과 크기 변화 그리고 회전과 같은 기하학적 변형에도 강한 속성을 가지는 영상 검색을 할 수 있도록 사용자의 질의 영상을 웨이블릿(Wavelet) 변환을 한 후 동일한 크기의 부영역으로 나누어진 저대역 부밴드에서 칼라의 특징으로 추출된 모멘트와 질감 특징인 GLCM(Gray Level Co-occurrence Matrix)의 Contrast를 사용해 유사 영상들의 1차 분류 과정을 거친다. 보다 정확한 검색을 수행하기 위해 1차 분류된 후보 영상들에 대해 고대역 부밴드에서 추출된 수평, 수직, 대각선 방향별 에너지(Energy)를 기반으로 한 에너지의 상대적인 성분 분포의 비교가 수행됨으로써 효율적인 영상 검색 결과를 보였다.

  • PDF

윤곽선 특성과 동적 시간 정합을 이용한 식물 잎 이미지 검색 기법 (A Leaf Image Retrieval Scheme based on Shape Descriptor and Dynamic Time Warping)

  • 탁윤식;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.3-5
    • /
    • 2007
  • 본 논문에서는 새로운 내용기반 이미지 검색 기법으로 식물 잎의 윤곽선에 대하여 동적 시간 정합 기법을 이용하여 유사한 이미지를 효과적으로 검색하는 방법을 제안한다. 이를 위하여 우선 식물 잎의 기준점에 대하여 잎의 가장자리를 따라 가면서 구해지는 거리의 곡선을 통하여 잎의 외형 특성을 표현하였다. 추출된 곡선 정보의 효율적인 저장과 처리를 위하여 곡선의 특성을 표현할 수 있는 퓨리에 계수(Fourier Coefficients)를 계산하고 이를 바탕으로 유사한 이미지를 계산하였다. 이런 과정에서 생기는 문제점으로는 복잡한 형태의 곡선에 대해서는 퓨리에 계수를 통하여 저장하고 복원하는 과정에서 원본 곡선의 세부적인 형태 정보를 상실하게 된다. 이러한 문제를 해결하기 위해서는 복잡한 곡선 유형에 대해서는 복원시 상실되는 정보가 최소화될 수 있는 작은 단위의 구간으로 나누고 이에 대한 퓨리에 계수를 계산하는 방법으로 다수의 퓨리에 계수 세트를 추출하는 이진 구간 분할 (Binary Range Reduction) 알고리즘을 사용하였고 질의 이미지와 저장된 이미지들을 비교하는 과정에서 검색의 정확도를 향상시키기 위하여 동적 시간 정합(Dynamic Time Warping) 알고리즘을 사용하였다. 그리고 검색의 효율을 더욱 높이기 위하여 추출된 외형 정보를 기반으로 잎의 유형을 다양한 카테고리로 분류하는 외형 기형 기반의 잎 분류 기법을 제안하였다. 다양한 실험을 통하여 제안한 기법이 식물 잎 검색에 우수한 성능을 나타냄을 보인다.

설계 패턴 기반 컴포넌트 분류와 E-SARM을 이용한 검색 (Design Pattern Base4 Component Classification and Retrieval using E-SARM)

  • 김귀정;한정수;송영재
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1133-1142
    • /
    • 2004
  • 본 연구에서는 성공적인 컴포넌트의 재사용을 위하여 도메인 지향(domain orientation) 개념을 도입하여 컴포넌트들을 저장소에 분류, 검색하는 방법을 제안한다. 설계 시 디자인 패턴이 적용된 기존 시스템의 컴포넌트를 대상으로, 해당 도메인 내에 있는 각 컴포넌트와 기준패턴과의 구조적 유사성을 비교함으로서 컴포넌트를 분류하는 방법을 제시하였다. 재사용 가능한 컴포넌트를 기능별로 분할하고 그 구조를 다이어그램으로 제공함으로서 컴포넌트의 재사용 및 플랫폼간의 이식성을 높일 수 있다. 또한 E-SARM 알고리즘을 이용하여 질의와 가장 적합한 컴포넌트와 그와 유사한 후보 컴포넌트들이 우선순위(priority order)로 제공됨으로서 컴포넌트 재사용 효율을 높여줄 수 있도록 하였다.

웹 로봇 에이전트의 효율적인 인터넷 정보검색 (Efficient Information Retrieval of A Web Robot Agent on the Internet)

  • 김동범;곽병정;김연옥;오용철;이재영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.574-576
    • /
    • 2002
  • 인터넷상에서의 정보검색은 검색엔진을 이용하여 이루어지는데, 방대한 사이트들을 검색하여야 하므로 검색효율이나 검색된 정보의 유용성에 문제가 있게 된다. 만약 이러한 정보들을 미리 자동적으로 검색, 분류해서 저장한다면 위의 두 가지 문제들을 해결할 수 있을 것이다. 자동적으로 이런 일을 처리하도록 고안된 것이 웹 로봇 에이전트라고 하며 현재국내에도 여러 개의 웹 로봇 에이전트를 이용한 검색엔진이 사용되고 있다. 본 논문에서는 검색엔진을 구현하기 위해 하이퍼텍스트 전송규약에 대한 연구와 웹 로봇 에이전트에 대한 연구를 하여 올바른 로봇 에이전트를 구현하여, 구현된 검색엔진을 통한 효율적인 정보검색을 실현하는데 목적이 있다.

  • PDF