• 제목/요약/키워드: online information retrieval

검색결과 122건 처리시간 0.024초

인터넷 서점의 주제별 분류체계 설계에 관한 연구 (A Study on a Design of Subject Classification Schemes for Internet Bookstores)

  • 정연경
    • 한국문헌정보학회지
    • /
    • 제35권3호
    • /
    • pp.17-34
    • /
    • 2001
  • 인터넷 서점에서 이용자를 위한 정보자료의 효율적인 조직화는 매우 중요하다. 그러므로 주제접근을 용이하게 하고 검색 효율성을 높이는 도구로서 분류체계에 대한 관심을 가져야할 시점이다. 본 연구에서는 국내외 인터넷 서점의 분류체계의 대분류 항목 및 접근 방법을 구조적 측면에서 조사하고 이에 대한 비교 분석을 통해 인터넷 서점에서 보다 효과적인 주제별 분류체계 설계 방안에 관해 살펴보았다. 이를 위하여 현재 국내외에서 활발하게 운영 중인 인터넷 서점 9개를 선정하여 주제별 분류의 측면에 중점을 두고 조사 분석하였다. 끝으로 본 연구 결과를 바탕으로 이용자 중심의 효과적인 주제별 검색 기능을 제공할 수 있는 인터넷 서점의 효과적인 주제별 분류체계의 모형을 제안하였다.

  • PDF

문서관리를 위한 자동문서범주화에 대한 이론 및 기법 (An Automatic Text Categorization Theories and Techniques for Text Management)

  • 고영중;서정연
    • 정보관리연구
    • /
    • 제33권2호
    • /
    • pp.19-32
    • /
    • 2002
  • 최근 디지털 도서관이 등장하고 인터넷이 폭 넓게 보급되어 온라인 상에서 얻을 수 있는 텍스트 정보의 양이 급증함에 따라 효율적인 정보 관리 및 검색이 요구되고 있다. 자동 문서 범주화란 문서의 내용에 기반하여 미리 정의되어 있는 범주에 문서를 자동으로 할당하는 작업으로써 효율적인 정보 관리 및 검색을 가능하게 하는 동시에 방대한 양의 수작업을 감소시키는데 그 목적이 있다. 문서 분류를 위해서는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고, 이러한 자질들을 통해 분류할 문서를 색인 과정을 통해 표현한다. 또한, 문서 분류기를 통해 문서를 목적에 맞게 분류한다. 본 논문에서는 자동 문서 범주화를 수행하기 위한 각 단계를 소개하고 각 수행 단계에서 사용되는 여러 가지 기법들을 소개하고자 한다.

비정형 패션 이미지 검색을 위한 MASK R-CNN 선형처리 기반 CNN 분류 학습모델 구현 (Implementation of CNN-based Classification Training Model for Unstructured Fashion Image Retrieval using Preprocessing with MASK R-CNN)

  • 조승아;이하영;장혜림;김규리;이현지;손봉기;이재호
    • 한국산업정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.13-23
    • /
    • 2022
  • 본 논문에서는 패션 분야의 비정형 데이터 검색을 위한 패션 아이템별 세부 컨포넌트 이미지 분류 알고리즘을 제안한다. 코로나-19 환경으로 인하여 최근 AI 기반 쇼핑몰이 증가하는 추세이다. 하지만 기존의 키워드 검색과 사용자 서핑 행위 기반 개인 맞춤형 스타일 추천으로는 정확한 비정형 데이터 검색에는 한계가 있다. 본 연구는 다양한 온라인 쇼핑 사이트에서 크롤링한 이미지를 사용하여 Mask R-CNN을 활용한 전처리를 진행한 후, CNN을 통해 패션 아이템별 컴포넌트에 대한 분류를 진행하였다. 셔츠의 카라 및 패턴과 청바지의 핏, 워싱 및 컬러에 대한 분류를 진행하였으며, 다양한 전이학습 모델을 비교 분석한 후 가장 높은 정확도가 나온 Densenet121모델을 사용하여 셔츠의 카라는 93.28%, 셔츠의 패턴은 98.10%의 정확도를 도달하였으며, 청바지의 핏은 Notched, Spread, Straight 3가지의 클래스의 경우 91.73%, Regular 핏을 추가한 4가지의 클래스의 경우 81.59%, 청바지의 색상은 93.91%, 청바지의 Washing은 91.20%, 청바지의 Demgae는 92.96%의 정확도를 도출하였다.

Jointly Image Topic and Emotion Detection using Multi-Modal Hierarchical Latent Dirichlet Allocation

  • Ding, Wanying;Zhu, Junhuan;Guo, Lifan;Hu, Xiaohua;Luo, Jiebo;Wang, Haohong
    • Journal of Multimedia Information System
    • /
    • 제1권1호
    • /
    • pp.55-67
    • /
    • 2014
  • Image topic and emotion analysis is an important component of online image retrieval, which nowadays has become very popular in the widely growing social media community. However, due to the gaps between images and texts, there is very limited work in literature to detect one image's Topics and Emotions in a unified framework, although topics and emotions are two levels of semantics that often work together to comprehensively describe one image. In this work, a unified model, Joint Topic/Emotion Multi-Modal Hierarchical Latent Dirichlet Allocation (JTE-MMHLDA) model, which extends previous LDA, mmLDA, and JST model to capture topic and emotion information at the same time from heterogeneous data, is proposed. Specifically, a two level graphical structured model is built to realize sharing topics and emotions among the whole document collection. The experimental results on a Flickr dataset indicate that the proposed model efficiently discovers images' topics and emotions, and significantly outperform the text-only system by 4.4%, vision-only system by 18.1% in topic detection, and outperforms the text-only system by 7.1%, vision-only system by 39.7% in emotion detection.

  • PDF

지명변경자료의 기술목록법에 관한 연구 (A study on the descriptive cataloging of serial title changes)

  • 윤희윤
    • 한국도서관정보학회지
    • /
    • 제22권
    • /
    • pp.61-93
    • /
    • 1995
  • This paper discussed which of the three basic entries of serials that changed their titles-earliest, latest, or successive entry cataloging-is the most efficient, informative, and economical in a manual and an online environment. The results of the study are as follow: 1. Earliest entry cataloging or as an alternative, successive entry cataloging advocated by Cutter in 1976 was replaced in ALA Cataloging Rules by latest entry cataloging and with AACR1 and AACR2, latest entry cataloging was replaced by successive entry cataloging again. 2. Entry method of serial cataloging should be determined in consideration of goals of catalog, efficiency of catalog retrieval, theoretical and practical standpoint of entry methods, average cataloging time and cost, the state of adaption. 3. In a card catalog environment, if the numbering and class number of the serial that title proper changed into initials itself continue and the title history must not be too complicated, the serial is desirable to entry under the latest title. Except for above case, successive entry cataloging enables serials to be more quickly and economically made available to users than with either earliest or latest entry cataloging. 4. In an automated catalog environment, successive entry cataloging has more potential of satisfying and impairs the efficiency of both accessing and processing a library's serials collection. However, when initial cataloging by MARC format is done, careful screen design and complex programming will be needed. And subfield containing the local record number should be added to the programming means to link the various records together, i.e., 780 (preceding title) and 785 (succeeding title) fields for all related titles.

  • PDF

도메인 질의응답 시스템 (Domain Question Answering System)

  • 윤승현;임은희;김덕호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권2호
    • /
    • pp.144-147
    • /
    • 2015
  • Question Answering (QA) 서비스는 사용자의 자연어 질의에 대응하는 정확한 답변을 제공하는 시스템이다. 본 연구는 특정 도메인에 관련한 사용자들의 질문에 대해 QA 서비스가 자동으로 대응하는 방법에 관한 연구이다. 이를 수행하기 위하여 사용자의 자연어 질문을 이해하고, 정형 데이터 및 비정형 데이터로부터 사용자 질문에 적합한 답변을 도출하여 제공하는 방법을 제시한다. 실험 결과 top 1 accuracy 68%, top 5 accuracy 77% 결과를 얻었다. 또한 본 논문은 QA 시스템 내부 모듈이 전체 accuracy에 미치는 영향에 대해서도 기술하였다.

여행자 관심 기반 스마트 여행 수요 예측 모형 개발: 웹검색 트래픽 정보를 중심으로 (The Development of Travel Demand Nowcasting Model Based on Travelers' Attention: Focusing on Web Search Traffic Information)

  • 박도형
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제26권3호
    • /
    • pp.171-185
    • /
    • 2017
  • Purpose Recently, there has been an increase in attempts to analyze social phenomena, consumption trends, and consumption behavior through a vast amount of customer data such as web search traffic information and social buzz information in various fields such as flu prediction and real estate price prediction. Internet portal service providers such as google and naver are disclosing web search traffic information of online users as services such as google trends and naver trends. Academic and industry are paying attention to research on information search behavior and utilization of online users based on the web search traffic information. Although there are many studies predicting social phenomena, consumption trends, political polls, etc. based on web search traffic information, it is hard to find the research to explain and predict tourism demand and establish tourism policy using it. In this study, we try to use web search traffic information to explain the tourism demand for major cities in Gangwon-do, the representative tourist area in Korea, and to develop a nowcasting model for the demand. Design/methodology/approach In the first step, the literature review on travel demand and web search traffic was conducted in parallel in two directions. In the second stage, we conducted a qualitative research to confirm the information retrieval behavior of the traveler. In the next step, we extracted the representative tourist cities of Gangwon-do and confirmed which keywords were used for the search. In the fourth step, we collected tourist demand data to be used as a dependent variable and collected web search traffic information of each keyword to be used as an independent variable. In the fifth step, we set up a time series benchmark model, and added the web search traffic information to this model to confirm whether the prediction model improved. In the last stage, we analyze the prediction models that are finally selected as optimal and confirm whether the influence of the keywords on the prediction of travel demand. Findings This study has developed a tourism demand forecasting model of Gangwon-do, a representative tourist destination in Korea, by expanding and applying web search traffic information to tourism demand forecasting. We compared the existing time series model with the benchmarking model and confirmed the superiority of the proposed model. In addition, this study also confirms that web search traffic information has a positive correlation with travel demand and precedes it by one or two months, thereby asserting its suitability as a prediction model. Furthermore, by deriving search keywords that have a significant effect on tourism demand forecast for each city, representative characteristics of each region can be selected.

합성곱 신경망(Convolutional Neural Network)을 활용한 지능형 유사상표 검색 모형 개발 (A Study on Similar Trademark Search Model Using Convolutional Neural Networks)

  • 윤재웅;이석준;송칠용;김연식;정미영;정상일
    • 경영과정보연구
    • /
    • 제38권3호
    • /
    • pp.55-80
    • /
    • 2019
  • 전 세계적으로 온라인 상거래 시장 규모가 성장함에 따라 국제 및 국내 기업의 상표권이 침해되는 사례가 빈번하게 발생하고 있다. 다양한 연구 및 보고서에 따르면, 해외 기업 또는 개인이 국내 기업의 상표권을 침해한 사례와, 국내 기업 간 발생하는 상표권 분쟁 사례가 증가하고 있는 것으로 나타나고 있으며, 특허청의 보고서에 따르면 기업의 규모가 작을수록 상표보호를 위한 사전 예방활동을 수행하지 않는다고 응답한 비율이 높은 것으로 나타났다. 이러한 문제는 선등록 상표에 대한 사전조사 또는 자사의 상표보호를 위해 소요되는 인력과 비용이 원인인 것으로 판단된다. 한편, 국내에서 선등록상표에 대한 사전조사를 위해 상용되는 서비스를 살펴보면 상표 이미지를 활용한 검색 서비스를 제공하고 있지 않은 상황이다. 이로 인해 국내 대다수의 기업은 자사의 상표 보호 및 선등록 상표에 대한 사전조사 수행 시 방대한 양의 선등록된 상표를 수작업으로 조사해야하는 문제가 발생한다. 따라서 본 연구에서는 기업의 상표권 보호 및 선등록 상표에 대한 사전조사 수행 시 투입되는 인력 및 비용절감과, 국내외에서 발생하고 있는 상표권 침해 문제를 해결하기 위해 합성곱 신경망 기법을 활용한 지능형 유사 상표 검색 모델을 개발하고자 한다. 지적 재산권 전문가가 선정한 테스트 데이터를 활용하여 지능형 유사 상표 검색 모델의 정확도를 측정한 결과 ResNet V1 101의 성능이 가장 높게 나타났다. 해당 결과를 통해 이미지 분류 알고리즘이 단순한 사물 인식 분야뿐만 아니라 이미지 검색 분야에서도 높은 성능을 나타낸다는 것을 실증적으로 입증했으며, 본 연구는 실제 상표 이미지 데이터를 활용했다는 측면에서 실제 산업 환경에서 활용성이 높을 것으로 사료된다.

이용자 중심 정보시스템: STEM 분야 중심으로 (User-oriented Information System: Focusing on STEM Field)

  • 박민수
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.249-253
    • /
    • 2020
  • 과학기술(STEM: Science, Technology, Engineering, and Medicine) 정보를 효과적으로 제공하기 위해서는 정보이용자의 정보요구 분석 및 정보이용 행태에 대한 이해가 선행되어야 한다. 정보통신 기술과 환경의 급격한 변화와 발전으로 이용자의 정보이용 환경에도 많은 영향을 미치고 있다. 이용자의 정보이용 변화와 특성, 이들의 정보요구 분석을 토대로 적극적인 과학기술정보서비스시스템의 설계 및 개선이 필요하다. 본 연구를 위하여 과학기술정보 이용자를 대상으로 유의할당추출을 통해 4개의 주요 콘텐츠별 (논문, 보고서, 동향, 특허)로 204명씩, 총 816이 참여하였다. 각 콘텐츠별(논문, 보고서, 동향, 특허) 이용자를 대상으로 온라인 설문조사를 통한 정량적 방법을 활용하여 과학기술정보 이용 실태 파악을 위한 조사를 실시하였다. 분석 결과를 토대로 STEM 분야 정보시스템 개선사항을 위한 시사점을 도출하였다.

반 전역 정렬을 이용한 온라인 게임 변형 욕설 필터링 시스템 (The Online Game Coined Profanity Filtering System by using Semi-Global Alignment)

  • 윤태진;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.113-120
    • /
    • 2009
  • 온라인 게임에서의 언어폭력 문제는 매우 심각하지만 그에 대한 효과적인 정책이나 기술적인 방법은 부족한 상황이다. 온라인 게임 서비스 업체에서는 금칙어 리스트를 작성하여 Swear Filter를 이용한 고정된 형식의 문자열 검색 방식을 통해 문제를 해결하려고 하고 있으나 사용자들은 다양한 방법으로 욕설을 조합 또는 변형시켜 기존의 필터링을 회피하고 있다. 특히 한글은 욕설의 변형이 매우 쉬운 특성을 가지고 있다. 본 논문에는 한글에 기초한 변형 욕설을 효율적으로 탐색하여 걸러내는 알고리즘을 제시한다. 이 알고리즘의 주된 특징은 변형 욕설의 표준형 변환과 자소단위의 반 전체 정렬(semi-global alignment), 이다. 실험 결과 저자들이 다양한 인터넷 게임 환경에서 직접 수집한 다종의 욕설 단어들에 대하여 약 90%의 우수한 필터링 성능을 보였다.