• 제목/요약/키워드: Web Search Engine

검색결과 248건 처리시간 0.022초

고객중심의 과학기술정보 서비스를 위한 FAST 검색엔진 커스터마이징 (FAST Search Engine Customizing for S&T Information Service)

  • 한희준;이태석;김선태;예용희;이상기;여일연
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2008년도 춘계 종합학술대회 논문집
    • /
    • pp.480-483
    • /
    • 2008
  • 다양한 인터넷 기술이 개발 및 발전됨에 따라 정보 제공자는 사용자에게 보다 효율적이고 고객중심의 서비스를 제공하기 위해 노력하고 있다. 특히 방대한 양의 정보에 대하여 고객이 원하는 정보를 정확하고 쉽게 제공하기 위해서는 검색기능의 효율성이 필수이다. 한국과학기술정보연구원(KISTI)에서는 국가과학기술포털서비스 성능향상을 위하여 FAST(Fast Search & Transfer ASA) 검색엔진을 도입하였다. 하지만 무엇보다도 서비스 환경에 적합하게 검색엔진의 하드웨어 및 소프트웨어적 성능을 최적화하는 것이 중요하다. 본 논문에서는 국가과학기술정보의 효율적 서비스를 위한 FAST 검색엔진 설계 및 최적화 기법에 대해 논한다.

  • PDF

심층 웹 문서 수집을 위한 크롤링 알고리즘 설계 (Crawling Algorithm Design for Deep Web Document Collection)

  • 원동현;강윤정;박혁규
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.367-369
    • /
    • 2022
  • 웹 기술이 발전함에 따라 웹은 사용자의 요구에 맞는 맞춤 정보들을 제공하게 된다. 클릭 이벤트나 사용자의 질의어에 따라 정보가 제공되며 검색엔진으로는 검색이 어려운 정보가 제공되는 웹 서비스를 심층웹이라 한다. 이러한 심층웹은 표면웹보다 많은 정보를 포함하고 있지만, 방문 당시의 정보를 수집하는 일반적인 크롤링으로는 정보 수집이 어렵다. 심층웹은 javascript와 같은 스크립트언어를 브라우저에서 실행함으로 서버의 정보를 사용자에게 제공한다. 본 논문에서는 심층웹 수집을 위해 스크립트를 분석하여 동적으로 변화되는 웹사이트의 탐색 및 정보 수집이 가능한 알고리즘을 제안한다. 본 논문에서는 실험을 위해 질병관리청의 게시판의 스크립트를 분석하였다.

  • PDF

웹 검색질의어 분석을 통한 사회·문화적 특성에 관한 연구 (A Study on the Social and Cultural Characteristics of Web Queries)

  • 김성희
    • 정보관리연구
    • /
    • 제42권4호
    • /
    • pp.155-174
    • /
    • 2011
  • 본 연구에서는 인터넷 정보 검색엔진으로부터 2007년부터 2009년까지 3년 동안 인기 검색어를 주제별로 분석함으로써 이용자의 검색어들이 시간이 흐름에 따라 주제별 변화양상을 살펴보았다. 또한 2009년도 네이버에서 제공하고 있는 상위 500개의 인기 검색어를 이용자의 검색의도에 따라 정보획득형(informational), 탐색형(navigational), 트랜잭션(transactional)형태로 구분하여 특성을 분석하였다. 그 결과 시간의 흐름에 따라 이용자의 관심 주제가 다르게 나타남을 알 수 있었다. 또한 이용자의 검색의도에 따라 인기 검색어를 분류한 결과 정보획득형 82%, 탐색형 10.8%, 트랜잭션형 7.2%로 나타났다. 이러한 연구는 미래의 검색엔진 또는 포털시스템에서 주제별 콘텐트를 구축하여 제공하는 정책수립에도 도움이 될 것으로 기대한다. 더 나아가서 이용자들의 사회적, 문화적 관심사를 분석함으로써 인기키워드의 주제 분석을 통해 나타난 사회 문화적 특성을 파악하는 데 도움이 될 수 있을 것이다.

콘텐츠 정보의 연관성을 고려한 Ajax기반의 깊이 검색 시스템 구현 (The implementation of the depth search system for relations of contents information based on Ajax)

  • 김운용;박석규
    • 한국항행학회논문지
    • /
    • 제12권5호
    • /
    • pp.516-523
    • /
    • 2008
  • 최근 웹은 집단지성을 근간으로 참여형 구조를 형성하고 이를 바탕으로 빠르게 성장하고 있다. 이 환경에서 사용자에 의해 생성된 콘텐츠는 정보의 주류를 형성하고 있으며 이들의 효율적인 검색기법이 요구된다. 현재 콘텐츠의 검색은 주로 키워드용 기반으로 운영 되고 있으며, 언어의 유사성과 관계를 고려한 시맨틱 웹(Semantic web)에 대한 연구나 웹2.0환경의 사용자 태그 활용에 대한 연구가 활발히 진행되고 있다. 일반적으로 참여형 구조의 웹 환경은 사용자에 의해 생성된 대량의 콘텐츠와 다양한 형태 및 분류 구조를 가진다. 그 결과 이들의 효율적인 분류와 검색 기법이 요구된다. 이에 본 논문에서는 콘텐츠 검색을 위한 태그들 간의 연관성을 고려한 깊이 검색 시스템을 제시한다. 이를 통해 불필요한 콘텐츠 검색을 줄이고 집단에 포함된 제시어 서비스를 통해 콘텐츠 검색의 효율성을 증가시킬 수 있을 것이다.

  • PDF

비주얼 의류 검색기술을 위한 의류 속성 기반 Annotation 기법 개발 (Annotation Technique Development based on Apparel Attributes for Visual Apparel Search Technology)

  • 이은경;김양원;김선숙
    • 한국의류산업학회지
    • /
    • 제17권5호
    • /
    • pp.731-740
    • /
    • 2015
  • Mobile (smartphone) search engine marketing is increasingly important. Accordingly, the development of visual apparel search technology to obtain easier and faster access to visual information in the apparel field is urgently needed. This study helps establish a proper classifying system for an apparel search after an analysis of search techniques for apparel search applications and existing domestic and overseas apparel sites. An annotation technique is developed in accordance with visual attributes and apparel categories based on collected data obtained by web crawling and apparel images collecting. The categorical composition of apparel is divided into wearing, image and style. The web evaluation site traces the correlations of the apparel category and apparel factors as dependent upon visual attributes. An appraisal team of 10 individuals evaluated 2860 pieces of merchandise images. Data analysis consisted of correlations between apparel, sleeve length and apparel category (based on an average analysis), and correlation between fastener and apparel category (based on an average analysis). The study results can be considered as an epoch-making mobile apparel search system that can contribute to enhancing consumer convenience since it enables an effective search of type, price, distributor, and apparel image by a mobile photographing of the wearing state.

온톨로지 기반 대학정보 검색 시스템의 설계 및 구현 (Implementation and Design of College Information Retrieval System Based On Ontology)

  • 박종훈;김철원
    • 한국정보통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.296-301
    • /
    • 2012
  • 오늘날 효과적인 정보검색을 위해 지능형 검색에 대한 다양한 기법들을 사용하고 있다. 이중에서 효과적인 검색 방법은 온톨로지 기술을 적용하는 것이다. 온톨로지는 시맨틱웹에서의 핵심기술이라 할 수 있다. 시맨틱웹에서 온톨로지 기술은 간단하면서 정확하게 추론엔진을 통하여 관련 정보를 검색하는데 사용될 수 있다. 본 논문에서는 대학, 대학원, 구성원을 중심으로 정보를 검색할 수 있는 온톨로지 기반 대학정보검색 시스템을 설계 및 구현을 하고자 한다. 대학, 대학원, 구성원 정보들의 계층구조를 수집하였으며, 온톨로지 개발도구인 protege 에디터를 이용하였다. 대학정보를 온톨로지로 설계하기 위해 설계된 대학정보 온톨로지를 protege 에디터의 추론기능을 이용하여 검증하였으며, 검증된 온톨로지는 지나 추론엔진을 적용하여 웹서비스 할 수 있도록 대학정보검색 시스템을 구현하였다.

이미지정보 탐색을 위한 웹 검색엔진의 비교 평가 (Comparison and Evaluation of Web-based Image Search Engines)

  • 김효정
    • 정보관리연구
    • /
    • 제31권4호
    • /
    • pp.50-70
    • /
    • 2000
  • 인터넷으로 접근할 수 정보의 형태가 텍스트는 물론 이미지나 사운드까지 포함되면서 다양한 웹 이미지 검색엔진들이 개발되고 있다. 그러나 이 검색엔진들은 검색 특성과 효율성 면에서 상당한 차이를 보이고 있다. 이에 본 연구에서는 현재 개발된 이미지정보를 탐색하는 검색엔진들의 유형을 살펴보고 이들의 특성과 성능을 비교 평가하여 이용자로 하여금 정보요구에 적합한 이미지 검색엔진을 선택할 수 있도록 하는데 그 목적이 있다. 본 연구의 비교대상 검색엔진으로는 현재 가장 널리 쓰이고 있는 AV Photo Finder, Lycos MultiMedia, Amazing Picture Machina Image Surfer, WebSeek, Ditto를 선정하였다. 먼저 문헌연구를 통해 이미지 검색엔진의 평가기준을 마련하였다. 그리고 마련된 기준에 따라 각 검색엔진들의 데이터베이스 및 색인 방법, 검색 기능, 출력 형태, 이용자 인터페이스를 조사하였고 검색성능을 평가하기 위해 상대적 재현율과 정확률을 측정하였다. 그 결과 AV Photo Finder의 정확률이 가장 높았고 Ditto와 WebSeek의 정확률은 비교적 높은 편이었다. 그리고 Lycos MultiMedia와 Image Surfer의 정확률 값이 그 뒤를 이었으며 Amazing Picture Machine의 정확율이 가장 낮았다.

  • PDF

An Implementation and Performance Evaluation of Fast Web Crawler with Python

  • Kim, Cheong Ghil
    • 반도체디스플레이기술학회지
    • /
    • 제18권3호
    • /
    • pp.140-143
    • /
    • 2019
  • The Internet has been expanded constantly and greatly such that we are having vast number of web pages with dynamic changes. Especially, the fast development of wireless communication technology and the wide spread of various smart devices enable information being created at speed and changed anywhere, anytime. In this situation, web crawling, also known as web scraping, which is an organized, automated computer system for systematically navigating web pages residing on the web and for automatically searching and indexing information, has been inevitably used broadly in many fields today. This paper aims to implement a prototype web crawler with Python and to improve the execution speed using threads on multicore CPU. The results of the implementation confirmed the operation with crawling reference web sites and the performance improvement by evaluating the execution speed on the different thread configurations on multicore CPU.

Semantic Image Search: Case Study for Western Region Tourism in Thailand

  • Chantrapornchai, Chantana;Bunlaw, Netnapa;Choksuchat, Chidchanok
    • Journal of Information Processing Systems
    • /
    • 제14권5호
    • /
    • pp.1195-1214
    • /
    • 2018
  • Typical search engines may not be the most efficient means of returning images in accordance with user requirements. With the help of semantic web technology, it is possible to search through images more precisely in any required domain, because the images are annotated according to a custom-built ontology. With appropriate annotations, a search can then, return images according to the context. This paper reports on the design of a tourism ontology relevant to touristic images. In particular, the image features and the meaning of the images are described using various properties, along with other types of information relevant to tourist attractions using the OWL language. The methodology used is described, commencing with building an image and tourism corpus, creating the ontology, and developing the search engine. The system was tested through a case study involving the western region of Thailand. The user can search specifying the specific class of image or they can use text-based searches. The results are ranked using weighted scores based on kinds of properties. The precision and recall of the prototype system was measured to show its efficiency. User satisfaction was also evaluated, was also performed and was found to be high.

TAG 정보를 활용한 기업검색의 적합성 향상 기법에 관한 연구 (A Study on the Relevance Improvement of Enterprise Search using Tag Information)

  • 손태식;박병섭;최효현
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권12호
    • /
    • pp.101-108
    • /
    • 2010
  • 기업에서 업무 시스템들을 활용하여 업무를 진행하다 보면 기하급수적으로 증가하는 정보를 얼마나 신속하고 정확하게 사용자에게 제공할 수 있는가 하는 것이 기업 경쟁력의 중요한 요소이다. 검색 적합성 향상을 통한 양질의 검색 결과 제공은 기업 경쟁력의 중요한 요소가 되었으며, 가치 있고 효율적인 검색 서비스 제공을 위해 검색엔진에서 제공하는 단순한 검색 서비스 이상을 제공하는 것이 필요하다. 본 논문에서는 검색 과정에서 Tag 정보와 그 가중치 값을 활용하여 검색 적합성을 향상 시키는 방안에 대해서 연구함으로써 검색엔진에서 제공하는 검색 적합성의 한계를 극복하는 방안을 제안한다. 또한, 제안된 방법에 대한 검색 성능을 비교하기 위해서 제안 기법을 기존 웹 검색 서비스에서 제공하는 검색결과와의 적합성 평가 및 연관 검색어와 비교함으로써 우수성을 검증하였다.