• 제목/요약/키워드: 웹 검색엔진

검색결과 366건 처리시간 0.023초

뉴스라인 / '보이지 않는' 콘텐츠를 찾아라. 새로운 검색엔진 '인비지블 웹'

  • 마이클단
    • 디지털콘텐츠
    • /
    • 3호통권94호
    • /
    • pp.81-85
    • /
    • 2001
  • 많은 검색 엔진들이 등장하고 나름대로 장단점을 가지고 있다. 하지만 그 어느 것 하나도 완벽이라는 칭송을 듣기에는 미흡하다. 여기에 새로운 검색엔진을 소개하고자 한다. '보이지 않는' 콘텐츠가 검색엔진으로 가능하다는 인비지블웹닷컴(InvisibleWeb.com)이다. 하지만 이 역시 완벽이라는 칭송을 받기에는 부족하다. 불필요한 것들이 검색되거나 전혀 무관한 것들이 검색된다는 점에서는 오히려 기존 검색 엔진보다 단점이 많을 수 있다. 하지만 다른 검색엔진으로는 검색 불가능한 것들이 검색된다는 점에서 주목을 받고 있으며 단점을 보완한다면 좋은 검색엔진으로 발전 가능성이 있기에 소개하고자 한다.

  • PDF

Linkly : CORBA 기반 링크 정보 검색 엔진 (LinkBoy: A CORBA-based Link Information Search Engine)

  • 김재훈;손주영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.221-223
    • /
    • 1999
  • 전세계를 연결하는 인터넷은 웹의 출현으로 급속히 퍼져 나가 하나의 거대한 정보망으로 형성되었다. 이러한 정보망에서 필요한 정보를 찾기 위한 검색 엔진이 인터넷에서의 필수 요건이 되고 있다. 그러나 정보가 저장되어 있는 여러 서버들 간의 플렛폼의 이질성의 극복, 언어 독립적인 플렛폼의 필요성이 대두된다. 그 해결책으로 이질적 분산 환경의 통합 환경 제공을 위한 CORBA가 제시되고 있다. 이에 본 논문에서는 CORBA 기술을 이용하여 인터넷에서의 정보 제공 서버간의 투명한 상호작용과 정보 검색이 가능하게 하며, 특히 일반 검색 엔진과는 달리 웹의 링크를 통해 정보를 검색할 수 있게 하기 위한 서버 엔진과 클라이언트 사용자 인터페이스를 설계, 구현하였다.

  • PDF

협동적 순위 평가와 워드넷을 이용한 검색엔진의 성능 향상 (Performance Inprovement of a Search Engine Using Collaborative Evaluation and The WordNet)

  • 김형일;김준태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.103-105
    • /
    • 2001
  • 웹에서 사용자가 원하는 정보를 정확히 추출하기란 쉬운 문제가 아닐 것이다. 이러한 정보추출의 중요성의 문제는 방대해지는 정보의 양과 직결된다. 현재 웹의 정보는 사용자들이 원하는 모든 정도를 담고 있다고 이야기할 수 있을 만큼 많은 정보들이 내재되어 있다. 그러나 이러한 정보의 홍수 속에서 사용자들은 자신이 원하는 정보를 정확히 추출하기란 쉽지 않은 일이며, 정확히 추출이 되었어도 전통적 방식을 따르는 검색엔진은 내용기반 방식을 기초로 웹페이지의 순위를 결정함으로, 사용자에게 중요한 페이지를 상위에 위치시키기란 쉬운 일이 아니다. 본 논문에서는 이러한 전통적 방식의 검색엔진의 문제점을 해결하기 위하여 협동적 순위 평가 방법과 워드넷을 기반으로 검색엔진의 성능 향상 방법을 제안한다.

  • PDF

유전자 알고리즘을 사용한 메타검색엔진에서의 사용자 모델링 (User Modeling in Meta-Search Engine with Genetic Algorithm)

  • 김수영;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.217-219
    • /
    • 2000
  • 정보의 바다라고 일컬어지는 인터넷에서 원하는 정보를 찾기란 쉽지 않다. 웹 검색엔진이 나날이 발전하고 있기는 하지만, 이들 검색엔진은 개인에게 특화된 것이 아니기 때문에 검색 결과의 양이 엄청나게 많은 뿐만아니라 원하지 않는 정보인 경우가 많다. 따라서 사용자의 기호를 반영하여 원하는 정보만을 찾아줄 수 있는 시스템이 필요하다. 본 논문에서는 사용자의 기호를 반영하여 개인에게 특화된 웹 검색 시스템을 개발하기 위하여 유전자 알고리즘으로 최적화된 다중에이전트 시스템을 제안한다. 실험결과 사용자 프로파일 벡터가 사용자기호에 따라 변화하여 제안한 시스템이 유용함을 알 수 있었다.

  • PDF

아파치 스파크 기반 검색엔진의 설계 및 구현 (Design and Implementation of a Search Engine based on Apache Spark)

  • 박기성;최재현;김종배;박제원
    • 한국정보통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.17-28
    • /
    • 2017
  • 최근 데이터의 활용가치가 높아지면서 데이터에 관한 연구가 활발히 진행되고 있다. 데이터의 수집, 저장, 활용을 위한 대표적인 프로그램으로 웹 크롤러, 데이터베이스, 분산처리 등이 있으며, 최근에는 웹 크롤러가 다양한 분야에 활용할 수 있는 유용성으로 인해 크게 각광받고 있는 실정이다. 웹 크롤러란 자동화된 방법으로 웹서버를 순회하여 웹 페이지를 분석하고 URL을 수집하는 도구라고 정의할 수 있다. 인터넷 사용량의 증가로 매일 대량으로 생성되는 웹 페이지의 처리를 위해 하둡의 맵리듀스를 기반으로 하는 분산 웹 크롤러가 많이 사용되고 있다. 그러나 맵리듀스는 사용이 어렵고 성능에 제약이 있는 단점이 있다. 이러한 맵리듀스의 한계를 보완하여 제시된 인메모리 기반 연산 플랫폼인 아파치 스파크가 그 대안이 되고 있다. 웹 크롤러의 주요용도 중 하나인 검색엔진은 웹 크롤러로 수집한 정보 중 특정 검색어에 맞는 결과를 보여준다. 검색엔진을 기존 맵리듀스 기반의 웹 크롤러 대신 스파크 기반 웹 크롤러로 구현할 경우 더욱 빠른 데이터 수집이 가능할 것이다.

퍼지 개념 네트워크를 이용한 링크기반 검색엔진의 개인화 (Personalization of Link-based Search Engine by Fuzzy Concept Network)

  • 김경중;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.316-318
    • /
    • 2001
  • 링크 기반 검색엔진은 사용자의 질의어와 관련된 웹문서들에 대해 링크 정보를 이용하여 순위를 생성한다. 링크 정보는 문서들간의 추천을 나타내므로 중요한 문서를 찾는데 이용할 수 있다. 링크 정보를 이용한 검색은 일반적인 텍스트 기반 검색엔진에 비해 좋은 결과를 낸다고 알려져 있다. 링크 정보를 이용한 검색엔진의 대표적인 예로는 Google과 Clever Search가 있다. 본 논문에서는 링크 정보를 이용한 검색엔진을 개발하고 퍼지 개념 네트워크를 이용하여 개인화를 수행한다. 퍼지 개념 네트워크는 퍼지 문서 추 2654; 시스템을 위한 지식베이스로 이용된다. 사용자 프로파일을 이용하여 사용자별로 퍼지 개념 네트워크를 생성하고 링크 기반 검색 결과를 개인화한다. 3명의 사용자에 대해 실험을 수행하여, 개인화가 주는 효과에 대해 평가한다. 검색결과는 중요한 웹 문서를 찾아 주었으며, 개인화 과정을 통해 사용자가 원하는 순서대로 정렬해 주는 것을 알 수 있었다.다.

  • PDF

시맨틱 웹 서비스를 위한 DAML-S 문서 관리 시스템 개발 (Development of the DAML-S Document Management System enabling Semantic Web Services)

  • 김학수;손진현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.73-75
    • /
    • 2004
  • 기존의 WSDL이 갖고 있던 문제정올 개선하고 좀더 의미있는 서비스 기술이 가능한 시맨틱 웹 서비스는. 현재의 뜬 서비스와 유사하지만 웹 서비스를 기술하던 WSDL 대신 시맨틱 웹 기술언어를 기반으로 한 새로운 기술 언어(DAML-S)를 사용한다. 이런 상황 속에서 만일 수많은 회사에서 자신들의 서비스를 제공하고. 그 사실을 알리기 위해서 시맨틱 엠 서비스 문서를 발간했을 때, 자연히 사용자는 검색 엔진을 사용하여 그런 비즈니스 정보를 검색하게 되고 사용자가 원하는 서비스, 사용자가 만족할 수 있는 서비스를 찾고 결합시켜주는 검색 엔진이 필요하게 될 것이다. 따라서, 시맨틱 웹 정보 검색은 기존의 정보 검색과는 다른 형태의 검색이 된다. 기존의 문서 내 단어의 존재 유무나 빈도수와 같은 휴리스틱한 방법을 적용하기는 매우 어려우며, 시맨틱 웹 기술 언어네 알맞은 새로운 검색 방법과 저장 시스템이 필요하다. 이 논문에서는 시맨틱 웹 정보 중 특별히 시맨틱 웹 비즈니스 정보에 대한 효율적인 저장 시스템의 모델을 제시하고자 한다. 이 모델을 통해서 시맨틱 웹 비즈니스 정보를 구조화하고 효율적으로 저장할 수 있다.

  • PDF

웹 이용자의 검색엔진 활용 및 탐색 행위와 성향 분석 (Analysis of Search Engine Use, Search Behaviors and Aptitude by Web Users)

  • 이해영
    • 한국문헌정보학회지
    • /
    • 제36권3호
    • /
    • pp.69-91
    • /
    • 2002
  • 본 연구는 웹 이용자들이 검색엔진을 어떻게 선택하여. 어떠한 기능들을 활용하며, 검색결과는 어떻게 평가하는지 그리고 어떤 어려움을 겪고 있는지를 밝혀 보고자 하였다. 28명의 대학의 교수와 대학원생으로 구성된 이용자들을 대상으로 한 인터뷰결과를 분석한다. 연구 결과에 따르면, 본 연구의 참가자들은 검색결과에 대한 평가보다는 특정한 기능이나 익숙함에 근거하여 엔진을 선택하였다. 이들은 통합검색에 대해서는 의견이 양분되어 있었으며, 연산자의 사용이 결과에 미치는 영향이 거의 없다고 보고 있었다. 검색엔진에 대한 평가를 내릴 때에도 검색결과의 정확성외에 결과를 보여주는 인터페이스 디자인에도 상당한 관심을 가지고 있는 것으로 나타났다.

질의어 의미별 사용자 선호도를 이용한 웹 검색의 성능 향상 (Improving Performance of Web Search using The User Preference in Query Word Senses)

  • 김형일;김준태
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.1101-1112
    • /
    • 2004
  • 본 논문에서는 웹 검색의 성능 향상을 위해 질의어 의미별 사용자 선호도를 이용한 웹 페이지의 가중치 부여 방식을 제안한다. 일반적으로 검색엔진들은 검색 질의어와 웹 페이지의 어휘 비교에 의한 관련도 측정만을 사용하여 웹 페이지의 가중치를 부여한다. 웹과 같이 방대한 자료를 대상으로 검색을 할 경우 유사한 관련도를 가진 검색 결과가 매우 많으므로 어휘 비교만으로는 중요한 웹 페이지를 선별하기 어렵다. 본 논문에서는 질의어의 의미를 구분하도록 워드넷(WordNet)을 이용한 사용자 인터페이스를 구축하고, 사용자의 클릭 수를 각 웹 페이지의 가중치에 누적함으로써 다수 사용자의 검색 행위에 의한 묵시적 평가가 웹 페이지의 검색 순위에 반영되는 검색 시스템을 구현하였다. 클릭수의 누적에 있어서 질의 어 의미별로 가중치를 구분하여 저장함으로써 일반적인 검색엔진보다 정확한 검색이 되었으며, 웹 페이지의 범주별 가중치와 질의어의 의미별 사용자 선호도를 이용함으로써 검색 시스템의 성능을 향상시킬 수 있다는 것을 20개의 어휘에 관련된 41개의 의미들을 대상으로 실험한 결과로 확인하였다.

전문가 검색 엔진에서 데이터 마이닝을 이용한 개념 관계 추출 (Extraction of conceptual relation using Data Mining in expert search engine)

  • 이권국;신일수;이상준;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.298-300
    • /
    • 2000
  • 전문가 검색 엔진은 전문가 시스템과 같은 목적에서 특정 전문 분야에 대한 특별한 정보를 모야 특정 정보를 검색하기 위한 엔진이다. 인터넷의 홈페이지는 서로를 연결하는데 하이퍼링크(hyperlink)를 사용하는데 이런 하이퍼링크(hyperlink)에 있는 정보를 이용하여 홈페이지와 홈페이지 사이의 연결관계를 모은 결과를 전문가 검색 엔진에서 모은 키워드와 웹 사이트를 이용하여 각 키워드 간의 관련성을 데이터 마이닝 기법을 사용해서 각 키워드나 웹 페이지간의 상관관계에 대한 개념을 추출한다. 본 논문에서는 이런 홈페이지 간의 추출을 이용한 시스템 설계와 구현 결과를 보여준다.

  • PDF