• 제목/요약/키워드: 웹엔진

검색결과 577건 처리시간 0.045초

온톨로지 추론시스템의 성능 향상에 관한 연구 (A research for the performance improvement of ontology reasoning systems)

  • 이성국;이지형
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.327-330
    • /
    • 2005
  • 시멘틱웹이란 컴퓨터가 정보의 의미를 이해하고 그 의미를 조작 할 수 있는 웹으로서 기존의 웹으로는 불가능했던 데이터의 자동처리를 가능하게 하는 차세대 웹 기술을 말한다. 이러한 웹을 위해서는 표준화된 데이터 표현 방법을 통해 기술된 내용을 기계가 이해할 수 있도록 해주는 온톨로지 시스템이 필요하다. 온톨로지 시스템은 일반적으로 OWL(web ontology language)로 표현된 온톨로지와 지식을 처리하는 추론시스템으로 구성되어 있으며 추론시스템으로는 연구 구현 예가 많은 LP(Logic Programming)방식의 추론시스템이 많이 사용된다. 하지만 LP방식의 추론기법들은 온톨로지를 처리하는데 있어 여러 가지 제약사항을 가지며 이로 인해 온톨로지 정보의 추론에 대한 효용성은 떨어진다. 이에 본 논문에서는 온톨로지 정보를 추론하기 위해 사용되는 기존 시스템들을 조사해 분류하고 문제점과 장점을 파악한 후 추론엔진의 효용성을 높이는데 필요한 최소한의 기능이 무엇인지 파악하여 기존의 LP엔진을 최대한 활용한 OWL추론엔진을 개발하는데 이용하고자 한다.

  • PDF

HCI를 위한 다중 디스플레이와 웹 정보검색 (MultiDisplay for HCI and Web Information Retrieval)

  • 양현택;박나연;김원중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.402-404
    • /
    • 2000
  • 현재 WWW(World Wide Web)는 가장 중요한 정보전달 및 획득 수단이 되었다. 대부분의 네트워크 사용자들은 웹에서 정보를 습득하기 위하여 대부분 검색엔진(Search Engine)을 사용한다. 그러나 웹에 등록되는 정보의 종류와 분량이 폭발적으로 증가함에 따라 검색엔진들이 제공하여 주는 인덱스화된 정보의 리스트들이 너무 많고, 또한 많은 문서들은 중복되어 나타나 사용자들이 효율적으로 정보를 검색하는데 문제점이 되고 있다. 본 연구에서는 다중디스플레이(MultiDisplay) 기법을 이용하여 사용자들에게 친숙하고, 웹의 정보검색에 필요한 시간과 노력을 대폭 줄이는 방안을 제시하였다.

  • PDF

웹서비스 기반 지능형 추천 시스템 (Web Service-based Intelligent Recommendation System)

  • 김성태;박수민;양정진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.187-189
    • /
    • 2004
  • 인터넷의 활용범위는 정보의 검색 및 수집을 넘어서 여러 범위로 확대되고 있고 점보의 양 또한 방대해 졌다. 그러나 필요한 정보를 찾기는 더욱 어려워지고 있고, 그에 따라 개인에게 맞는 정보를 제공해주는 시스템이 절실해지고 있다. 본 연구에서는 웹 서비스 기반 위에 추론엔진을 사용하여 사용자에게 가장 적합한 상품을 검색하여 추천해주는 추천 시스템의 모델을 제시하고 있다. 웹 서비스 기반 위에 시스템을 구축함으로써 표준 웹서비스의 가능성을 엿보고, 복잡한 논리적 추론을 추론엔진을 사용함으로써 효율성을 증가시키고 있다.

  • PDF

웹 2.0 기반 RSS 데이터 수집 엔진의 설계 및 구현 (A Design and Implementation of RSS Data Collecting Engine based on Web 2.0)

  • 강필구;김재환;이상준;채진석
    • 한국멀티미디어학회논문지
    • /
    • 제10권11호
    • /
    • pp.1496-1506
    • /
    • 2007
  • 기존의 웹 서비스가 정적이고 수동적인데 반해 최근의 웹 서비스는 점차 동적이고 능동적으로 변화하고 있는데, 이러한 웹 서비스 변화의 흐름을 잘 반영하는 것이 웹 2.0이다. 웹 2.0의 특징은 사용자가 능동적으로 참여하여 정보를 생산하는 것인데, 이렇게 되면, 생산되는 정보의 양이 지속적으로 증가하게 되므로 더 빠르고 정확한 정보를 공유할 필요가 있다. 이러한 필요성을 충족시키는 기술이 웹 2.0의 웹 신디케이션 기술과 태그 기술이다. 웹 신디케이션은 웹 사이트의 내용을 다른 사이트나 사용자가 받아볼 수 있도록 피드를 만든다. 태그는 정보의 핵심이 되는 단어로, 여러 인터넷 사용자들이 태그를 통한 검색으로 좀 더 빠른 정보의 공유를 가능하게 한다. 이 논문에서는 웹 2.0의 핵심 기술인 웹 신디케이션과 태그의 활용을 높이기 위한 방법으로 데이터 수집 엔진을 만들어 데이터를 효율적으로 관리하는 기법을 제안하였다. 데이터 수집 엔진은 데이터베이스에 저장된 사용자의 웹 사이트 정보를 이용하여 사용자의 웹 사이트에 접속하여 업데이트된 데이터를 수집한다. 이 논문에서 제안한 데이터 수집 엔진을 사용하여 실험한 결과 기존의 기법에 비해 검색 속도가 최대 3.14배 향상되었고, 연관 태그를 구성하는데 사용되는 데이터 건수가 최대 66%까지 감소함을 확인할 수 있었다.

  • PDF

웹 서비스 검색을 위한 시맨틱 매칭 엔진 (Semantic Matching Engine for Searching Web Services)

  • 양승훈;이대욱;권준호;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.267-272
    • /
    • 2006
  • 인터넷망의 지속적인 발달과 함께 웹 애플리케이션 개발 방법으로 XML 기반의 웹 서비스가 부각되면서 많은 웹 서비스들이 개발되었고, 점차 더 많은 웹 서비스들이 개발될 것으로 예상된다. 이처럼 급격하게 늘어나는 웹 서비스들 중에서 사용자가 원하는 웹 서비스 찾는 것이 중요한 이슈로 부각되고 있다. 그러나 현재의 웹 서비스 검색 표준인 UDDI 레지스트리는 키워드 기반이기 때문에 검색 성능의 한계점을 갖고 있다. 최근에 이러한 한계를 극복하고자 하는 많은 연구가 진행되고 있지만 아직은 많이 부족한 상황이다. 따라서 본 논문에서는 비록 키워드가 일치하지 않더라도 사용자가 원하는 웹 서비스를 찾을 수 있도록 웹 서비스 표준인 UDDI 레지스트리에 시맨틱 매칭 엔진(semantic matching engine)이라는 추가적인 시맨틱 레이어를 추가하여 재현율(recall)과 정확률(precision)을 모두 향상 시킬 수 있는 시스템을 제안한다.

  • PDF

시맨틱 웹 서비스를 위한 DAML-S 문서 관리 시스템 개발 (Development of the DAML-S Document Management System enabling Semantic Web Services)

  • 김학수;손진현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.73-75
    • /
    • 2004
  • 기존의 WSDL이 갖고 있던 문제정올 개선하고 좀더 의미있는 서비스 기술이 가능한 시맨틱 웹 서비스는. 현재의 뜬 서비스와 유사하지만 웹 서비스를 기술하던 WSDL 대신 시맨틱 웹 기술언어를 기반으로 한 새로운 기술 언어(DAML-S)를 사용한다. 이런 상황 속에서 만일 수많은 회사에서 자신들의 서비스를 제공하고. 그 사실을 알리기 위해서 시맨틱 엠 서비스 문서를 발간했을 때, 자연히 사용자는 검색 엔진을 사용하여 그런 비즈니스 정보를 검색하게 되고 사용자가 원하는 서비스, 사용자가 만족할 수 있는 서비스를 찾고 결합시켜주는 검색 엔진이 필요하게 될 것이다. 따라서, 시맨틱 웹 정보 검색은 기존의 정보 검색과는 다른 형태의 검색이 된다. 기존의 문서 내 단어의 존재 유무나 빈도수와 같은 휴리스틱한 방법을 적용하기는 매우 어려우며, 시맨틱 웹 기술 언어네 알맞은 새로운 검색 방법과 저장 시스템이 필요하다. 이 논문에서는 시맨틱 웹 정보 중 특별히 시맨틱 웹 비즈니스 정보에 대한 효율적인 저장 시스템의 모델을 제시하고자 한다. 이 모델을 통해서 시맨틱 웹 비즈니스 정보를 구조화하고 효율적으로 저장할 수 있다.

  • PDF

웹 문서 중요도 평가를 위한 적합도 향상 HITS 알고리즘 설계 (Design of Advanced HITS Algorithm by Suitability for Importance-Evaluation of Web-Documents)

  • 김분희;한상용;김영찬
    • 한국전자거래학회지
    • /
    • 제8권2호
    • /
    • pp.23-31
    • /
    • 2003
  • 링크 기반 검색엔진은사용자의 질의어와 관련된 웹 문서들의 링크 정보를 이용하여 순위를 생성한다. 이러한 링크기반 웹 문서의 특성을 이용한 대표적인 순위 평가 알고리즘. HITS는 웹 페이지들 간의 상호 연결된 링크 정보로부터 웹 문서들의 중요도를 평가하고, 순위 정보에 따른 결과를 제시한다. 이러한 HITS 알고리즘의 문제점은 문서 내의 링크 빈도 수만을 고려하고, 입력 값으로 주어지는 웹 문서 집합의 특성에 의존적이라는 것이다. 본 논문에서는 링크기반 웹 검색 엔진들로부터 얻어진 문서 집합에 대해 질의와 검색결과 간의 적합도를 향상시킨 HITS 알고리즘을 수행하는 검색 에이전트를 설계하였다. 이로써 향상된 검객 성능과 결과의 지역성을 보완한다.

  • PDF

협동적 순위 평가와 워드넷을 이용한 검색엔진의 성능 향상 (Performance Inprovement of a Search Engine Using Collaborative Evaluation and The WordNet)

  • 김형일;김준태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.103-105
    • /
    • 2001
  • 웹에서 사용자가 원하는 정보를 정확히 추출하기란 쉬운 문제가 아닐 것이다. 이러한 정보추출의 중요성의 문제는 방대해지는 정보의 양과 직결된다. 현재 웹의 정보는 사용자들이 원하는 모든 정도를 담고 있다고 이야기할 수 있을 만큼 많은 정보들이 내재되어 있다. 그러나 이러한 정보의 홍수 속에서 사용자들은 자신이 원하는 정보를 정확히 추출하기란 쉽지 않은 일이며, 정확히 추출이 되었어도 전통적 방식을 따르는 검색엔진은 내용기반 방식을 기초로 웹페이지의 순위를 결정함으로, 사용자에게 중요한 페이지를 상위에 위치시키기란 쉬운 일이 아니다. 본 논문에서는 이러한 전통적 방식의 검색엔진의 문제점을 해결하기 위하여 협동적 순위 평가 방법과 워드넷을 기반으로 검색엔진의 성능 향상 방법을 제안한다.

  • PDF

계층적 캐시 기법을 이용한 대용량 웹 검색 질의 처리 시스템의 구현 (Implementation of a Large-scale Web Query Processing System Using the Multi-level Cache Scheme)

  • 임성채
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.669-679
    • /
    • 2008
  • 웹을 이용한 정보 공개 및 검색이 확대됨에 따라 웹 검색 엔진도 지속적인 주목을 받고 있다. 이에 따라 웹 검색 엔진의 다양한 기술적 문제를 해결하고자 하는 연구가 있었음에도 웹 검색 엔진의 질의 처리 시스템에 대한 기술적 내용은 잘 다뤄지지 않았다. 질의 처리 시스템의 경우 소프트웨어 아키텍처나 운영 기법을 고안하기 어렵기 때문에 본 논문에서는 구현된 상용 시스템을 바탕으로 관련 기술을 소개하고자 한다. 구현된 질의 처리 시스템은 6,500 만개 웹 문서를 색인하여 일 500만개 이상의 사용자 질의 요청을 수행하는 큰 규모의 시스템이다. 구현한 시스템은 질의 처리 결과를 재사용하기 위해 계층적 캐시 기법을 적용했으며, 저장된 캐시 데이타는 4계층으로 구성된 데이타 저장소에 분산 저장되는 것이 특징이다. 계층적 캐시 기법을 통해 질의 처리 용량을 400% 정도로 향상 시킬 수 있었으며 이를 통해 서버 구축비용을 70% 정도 절감할 수 있었다.

Web 검색 엔진의 제목과 문서요약을 이용한 동위어와 문맥의 발견 (Discovery of Coordinate Terms and Context using the Title and Snippet in Web Search)

  • 한상용;이상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.210-215
    • /
    • 2007
  • 웹상에서의 정보량이 증가함에 따라, 사용자가 알고 싶어 하는 단어에 대해서 연관된 단어를 통해서 이해하게 된다. 동위어란 공통의 상위어를 가지는 단어이다. 이를 위한 기존의 연구로서 동위어와 상위어, 하위어 등을 찾는 연구는 많이 있었지만, 웹상의 문서를 이용하여 거대한 코퍼스를 해석해서 결과를 구하는 데 많은 시간이 소요되었다. 이에 본 논문에서는 사용자의 질의어에 대해서 웹 검색엔진이 가지는 제목과 문서요악으로부터 동위어와 문맥을 빠른 시간 안에 발견하는 방법에 대해 제안한다. 어떤 단어에 대한 동위어가 병렬조사 #와#로 접속되는 것을 이용하여 웹 검색 엔진에 대한 질의어를 작성하고, 그 검색 결과로부터 동위어를 얻는다. 이와 동시에 발견된 동위어와 질의어의 배후에 있는 문맥도 얻는다. 이를 통해, 웹 검색에 있어서 질의어의 확장과 비교 대상의 발견 등 폭넓은 분야에서도 적용가능하다고 할 수 있다.

  • PDF