• 제목/요약/키워드: Web engine

검색결과 483건 처리시간 0.026초

차세대 웹 환경에서의 Rete Algorithm을 이용한 정방향 추론엔진 SMART - F 개발 (Development of Forward chaining inference engine SMART-F using Rete Algorithm in the Semantic Web)

  • 정균범;홍준석;김우주;이명진;박지형;송용욱
    • 지능정보연구
    • /
    • 제13권3호
    • /
    • pp.17-29
    • /
    • 2007
  • 웹 표준 언어인 XML에 기반한 각종 표준들을 바탕으로 소프트웨어 에이전트와의 인터페이스에 초점을 맞추고 있는 차세대 웹에서 소프트웨어 에이전트의 두뇌 역할을 수행하기 위한 추론엔진은 시맨틱 웹(Semantic Web)에서의 규칙 표현을 위한 언어인 SWRL(Semantic Web Rule Language)을 이해할 수 있어야 한다. 본 연구에서는 SWRL을 규칙 표현 방법으로 사용하고, OWL을 사실 표현 방법으로 사용하는 정방향 추론엔진인 SMART-F(SeMantic web Agent Reasoning Tools-Forward chaining inference engine)을 개발하고자 한다. 전통적인 규칙 추론 분야에서는 정방향 추론을 위하여 if-then 형태의 규칙을 네트워크 구조로 변환하여 정방향 규칙 추론의 효율성을 높인 Rete 알고리즘이 많이 사용되고 있다. 이를 시맨틱 웹 환경에 적용하기 위하여 SWRL 기반 정방향 추론을 위한 요구 기능을 분석하고, Rete 알고리즘에 도출된 차세대 시맨틱 웹의 요구 기능을 반영한 정방향 추론 알고리즘을 설계하였다. 또한, 유비쿼터스 환경에서의 각종 플랫폼의 독립성과 이식성을 확보하고 기기간의 성능 차이를 극복할 수 있도록 사실 베이스 및 규칙 베이스의 관리도구와 정방향 추론 엔진 등을 Java 컴포넌트로 개발하였으며, 이는 이미 개발된 역방향 추론엔진인 SMART-B와 규칙 베이스 및 사실 베이스를 완벽하게 호환 가능하므로 차세대 웹 환경에서의 지식 활용을 극대화시킬 것이다.

  • PDF

로컬 웹사이트의 탐색전략과 웹사이트 유형분석에 관한 연구 (A Study on the Crawling and Classification Strategy for Local Website)

  • 황인수
    • Journal of Information Technology Applications and Management
    • /
    • 제13권2호
    • /
    • pp.55-65
    • /
    • 2006
  • Since the World-Wide Web (WWW) has become a major channel for information delivery, information overload also has become a serious problem to the Internet users. Therefore, effective information searching is critical to the success of Internet services. We present an integrated search engine for searching relevant web pages on the WWW in a certain Internet domain. It supports a local search on the web sites. The spider obtains all of the web pages from the web sites through web links. It operates autonomously without any human supervision. We developed state transition diagram to control navigation and analyze link structure of each web site. We have implemented an integrated local search engine and it shows that a higher satisfaction is obtained. From the user evaluation, we also find that higher precision is obtained.

  • PDF

네트워크 및 웹 서버의 부하를 고려한 지능적인 검색시스템의 설계 및 구현 (Intelligential Search Engine Considering the Load of Web Servers and Networks)

  • 김창근;탁한호
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권8호
    • /
    • pp.1035-1044
    • /
    • 2001
  • 기존의 검색엔진은 분산된 불특정 다수의 웹 서버에 대해 웹 서버 부하, 네트워크 부하를 고려하지 않고 로봇을 동작시키므로 웹서버 및 네트워크의 과부하를 초래한다. 또한 정보의 갱신 기간도 3∼4주 간격으로 필요한 시기에 정보가 갱신되지 않는 경우가 많으며, 웹서버의 내용 변경이 없음에도 불구하고 무조건 웹서버의 내용을 수집하여 갱신한다. 본 논문에서는 네트워크 및 웹서버 부하를 고려한 지능적인 검색시스템을 제안하고, 이 시스템에 필요한 실시간 제어 검색엔진 및 분산되어 있는 정보를 모아서 갱신해 주는 지능적인 로봇을 설계 및 구현하였으며, 네트워크 부하 및 웹 서버의 부하를 모니터링하여 전체 시스템의 성능을 향상시킬 수 있는 로봇 제어 정책을 수립하였다.

  • PDF

자바스크립트 함수처리 기능을 포함한 분산처리 방식의 웹 수집 로봇의 설계 (Efficient Design of Web Searching Robot Engine Using Distributed Processing Method with Javascript Function)

  • 김대유;김정태
    • 한국정보통신학회논문지
    • /
    • 제13권12호
    • /
    • pp.2595-2602
    • /
    • 2009
  • 본 논문에서는 기존의 웹 수집 로봇에서 처리 하지 못하는 자바스크립트 함수 링크를 처리하기 위하여 인터넷 익스플로러의 "Active Script Engine"을 사용하여 웹 로봇을 구현하였으며, 또한 자바스크립트 함수 링크를 처리하였을 경우 웹 수집 로봇의 수집량을 측정하기 위한 웹 수집 로봇을 개발하였다. 웹 수집 로봇을 개발하기 위해서 구글봇과 네이봇 등 웹 수집 로봇의 구조를 파악하여, 수집 로봇에 활용되는 구성요소를 구현하고 분산처리 형태의 웹 수집 로봇을 설계하였다. 또한 제안된 웹 로봇에 제안된 자바스크립트 처리 모델을 추가하여 성능평가를 하였으며, 성능평가방법은 자바스크립트를 사용하는 웹 사이트의 게시판을 대상으로 하여 웹 수집량을 비교 분석하였다. 웹 사이트 게시물 1000개인 경우, 일반 웹 로봇의 경우에는 1페이지밖에 수집하지 못하였고, 제안된 웹 로봇의 경우 1000개 이상의 웹 페이지를 수집하는 결과를 얻었다.

WebGL 기반의 상호작용 콘텐츠를 위한 행위 엔진 (Behavior Engine for WebGL-based Interactive Contents)

  • 서진석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.862-865
    • /
    • 2011
  • WebGL은 OpenGL ES 2.0기반의 로우레벨(low-level) 3차원 그래픽스 API를 위한 크로스 플랫폼 웹 표준으로써, 웹 브라우저에서 별도의 플러그인을 설치하지 않고도 3차원 그래픽을 표현할 수 있도록 해준다. WebGL이 더욱 관심을 끌고 있는 이유는 PC 뿐만 아니라 스마트폰, 태블릿, 스마트 TV 등 다양한 디바이스를 위한 차세대 RIA(Rich Internet Application) 플랫폼으로 각광을 받고 있는 HTML5의 표준 안에 포함되기 때문이다. 본 연구에서는 WebGL 기반의 콘텐츠에서 복잡한 상호작용과 3차원 객체의 행위 모델을 쉽고 빠르게 저작하기 위한 행위 엔진을 제안하고 개발하고자 한다.

  • PDF

Implementation of Search Engine to Minimize Traffic Using Blockchain-Based Web Usage History Management System

  • Yu, Sunghyun;Yeom, Cheolmin;Won, Yoojae
    • Journal of Information Processing Systems
    • /
    • 제17권5호
    • /
    • pp.989-1003
    • /
    • 2021
  • With the recent increase in the types of services provided by Internet companies, collection of various types of data has become a necessity. Data collectors corresponding to web services profit by collecting users' data indiscriminately and providing it to the associated services. However, the data provider remains unaware of the manner in which the data are collected and used. Furthermore, the data collector of a web service consumes web resources by generating a large amount of web traffic. This traffic can damage servers by causing service outages. In this study, we propose a website search engine that employs a system that controls user information using blockchains and builds its database based on the recorded information. The system is divided into three parts: a collection section that uses proxy, a management section that uses blockchains, and a search engine that uses a built-in database. This structure allows data sovereigns to manage their data more transparently. Search engines that use blockchains do not use internet bots, and instead use the data generated by user behavior. This avoids generation of traffic from internet bots and can, thereby, contribute to creating a better web ecosystem.

효과적인 콘텐츠 서비스를 위한 RSS피드 검색 엔진의 설계 및 구현 (Design and Implementation of RSS feed search engine for Effective Contents Service)

  • 이해성;권준희
    • 디지털산업정보학회논문지
    • /
    • 제4권1호
    • /
    • pp.1-8
    • /
    • 2008
  • In the Web 2.0, besides more gaining information on the web, the number of web sites that take advantage of RSS increases explosively. Commonly each users search RSS channels through the web search engine before registering RSS channel's url to the RSS reader. Users judge whether the site is RSS channel or not and register an RSS channel's url through theirs interests. Because accomplished by users themselves, those processes conflict to user's convenience and quick consumption of information. Techniques of current search engines can't provide users with reliable RSS feed information as search results. In this paper, we analysis appropriateness of current search engines' techniques that offer users RSS feed search service and discuss their limitations. Also, we make up RSS feed database through classification of RSS tag being possible to search RSS feed information effectively and apply update rate of each RSS channel's feed to ranking algorithm providing more reliable search results.

연관 규칙 탐사 기법을 이용한 선박 부품 전문 검색 엔진의 설계 및 구현 (Design and Implementation of the Specialized Internet Search Engine for Ship′s Parts Using Method of Mining for the Association Rule Discovery)

  • 하창승;윤병수;성창규;김종화;류길수
    • 한국마린엔지니어링학회:학술대회논문집
    • /
    • 한국마린엔지니어링학회 2002년도 춘계학술대회논문집
    • /
    • pp.225-231
    • /
    • 2002
  • A specialized web search engine is an internet tool for detecting information in finite cyber world. It helps to retrieve necessary information in internet sites quickly In this paper, we design and implement a prototype search engine using method of mining for the association rule discovery. It consists of a search engine part and a search robot part. The search engine uses keyword method and is considered as various user oriented interface. The search robot fetches information related to ship parts n world wide web. The experiments show that our search engine(AISE) is superior to other search engines in collecting necessary informations.

  • PDF

XML 웹 서비스 검색 엔진의 개발 (Development of a XML Web Services Retrieval Engine)

  • 손승범;오일진;황윤영;이경하;이규철
    • Journal of Information Technology Applications and Management
    • /
    • 제13권4호
    • /
    • pp.121-140
    • /
    • 2006
  • UDDI (Universal Discovery Description and Integration) Registry is used for Web Services registration and search. UDDI offers the search result to the keyword-based query. UDDI supports WSDL registration but it does not supports WSDL search. So it is required that contents based search and ranking using name and description in UDDI registration information and WSDL. This paper proposes a retrieval engine considering contents of services registered in the UDDI and WSDL. It uses Vector Space Model for similarity comparison between contents of those. UDDI registry information hierarchy and WSDL hierarchy are considered during searching process. This engine suppports two discovery methods. One is Keyword-based search and the other is template-based search supporting ranking for user's query. Template-based search offers how service interfaces correspond to the query for WSDL documents. Proposed retrieval engine can offer search result more accurately than one which UDDI offers and it can retrieve WSDL which is registered in UDDI in detail.

  • PDF

Document Classification Model Using Web Documents for Balancing Training Corpus Size per Category

  • Park, So-Young;Chang, Juno;Kihl, Taesuk
    • Journal of information and communication convergence engineering
    • /
    • 제11권4호
    • /
    • pp.268-273
    • /
    • 2013
  • In this paper, we propose a document classification model using Web documents as a part of the training corpus in order to resolve the imbalance of the training corpus size per category. For the purpose of retrieving the Web documents closely related to each category, the proposed document classification model calculates the matching score between word features and each category, and generates a Web search query by combining the higher-ranked word features and the category title. Then, the proposed document classification model sends each combined query to the open application programming interface of the Web search engine, and receives the snippet results retrieved from the Web search engine. Finally, the proposed document classification model adds these snippet results as Web documents to the training corpus. Experimental results show that the method that considers the balance of the training corpus size per category exhibits better performance in some categories with small training sets.