• Title/Summary/Keyword: 웹 서비스 추출

Search Result 271, Processing Time 0.024 seconds

Implementation and Design of Robot Engine for Web Collection (웹 수집 로봇 엔진의 설계 및 구현)

  • Kim, Dae-You;Kim, Jung-Tae
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2007.10a
    • /
    • pp.313-317
    • /
    • 2007
  • 인터넷의 이용이 활발해짐에 따라 수많은 정보들이 웹을 통하여 공개되고 있으며, 이용자는 웹 검색 서비스를 이용하여 이러한 정보들에 효과적으로 접근할 수 있다. 웹 검색 서비스의 구축을 위해서는 웹 로봇을 사용한 웹 문서 수집이 선행되어야 하며, 웹 문서들의 수가 급격히 증가하면서 양질의 웹 문서들을 효과적으로 수집할 수 있는 웹 로봇에 대한 필요성이 증가되고 있으며, 그에 따른 많은 웹 수집 로봇이 탄생되고 있다. 본 논문에서는 효과적인 웹 수집 로봇의 설계와 동적인 웹페이지에서 사용하는 자바스크립트의 링크 추출방안에 대하여 제시하고자 한다.

  • PDF

Implementation of perfume recommendation service using web crawling and image color extraction artificial intelligence (웹 크롤링과 이미지 색상 추출 인공지능을 이용한 향수 추천 서비스 구현)

  • Yu-jin Kim;Ye-lim Lee;Sung-Yoon Jung;Yu-jin Jo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.758-759
    • /
    • 2023
  • 이 논문에서는 웹 크롤링과 인공지능의 색상 추출 기능을 사용하여 사용자에게 맞는 향수를 추천해주는 서비스를 구현한다. 웹 사이트 제작에 용이한 Java 와 웹 크롤링과 인공지능 구현에 용이한 Python 을 기반으로 구현하였다.

Web Application Generation System Based on UML (UML 기반의 웹 어플리케이션 자동 생성 시스템)

  • 정진영;송정길
    • Journal of the Korea Computer Industry Society
    • /
    • v.3 no.5
    • /
    • pp.661-670
    • /
    • 2002
  • As web technology is developed, web application becomes the basis which combines business services. However, most of the web applications have depended upon the capability of the web developer. When web application is developing, the property of the web should be considered in the ways of approach and modeling. In this paper, after modeling web application using UML and the extend of UML, web pages are extracted automatically. Thus, web application developing is easy to be maintained and to be repaired on a large scale.

  • PDF

Text Extraction and Summarization from Web News (웹 뉴스의 기사 추출과 요약)

  • Han, Kwang-Rok;Sun, Bok-Keun;Yoo, Hyoung-Sun
    • Journal of the Korea Society of Computer and Information
    • /
    • v.12 no.5
    • /
    • pp.1-10
    • /
    • 2007
  • Many types of information provided through the web including news contents contain unnecessary clutters. These clutters make it difficult to build automated information processing systems such as the summarization, extraction and retrieval of documents. We propose a system that extracts and summarizes news contents from the web. The extraction system receives news contents in HTML as input and builds an element tree similar to DOM tree, and extracts texts while removing clutters with the hyperlink attribute in the HTML tag from the element tree. Texts extracted through the extraction system are transferred to the summarization system, which extracts key sentences from the texts. We implement the summarization system using co-occurrence relation graph. The summarized sentences of this paper are expected to be transmissible to PDA or cellular phone by message services such as SMS.

  • PDF

Automatic Bookmarking System to Improve Web Accessibility (웹의 접근성 향상을 위한 자동 북마크 시스템)

  • 이시은;황인준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10e
    • /
    • pp.187-189
    • /
    • 2002
  • 웹 환경이 복잡해짐에 따라 시각 장애인이 웹 페이지에서 원하는 정보와 서비스를 찾는데 많은 시간이 소요된다. 본 논문에서는 웹의 접근성 향상을 위해 웹 페이지를 분석해사용자가 접근하는 객체와 관련 된 객체 주변의 정보를 추출하여 자동으로 북마크를 생성하고, 이를 이용하여 재접근 시에 저장된 북마크가 반영된 페이지로 변환시키는 시스템을 제안한다. 본 시스템의 특징은 전체 페이지가 아닌 사용자의 접근 구역을 자동 추출함으로써 재접근 시의 소요시간을 단축시키고 페이지에 변화가 있을 경우에도 저장된 북마크 정보와 가장 상응되는 객체나 구역을 추출하여 유동적으로 제공한다는 것이다. 또한 이전에 접근한 객체나 구역만으로 구성된 변환 페이지를 생성하여 사용자에게 원본(original) 페이지와 변환 페이지 사이를 필요에 따라 전환할 수 있게 한다.

  • PDF

전자해도 데이터 기반 웹 맵 서비스 구축에 관한 연구

  • Lee, Yeong-Ju;O, Jae-Yong;Kim, Hye-Jin;Park, Se-Gil;Park, Ji-Su
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2016.05a
    • /
    • pp.319-321
    • /
    • 2016
  • 전자해도는 전자해도표시시스템(ECDIS)에 사용할 목적으로 선박의 항해와 관련된 모든 해도 정보를 국제수로기구(IHO)의 표준규격(S-57)에 따라 제작된 디지털해도를 말한다. 전자해도는 주로 전자해도표시시스템를 통해 이용되거나 필요한 데이터를 추출, 가공 절차를 거쳐 활용되고 있다. 본 연구에서는 전자해도 데이터 기반 웹 맵 서비스 구축 방법을 제시한다. 웹 맵 서비스는 다양한 플랫폼에서 사용할 수 있어 전자해도의 활용도를 높여주고, 맵 데이터의 업데이트를 용이하게 한다. 향후 제시된 방법을 통해 전자해도 데이터 기반의 시스템 개발에 폭넓게 활용될 것으로 예상된다.

  • PDF

Service-based Personalization System for Mobile User (모바일 사용자를 위한 서비스 중심의 개인화 시스템)

  • 전영효;황인준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10e
    • /
    • pp.367-369
    • /
    • 2002
  • 인터넷 검색 기술은 발전을 거듭하고 있지만 불필요한 정보의 과잉현상으로 개인에게 필요한 정보나 서비스를 찾기 위해서는 많은 시간과 노력이 필요하다. 웹 사이트 개인화(web site personalization)는 이러한 문제점을 해결하기 위한 노력으로 맞춤형 정보를 제공한다. 특히 차세대 인터넷 접속 매체인 PDA나 휴대폰, 스마트폰 등 모바일 단말기가 보편화되면서 작은 화면이나 낮은 대역폭과 같은 무선 환경의 단점을 극복하고 개인화의 장점을 얻을 수 있는 연구들이 활발히 진행되고 있다. 본 논문에서는 웹 사이트에서 제공되는 서비스 페이지들을 사용자의 개인별 선호도에 따라 쉽게 접근할 수 있도록 추출하여 제공함으로써 단순히 웹 페이지에 대한 사용자 접근 패턴을 이용한 기존 모바일 개인화 시스템의 단점을 극복한 웹 서비스 페이지 중심의 모바일 개인화 기법을 제안한다.

  • PDF

Web Information Extraction for Expanding Knowledge Base of a Specific Domain Information Agent (특정 영역 정보 에이전트의 지식베이스 확장을 위한 웹 정보추출)

  • 조은휘;변영태
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.336-341
    • /
    • 2002
  • 현재 연구개발 중인 웹 정보 에이전트는 Agent Manager와 KB Manager. Web Manager로 구성되어 있다. 이 시스템은 동물영역에 관련된 정보를 영어로 서비스하고 있어 국내 접근보다는 외국에서의 접근이 더 많았다. 그러므로 국내 사용을 높이기 위해 애완용 동물을 위주로 한 정보추출(IE)을 수행하여 지식베이스(KB)의 확장을 시도하고 있다. 이를 위하여 태그(tag) 및 심볼(symbol)의 패턴(pattern) 유사성 정보를 찾아내고, 기존 KB와 연계하여 KB의 확장 및 수정에 이용하기 위한 유효 정보 패턴 결정에 활용함으로써 정보 추출의 새로운 방법을 고찰하고 그 가능성을 제시하고자 한다.

  • PDF

Extraction method of spatial relation by analyzing location tag in folksonomy (폭소노미에서 위치태그 분석을 통한 공간관계 추출 기법)

  • Choi, Yun-Hee;Yong, Hwan-Seung
    • Journal of Korea Multimedia Society
    • /
    • v.12 no.8
    • /
    • pp.1043-1054
    • /
    • 2009
  • As the semantic web receives higher concern with an intensified necessity in these days, the research on the ontology as its core technology has been carried out in various fields. The ontology has been adopted as an alternative to work out lots of problematic issues resulted from the insufficient vocabulary selection rules in folksonomy, widely accepted under Web 2.0. Therefore the importance of research to complementarily consolidate the two disciplines, the folksonomy and the ontology, has been increased. Based on this idea this research proposes a system, which pulls out, using open services, the location information tags from folksonomy-based metadata, ultimately extracts, following location information analyses, spatial relationships among tags, and in turn automatically constructs self-correcting location information domain ontology. The system devised in this study will associate data derived from easily accessible folksonomy with meaningful and technological information from ontology.

  • PDF

A Study on the Extraction and Integration of Learning Object Meta-data using Web Service of Databases (DBMS의 웹서비스를 이용한 학습객체 메타데이터 추출 및 통합에 관한 연구)

  • Choe, Hyun-Jong
    • Journal of The Korean Association of Information Education
    • /
    • v.7 no.2
    • /
    • pp.199-206
    • /
    • 2003
  • XML is becoming a new developing tool of web technology because of its ability of data management and flexibility in data presentation. So it's well researched that the reusability and integration with learning objects such as text, image, sound, video and plug-in programs of web contents in computer education. But the research for storing, extracting and integrating metadata about learning object was needed prior to implementing online learning system to integrate and manage it. Therefore this study propose a new method of using web service of DBMS for extracting learning object's metadata in database server which located in 3-tier system. To evaluate the efficiency of proposed method, The test server and two DBMSs(MS SQL Server 2000 and Oracle 9i) which have 30 metadata was implemented and the response time of it was measured. The response time of it was short, but in order to using this method the additional programming with SAX/DOM was necessary.

  • PDF