• 제목/요약/키워드: RSS 피드

검색결과 11건 처리시간 0.019초

RSS 피드 파서의 구현을 위한 패키지의 설계 (A Package Design for an RSS Feed Parser Implementation)

  • 이동규;김윤호
    • 한국정보통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.656-669
    • /
    • 2007
  • RSS는 웹사이트에서 제작한 문서를 배포하기 위한 문서 규격이다. 이 문서 규격에 맞게 제작되어 배포되는 문서를 RSS 피드 또는 피드라고 한다. 본 논문은 수집한 RSS 피드를 분석하여 정보를 저장하는 RSS 피드 파서를 위한 패키지의 설계를 제시한다. RSS 명세서에 의거하여 RSS 피드의 문법과 이를 인식하는 오토마타를 설정한다. 이에 의거하여 RSS 피드의 구성요소의 인식 기능을 하는 클래스들을 그룹화하는 방법으로 패키지를 설계하고, 이들 클래스의 예외 처리를 위한 클래스를 설계한다.

RSS 서비스를 위한 최소 누락 수집 정책 (A Minimum Missing Aggregation Policy for RSS Services)

  • 한영근;이상호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권5호
    • /
    • pp.391-399
    • /
    • 2008
  • RSS는 웹 콘텐츠 배급을 위한 XML기반 포맷으로, 사용자는 RSS 피드 수집기를 통해 RSS 피드를 수집한다. RSS 피드를 효과적으로 수집하기 위해서는 RSS 피드에 대한 수집 정책이 필요하다. 본 논문은 RSS 피드 수집 시에 누락되는 포스팅을 최소화하기 위한 RSS 피드 수집 정책을 제안하고, 실험을 통해 제안한 수집 정책과 기존 수집 정책을 비교 분석하였다. 본 논문에서 제안한 수집 정책은 기존 수집 정책과 비교하여 6%의 수집 지연 증가로 23%의 수집 누락이 감소됨을 실험을 통하여 알 수 있었다.

효과적인 콘텐츠 서비스를 위한 RSS피드 검색 엔진의 설계 및 구현 (Design and Implementation of RSS feed search engine for Effective Contents Service)

  • 이해성;권준희
    • 디지털산업정보학회논문지
    • /
    • 제4권1호
    • /
    • pp.1-8
    • /
    • 2008
  • In the Web 2.0, besides more gaining information on the web, the number of web sites that take advantage of RSS increases explosively. Commonly each users search RSS channels through the web search engine before registering RSS channel's url to the RSS reader. Users judge whether the site is RSS channel or not and register an RSS channel's url through theirs interests. Because accomplished by users themselves, those processes conflict to user's convenience and quick consumption of information. Techniques of current search engines can't provide users with reliable RSS feed information as search results. In this paper, we analysis appropriateness of current search engines' techniques that offer users RSS feed search service and discuss their limitations. Also, we make up RSS feed database through classification of RSS tag being possible to search RSS feed information effectively and apply update rate of each RSS channel's feed to ranking algorithm providing more reliable search results.

웹 2.0을 활용한 사용자 맞춤형 게시판의 설계 (A Design of Customized Board using the Web 2.0)

  • 박성신;김창석
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.391-394
    • /
    • 2007
  • 인터넷은 그 탄생 이후로 점점 더 많은 사용자들을 가지게 되었으며, 이러한 사용자들로 인하여 인터넷으로 흘러나오는 정보의 양은 갈수록 더 많아지고 있다. 특히, 인터넷 게시판은 수많은 사용자들의 생각과 그들이 가진 정보를 교환하기 위하여 주요한 방법으로 사용되고 있다. 본 연구에서는 웹 2.0을 활용하여 각각의 사용자에게 맞춤형 서비스를 제공하는 인터넷 게시판을 설계한다. 설계될 인터넷 게시판은 사용자에게 제공되는 정보는 동일하지만, 각 사용자마다 설정된 정보에 의하여 정보의 분류가 다르게 이루어지도록 하여 자신이 원하는 정보를 보다 빠르게 검색할 수 있도록 하였다. 또한, 각 사용자는 개인 게시판을 생성하여 모든 사용자가 공유하는 게시판에서 자신에게 필요한 정보만을 자동으로 수집하여 저장할 수 있으며, 외부 RSS 피드들을 필터링하여 개인 게시판에 연결하거나, 자신만의 정보를 개인 게시판에 등록할 수도 있다. 위와 같이 방법들은 사용자가 약간의 정보를 미리 등록해 주는 것만으로 여러 게시판과 RSS 피드들로부터 자기가 원하는 최신정보들을 실시간으로 수집하여 개인 게시판에 저장해주며, 간단한 클릭 몇 번으로 게시판의 형태가 변경되어 각각의 사용자가 원하는 정보를 빠른 시간에 찾을 수 있도록 해주게 될 것이다.

  • PDF

콘텐츠 신디케이션을 이용한 웹 데이터 수집 및 활용 (Web Data Collection and Utilization using Content Syndication)

  • 황상현;김희완
    • 서비스연구
    • /
    • 제5권2호
    • /
    • pp.83-92
    • /
    • 2015
  • 웹 상에는 수 많은 데이터가 존재하고 있지만 원하는 데이터를 수집하여 서비스 제공을 위한 콘텐츠로 가공해 내는 것은 쉽지 않다. 그 이유 중 하나가 바로 표준화된 데이터 제공 방식이 없기 때문이다. 따라서 사이트 콘텐츠의 일부 또는 전체를 다른 서비스에서 이용할 수 있도록 해주는 콘텐츠 신디케이션은 매우 중요하다고 볼 수 있다. 콘텐츠 신디케이션의 대표적 포맷으로 XML에 기반한 RSS와 Atom, OPML 등이 있다. 이러한 신디케이션 포맷에서 제공하는 링크를 통틀어 피드 주소라고 한다. 피드 주소를 이용하면 기존 HTML을 파싱하는 것 보다 빠르게 데이터를 수집할 수 있고 데이터 제공자는 간편하게 데이터를 외부로 제공할 수 있다는 장점이 있다. 본 논문에서는 피드 주소를 기반으로 하는 웹 데이터 수집 시스템을 구현하여 수집하여 얻은 데이터를 바탕으로 해당 데이터를 가공하고 활용하는 방법을 제안하였다.

웹 2.0을 기반으로 한 맞춤형 게시판 (The Design of Customized Board using the Web 2.0)

  • 박성신;김창석;김대수
    • 한국지능시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.773-779
    • /
    • 2007
  • 인터넷 게시판은 수많은 사용자들의 생각과 그들이 가진 정보를 교환하기 위하여 주요한 방법으로 사용되고 있다. 그러나 공동의 게시판은 사용자 개개인의 관심분야를 만족시키지 못한다. 본 연구에서는 웹 2.0을 활용하여 각각의 사용자에게 맞춤형 서비스를 제공하는 인터넷 게시판을 설계한다. 설계될 인터넷 게시판은 사용자에게 제공되는 정보는 동일하지만, 각 사용자마다 설정된 정보에 의하여 정보의 분류가 다르게 이루어지도록 하여 자신이 원하는 정보를 보다 빠르게 검색할 수 있도록 하였다. 또한, 각 사용자는 개인 게시판을 생성하여 모든 사용자가 공유하는 게시판에서 자신에게 필요한 정보만을 자동으로 수집하여 저장할 수 있으며, 외부 RSS 피드들을 필터링하여 개인 게시판에 연결하거나, 자신만의 정보를 개인 게시판에 등록할 수도 있다.

웹 2.0 기반 RSS 데이터 수집 엔진의 설계 및 구현 (A Design and Implementation of RSS Data Collecting Engine based on Web 2.0)

  • 강필구;김재환;이상준;채진석
    • 한국멀티미디어학회논문지
    • /
    • 제10권11호
    • /
    • pp.1496-1506
    • /
    • 2007
  • 기존의 웹 서비스가 정적이고 수동적인데 반해 최근의 웹 서비스는 점차 동적이고 능동적으로 변화하고 있는데, 이러한 웹 서비스 변화의 흐름을 잘 반영하는 것이 웹 2.0이다. 웹 2.0의 특징은 사용자가 능동적으로 참여하여 정보를 생산하는 것인데, 이렇게 되면, 생산되는 정보의 양이 지속적으로 증가하게 되므로 더 빠르고 정확한 정보를 공유할 필요가 있다. 이러한 필요성을 충족시키는 기술이 웹 2.0의 웹 신디케이션 기술과 태그 기술이다. 웹 신디케이션은 웹 사이트의 내용을 다른 사이트나 사용자가 받아볼 수 있도록 피드를 만든다. 태그는 정보의 핵심이 되는 단어로, 여러 인터넷 사용자들이 태그를 통한 검색으로 좀 더 빠른 정보의 공유를 가능하게 한다. 이 논문에서는 웹 2.0의 핵심 기술인 웹 신디케이션과 태그의 활용을 높이기 위한 방법으로 데이터 수집 엔진을 만들어 데이터를 효율적으로 관리하는 기법을 제안하였다. 데이터 수집 엔진은 데이터베이스에 저장된 사용자의 웹 사이트 정보를 이용하여 사용자의 웹 사이트에 접속하여 업데이트된 데이터를 수집한다. 이 논문에서 제안한 데이터 수집 엔진을 사용하여 실험한 결과 기존의 기법에 비해 검색 속도가 최대 3.14배 향상되었고, 연관 태그를 구성하는데 사용되는 데이터 건수가 최대 66%까지 감소함을 확인할 수 있었다.

  • PDF

효율적인 클라우드 인프라 및 서비스 메쉬업을 위한 미들웨어 구조 연구 (A Study on Structure of Middleware for Effective Cloud Infra and Service Mashup)

  • 박승균;박용성;성기원;윤찬현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1549-1550
    • /
    • 2011
  • 현재의 다양한 메쉬업(Mashup) 기술은 웹에서 제공되는 데이터, 웹서비스, RSS/Atom 피드 등에만 사용이 국한되어 있기 때문에, 클라우드 환경에 적용하게 되면 SaaS(Software as a Service) 형태의 서비스로만 구성되게 된다. 하지만, 클라우드에서는 인프라 자원들도 서비스의 형태로 접근될 수 있으며, 이를 이용한 메쉬업이 가능하다. 이에 본 논문에서는 클라우드의 인프라 자원 및 SaaS 형태의 서비스를 메쉬업 할 수 있는 효율적인 미들웨어 구조를 제안하고자 한다.

블로그에서 포스팅 성향 분석과 갱신 가능성 예측 (Analysis of Posting Preferences and Prediction of Update Probability on Blogs)

  • 이범석;황병연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권5호
    • /
    • pp.258-266
    • /
    • 2010
  • 메타 블로그에 등록된 RSS(Really Simple Syndication)의 수는 수십만 개 또는 수백만 개에 이른다. 따라서 이들에 대한 갱신 확인을 수행하는 것은 상당히 긴 시간과 네트워크 자원을 필요로 한다. 메타 블로그나 블로그 검색엔진은 제한된 자원을 가지고 있기 때문에 하루에 방문할 수 있는 블로그의 수가 제한적이다. 하지만 블로그 검색엔진의 성능향상을 위해 새로운 데이터를 최대한 수집하는 것이 필요하기 때문에, 우리는 이 논문에서 수집 효율을 높이기 위한 새로운 방법을 제안한다. 제안하는 방법은 블로그의 포스팅 성향을 분석하여 그것을 토대로 향후 갱신 가능성에 대해 예측하고 갱신 가능성이 높은 시점에만 갱신 확인을 수행한다. 이 연구는 블로그의 입장에서는 분산 서비스 거부 공격(DDoS Attack: Distributed Denial-of-Service Attack)만큼이나 빈번한 갱신확인을 줄이는데 도움이 되고, 인터넷 전체로 보아서는 트래픽을 감소시키는데 기여할 수 있다. 본 논문에서는 블로거들의 포스팅이 이루어지는 요일과 시간에 특정한 패턴이 존재할 것이라는 가정을 하고, 15119개의 실제 블로그에 작성된 포스트에 대해 요일과 시간의 선호도를 분석하였다. 그리고 과거의 포스팅 이력과 요일에 대한 선호도를 바탕으로 갱신 가능성을 예측하기 위한 방법을 제안하고, 12115개의 실제 블로그에 적용하여 그 정확도를 확인하였다. 성능평가를 통해 약 93.06%의 블로그에서 0.5 이상의 정확도를 가짐을 확인하였다.