• 제목/요약/키워드: Dynamic Web Pages

검색결과 48건 처리시간 0.028초

웹 컨텐츠 선호도 측정을 위한 대용량 웹로그 분석기 구현 (Implementation of big web logs analyzer in estimating preferences for web contents)

  • 최은정;김명주
    • 디지털산업정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.83-90
    • /
    • 2012
  • With the rapid growth of internet infrastructure, World Wide Web is evolving recently into various services such as cloud computing, social network services. It simply go beyond the sharing of information. It started to provide new services such as E-business, remote control or management, providing virtual services, and recently it is evolving into new services such as cloud computing and social network services. These kinds of communications through World Wide Web have been interested in and have developed user-centric customized services rather than providing provider-centric informations. In these environments, it is very important to check and analyze the user requests to a website. Especially, estimating user preferences is most important. For these reasons, analyzing web logs is being done, however, it has limitations that the most of data to analyze are based on page unit statistics. Therefore, it is not enough to evaluate user preferences only by statistics of specific page. Because recent main contents of web page design are being made of media files such as image files, and of dynamic pages utilizing the techniques of CSS, Div, iFrame etc. In this paper, large log analyzer was designed and executed to analyze web server log to estimate web contents preferences of users. With mapreduce which is based on Hadoop, large logs were analyzed and web contents preferences of media files such as image files, sounds and videos were estimated.

러프 셋 이론을 이용한 시퀀스 데이터의 클러스터링 알고리즘 (A Clustering Algorithm for Sequence Data Using Rough Set Theory)

  • 오승준;박찬웅
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.113-119
    • /
    • 2008
  • 월드 와이드 웹에는 거대한 양의 하이퍼링크들과 웹 사용 정보들을 포함하고 있는 동적인 페이지들이 모여 있다. 이러한 구조화되어 있지 않은 웹 데이터들과 온라인 정보들의 폭발적인 증가로 인해 효율적인 웹 데이터 마이닝 툴이 필요로 하게 되었다. 최근에는 웹 사용자들의 특성을 자동적으로 발견하기 위한 Web usage mining 분야에서 많은 연구가 진행되고 있다. 본 연구에서는 웹 사용자들의 방문 기록, 단백질 시퀀스, 소매점 거래 데이터 등과 같은 시퀀스 데이터를 분석하는 방법에 대하여 연구한다. 러프 셋 이론을 이용하여 시퀀스 데이터들을 클러스터링 하는 방법을 제안하고, 간단한 예제를 통하여 제안하는 절차를 소개하고 splice 데이터셋과 합성 데이터셋을 통한 실험 결과를 제시한다.

  • PDF

WebPR :빈발 순회패턴 탐사에 기반한 동적 웹페이지 추천 알고리즘 (WebPR : A Dynamic Web Page Recommendation Algorithm Based on Mining Frequent Traversal Patterns)

  • 윤선희;김삼근;이창훈
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.187-198
    • /
    • 2004
  • 월드 와이드 웹(World-Wide Web)은 가장 커다란 분산된 정보저장소로서 계속하여 빠른 속도로 성장해왔다. 그러나 비록 웹이 빠른 속도로 성장하고 있다 할지라도, 웹의 정보를 읽고 이해하는 데는 본질적으로 한계가 있다. 웹 사용자 입장에서 보면 웹의 정보 폭발, 꾸준하게 변화하는 환경, 사용자 요구에 대한 이해 부족 둥으로 오히려 혼란을 겪을 수 있다. 웹의 이러한 환경에서 사용자의 순회패턴(traversal patterns)을 탐사하는 것은 시스템 설계나 정보서비스 제공 측면에서 중요한 문제이다. 순회패턴 탐사에 관한 기존의 연구들은 세션(sessions)에 나타나는 페이지들간의 연관성 정보를 충분히 활용하지 못한다. 본 논문에서는 세션에 나타나는 페이지들간의 연관성 정보를 활용하여 빈발 k-페이지집합을 탐사하고, 이를 기반으로 하여 추천 페이지집합을 생성함으로써 효율적인 웹 정보서비스를 제공할 수 있는 Web Page Recommend(WebPR) 알고리즘들을 제안한다. 제안한 WebPR 알고리즘은 웹 사이트를 방문한 사용자에게 추천 페이지집합을 포함하는 새로운 페이지뷰(pageview)를 제공함으로써 궁극적으로 찾고자하는 목표 페이지에 효과적으로 접근할 수 있도록 해준다. 기존 연구들과의 가장 큰 차이점은 페이지들간의 연관성 정보를 활용하는 방법들을 일관성 있게 고려하고 있다는 점과 가장 효율적인 트리모델을 제안한다는 점이다. 두개의 실제 웹로그(Weblog) 데이터에 대한 실험은 제안한 방법이 기존의 방법들보다 성능이 우수함을 보여준다.

ASE 파일 파싱과 모델 데이터베이스 연동을 통한 3D 웹 서비스 설계 및 구현 (Design and Implementation of 3D Web Service based on ASE File and Model Database)

  • 여윤석;박종구
    • 정보처리학회논문지D
    • /
    • 제11D권6호
    • /
    • pp.1327-1334
    • /
    • 2004
  • 본 논문의 목적은 기존의 정적인 정보검색의 형태를 탈피하여 동적이면서 사용자 지향적인 범용 3D모델 데이터 렌더링을 인터넷 사용자들에게 제공할 수 있는 환경을 설계 및 구현하는 것이다. 이는 3차원 렌더링 프로그램을 실행하여 사용자가 원하는 정보의 결과를 확인하거나 변경하는 등의 동적 정보를 제공하는 웹 서비스를 구현하는 것이다. 이를 위해 가장 보편적인 3차원 모델 데이터, 3D 스튜디오 맥스의 텍스트 출력물인 ASE 포맷 파일을 파싱하여 렌더링 해주는 3D Viewer 프로그램을 제작하고, 이를 ActiveX 컴포넌트인 OCX로 만들어 웹 페이지 상에서 실행 가능하게 한다. 데이터의 효율적 관리와 사용자와의 상호작용을 위하여 ASE 모델들을 위한 데이터베이스를 구축하여 사용자 상호작용적인 Web 3D 웹 서비스를 실현한다. 이를 통하여 인터넷을 통한 실시간적인 정보 교환이나, 네트워크상의 가상공간 내에서의 공동 업무 작업의 가능성을 내다본다.

DOM을 이용한 PC 웹 페이지에서 모바일 웹 페이지로의 다이나믹 오브젝트 변환 및 서비스 기법 (A Scheme that Transcodes and Services from PC Web Page to Mobile Web Page of Dynamic Object with DOM)

  • 김종근;강의선;심근정;고희애;임영환
    • 정보처리학회논문지D
    • /
    • 제14D권3호
    • /
    • pp.355-362
    • /
    • 2007
  • 이동 통신 단말기의 발달과 모바일 인터넷의 확산으로 많은 사용자들은 언제 어디서나 모바일 웹 콘텐츠를 이용 할 수 있게 되었으며 나아가 더 많은 콘텐츠의 서비스를 요구하게 될 것이다. 이러한 요구로 인하여 유선 웹 콘텐츠를 모바일 웹에 사용할 수 있도록 콘텐츠를 변환하는 연구들이 많이 진행되고 있으나, 통신사 및 모바일 단말기들의 지원사양이 표준화되지 않아 모바일 웹 콘텐츠의 변환 및 생성에 많은 어려움이 따르고 있다. 특히나 유선 웹 페이지의 내용 중에 시간이나 사용자에 따라 그 내용이 동적으로 변화하는 다이나믹 오브젝트를 모바일 웹에 서비스하기 위해서는 각각의 단말기에 맞도록 스크립트를 프로그래밍 해야 할 뿐 아니라 사용되는 리소스의 선 변환이 요구되어진다. 이러한 어려움을 해결하기 위해 본 논문에서는 유선 웹 페이지의 구조적 특성을 나타내는 DOM(Document Object Model)의 계층구조를 이용한다. 즉 유선 웹페이지를 분석하여 이를 자료구조화 하고, 이 가운데에서 다이나믹 오브젝트를 추출하여 그 영역을 인덱싱 하였다가, 모바일 웹 페이지를 서비스 할 때 인덱싱 된 위치에서 정보를 추출하여 실시간으로 모바일 웹 콘텐츠를 생성하여 서비스하는 기법을 제시한다. 또한 본 논문은 이 기법을 적용하여 모바일 웹 콘텐츠를 편집하는 편집기와 이를 서비스하는 모바일 웹 서비스 서버를 개발하는 데 그 목표가 있다.

DOM을 이용하여 PC 웹 페이지의 다이나믹 오브젝트를 모바일 웹 컨텐츠로 변환하는 기법 (A Scheme that Transcodes from Dynamic Object of PC Web Page to Mobile Web Contents with DOM)

  • 김종근;고희애;심근호;강의선;임영환
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.648-653
    • /
    • 2008
  • 이동 통신 단말기의 발달과 모바일 인터넷의 확산으로 많은 사용자들은 언제 어디서나 모바일 웹 콘텐츠를 이용 할 수 있게 되었으며 나아가 더 많은 콘텐츠의 서비스를 요구하게 될 것이다. 이러한 요구로 인하여 유선 웹 콘텐츠를 모바일 웹에 사용할 수 있도록 콘텐츠를 변환하는 연구들이 많이 진행되고 있으나, 통신사 및 모바일 단말기들의 지원사양이 표준화되지 않아 모바일 웹 콘텐츠의 변환 및 생성에 많은 어려움이 따르고 있다. 특히나 유선 웹 페이지의 내용 중에 시간이나 사용자에 따라 그 내용이 동적으로 변화하는 다이나믹 오브젝트를 모바일 웹에 서비스 하기 위해서는 각각의 단말기에 맞도록 스크립트를 프로그래밍 해야 할 뿐 아니라 사용되는 리소스의 선 변환이 요구되어진다. 이러한 어려움을 해결하기 위해 본 논문에서는 유선 웹 페이지의 구조적 특성을 나타내는 DOM(Document Object Model)의 계층구조를 이용한다. 즉 유선 웹페이지를 분석하여 이를 자료구조화 하고 이 가운데에서 다이나믹 오브젝트를 추출하여 그 영역을 인덱싱 하였다가, 모바일 웹 페이지를 서비스 할 때 인덱싱 된 위치에서 정보를 추출하여 실시간으로 모바일 웹 콘텐츠로 변환하는 기법을 제시한다.

  • PDF

내용 분석을 통한 한국의 학술적 웹 공간 구조 분석 (Ascertaining the Structure and Content of a National Scholarly Web Space Based on Content Analysis)

  • 정영미;유소영
    • 정보관리학회지
    • /
    • 제26권3호
    • /
    • pp.7-24
    • /
    • 2009
  • 학술적 웹 공간을 대상으로 하는 연구는 페이지와 링크의 역동성 때문에 정량적인 방법과 함께 내용 분석 등의 정성적인 방법을 사용하는 것이 필요하다. 따라서 이 연구에서는 내용 분석의 한 방법으로 한국 학술적 웹 공간 내에서 외부 링크로 연결된 페이지 및 링크의 유형을 분류한 후 이를 네트워크 구조 분석에 반영하여 한국 학술적 웹 공간의 특성을 자세히 살펴보았다. 분석 결과 데이터의 수집 시점을 나타내는 기본 네트워크와 내용 분석 시점을 나타내는 활성 네트워크 사이에 구조적으로 큰 차이가 없었으나, 기관 유형별로 다른 기관들을 링크하는 목적이 다르게 나타났다. 그리고 한국 학술적 웹 공간은 여러 중앙성 지수들과 결속계수 간의 설명력이 유사하게 나타나는 형태의 네트워크임을 확인하였다.

분산수집 모델을 이용한 웹 로봇의 설계 및 구현 (Design of Web Robot Engine Using Distributed Collection Model Processing)

  • 김대유;김정태
    • 한국정보통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.115-121
    • /
    • 2010
  • 인터넷의 이용이 활발해짐에 따라 수많은 정보들이 웹을 통하여 공개되고 있으며, 이용자는 웹 검색 서비스를 이용하여 이러한 정보들에 효과적으로 접근할 수 있다. 웹 검색 서비스의 구축을 위해서는 웹 로봇을 사용한 웹 문서 수집이 선행되어야 하며, 웹 문서들의 수가 급격히 증가하면서 양질의 웹 문서들을 효과적으로 수집할 수 있는 웹 로봇에 대한 필요성이 증가되고 있으며, 그에 따른 많은 웹 수집 로봇이 탄생되고 있다. 본 논문에서는 효과적인 웹 수집 로봇의 설계와 동적인 웹페이지에서 사용하는 자바스크립트의 링크추출 방안을 제안하였다. 본 논문에서는 성능 분석을 위하여 제안된 모델을 사용하여 수집 모델을 1개로 설정해 놓고 299개의 웹 페이지를 점검 하였을 경우, 2분 12.67초가 소요되었고, 수집 모델을 10개로 생성하여 점검 하였을 경우 12.33초가 소요됨을 알 수 있었다.

동적 컨텐츠 캐싱을 지원하는 XML 기반의 컨텐츠 관리 시스템의 구현 (An XML-based Content Management System supporting Dynamic Content Caching)

  • 구흥서
    • 한국지능시스템학회논문지
    • /
    • 제15권7호
    • /
    • pp.794-799
    • /
    • 2005
  • 본 논문에서는 효율적인 동적 컨텐츠 출판을 지원하는 XML 기반 웹 컨텐츠 관리 시스템인 EasyCM을 설계하였다. EasyCM은 효율적인 동적 웹 컨텐츠 출판을 지원하기 위해 XML 기반의 컨텐츠 관리 시스템의 출판에서 필요한 컨텐츠저장소로부터 XDL 객체의 추출과 XSLT를 이용한 HTML 변환의 추가적인 처리과정을 전처리하여 컨텐츠 컴포넌트를 생성하고 사용자 요청시 컨텐츠 컴포넌트를 최종 웹 페이지로 조립하여 출판함으로써 컨텐츠의 재사용성을 향상시켰다. 또한 EasyCM의 성능을 향상시키기 위해서 기반 데이터와 동적 컨텐츠 컴포넌트간의 종속정보를 Dependency Map으로 유지하여 동적 컨텐츠 캐싱을 지원한다. 이를 위해서 EasyCM은 XML 출판 프레임워크인 Cocoon2를 기반으로 하고, 동적 컨텐츠 캐싱이 가능하도록 Cocoon2의 캐싱 구조를 화장하였다. 본 논문에서 설계한 확장된 캐싱 시스템은 캐싱된 컨텐츠의 효율적인 갱신을 지원하기 위하여 동적 컨텐츠의 특성에 따른 두 가지 갱신 유형, 즉 즉시갱신과 지연갱신을 지원한다.

A Source Code Cross-site Scripting Vulnerability Detection Method

  • Mu Chen;Lu Chen;Zhipeng Shao;Zaojian Dai;Nige Li;Xingjie Huang;Qian Dang;Xinjian Zhao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권6호
    • /
    • pp.1689-1705
    • /
    • 2023
  • To deal with the potential XSS vulnerabilities in the source code of the power communication network, an XSS vulnerability detection method combining the static analysis method with the dynamic testing method is proposed. The static analysis method aims to analyze the structure and content of the source code. We construct a set of feature expressions to match malignant content and set a "variable conversion" method to analyze the data flow of the code that implements interactive functions. The static analysis method explores the vulnerabilities existing in the source code structure and code content. Dynamic testing aims to simulate network attacks to reflect whether there are vulnerabilities in web pages. We construct many attack vectors and implemented the test in the Selenium tool. Due to the combination of the two analysis methods, XSS vulnerability discovery research could be conducted from two aspects: "white-box testing" and "black-box testing". Tests show that this method can effectively detect XSS vulnerabilities in the source code of the power communication network.