• 제목/요약/키워드: web page change

검색결과 39건 처리시간 0.025초

웹 문서 변경 예측 (Estimation of Web Page Change Behavior)

  • 김성진
    • 인터넷정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.149-158
    • /
    • 2007
  • 본 논문은 웹 문서의 다운로드 가능 여부와 내용 변경 여부를 예측하는 도구를 기술한다. 웹 데이터베이스 관리자는 자신이 관리하는 웹 문서 집합을 최신 상태로 유지하려고 할 때, 예측 도구를 통하여 다운로드되지 않거나 변경되지 않았을 웹 문서에 대한 불필요한 요청을 감소시킬 수 있다. 본 논문에서는 웹 문서들의 과거 변경이 미래 변경과 매우 밀접한 관련이 있음을 가정한다. 본 논문에서는 약 300만개의 웹 문서들을 2일 주기로 100일 동안 관찰하여 변경 경향을 분석하고, 관찰된 문서들의 다운로드 가능 여부와 내용 변경 여부를 예측한다. 예측 결과는 실제의 변경 사실과 비교 평가되었다.

  • PDF

웹 문서 변화에 관한 실험적 연구 (An Empirical Study on Changes of Web Pages)

  • 김성진;이상호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.151-160
    • /
    • 2005
  • 웹 문서들은 빈번하게 생성, 소멸, 변경을 반복하고 있으며, 웹 데이타베이스는 최신의 웹 상태를 반영하여야 한다. 웹 데이타베이스의 효과적인 갱신 전략 수립을 위하여 실제 웹의 변화 성향을 파악하는 일은 매우 중요하다. 웰의 변화를 관찰한 연구들이 다양하게 발표되고 있으나 기존의 연구들은 웹 문서의 내용 변경에 주된 초점이 맞추어 있고 웹 문서의 생성과 소멸에 대한 결과가 부족하였다. 본 논문에서는 쇌 문서의 변화를 표현할 수 있는 척도로서 URL의 '다운로드 성공률', '변경률', '나이 변이 계수'를 소개하고, 한국의 유명 사이트 집합과 임의(random) 사이트 집합에서 발견된 300만 개의 URL들이 2 일 주기로 100일 동안 관찰한다. 본 논문에서는 '다운로드 성공률'과 '변경률'의 분포를 통해 웰 문서의 다운로드 성공과 변경이 과거 기록과 밀접한 연관이 있음을 발견하였으며, 과거 기록을 이용하여 향후 웹 문서의 다운로드 성공과 변경을 예측할 수 있는 모델을 제안한다. 또한, '나이 변이 계수'를 통해 웹 문서들이 얼마나 비주기적으로 변경되는가를 보고한다.

XML 기반 위키엔진 시스템 (XML Based Wiki Engine Systerm)

  • 최현식;안성옥
    • 공학논문집
    • /
    • 제6권1호
    • /
    • pp.151-160
    • /
    • 2004
  • 웹 페이지 관리자에 의해 정적인 정보만 제공되던 기존의 웹 형태는 최근 큰 변화를 맞는다. '위키위키' 란 새로운 개념의 웹 서비스가 등장했기 때문이다. 위키는 서비스 제공자뿐 아나라 웹페이지를 열람하는 누구나 자유롭게 페이지를 바꾸고 추가할 수 있어, 사용자들의 능동적인 참여를 최대한 얻어 낼 수 있는 시스템이다. 본 논문에서는 차세대 웹 Markup 언어인 XML와 XML Markup 언어 XSLT 등을 이용하여 위키엔진시스템을 구현하였고 CVS 시스템을 이용해서 문서 변화의 history를 어떻게 관리하는지 설명 하고 있다.

  • PDF

링크 분석을 통한 비동기 웹 페이지 크롤링 알고리즘 (Asynchronous Web Crawling Algorithm)

  • 원동현;박혁규;강윤정;이민혜
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.364-366
    • /
    • 2022
  • 웹은 처리 속도가 다른 다양한 정보들을 함께 제공하기 위해 비동기식 웹 기술을 이용한다. 비동기 방식에서는 작업 완료 전에도 다른 이벤트에 응답할 수 있다는 장점이 있으나 일반적인 크롤러는 웹페이지의 방문 시점 정보를 수집함으로 비동기 방식으로 제공되는 정보를 수집하는 데 어려움이 있다. 또한 비동기식 웹 페이지는 페이지 내용이 변경되어도 웹 주소가 변하지 않는 경우도 많아 크롤링하는 데 어려움이 있다. 본 논문에서는 웹의 링크를 분석하여 비동기 방식 페이지 이동을 고려한 웹 크롤링 알고리즘을 제안한다. 제안한 알고리즘으로 비동기 방식으로 정보를 제공하는 TTA의 정보통신용어사전 정보를 수집할 수 있었다.

  • PDF

Stochastic 프로세스 모델을 이용한 웹 페이지 추천 기법 (Web Page Recommendation using a Stochastic Process Model)

  • 노수호;박병준
    • 전자공학회논문지CI
    • /
    • 제42권6호
    • /
    • pp.37-46
    • /
    • 2005
  • 다양하고 많은 양의 정보가 존재하는 웹 환경에서 웹 사이트를 방문하는 사용자의 접근패턴도 매우 다양하며, 웹 환경의 변화에 따라서 이러한 접근패턴은 계속 변화한다. 이러한 이유로, 웹 사이트 개발자가 사전에 사용자의 욕구에 완벽하게 부합하는 완벽한 사이트를 개발하기란 사실상 불가능하다. 이에 대한 해결방안으로, 웹 사이트에 대한 사용자 접근 패턴을 학습해서 웹 사이트의 구조나 외형을 자동적으로 개선시켜 나가는 적응형 웹 사이트 (Adaptive Web site)가 제시되었다. 본, 논문에서는 DTMC(Discrete-Time Markov Chain)에 의거한 확률적 모델을 이용하여 적응형 웹 사이트 구축에 필요한 사용자 접근패턴을 학습하고 이를 적용하기 위한 효과적인 방법론을 제시한다.

DOM을 이용한 PC 웹 페이지에서 모바일 웹 페이지로의 다이나믹 오브젝트 변환 및 서비스 기법 (A Scheme that Transcodes and Services from PC Web Page to Mobile Web Page of Dynamic Object with DOM)

  • 김종근;강의선;심근정;고희애;임영환
    • 정보처리학회논문지D
    • /
    • 제14D권3호
    • /
    • pp.355-362
    • /
    • 2007
  • 이동 통신 단말기의 발달과 모바일 인터넷의 확산으로 많은 사용자들은 언제 어디서나 모바일 웹 콘텐츠를 이용 할 수 있게 되었으며 나아가 더 많은 콘텐츠의 서비스를 요구하게 될 것이다. 이러한 요구로 인하여 유선 웹 콘텐츠를 모바일 웹에 사용할 수 있도록 콘텐츠를 변환하는 연구들이 많이 진행되고 있으나, 통신사 및 모바일 단말기들의 지원사양이 표준화되지 않아 모바일 웹 콘텐츠의 변환 및 생성에 많은 어려움이 따르고 있다. 특히나 유선 웹 페이지의 내용 중에 시간이나 사용자에 따라 그 내용이 동적으로 변화하는 다이나믹 오브젝트를 모바일 웹에 서비스하기 위해서는 각각의 단말기에 맞도록 스크립트를 프로그래밍 해야 할 뿐 아니라 사용되는 리소스의 선 변환이 요구되어진다. 이러한 어려움을 해결하기 위해 본 논문에서는 유선 웹 페이지의 구조적 특성을 나타내는 DOM(Document Object Model)의 계층구조를 이용한다. 즉 유선 웹페이지를 분석하여 이를 자료구조화 하고, 이 가운데에서 다이나믹 오브젝트를 추출하여 그 영역을 인덱싱 하였다가, 모바일 웹 페이지를 서비스 할 때 인덱싱 된 위치에서 정보를 추출하여 실시간으로 모바일 웹 콘텐츠를 생성하여 서비스하는 기법을 제시한다. 또한 본 논문은 이 기법을 적용하여 모바일 웹 콘텐츠를 편집하는 편집기와 이를 서비스하는 모바일 웹 서비스 서버를 개발하는 데 그 목표가 있다.

악성사이트 검출을 위한 안전진단 스케줄링 (Security Check Scheduling for Detecting Malicious Web Sites)

  • 최재영;김성기;민병준
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제2권9호
    • /
    • pp.405-412
    • /
    • 2013
  • 최근의 웹은 구현 방법과 이용 패턴이 변화되면서 서로 연결되고 융합되는 형태로 변화하였다. 서비스가 진화되고 사용자 경험이 향상되었으나 다양한 출처의 검증되지 않은 웹자원들이 서로 결합되어 보안 위협이 가중되었다. 이에 웹 확장의 역기능을 억제하고 안전한 웹서비스를 제공하기 위해 확장된 대상에 대한 안전성 진단이 필요하다. 본 논문에서는 웹사이트의 안전한 운영을 위해 안전진단을 외부 링크까지 확장하여, 진단 대상을 선별하고 지속적으로 진단하여 악성페이지를 탐지하고 웹사이트의 안전성을 확보하기 위한 스케줄링 방안을 제안한다. 진단 대상의 접속 인기도, 악성사이트 의심도, 검사 노후도 등의 특징을 추출하고 이를 통해 진단 순서를 도출하여 순서에 따라 웹페이지를 수집하여 진단한다. 실험을 통해 순차적으로 반복 진단하는 것보다 순위에 따라 진단 주기를 조정하는 것이 중요도에 따라 악성페이지 탐지에 효과적임을 확인하였다.

웹2.0의 동영상 UCC 서비스현황과 소비자 참여 (Multimedia UCC Services as a Web 2.0 and Consumer Participation)

  • 김연정;박선영
    • 가정과삶의질연구
    • /
    • 제26권1호
    • /
    • pp.95-105
    • /
    • 2008
  • This paper identifies current status and key determinants of participation in multimedia UCC as a web2.0 paradigm. Significant factors composed of IT digital convergence environments and young generation's value, attitude to connecting to web (human relation, visual expressionism, arousal, et al). This paper analyze multimedia UCC service status & current status of participation level of UCC users. The research implemented to analysis customer click streaming data (inter-temporary page-view, unique user)of small-mid multimedia UCC Company and to 2nd data(ww.rankey.com) for page-view and unique user to participation tendency by age and sex about total participation amount of multimedia UCC. In case of young generation be familiar with new internet service, Internet web space meaning important information seeking media and 1 person media able to connect to new web network as prosumer. In UCC centered internet business, web based customers implemented the role of prosumer as generate web contents and consuming to net-working.

Classifying Malicious Web Pages by Using an Adaptive Support Vector Machine

  • Hwang, Young Sup;Kwon, Jin Baek;Moon, Jae Chan;Cho, Seong Je
    • Journal of Information Processing Systems
    • /
    • 제9권3호
    • /
    • pp.395-404
    • /
    • 2013
  • In order to classify a web page as being benign or malicious, we designed 14 basic and 16 extended features. The basic features that we implemented were selected to represent the essential characteristics of a web page. The system heuristically combines two basic features into one extended feature in order to effectively distinguish benign and malicious pages. The support vector machine can be trained to successfully classify pages by using these features. Because more and more malicious web pages are appearing, and they change so rapidly, classifiers that are trained by old data may misclassify some new pages. To overcome this problem, we selected an adaptive support vector machine (aSVM) as a classifier. The aSVM can learn training data and can quickly learn additional training data based on the support vectors it obtained during its previous learning session. Experimental results verified that the aSVM can classify malicious web pages adaptively.

DOM을 이용하여 PC 웹 페이지의 다이나믹 오브젝트를 모바일 웹 컨텐츠로 변환하는 기법 (A Scheme that Transcodes from Dynamic Object of PC Web Page to Mobile Web Contents with DOM)

  • 김종근;고희애;심근호;강의선;임영환
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.648-653
    • /
    • 2008
  • 이동 통신 단말기의 발달과 모바일 인터넷의 확산으로 많은 사용자들은 언제 어디서나 모바일 웹 콘텐츠를 이용 할 수 있게 되었으며 나아가 더 많은 콘텐츠의 서비스를 요구하게 될 것이다. 이러한 요구로 인하여 유선 웹 콘텐츠를 모바일 웹에 사용할 수 있도록 콘텐츠를 변환하는 연구들이 많이 진행되고 있으나, 통신사 및 모바일 단말기들의 지원사양이 표준화되지 않아 모바일 웹 콘텐츠의 변환 및 생성에 많은 어려움이 따르고 있다. 특히나 유선 웹 페이지의 내용 중에 시간이나 사용자에 따라 그 내용이 동적으로 변화하는 다이나믹 오브젝트를 모바일 웹에 서비스 하기 위해서는 각각의 단말기에 맞도록 스크립트를 프로그래밍 해야 할 뿐 아니라 사용되는 리소스의 선 변환이 요구되어진다. 이러한 어려움을 해결하기 위해 본 논문에서는 유선 웹 페이지의 구조적 특성을 나타내는 DOM(Document Object Model)의 계층구조를 이용한다. 즉 유선 웹페이지를 분석하여 이를 자료구조화 하고 이 가운데에서 다이나믹 오브젝트를 추출하여 그 영역을 인덱싱 하였다가, 모바일 웹 페이지를 서비스 할 때 인덱싱 된 위치에서 정보를 추출하여 실시간으로 모바일 웹 콘텐츠로 변환하는 기법을 제시한다.

  • PDF