• 제목/요약/키워드: 웹 페이지 예측

검색결과 40건 처리시간 0.024초

Framework for Efficient Web Page Prediction using Deep Learning

  • Kim, Kyung-Chang
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.165-172
    • /
    • 2020
  • 웹에서 접근하는 정보의 폭발적인 증가에 따라 사용자의 다음 웹 페이지 사용을 예측하는 문제의 중요성이 증가되었다. 사용자의 다음 웹 페이지 접근을 예측하는 방법 중 하나가 딥 러닝 기법이다. 웹 페이지 예측 절차는 데이터 전처리 과정을 통해 웹 로그 정보들을 분석하고 딥 러닝 기법을 이용하여 분석된 웹 로그 결과를 가지고 사용자가 접근할 다음 웹 페이지를 예측한다. 본 논문에서는 웹 페이지 예측을 위한 효율적인 웹 로그 전처리 작업과 분석을 위해 딥 러닝 기법을 사용하는 웹 페이지 예측 프레임워크를 제안한다. 대용량 웹 로그 정보의 전처리 작업 속도를 높이기 위하여 Hadoop 기반 맵/리듀스(MapReduce) 프로그래밍 모델을 사용한다. 또한 웹 로그 정보의 전처리 결과를 이용한 학습과 예측을 위한 딥 러닝 기반 웹 예측 시스템을 제안한다. 실험을 통해 논문에서 제안한 방법이 기존의 방법과 비교하여 성능 개선이 있다는 사실을 보였고 아울러 다음 페이지 예측의 정확성을 보였다.

포린 페이지 시스템: 웹 컨텐츠 추출 및 통합을 통한 메타 브라우징 서비스의 설계 및 구현 (Foreign Page System: Design and Implementation of Meta-Browsing Service by Web-Contents Extraction and Composing)

  • 박남훈;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (하)
    • /
    • pp.1159-1162
    • /
    • 2001
  • 본 연구는 웹 컨텐츠 통합 서비스에 관한 것으로 메타 브라우저, 중계 웹 서버, 포린 페이지 저작기, 포린 페이지 저장기로 구성한다. 메타 브라우저를 통해 사용자가 웹 사이트를 탐색하면서 웹 컨텐츠를 선택하며, 포린 페이지 저작기를 통해 각 사이트의 컨텐츠들로 포린페이지를 저작한다. 중계 웹 서버에서는 포린 페이지에 사용된 컨텐츠를 주기적으로 모니터링하여 컨텐츠 변화 감지시에 해당 컨텐츠로 구성된 포린페이지도 자동으로 갱신한다. 컨텐츠 추출을 위해 뭔 문서로 태그 트리를 구성하고, 그룹 시간 관계를 정의하여 포린 페이지 재생 모델을 제시했으며, 동기화를 위해 종료 제한 시간을 예측한다. 컨텐츠 변화 탐지 및 자동 갱신을 위해 컨텐츠 태그 트리와 웹 문서의 테그 트리간 차이값을 구하여 컨텐츠 변화 감지 방법을 제시한다.

  • PDF

웹 응용 모델링의 요소 분류와 그에 따른 제약조건 기반 모델링 (Classification of Web Application Model ing Elements and Constraints Based Web Application Modeling)

  • 박영주;이기열;이병정;김희천;우치수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.358-360
    • /
    • 2004
  • 웹 어플리케이션은 생명 주기가 짧고, 마르고 정확한 개발이 요구되므로 모델링 단계에서의 요소 분류 및 요소간의 제약조건을 정의할 필요가 있다. 이에 본 연구에서는 각 프레임과 페이지를 그 성격에 따라 집합 프레임과 구조 프레임, 내용 페이지와 구조 정보 페이지로 분류, 이를 바탕으로 요소간의 관계를 정의하였다. 웹 응용 모델링의 요소 분류를 통해 그에 따른 제약 조건을 서술할 수 있는데, 이를 통해 사소한 예측할 수 있는 오류를 피할 수 있고, 웹 응용의 기본적인 테스트 케이스로도 사용할 수 있다.

  • PDF

Support Vector Regression을 ol용한 연속성 피드백 정보의 협동 추천 시스템 (Collaborative Recommendation System of Continuous Feedback Information Using Support Vector Regression)

  • 임민택;전성해;오경환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.265-267
    • /
    • 2002
  • 인터넷으로부터 필요한 정보를 얻기 위하여 무의미한 탐색을 반복하는 경우가 자주 나타나고 있다. 이러한 Dizzy Web에서 사용자와 관련 있는 정보를 추천해 주는 방법에 대한 연구가 많이 진행되고 있다. 특히 협동 추천시스템에 대한 연구가 활발히 진행되고 있다. 이 시스템의 구현 알고리즘 중에서 기존의 메모리 기반은 수행 시간에 대한 부담이 매우 크며, 모델 기반은 연속성 데이터에 대한 처리가 어렵거나 불가능하다는 문제가 있다. 본 논문에서는 특히 웹 사용자 모델에서 효과적인 연속성 피드백 데이터를 이용한 사용자 모델링 방법을 제안하고 이를 통해 웹 페이지 예측을 수행하는 시스템을 구현하였다. 논문에 사용된 연속성 데이터는 사용자의 웹 페이지 방문시간이고 이 데이터를 분석하기 위해 기존의 모델 기반 알고리즘에 Support Vector Regression 기법을 결합하는 알고리즘을 설계하였다. 실험에서는 제안 모델의 정확성과 예측 능력에 대하여 기존의 Pearson 알고리즘과 비교하였다. 논문에서 제안하는 방법이 매우 적은 시간 비용을 요구하면서도 유의할 수 있는 수준의 결과가 얻을 수 있음이 확인되었다.

  • PDF

수요예측 모니터링 애플리케이션과 웹의 사례 비교 분석 (A Comparative Analysis of Demand Forecast Monitoring Applications and the Web)

  • 이효원;임소연;이영우;박철우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.439-441
    • /
    • 2022
  • 본 연구는 수요예측 알고리즘으로 예측한 데이터와 실시간 데이터를 모니터링하기 위한 모니터링 애플리케이션과 웹 중 전력 수요관리 애플리케이션인 '해줌온', U&E 커뮤니케이션즈에서 사용하는 건설 현장 안전관리 시스템 웹 페이지를 비교하는 연구이다. 해당 연구는 위의 두 개의 대표적인 사례로 웹과 애플리케이션의 UI의 차이점, 장단점, 데이터의 보완 등을 비교하여 적절한 애플리케이션 또는 웹을 파악할 수 있다.

  • PDF

대기행렬 페트리넷을 이용한 웹서비스 시스템 분석 방법 (A Web Service System Analysis Method Using Petri Net with Queue)

  • 심규박;임재걸;이계영;김진석
    • 한국멀티미디어학회논문지
    • /
    • 제14권11호
    • /
    • pp.1409-1419
    • /
    • 2011
  • 소프트웨어 시스템 개발의 초기 단계에서 시스템의 처리 시간이나 비용을 예측하는 것이 매우 중요하다는 것은 널리 알려진 사실이다. 많은 논문에 처리 시간을 예측하는 페트리넷 방법이 소개된 바 있다. 한편, 컴퓨터 과학 분야의 다른 영역에서는 응용 시스템 개발의 효율성을 증진시키는 방법으로 웹서비스가 깊이 있게 연구되고 있다. 이러한 두 가지 현상을 고려하여, 본 논문은 웹 서비스로 구성된 응용 소프트웨어 시스템의 처리시간을 분석하는 페트리넷 방법을 소개한다. 웹 응용 시스템의 처리시간을 어떤 상수로 표현하기는 대단히 어렵다. 따라서 본 논문은 대기행렬을 갖는 페트리넷으로 웹 응용 시스템을 표현할 것을 제안한다. 본 논문의 핵심은 이러한 대기행렬을 갖는 페트리넷의 분석 방법을 소개한 것이다.

웹 로그 마이닝을 이용한 웹 문서 예측 시스템 (Web Document Prediction System by using Web Log Mining)

  • 이범석;황병연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.97-99
    • /
    • 2005
  • 웹 문서 수의 급격한 증가는 사용자로 하여금 방대한 양의 웹 문서들로부터 필요한 정보를 선별하기 위한 시간과 비용을 낭비하게 만들었다. 따라서 이러한 문제를 해결하기 위한 연구의 필요성이 점차 증가하였는데, 그 중 웹 서버 로그 데이터에 마이닝 기법을 적용하여 사용자들의 사이트 내 문서의 접근 패턴을 분석하고, 그 데이터를 이용하여 동적으로 변화하는 적응형 웹 사이트를 제공하려는 것이 대표적인 연구 사례이다. 본 논문에서는 웹 서버 로그 마이닝을 이용하여 사용자가 필요로 하거나, 관심을 가지고 있는 페이지를 예측하여 추천해 주는 시스템에 대해 소개한다. 이러한 시스템을 구현하기 위해 순차 패턴 마이닝이나 빈발 에피소드 발견 기법 등의 알고리즘을 사용할 수 있다. 제안하는 시스템에서는 사용자 접근 패턴을 분석할 때 순차 패턴 마이닝 기법을 사용하고, 사용자의 이동 패턴을 근거로 웹 문서를 예측하여 추천해줄 때에는 에피소드 발견 기법에서의 window 개념을 이용한다. 본 논문에서 제안한 시스템은 웹 문서를 사용자가 머물었던 시간에 따라 관심 있는 문서와 지나간 문서로 구분하여 관심 있는 문서에 대해서안 마이닝을 수행한다. 또한 일정한 크기를 갖는 History window에 의해 다음 문서를 추천해주기 때문에 사용자의 모든 로그를 저장하지 않으므로 보다 효율적이다.

  • PDF

SVM과 로짓회귀분석을 이용한 흥미있는 웹페이지 예측 (Predicting Interesting Web Pages by SVM and Logit-regression)

  • 전도홍;김형래
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권3호
    • /
    • pp.47-56
    • /
    • 2015
  • 흥미 있는 웹페이지의 자동화된 탐색은 다양한 응용 분야에 활용될 수 있다. 웹페이지에 대한 사용자의 흥미는 판단하는 것은 사용자의 행동을 관찰함으로 자동화가 가능하다. 흥미 있는 웹페이지를 구분하는 작업은 판별 문제에 속하며, 우리는 실증을 위해 화이트 박스의 학습 방법(로짓회귀분석, 지지기반학습)을 선택한다. 실험 결과는 다음을 나타내었다. (1) 고정효과 로짓회귀분석, polynomial 과 radial 커널을 이용한 고정효과 지지기반학습은 선형 커널보다 높은 성능을 보였다. (2) 개인화가 모델 성능을 향상시킴에 있어 주요한 이슈이다. (3) 사용자에게 웹페이지에 대항 흥미를 물을 때, 구간은 단순히 예/아니 도 충분할 수 있다. (4) 웹페이지에 머문 기간이 매초 증가할 때마다 성공확률은 1.004배 증가하며, 하지만 스크롤바 클릭 수 (p=0.56) 와 마우스 클릭 수 (p=0.36) 지표는 흥미와 통계적으로 유의한 관계를 가지지 않았다.

선사상 기법을 통한 안드로이드 스마트폰의 응답성 향상 (Improving Responsiveness of Android Smartphones via Premapping Mechanism)

  • 김정호;허승주;홍성수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제47차 동계학술대회논문집 21권1호
    • /
    • pp.61-62
    • /
    • 2013
  • 안드로이드 스마트폰 사용자에게 응답성은 중요한 성능 이슈이다. 스마트폰 응용 구동 시 응답성에 큰 영향을 미치는 것은 수많은 페이지 부재 처리기의 수행 시간이다. 선사상 기법은 페이지 부재 발생을 효과적으로 줄일 수 있는 기법이지만, 선사상할 페이지를 예측하기 어렵기 때문에 기존 안드로이드 스마트폰에서는 요구 사상 기법이 사용되고 있다. 본 논문은 응답성 향상을 위해 커널이 안드로이드 런타임과 라이브러리의 도움을 받아 선사상할 페이지를 예측하는 선사상 기법을 제안한다. 실험 결과 제안된 기법은 기존 시스템에 비해 웹 브라우저 응용의 응답 시간을 최대 3.25% 단축할 수 있었다.

  • PDF

Web access prediction based on parallel deep learning

  • Togtokh, Gantur;Kim, Kyung-Chang
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권11호
    • /
    • pp.51-59
    • /
    • 2019
  • 웹에서 정보 접근에 대한 폭발적인 주문으로 웹 사용자의 다음 접근 페이지를 예측하는 필요성이 대두되었다. 웹 접근 예측을 위해 마코브(markov) 모델, 딥 신경망, 벡터 머신, 퍼지 추론 모델 등 많은 모델이 제안되었다. 신경망 모델에 기반한 딥러닝 기법에서 대규모 웹 사용 데이터에 대한 학습 시간이 엄청 길어진다. 이 문제를 해결하기 위하여 딥 신경망 모델에서는 학습을 여러 컴퓨터에 동시에, 즉 병렬로 학습시킨다. 본 논문에서는 먼저 스파크 클러스터에서 다층 Perceptron 모델을 학습 시킬 때 중요한 데이터 분할, shuffling, 압축, locality와 관련된 기본 파라미터들이 얼마만큼 영향을 미치는지 살펴보았다. 그 다음 웹 접근 예측을 위해 다층 Perceptron 모델을 학습 시킬 때 성능을 높이기 위하여 이들 스파크 파라미터들을 튜닝 하였다. 실험을 통하여 논문에서 제안한 스파크 파라미터 튜닝을 통한 웹 접근 예측 모델이 파라미터 튜닝을 하지 않았을 경우와 비교하여 웹 접근 예측에 대한 정확성과 성능 향상의 효과를 보였다.