• 제목/요약/키워드: Web log analysis

검색결과 160건 처리시간 0.025초

Web Log Analysis Using Support Vector Regression

  • Jun, Sung-Hae;Lim, Min-Taik;Jorn, Hong-Seok;Hwang, Jin-Soo;Park, Seong-Yong;Kim, Jee-Yun;Oh, Kyung-Whan
    • Communications for Statistical Applications and Methods
    • /
    • 제10권1호
    • /
    • pp.61-77
    • /
    • 2003
  • Due to the wide expansion of the internet, people can freely get information what they want with lesser efforts. However without adequate forms or rules to follow, it is getting more and more difficult to get necessary information. Because of seemingly chaotic status of the current web environment, it is sometimes called "Dizzy web" The user should wander from page to page to get necessary information. Therefore we need to construct system which properly recommends appropriate information for general user. The representative research field for this system is called Recommendation System(RS), The collaborative recommendation system is one of the RS. It was known to perform better than the other systems. When we perform the web user modeling or other web-mining tasks, the continuous feedback data is very important and frequently used. In this paper, we propose a collaborative recommendation system which can deal with the continuous feedback data and tried to construct the web page prediction system. We use a sojourn time of a user as continuous feedback data and combine the traditional model-based algorithm framework with the Support Vector Regression technique. In our experiments, we show the accuracy of our system and the computing time of page prediction compared with Pearson's correlation algorithm.algorithm.

효율적 웹 개인화를 위한 웹 사용자들의 경향분석 (Trend Analysis of Users for The Effective Web Personalization)

  • 임영문;김홍기
    • 대한안전경영과학회지
    • /
    • 제3권4호
    • /
    • pp.193-205
    • /
    • 2001
  • 온라인 기업의 경우 쉽게 가질 수 있는 고객데이터는 고객이 자사의 홈페이지에 접속하여 남기고 간 흔적(Web Log)이나, 고객이 직접 제공하는 데이터 일 것이다. 현재 많은 온라인 기업이 가장 기본적인 분석으로 웹 로그 분석을 시행하고 있으나, 그 양이 너무 많아 수시로 처리하는데는 문제가 있기도 하지만, 가장 쉽고, 기본적인 분석임은 피할 수 없는 사실이다. 기존의 웹 로그 분석에 관한 연구들이 웹 로그 분석을 통하여 사용자패턴 분석에 그친대 비하여 본 논문은 무선 페이지를 위한 컨텐츠추출 및 기존의 데이터중심의 마케팅 전략에서 벗어나 동양적인 정서를 가미한 마케팅 전략도 함께 제시한 것에 그 의의가 있다.

  • PDF

객체 참조 특성 기반의 분할된 영역 웹 캐시 대체 기법 (A Divided Scope Web Cache Replacement Technique Based on Object Reference Characteristics)

  • 고일석;임춘성;나윤지;조동욱
    • 정보처리학회논문지C
    • /
    • 제10C권7호
    • /
    • pp.879-884
    • /
    • 2003
  • 일반적으로 웹 기반 시스템의 성능을 높이기 위하여 웹 캐시를 사용하며, 대체 기법은 웹 캐시의 성능에 큰 영향을 미친다. 웹 캐시를 위한 대체 기법은 메모리 영역의 대체 기법과는 다르게, 대체되는 단위가 웹 객체이다. 또한 웹 객체는 사용자 참조 특성의 편차가 매우 크다. 따라서 웹 캐시론 위한 대체 기법은 이러한 웹 객체의 특성을 충분히 반영할 수 있어야한다. 하지만 기존의 기법에서는 이러한 특성을 충분히 반영하고 있지 못하다. 본 연구의 주된 관점은 참조특성 분석, 객체적중률의 향상, 응답시간의 개선이다. 이를 위해 로그분석을 이용하여 웹 객체의 참조특성을 분석하고, 이 참조특성의 분석 결과를 기반으로 분할된 웹 캐시 대체 기법을 제안하고 실험하였다. 실험 결과에서는, 제안 기법이 기존의 기법에 대해 객체 적중률과 응답속도의 성능이 개선되었음을 확인할 수 있다.

국가기록원 질의로그 빅데이터 기반 이용자 정보요구 유형 분석 (User Information Needs Analysis based on Query Log Big Data of the National Archives of Korea)

  • 백지연;오효정
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.183-205
    • /
    • 2019
  • 이용자의 정보요구를 파악하기 위한 다양한 방법 중 로그 분석 방법은 이용자의 실제 검색 행위를 사실적으로 반영하고, 대다수 이용자의 전반적인 이용행태를 분석할 수 있다. 이에 본 연구에서는 국가기록원 웹 포털서비스를 통해 입수된 대량의 질의로그 빅데이터를 기반으로 이용자의 정보요구를 파악하기 위해 1) 질의에 내포된 정보요구 유형별과 2) 검색결과로 제공한 기록 유형별 분석을 진행하였다. 분석에 활용한 질의로그는 국가기록원이 웹을 통해 검색서비스를 제공한 2007년부터 2018년 12월까지, 총 141개월 동안 수집된 월별 상위 100개 질의어 1,571,547개를 대상으로 하였다. 나아가 분석결과를 토대로 이용자 검색 만족도를 향상시킬 수 있는 개선방안을 제안하였다. 본 연구의 결과는 국가기록원 검색 서비스 개선 및 고도화를 위한 구체적이고 실질적 방안을 제시했다는 점에서 의의가 있다.

웹 서버 전용 에이전트를 이용한 실시간 웹 서버 침입탐지에 관한 연구 (A Study on Real-Time Web-Server Intrusion Detection using Web-Server Agent)

  • 진홍태;박종서
    • 융합보안논문지
    • /
    • 제4권2호
    • /
    • pp.17-25
    • /
    • 2004
  • 인터넷 사용이 보편화됨에 따라 기존의 방화벽만으로는 탐지가 불가능한 웹 서버의 취약점을 이용한 공격이 나날이 증가하고 있다. 그 중에서도 특히 웹 어플리케이션의 프로그래밍 오류를 이용한 침입이 공격 수단의 대부분을 차지하고 있다. 본 논문에서는 웹 어플리케이션의 취약점을 분석한 후 취약점 발생 부분에 대해 웹 서버 전용으로 로그 분석을 해 주는 실시간 에이저트를 도입하였다. 실시간 에이전트는 공격 패턴을 비교 분석한 후 프로세스 분석기를 통한 결정(decision) 과정을 통해 침입으로 판단되면 해당 접속 프로세스(pid)를 제거한 후 공격 아이피를 차단함으로서 침입을 탐지하는 모델을 제시한다.

  • PDF

연관규칙을 이용한 데이터 분석에 관한 연구 (A Study on the Analysis of Data Using Association Rule)

  • 임영문;최영두
    • 산업경영시스템학회지
    • /
    • 제23권61호
    • /
    • pp.115-126
    • /
    • 2000
  • In General, data mining is defined as the knowledge discovery or extracting hidden necessary information from large databases. Its technique can be applied into decision making, prediction, and information analysis through analyzing of relationship and pattern among data. One of the most important works is to find association rules in data mining. Association Rule is mainly being used in basket analysis. In addition, it has been used in the analysis of web-log and user-pattern. This paper provides the application method in the field of marketing through the analysis of data using association rule as a technique of data mining.

  • PDF

이용자 서비스의 품질 향상을 위한 웹사이트 사용성 평가에 관한 연구 (A Study on Usability Evaluation for Improving Quality of User Services in CNU Digital Library Website)

  • 이응봉
    • 한국문헌정보학회지
    • /
    • 제36권4호
    • /
    • pp.311-329
    • /
    • 2002
  • 본 연구에서는 최신의 정보기술을 적용한 XML 기반 충남대학교 전자도서관 웹사이트를 대상으로 사용성 평가를 실시하였다. 사용성 평가는 로그파일 분석, 온라인 설문조사 그리고 발견평가의 3가지 방법을 적용하였다. 본 연구에서는 사용자 입장에서의 대학도서관 웹사이트 서비스의 문제점을 분석$\cdot$평가하여 개선 방안을 제시함으로써 이용자 서비스의 품질 향상을 제고할 수 있는 근거를 마련하고자 한다.

웹사이트 로그 분석과 사례기반의 전자상거래 에이전트 시스템 (An e-Commerce Agent System based on Web Site Log Analysis and Case Base)

  • 나윤지;원동유;이순애;조용환
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권3호
    • /
    • pp.363-368
    • /
    • 2002
  • 전자상거래시스템의 효율적인 운영과 관리를 위해 더욱 많은 노력이 요구되고 있으며 고객의 요구에 대해 가장 적절한 정보를 제공함으로서 만족을 극대화할 수 있어야 한다. 이를 위해 많은 지능형 에이전트 기술을 사용한 전자상거래 시스템이 도입되고 있다. 본 논문에서는 전자상거래시스템에서 CRM 지원을 위한 사례기반 추론과 웹 로그 분석을 기반으로 한 다중 에이전트 시스템을 제안하였다. 본 논문에서 제안한 시스템은 로그분석을 통해 트래픽과 시스템 정보의 분석과 사례기반 추론을 통해 특정 조건에서 고객의 요구에 대해 적절한 정보를 제공할 수 있다.

  • PDF

질의로그 데이터에 기반한 특허 및 상표검색에 관한 연구 (Analysis of Korean Patent & Trademark Retrieval Query Log to Improve Retrieval and Query Reformulation Efficiency)

  • 이지연;백우진
    • 정보관리학회지
    • /
    • 제23권2호
    • /
    • pp.61-79
    • /
    • 2006
  • 본 연구는 특허 및 상표 검색 개선을 위한 방법을 제안하고자 하는 목적에서 출발하였다. 이를 위해 193일간 한국 특허정보원의 특허기술정보서비스를 이용한 17,559명의 이용자가 작성한 100,016개의 질의문에 대한 로그 데이터를 분석하였다. 개별적인 질의로그 분석 이외에, 2,202개의 복수 질의문을 이용한 탐색세션을 분석함으로써 검색 개선을 위한 추가적인 단서를 발견하였다. 분석결과에 의하면, 특허 및 상표검색은 일반적인 웹 검색의 유형과 유사한데, 특히 질의문의 길이가 짧다는 측면에서 매우 흡사하다. 그러나 특히 및 상표검색의 경우, 일반 웹 검색보다 불리언 연산자를 많이 사용하고 있었다. 복수 질의문 분석을 통해 이용자들이 질의문을 재작성하는데 도움이 될 수 있는 탐색기능을 제안할 수 있었다. 복수의 질의문으로 구성된 탐색세션을 분석한 결과, 이용자들은 질의문을 재작성하기 위하여 부연하기, 특정화하기, 일반화하기, 교체하기, 중단하기와 같은 방법을 사용하고 있음을 알 수 있었다.

인터넷 쇼핑몰을 위한 데이터마이닝 기반 개인별 상품추천방법론의 개발 (Development of a Personalized Recommendation Procedure Based on Data Mining Techniques for Internet Shopping Malls)

  • Kim, Jae-Kyeong;Ahn, Do-Hyun;Cho, Yoon-Ho
    • 지능정보연구
    • /
    • 제9권3호
    • /
    • pp.177-191
    • /
    • 2003
  • 상품추천시스템은 고객들에게 추천 상품 리스트를 만들어 고객들이 구매 가능성이 있는 상품을 쉽게 찾도록 도와주는 개인화 된 정보필터링 기술이다 협업 필터링(collaborative filtering)이 가장 성공적인 상품추천 기법으로 알려져 있으며 많이 이용되고 있다. 그러나, 인터넷 쇼핑몰에서 관리하는 상품과 고객의 수가 급속히 증가하면서 협업필터링에 기반 한 상품추천 시스템은 입력데이터의 희박성(Sparsity) 문제와 시스템 확장성(Scalability) 문제가 노출되고 있다. 따라서 본 연구에서는 협업필터링 기반 상품추천시스템의 상품추천 효과 및 성능을 개선하기 위해 웹 마이닝과 군집분석 기법에 기반을 둔 개인별 상품추천 방법론을 개발한다. 또한 실제 인터넷 쇼핑몰에서 개인별로 상품을 추천할 때 개발된 상품추천 방법론을 적용하여 다른 기존 상품추천 방법론과 실험적으로 비교함으로써 개발 방법론의 효과 및 성능을 검증한다.

  • PDF