• 제목/요약/키워드: Korean Web Statistics

검색결과 267건 처리시간 0.024초

웹 로봇 구현 및 한국 웹 통계보고 (Implementation of a Web Robot and Statistics on the Korean Web)

  • 김성진;이상호
    • 정보처리학회논문지C
    • /
    • 제10C권4호
    • /
    • pp.509-518
    • /
    • 2003
  • 웹 로봇은 웹 문서를 다운로드하고 저장하는 프로그램이다. 현재 웹 로봇 구현에 대한 여러 연구들이 진행되고, 웹에 대한 다양한 통계들이 보고되고 있다. 첫째, 본 논문에서는 새로운 웹 로봇을 개발하고, 개발된 웹 로봇의 전체적인 구조와 구현 결정들을 기술한다. 둘째, 약 7천 4백만 한국 웹 문서들에 대한 여러 통계치를 보고한다. 셋째, 1,424 개의 한국 웹 사이트를 지속적으로 관찰하여 웹 문서들의 변경 경향을 조사한다. 본 논문에서는 웹 문서의 변경에 영향을 미치는 요소들이 식별된다. 식별된 요소는 갱신할 웹 문서를 선택하기 위한 정보로서 유용하게 활용될 수 있다.

A Development Study of Tool for Web Log Analysis

  • Choi, Seungbae;Kang, Changwan;Kim, Kyukon;Son, Jongkwan
    • Communications for Statistical Applications and Methods
    • /
    • 제11권1호
    • /
    • pp.93-106
    • /
    • 2004
  • Recently, many data of various types is gained with development of computer in many fields. Especially, web log data generating in web site furnish beneficial information on an organization. The enterprise's destiny is swayed by according as how these information gaining from the web site utilize. In this paper, for the purpose of obtaining useful information, we present a tool is called WebBizi for web log analysis. This will be helpful to enterprise working the web site.

Web GIS 기반 유선도 작성을 통한 인구이동통계의 지리적 시각화 (Geovisualization of Migration Statistics Using Flow Mapping Based on Web GIS)

  • 김감영;이상일
    • 대한지리학회지
    • /
    • 제47권2호
    • /
    • pp.268-281
    • /
    • 2012
  • 인구이동통계는 사회현상에 대한 공간적 이해와 공간과정의 사회적 영향 파악에 유용한 정보를 제공해줌에도 불구하고 데이터 구조의 복잡성 때문에 자료 서비스와 분석이 제한되어 왔다. 한편 인구이동통계를 탐색하고 시각화하는 효과적인 방법인 유선도 작성(flow mapping)은 아직 상용 GIS 소프트웨어서 완전히 구현되지 못하고 있다. 이에 본 연구의 목적은 Web GIS를 통한 유선도 제작과 이를 이용한 인구이동통계에 대한 탐색적 공간 분석이 가능함으로 보여주는 것이다. 데이터베이스, GIS, 지도학적 관점에서 인구이동통계의 특성을 고찰하였고, 이를 바탕으로 O-D 구조의 인구이동통계를 유선도 제작에 적합한 공간데이터로 변환하였다. 인구이동통계에 적합하도록 Web GIS의 사용자 인터페이스를 전문화하였고, 지도화의 시간, 공간 및 속성 범위의 설정을 통한 탐색적 시각화가 가능하도록 구성하였다.

  • PDF

A Clustering Algorithm Considering Structural Relationships of Web Contents

  • Kang Hyuncheol;Han Sang-Tae;Sun Young-Su
    • Communications for Statistical Applications and Methods
    • /
    • 제12권1호
    • /
    • pp.191-197
    • /
    • 2005
  • Application of data mining techniques to the world wide web, referred to as web mining, has been the focus of several recent researches. With the explosive growth of information sources available on the world wide web, it has become increasingly necessary to track and analyze their usage patterns. In this study, we introduce a process of pre-processing and cluster analysis on web log data and suggest a distance measure considering the structural relationships between web contents. Also, we illustrate some real examples of cluster analysis for web log data and look into practical application of web usage mining for eCRM.

Implementation of a Web-Based Electronic Text for High School's Probability and Statistics Education

  • Choi, Sook-Hee
    • Communications for Statistical Applications and Methods
    • /
    • 제11권2호
    • /
    • pp.329-343
    • /
    • 2004
  • With advancement of computer and network, world wide web(WWW) as a medium of information communication is generalized in many fields. In educational aspect, applications of WWW as alternative media for class teachings or printed matters are increasing. In this article, we demonstrate a web-based electronic text on the 'probability and statistics' which is one of six fields of mathematics in the 7th curriculum. This text places importance on comprehension of concepts of probability and statistics as an applied science.

웹 서비스 분석기의 디자인과 구현 (Design and Implementation of Public Web Services Analyzer)

  • ;한동수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.241-243
    • /
    • 2005
  • Web services (WS) present a new promising software technology, which provides application-to-application interaction. They are built on the top of existing web protocol and based on open XML standards. Web services are described using WSDL, and the UDDI is a integration directory provide registry of Web Services descriptions. WSDL provides information of Web Services but it is getting more and more important to know more than those provided by WSDL. From WSDL we can not get the information like usage of WS, performance of WS, complexity of WS, usability of WS with other web service. In this paper, we proposed a new method for Web Services so called Public Web Services Analyzer (PWSA). This technique is based on analyzing various public UDDI registries in order to get various kinds of statistics of web services. Those statistics will be used by both web services developers and consumers for finding them suitable services for their needs. PWSA guarantees that it can provide enough information to find right web services for both Web Services Consumers and Web Service Developers.

  • PDF

Implementation of Estimation and Inference on the Web

  • Kang, Heemo;Sim, Songyong
    • Communications for Statistical Applications and Methods
    • /
    • 제7권3호
    • /
    • pp.913-926
    • /
    • 2000
  • An electronic statistics text on the web is implemented. The introduced text provide interactive instructions on the statistical estimation and inference. As a by-product, we also provide a calculation of quantiles and p-value of t-distribution and standard normal distribution. This program was written in JAVA programming language.

  • PDF

Regression and Correlation Analysis via Dynamic Graphs

  • Kang, Hee Mo;Sim, Songyong
    • Communications for Statistical Applications and Methods
    • /
    • 제10권3호
    • /
    • pp.695-705
    • /
    • 2003
  • In this article, we propose a regression and correlation analysis via dynamic graphs and implement them in Java Web Start. For the polynomial relations between dependent and independent variables, dynamic graphics are implemented for both polynomial regression and spline estimates for an instant model selection. The results include basic statistics. They are available both as a web-based service and an application.

에어비앤비(Airbnb) 웹 로그 데이터를 이용한 고객 행동 예측 (Consumer behavior prediction using Airbnb web log data)

  • 안효인;최유리;오래은;송종우
    • 응용통계연구
    • /
    • 제32권3호
    • /
    • pp.391-404
    • /
    • 2019
  • 그동안의 고객 행동에 대한 예측은 주로 고객이 가지는 고정적인 특성을 이용해왔다. 최근에는 점차 고객들의 활동이 오프라인에서 온라인으로 이동하면서 각 고객의 웹 로그를 추적하는 일이 가능해졌다. 그러나 방대한 양의 웹 로그 데이터를 수집할 수 있게 된 반면, 이에 대한 연구는 로그 데이터를 정리하거나 기술적인 특성만을 설명하는 것에 그쳤다. 본 연구에서는 웹사이트 Kaggle에서 제공하는 Airbnb 고객들의 성별, 연령 등의 기본 정보 및 웹 로그가 포함된 데이터셋을 이용하여 첫 숙소 예약까지 걸리는 개인의 의사 결정 시간을 예측하였다. Lasso, SVM, Random Forest, XGBoost 등 다양한 방법론을 활용하여 최적의 모형을 찾고, 웹 로그 데이터의 유무에 따른 예측 오차를 비교하여 웹 로그의 효용성을 확인하였다. 결과적으로 오분류율이 약 20%로 낮은 랜덤 포레스트 분류모형을 최적모형으로 선택하였다. 또한, 웹 로그 데이터를 이용하여 고객 개개인의 행동을 예측한 결과 사용하지 않은 경우와 비교해 예측의 정확도가 최대 두 배 더 높아진 것을 확인할 수 있었다.

The Design and Implementation of Web-based Statistical Consulting System

  • 류재열;이정훈;조민지;김애지
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2006년도 추계 학술발표회 논문집
    • /
    • pp.167-180
    • /
    • 2006
  • The statistical survey and analysis is much restricted to time, space and material. The statistical survey and analysis could hardly resume. The statistical survey and analysis is very important to create various and accurate information. The statistical survey and analysis which is not a expert knowledge have many problems in productivity of information, reliability and etc. In this paper, we study the design and Implementation of web-based statistical survey and analysis consulting system which a client meet easily a statistical expert on the web.

  • PDF