• 제목/요약/키워드: 클릭스트림

검색결과 28건 처리시간 0.02초

웹 문서와 접근로그의 하이퍼링크 추출을 통한 웹 구조 마이닝 (Web Structure Mining by Extracting Hyperlinks from Web Documents and Access Logs)

  • 이성대;박휴찬
    • 한국정보통신학회논문지
    • /
    • 제11권11호
    • /
    • pp.2059-2071
    • /
    • 2007
  • 웹 사이트의 구조가 정확하게 주어진다면, 정보 제공자의 입장에서는 사용자의 행위 패턴이나 특성을 효과적으로 파악할 수 있어 보다 나은 서비스를 제공할 수 있고, 사용자의 입장에서는 더욱 쉽고 정확하게 유용한 정보를 찾을 수 있을 것이다. 하지만 웹상의 문서들은 빈발하게 수정되기 때문에 웹 사이트의 구조를 정확하게 추출하는 것은 상당한 어려움이 있다. 본 논문에서는 이러한 웹 사이트의 구조를 자동으로 추출하는 알고리즘을 제안한다. 제안하는 알고리즘은 두 단계로 구성된다. 첫 번째 단계는 웹 문서를 분석하여 그들 간의 하이퍼링크를 추출하고 이를 웹 사이트의 구조를 나타내는 방향 그래프로 표현한다. 하지만 플래시나 자바 애플릿에 포함된 하이퍼링크는 추출할 수 없는 한계가 있다. 두 번째 단계에서는 이러한 숨겨진 하이퍼링크를 추출하기 위하여 웹 사이트의 접근로그를 이용한다. 즉, 접근로그로부터 각 사용자의 클릭스트림을 추출한 후, 첫 번째 단계에서 생성한 그래프와 비교하여 숨겨진 하이퍼링크를 추출한다. 본 논문에서 제안한 알고리즘의 성능을 평가하기 위하여 다양한 실험을 수행하였고, 이러한 실험을 통하여 웹 사이트의 구조를 보다 정확하게 추출할 수 있음을 확인하였다.

실시간 웹로그 스트림데이터를 이용한 고객행동평가시스템 구현 (Implementation of Customer Behavior Evaluation System Using Real-time Web Log Stream Data)

  • 이한주;박홍규;이원석
    • 한국정보기술학회논문지
    • /
    • 제16권12호
    • /
    • pp.1-11
    • /
    • 2018
  • 최근 온라인 쇼핑 유통시장의 규모는 지속적이고 빠르게 성장하고 있기 때문에 고객 행동평가분석을 통한 맞춤형 쇼핑서비스가 매우 중요해지고 있다. 하지만 기존의 분석 방식은 소비자의 프로파일 및 행동에 대한 분석 데이터만을 제공하고, 디스크기반 마이닝 탐사로 인해 실시간 분석의 한계가 존재했다. 그러므로 실시간 처리 및 분석이 필요한 웹 서비스와 같은 분야에 기존 방식을 적용하기에는 정확성의 문제와 시스템 성능 문제가 존재한다. 본 연구에서는 실시간으로 발생되는 웹 클릭 로그 스트림을 분석하고 특정 상품에 대한 집중도를 분석하여 상품 구매 의지가 있는 관심고객을 찾아내며, 이를 바탕으로 전체 고객 대상이 아닌 관심고객 중심의 상품 프로모션을 진행할 수 있는 시스템을 구현하고 이들의 효율성과 정확성을 검증한다.

앙상블 SVM을 이용한 동적 웹 정보 예측 시스템 (Dynamic Web Information Predictive System Using Ensemble Support Vector Machine)

  • 박창희;윤경배
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.465-470
    • /
    • 2004
  • 기존의 웹 정보 예측 시스템은 예측에 필요한 정보를 얻기 위하여 사용자 프로파일과 사용자로부터의 명시적 피드백 정보를 필요로 하는 단점이 존재한다. 본 논문에서는 이러한 단점을 극복하고자 웹 사이트에 접속한 고객의 행동을 나타내는 클릭 스트림 데이터와 이를 기반으로 한 사용자의 암시적 피드백 정보를 이용하여 각 사용자가 가장 필요로 하는 웹 정보를 예측한다. 이를 이용하여 관련 정보를 제공할 수 있는 앙상블 SVM을 이용한 동적 웹 정보 예측 시스템을 설계하고 구현하며, 기존의 웹 정보 예측 시스템과 성능 비교를 수행한 결과, 제안된 방법의 우수함이 입증되었다.

웹 마이닝을 위한 웹 문서 하이퍼링크와 웹 접근로그를 통합한 방향그래프 (Directed Graph by Integrating Web Document Hyperlink and Web Access Log for Web Mining)

  • 박철현;이성대;곽용원;전성환;박휴찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.16-18
    • /
    • 2005
  • 웹은 사용자가 원하는 정보를 쉽고 정확하게 검색할 수 있도록 웹 문서를 자료구조화하여 보다 신뢰성 있는 패턴을 추출하고 사용자의 특성과 행동 패턴을 적용하여 개인화 하여야한다. 본 논문에서는 개인화하기 위한 전처리 과정으로서 웹 문서를 구조화 하는 방법을 제안한다. 제안 방법은 기본적으로 웹 문서 태그의 하이퍼링크를 깊이 우선 탐색 알고리즘을 사용하여 방향그래프를 만드는 것이다. 이때 웹 문서 태그 탐색 시 플래시, 스크립트 등의 찾기 힘든 하이퍼링크를 찾는 문제와 '뒤로' 버튼 사용 시 웹 접근로그에 기록되지 않는 문제점을 보완한다. 이를 위해 클릭 스트림을 스택에 저장하여 이미 만들어진 방향그래프와 비교하여 새롭게 찾은 정점과 간선을 추가함으로써 보다 신뢰성높은 방향그래프를 만든다.

  • PDF

웹 접근로그를 활용한 웹 구조 마이닝 (Web Structure Mining Using Web Access Log)

  • 박철현;이성대;전성환;박휴찬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.393-396
    • /
    • 2006
  • 웹의 급속한 성장으로 정보의 양이 많아졌지만 디자인의 비중이 커지면서 웹 문서에 대한 구조를 추출하는데 어려움이 있다. 웹은 사용자가 원하는 정보를 쉽고 정확하게 검색할 수 있도록 웹 문서의 내용을 구조화하여 지속적으로 개선하면서 사용자의 특성과 행동 패턴에 따라 개인화 하여야한다. 이러한 문제를 해결하기 위해서는 웹 문서들 간의 정확한 구조를 추출하는 것이 선행되어야 한다. 본 논문에서는 보다 웹 사이트의 정확한 구조를 추출하기 위한 방법을 제안한다. 제안 방법은 기본적으로 웹문서 태그의 하이퍼링크와 플래시 파일을 2진 형태의 문서로 불러 하이퍼링크를 추출하고 이를 깊이 우선 탐색 알고리즘을 사용하여 방향그래프로 만든다. 하지만 이러한 웹 문서 태그 탐색 시 애플릿이나 스크립트 등에 숨어 있는 하이퍼링크를 찾는 문제와 '뒤로' 버튼 사용 시 웹 접근로그에 기록되지 않는 문제점이 보완되어야 한다. 이를 위해 클릭 스트림을 스택에 저장하여 이미 만들어진 방향그래프와 비교하여 새롭게 찾은 정점과 간선을 추가 삭제함으로써 보다 신뢰성 높은 방향 그래프를 만든다.

  • PDF

디바이스 유형을 고려한 온라인 멀티 채널 마케팅 효과 (The Effect of Online Multiple Channel Marketing by Device Type)

  • 신하정;남기환
    • 경영정보학연구
    • /
    • 제20권4호
    • /
    • pp.59-78
    • /
    • 2018
  • 다양한 디바이스 유형과 마케팅 커뮤니케이션의 등장으로 온라인 환경에서 고객들의 탐색 및 구매 행동은 더욱 세분화 되었다. 하지만 기존 연구들은 고객 구매여정에서의 마케팅 채널 효과를 분석하는 과정에서 디바이스 종류에 따라 드러나는 UI(User Interface)와 UX(User Experience) 특성을 반영하지 못하였다. 본 연구는 글로벌 쇼핑몰의 대규모 클릭스트림 데이터를 활용하여 다양한 디바이스를 사용하는 고객들의 유입 채널 효과를 분석하였다. 온라인 쇼핑을 활성화 시키는 디바이스 유형을 구별하고, 디바이스 유형에 따라 방문을 증진시키는 유입 채널 간의 차이를 비교하였다. 고객의 과거 쇼핑 누적 경험과 유입 채널 전환 행태를 통해 방문과 구매액 미치는 직접효과 간접효과를 판별하였다. 그 결과 동일한 고객이더라도 디바이스 선택에 따라 활용하는 마케팅 채널이 달라지는 것을 발견할 수 있었다. 온라인 소매업체는 이러한 결과를 통해 디바이스 유형을 고려하여 멀티 마케팅 채널 환경에서의 고객 의사결정과정을 더욱 잘 이해하고 최적의 전략을 세울 수 있을 것이다. 본 연구는 실제 글로벌 빅 데이터를 분석하여 얻어진 유의미한 결과를 기반으로 경영학적 시사점을 도출하고, 계량 경제 모델을 활용하여 의미 있는 이론적립에 학문적으로 기여한다. 실제 온라인 쇼핑 마케팅 담당자들이 시도할 수 있는 전략적 통찰력을 제시한다는 점에서 실용적으로 활용할 가치가 있다.

Prefix-트리를 이용한 동적 가중치 빈발 패턴 탐색 기법 (Efficient Dynamic Weighted Frequent Pattern Mining by using a Prefix-Tree)

  • 정병수
    • 정보처리학회논문지D
    • /
    • 제17D권4호
    • /
    • pp.253-258
    • /
    • 2010
  • 지금까지의 빈발 패턴(Frequent Pattern) 마이닝에서는 각 항목들의 중요도(Weight)는 모든 같은 값으로 다루어 왔으나 실 환경에서는 각 항목들의 중요도가 다르게 적용되는 경우가 많이 있고 또 같은 항목이라도 시간에 따라 다른 중요도 값으로 다루어져야 할 경우가 있다. 비즈니스 데이터 분석 환경이나 웹 클릭 데이터 분석 환경과 같은 응용에서도 동적으로 변하는 중요도를 고려하여야 한다. 지금까지 항목의 중요도를 고려하는 여러 패턴 마이닝 기법들이 제안되고 있으나 동적으로 변하는 항목의 중요도를 고려하는 연구는 발표되지 않고 있다. 본 논문에서는 처음으로 동적인 항목들의 중요도(혹은 가중치)를 고려하는 빈발 패턴 마이닝 알고리즘을 제안한다. 제안하는 기법은 단 한번의 데이터베이스 스캔으로 처리되므로 스트림 데이터를 분석할 수 있다. 여러 실험을 통하여 제안하는 기법은 매우 효과적이며 확장성이 좋은 것임을 보인다.

T-DMB 실시간 비디오 부가데이터 서비스 시스템 개발 (The Development of Real-time Video Associated Data Service System for T-DMB)

  • 김상훈;곽천섭;김만식
    • 방송공학회논문지
    • /
    • 제10권4호통권29호
    • /
    • pp.474-487
    • /
    • 2005
  • T-DMB (Terrestrial-Digital Multimedia Broadcasting)는 비디오 부가데이터 서비스 표준으로 MPEG-4 BIFS (Binary Format for Scene) Core2D 장면서술 프로파일과 그래픽스 프로파일을 채택하였다. BIFS 기능을 이용하면 송신측에서 지정하는 속성에 따라 글자, JPEG 정지영상, 도형 등을 수신측의 주 화면상에 오버레이 할 수 있고, 원하는 객체에 클릭 가능한 버튼이나 웹 링크를 설정할 수 있어 다양한 형태의 대화형 방송이 가능하다. 본 논문은 비디오 부가데이터 서비스를 제공하기 위한 시스템 개발에 관한 것이다. 개발 중인 시스템은 사용자의 조작에 따라 프로그램에 실시간으로 반영되는 부가데이터 서비스 제공, 비디오 인코더와의 연동 및 안정성에 중점을 두었으며, BIFS 실시간 시스템, 자동 스트림 제어 시스템, 수신 모니터링 시스템으로 구성되어 있다. 시스템의 기본기능들은 방송 프로그램과 제작 현장의 특성을 최우선적으로 반영하여 설계되었다. 개발된 시스템은 KBS T-DMB 부가데이터 시범서비스에 사용되었으며, 안정성 강화 등의 작업을 거친 후 본 방송에 투입될 예정이다.