• 제목/요약/키워드: 웹패턴

검색결과 552건 처리시간 0.026초

다차원 FCM을 이용한 웹 로그 데이터의 유사 패턴 분석 (Similarity Pattern Analysis of Web Log Data using Multidimensional FCM)

  • 김미라;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.190-192
    • /
    • 2002
  • 데이터 마이닝(Data Mining)이란 저장된 많은 양의 자료로부터 통계적 수학적 분석방법을 이용하여 다양한 가치 있는 정보를 찾아내는 일련의 과정이다. 데이터 클러스터링은 이러한 데이터 마이닝을 위한 하나의 중요한 기법이다. 본 논문에서는 Fuzzy C-Means 알고리즘을 이용하여 웹 사용자들의 행위가 기록되어 있는 웹 로그 데이터를 데이터 클러스터링 하는 방법에 관하여 연구하고자 한다. Fuzzv C-Means 클러스터링 알고리즘은 각 데이터와 각 클러스터 중심과의 거리를 고려한 유사도 측정에 기초한 목적 함수의 최적화 방식을 사용한다. 웹 로그 데이터의 여러 필드 중에서 사용자 IP, 시간, 웹 페이지 필드를 WLDF(Web Log Data for FCM)으로 가공한 후, 다차원 Fuzzy C-Means 클러스터링을 한다. 그리고 이를 이용하여 샘플 데이터와 임의의 데이터간의 유사 패턴 분석을 하고자 한다.

  • PDF

그래프 기반의 상호 중요도 측정 기법을 이용한 영역별 개체명 자동 추출 (Automatic Named Entities Extraction Using the Graph-based Measurement Technique of the Mutual Importance)

  • 배상준;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.17-22
    • /
    • 2008
  • 본 논문에서는 영역별로 자동으로 개체명을 추출하기 위하여 씨앗단어를 이용하고, 웹페이지와 개체명 후보들 간의 상호 중요도를 측정하여 개체명 후보들의 순위를 정하는 방식을 제안한다. 제안된 방식은 크게 세 단계에 의해서 수행되어 지는데 먼저 씨앗단어 정보를 이용하여 웹페이지를 검색하고, 검색되어진 웹 페이지와 씨앗단어 정보를 이용하여 패턴 규칙을 추출한다. 추출된 패턴 규칙을 웹페이지에 적용하여 개체명 후보들을 추출하고 추출된 후보들과 웹페이지 사이의 상호 중요도를 재귀적으로 계산하여 최종적으로 개체명 후보들의 순위가 정해 진다. 한국어와 영어 개체명 영역에 제안된 기법을 적용하여 실험한 결과 한국어에서는 78.72%의 MAP를 얻을 수 있었고, 영어에서는 96.48%의 MAP를 얻었다. 특히 영어 개체명 인식에서의 성능은 구글에서 제공하고 있는 구글셋의 결과보다도 높은 성능을 보였다.

  • PDF

정렬패턴과 광량을 이용한 롤투롤 인쇄전자공정의 횡 방향 웹 위치 측정 시스템 (Lateral Position Measurement System for Precision Alignment of Roll-to-Roll Printing Using Alignment Patterns and Quantity of Light)

  • 정민규;김현기;오동호
    • 대한기계학회논문집A
    • /
    • 제39권9호
    • /
    • pp.879-884
    • /
    • 2015
  • 인쇄전자는 필름과 같이 유연한 웹 위에 기능성 잉크를 인쇄하여 전자소자 및 회로를 만들어내는 기술로써, 대면적 및 고속 대량 생산에 적합하며 유연소재의 전자소자를 만들어 낼 수 있는 차세대 공정기술이다. 이러한 롤투롤 인쇄전자 공정의 상용화를 위해서는 웹의 정밀 위치 측정이 요구되므로 본 연구의 선행연구를 통해 수 마이크로미터 측정 정밀도를 가진 광학 측정 시스템을 제안하였다. 하지만 선행연구의 횡 방향 측정은 웹 전체가 횡 방향으로 밀림 현상이 발생한 경우 이를 인지 할 수 없는 한계를 가지고 있다. 본 연구에서는 선행연구의 이송방향 웹 위치 측정 정밀도는 유지하며 웹의 횡 방향 위치에 따라 정렬패턴에서 반사되는 광량 차이를 이용한 웹의 횡 방향 위치 측정 시스템을 제안하였고 신뢰성을 확인하였다.

클릭스트림 분석을 위한 웹 서버 시스템의 설계 및 구현 (Design and Implementation of Web Server for Analyzing Clickstream)

  • 강미정;정옥란;조동섭
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.945-954
    • /
    • 2002
  • 인터넷을 통한 비즈니스에 수익 모델에 대한 관심이 높아지면서 방문자별로 개인화된 서비스를 제공하려는 노력이 커지고 있다. 개인화(Personalization)란 고객 한 명을 대상으로 하여 그 고객 한 사람을 위한 정보나 제품을 제공해주는 작업을 말한다. 개인화 서비스를 위해서 전 처리과정인 사용자 프로파일 생성과정이 필요하며, 적극적인 개인화 서비스를 제공하기 위해서는 충분한 고객 데이터가 필요하다. 본 논문에서는 웹사이트 상에서 사용자 행위 패턴을 파악할 수 있는 클릭스트림 정보를 모듈화 하였으며, 이를 이용하여 확장된 웹 로그 시스템을 구현하였다. 클릭스트림 정보를 웹 로그정보에 포함시켜 사용자의 행위 패턴을 파악할 수 있도록 웹 서버 시스템을 설계하고 구현하였다. 그리고 이 웹 서버는 웹사이트로부터 얻은 클릭스트림 정보를 분류하고 저장하여 관리자가 쉽게 분석할 수 있다. 이때 데이터베이스 저장 기술로 OLE DB Provider상에서 수행되는 ADO(ActiveX Data Object)기술을 사용함으로써 확장된 웹 로그 처리 시스템을 설계하였다. 확장된 웹 로그 DB를 패턴분석, 군집분석 등의 마이닝(Mining) 기법을 통하여 맞춤서비스에 대한 사용자 프로파일을 구축할 수 있다.

소셜 네트워크 기반 사용자 유사성 발견을 통한 개인화 및 소셜 검색 (Personalized and Social Search by Finding User Similarity based on Social Networks)

  • 박건우;오정운;이상훈
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.683-690
    • /
    • 2009
  • 소셜 네트워크(Social Network)는 웹 환경에서 개인 중심의 네트워크로 구성되어 웹 사용자별 프로파일을 탐색하고 새로운 연결을 형성함으로써 정보의 소통을 지원한다. 따라서 유사한 내재적 정보를 가진 웹 사용자들로 구성 된 소셜 네트워크를 찾아서 검색에 적용한다면 검색의 효율성과 검색 결과에 대한 웹 사용자의 만족도를 향상 시킬 수 있다. 본 논문에서는 첫째, 웹 사용자간 직접 또는 간접적인 연결로 구성된 소셜 네트워크를 구성 한다. 둘째, 사용자들의 속성(Feature)에 내재된 정보를 이용하여 주제(topic)별 웹 사용자 간 유사성(Similarity)을 산정한 후, 주제(Topic)별 변화되는 유사성에 따라 소셜 네트워크를 재구성한다. 마지막으로 산정된 유사성과 웹 사용자들의 검색결과에 대한 만족도, 즉 검색 패턴(Search Pattern)을 비교 실험 한다. 실험 결과 주제별 유사성이 높은 웹 사용자 간에는 검색 패턴 또한 유사함을 확인 하였다. 이와 같은 사실을 검색에 적용한다면 개인화 검색(Personalized Search) 및 소셜 검색(Social Search)의 효율성 및 신뢰성 향상에 기여 할 수 있다.

eCRM을 위한 고객구매패턴 분석에 관한 연구 (A Study on the Analysis of Customer Purchasing Pattern for eCRM)

  • 김남호;이도헌
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.15-18
    • /
    • 2001
  • 개별화 웹 마케팅은 본질적으로 고객지향의 패러다임이다. 즉, 개별 고객의 특수한 니즈를 개별적으로 파악해서 각각의 고객에게 차별화된 서비스를 제공하는 것이 그 핵심이다. 웹 서버의 고객이 접근한 상품의 로그파일에 데이터마이닝의 연관규칙 기술을 이용하게 되면 고객행동 패턴의 파악 및 예측을 위한 기법으로 활용할 수 있다. 본 연구에서는 웹 사용자의 교차 판매를 위한 원투원 마케팅에 필요한 접근패턴을 분석하고자 하며, 이는 고객의 상품에 대한 접근이 기록된 액세스 로그 데이터베이스의 분석을 통하여 이루어진다. 이들 데이터 처리와 교차판매 지원을 위한 데이터마이닝 모델링, 이를 통한 원투원 마케팅 모델 제시, 그리고 이의 활용이 고객관계관리(eCRM)에 미치는 효과를 제시한다.

  • PDF

WebPR :빈발 순회패턴 탐사에 기반한 동적 웹페이지 추천 알고리즘 (WebPR : A Dynamic Web Page Recommendation Algorithm Based on Mining Frequent Traversal Patterns)

  • 윤선희;김삼근;이창훈
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.187-198
    • /
    • 2004
  • 월드 와이드 웹(World-Wide Web)은 가장 커다란 분산된 정보저장소로서 계속하여 빠른 속도로 성장해왔다. 그러나 비록 웹이 빠른 속도로 성장하고 있다 할지라도, 웹의 정보를 읽고 이해하는 데는 본질적으로 한계가 있다. 웹 사용자 입장에서 보면 웹의 정보 폭발, 꾸준하게 변화하는 환경, 사용자 요구에 대한 이해 부족 둥으로 오히려 혼란을 겪을 수 있다. 웹의 이러한 환경에서 사용자의 순회패턴(traversal patterns)을 탐사하는 것은 시스템 설계나 정보서비스 제공 측면에서 중요한 문제이다. 순회패턴 탐사에 관한 기존의 연구들은 세션(sessions)에 나타나는 페이지들간의 연관성 정보를 충분히 활용하지 못한다. 본 논문에서는 세션에 나타나는 페이지들간의 연관성 정보를 활용하여 빈발 k-페이지집합을 탐사하고, 이를 기반으로 하여 추천 페이지집합을 생성함으로써 효율적인 웹 정보서비스를 제공할 수 있는 Web Page Recommend(WebPR) 알고리즘들을 제안한다. 제안한 WebPR 알고리즘은 웹 사이트를 방문한 사용자에게 추천 페이지집합을 포함하는 새로운 페이지뷰(pageview)를 제공함으로써 궁극적으로 찾고자하는 목표 페이지에 효과적으로 접근할 수 있도록 해준다. 기존 연구들과의 가장 큰 차이점은 페이지들간의 연관성 정보를 활용하는 방법들을 일관성 있게 고려하고 있다는 점과 가장 효율적인 트리모델을 제안한다는 점이다. 두개의 실제 웹로그(Weblog) 데이터에 대한 실험은 제안한 방법이 기존의 방법들보다 성능이 우수함을 보여준다.

일반적인 웹 검색 경로패턴 추출 알고리즘 (Algorithm for Extracting the General Web Search Path Pattern)

  • 장민석;하은미
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.771-773
    • /
    • 2005
  • 웹 환경에서 사용자들의 정보검색 패턴을 얻어내기 위해 흔히 로그 파일의 정보검색 패턴을 분석하는 기존 연구들이 있어 왔다. 이들에서 흔히 사용하는 방법은 경로 순회 패턴(path traversal patterns)에서 효율적으로 빈번 패턴(frequent patterns)을 찾아내는 알고리즘을 제안하는 것이다. 하지만 이들의 기존 연구의 가장 일반적인 문제점들 중의 하나는 일반적인 패턴 즉, 복잡한 형태 패턴(topological patterns)에 대한 적절한 해답을 찾아주지는 못한다는 것이다. 따라서 본 논문에서는 일반적인 패턴 유형을 정의하고 이들로부터 정보검색 패턴을 알아내는 효율적인 알고리즘을 제안하고자 한다.

  • PDF

메타 검색엔진을 위한 페이지 변경 탐지기 설계 (Design of A Page Modification Detector for Meta-search Engines)

  • 박상위;오정석;이상호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.205-207
    • /
    • 2001
  • 웹 상의 HTML 문서들은 수시로 변경되고 있으며, 정보를 검색하는 웹사이트 또한 예외는 아니다. 다수의 웹 검색엔진들의 결과를 통합하는 메타 검색엔진은 각 검색엔진의 정보 변경에 민감해야 된다. 본 논문은, 수시로 변경되는 검색엔진들의 HTML 문서 정보를 메타 검색 엔진에 반영하기 위해, 자동적으로 검색엔진들의 질의 형태 변경과 검색 엔진의 검색 결과 HTML 문서의 구조 변경 탐지는 질의 결과가 반복되는 HTML 태그(tags) 문서 구조를 패턴(pattern)으로 이용한다. 패턴 발견 알고리즘은 문자열에서 규칙적으로 발생하는 패턴을 찾아내는 Jaak Vilo 알고리즘을 기반으로 HTML 문서를 처리할 수 있도록 확장하였다. 발견된 HTML 문서 패턴과 기존의 검색 엔진 HTML 페이지의 구조적 패턴 정보를 비교하여 문서 구조 변경을 탐지한다.

  • PDF

효율적인 웹 마이닝 시스템의 설계 및 구현 (Design and Implementation for the Effective Web)

  • 김형욱;최익규;김민구
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.303-307
    • /
    • 2002
  • 효율적인 웹 마이닝을 위해서는 방대한 인터넷 공간에서 사용자가 원하는 정보를 찾아내고, 이들 중 보다 유용하다고 판단되어진 자료를 선별적으로 제시할 수 있어야 한다. 본 논문에서는 웹 컨텐츠 분석과 HTML 문서들 사이의 링크 연결의 패턴 분석을 기반으로 하는 웹 구조 분석 방법들을 검토하고, 웹 검색 시스템을 구현하여 결과를 분석하였다. 이를 위해 웹 문서의 내용을 인덱싱한 뒤 질의와의 관련성의 확률을 구하는 랭귀지 검색 모델에 링크 구조 분석을 이용한 순위 알고리즘을 사용하여 좋은 결과를 얻고자 하였다. 또한 기존의 링크 관련 알고리즘에서 알려진 문제점을 해결하기 위한 몇가지 테크닉을 사용하였다.

  • PDF