• 제목/요약/키워드: 웹페이지

검색결과 1,044건 처리시간 0.026초

온톨로지 기반의 웹 페이지 분류 시스템 (Web Page Classification System based upon Ontology)

  • 최재혁;서혜성;노상욱;최경희;정기현
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.723-734
    • /
    • 2004
  • 본 논문은 온톨로지(ontology)에 기반 한 자동화된 웹 페이지 분류 시스템을 제안한다. 웹 페이지의 분류를 위하여 첫 번째 단계에서는 각 웹 페이지가 속한 범주(category)를 대표할 수 있는 단어를 선정하며, 이를 위하여 단어빈도와 문서빈도를 곱한 값을 계산한다. 두 번째 단계에서는 첫 번째 단계에 의해 선택된 단어의 정보이득(information gain)을 계산해 분류 확률이 높은 단어를 우선적으로 선정한다. 두 단계를 통하여 선정된 단어들과 웹 페이지의 분류 정보를 가지고, 기계학습에 의하여 컴파일 된 규칙(compiled rules)을 생성한다. 생성된 규칙은 임의의 웹 페이지들을 도메인 온톨로지에 의해 정의된 범주 별로 분류할 수 있도록 한다. 본 논문의 실험에서는 주어진 웹 페이지 집합에서 각 범주 별로 평균 240개의 단어로부터 78개의 단어를 결과적으로 선정하였으며, 이를 바탕으로 웹 페이지 분류 규칙을 생성하였다. 실험 결과에서 제안한 시스템의 평균 분류 정확도는 약 83.52%로 측정되었다.

오디세우스 대용량 검색 엔진을 위한 병렬 웹 크롤러의 구현 (Implementation of a Parallel Web Crawler for the Odysseus Large-Scale Search Engine)

  • 신은정;김이른;허준석;황규영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권6호
    • /
    • pp.567-581
    • /
    • 2008
  • 웹의 크기가 폭발적으로 증가함에 따라 인터넷에서 정보를 얻는 수단으로서 검색 엔진의 중요성이 부각되고 있다. 검색 엔진은 사용자에게 최신의 정보를 검색 결과로서 제공하기 위해 웹 페이지를 주기적으로 수집하고 이를 데이타베이스에 저장한다. 웹 크롤러는 이러한 목적으로 웹 페이지를 수집하는 프로그램이다. 대부분의 검색 엔진은 제한된 시간 내에 많은 수의 웹 페이지를 수집하기 위해 다수의 머신을 사용하는 병렬 웹 크롤러를 이용한다. 그러나, 병렬 웹 크롤러의 아키텍처와 세부 구현 방법이 잘 알려져 있지 않기 때문에 실제로 병렬 웹 크롤러를 구현하는 데에 어려움이 많다. 본 논문에서는 병렬 웹 크롤러(parallel web crawler)의 아키텍처와 세부 구현 방법을 제시한다. 병렬 웹 크롤러는 다수의 머신에서 웹 페이지를 병렬적으로 수집하기 위해 조정자(coordinator) 대리자(agent) 구조의 2-티어(tier) 모델을 사용한다. 조정자/대리자 모델은 각 머신에서 웹 페이지를 수집하기 위한 다수의 대리자들과 이 대리자들을 관리하기 위한 하나의 조정자로 구성된다. 병렬 웹 크롤러는 웹 페이지를 수집하기 위한 크롤링(crawling) 모듈, 수집한 웹 페이지를 데이타베이스 로딩 포맷으로 변환하기 위한 컨버팅(converting) 모듈, 수집된 웹 페이지의 중요도를 계산하기 위한 랭킹(ranking) 모듈로 구성된다. 본 논문에서는 병렬 웹 크롤러의 각 모듈들을 설명하고, 세부 구현 방법을 설명한다. 마지막으로, 실험을 통해 병렬 웹 크롤러의 성능을 평가하였다. 실험 결과, 제안된 병렬, 웹 크롤러가 수집해야할 웹 페이지 개수와 머신 개수에 따라 확장 가능함을 보였다.

웹 페이지 분석을 위한 Web-Picker 설계 및 구현 (Design and Implementation Web-Picker for web page analysis)

  • 이미란;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.603-605
    • /
    • 2003
  • 1990년대 중반에 일어나기 시작한 인터넷 열풍은 웹을 통한 인터넷의 확산으로, 웹 기반 서비스의 발전을 가져왔다. 현재 대부분의 인터넷 서비스는 HTTP를 사용한 일정한 형식의 웹 페이지로, 사용자가 최종적으로 받아보게 되는 형식은 HTML의 태그로써 나타내어진다. 어떠한 태그를 어떻게 사용하였느냐에 따라 그 웹 페이지는 사용자가 사용하기 편리할 수도 있고, 사용하는데 불편할 수도 있다. 따라서 웹사이트의 개발자는 사용자가 편리함과 친숙성을 느낄 수 있도록 웹사이트를 개발해야 한다. 본 논문에서는 이률 해결하기 위해 웹 페이지 분석을 위한 Web-Picker를 제안하고자 한다. Web-Picker를 이용하면 사용자들이 자주 방문하는 웹 페이지의 태그를 분석할 수 있고. 이렇게 분석한 정보를 통해 새로운 웹사이트를 개발하는 개발자들은 사용자가 친숙성과 편리함을 느낄 수 있도록 웹사이트를 개발 할 수 있다.

  • PDF

웹 환경에서 온톨로지를 이용한 지역정보 융합 시스템 (A Local Information Integration System using Ontology on Web)

  • 최영수;정회윤;노성민;양형정
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제45차 동계학술발표논문집 20권1호
    • /
    • pp.45-48
    • /
    • 2012
  • 방대한 웹 페이지의 홍수 속에서, 의미상 서로 연관되었지만 산재되어 있는 정보들을 사용자에게 효과적으로 제공하기란 그리 쉽지 않다. 웹 페이지에서 질적으로 향상된 정보를 얻기 위해서는, 이질적이지만 서로 연관된 의미를 갖는 데이터들을 하나로 융합하는 방법이 필요하다. 본 논문에서는 이질적인 형태로 이루어진 다수의 웹 페이지들을 XML 기반의 메타데이터(metadata)로 융합하여 사용자에게 제공하는 방법을 제시한다. 본 논문에서 제안한 시스템에서 메타데이터는 온톨로지와 OWL을 이용하여 융합된다. 또한 제시한 방법을 검증하기 위해 지역정보 중 부동산을 사례를 들어 시스템을 구현한다. 구현된 시스템은 각기 다른 데이터를 가지고 있는 다수의 웹 페이지를 하나의 웹 페이지로 통합하는 과정을 거쳐 XML 문서 형태로 사용자에게 제공한다.

  • PDF

사용자의 의도를 반영한 문맥 광고 랭킹 개선 기법 (Improving Contextual Advertising Ranking by Reflecting User Intention)

  • 정다운;하종우;심규선;이상근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.76-78
    • /
    • 2010
  • 최근 몇 년간 정보 검색 분야에서 문맥 광고에 관한 연구가 활발히 연구되고 있다. 하지만 기존의 관련된 연구들은 대부분 웹페이지 내용만을 활용하여 유사한 광고를 찾고자 하였다. 그럼으로써 동일한 웹페이지를 접속하는 다양한 의도를 가진 사용자들이 동일한 광고를 보게 된다는 한계가 존재하였다. 본 논문에서는 웹페이지의 내용뿐만 아니라 각각의 사용자들의 웹페이지 방문 의도를 웹 페이지 방문 히스토리로부터 추출하여 이를 활용한 기법을 제안하고자 한다. 또한 실험을 통하여 본 논문에서 제안된 기법이 사용자 방문 의도를 반영함으로써 기존 기법에 비해 성능이 향상되었음을 보여준다.

웹 기반 멀티미디어 웹페이지 구축 학습 시스템 설계 및 구현 (Design and Implementation of Web-based Tutoring System of Multimedia Web Page Implementation)

  • 권정식;김현주;엄희선;임한규
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.407-411
    • /
    • 2001
  • 웹 기반 멀티미디어 웹페이지 구축 학습 시스템은 인터넷을 통하여 웹페이지 개발기술을 체계적으로 습득하는 멀티미디어적 교육 시스템으로, 일방적으로 보여주는 것을 탈피하여 상호 작용성을 강조한 학습방식이다. 사용자가 직접 조작할 수 있는 학습 시스템으로 내용의 이해를 쉽도록 설계하였고 기존의 텍스트와 정적 이미지 세시방식에서 더 나아가 실제 학습통영 상을 제작하여 사용자의 습득 능률을 높이도록 하였다.

  • PDF

웹 이미지 로드 방법에 따른 속도 비교 (Speed Comparison by Web Image Loading Method)

  • 최문혁;박진태;문일영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.310-312
    • /
    • 2019
  • 4차 산업 혁명으로 인해 많은 기술들이 발전했다. 해당 기술들은 웹 표준 HTML5를 이용하여 웹을 통해 많은 사용자들에게 제공되고 있다. 웹에서 제공되는 콘텐츠가 증가함에 따라 웹을 이용하는 사용자의 수가 증가하였고 기존보다 더 웹 속도에 대한 중요성이 높아지고 있다. 왜냐하면 사용자들은 웹 페이지 로딩 속도가 빠르게 되는 것을 기대하고 있기 때문에 웹 페이지 로딩 속도가 증가되면 사용자들은 해당 페이지를 이탈하게 된다. 즉 웹 페이지 로딩 속도와 페이지 이탈률은 비례 관계에 있다. 따라서 콘텐츠를 제공하는 속도를 증가시켜 웹 페이지 로딩을 빠르게 할 필요가 있다. 본 논문에서는 웹을 통해 제공되는 콘텐츠 중 하나인 이미지에 관련하여 웹에서 이미지를 제공할 때 어떤 방식으로 제공하면 더 빠르게 제공될 수 있는지 실험을 통해 확인해보자고 한다. 해당 실험 결과를 바탕으로 웹을 통해 이미지를 제공하는 속도가 빠른 방법을 확인하고 해당 방법으로 이미지를 제공함으로써 페이지 이탈률을 낮추며 기존보다 더 사용자 친화적인 서비스를 제공하고자 한다.

  • PDF

WebSES : 배색을 이용한 웹 사이트 감성 평가 시스템 (WebSES : Web Site Sensibility Evaluation System based on Color Combination)

  • 유헌우;조경자;홍지영;박수이
    • 감성과학
    • /
    • 제7권1호
    • /
    • pp.51-64
    • /
    • 2004
  • 본 논문에서는 웹 페이지의 배색에 따른 감성 평가치를 바탕으로 감성기반 웹 페이지 검색 시스템을 구현하였다. 구현된 시스템은 웹 페이지의 색상 정보를 자동으로 추출하여 데이터베이스에 색인하는 모듈과 감성 형용사가 주어졌을 때 감성과 관련된 색상 배색이 많이 포함된 웹 페이지를 내림차순으로 검색하는 모듈로 구성된다. 구현된 시스템의 타당성을 검증하기 위해 실제 웹 페이지를 대상으로 시스템이 검색한 순위와 사용자 설문조사와 전문가 평정에 의한 순위를 비교 분석한다. 사용자 설문조사 결과 18개의 감성 형용사 중 10개의 형용사에 대해 통계적으로 적합한 결과를 보였으며, 상/하위 5개의 사이트만을 고려한 전문가 평정에서는 14개의 형용사가 적합한 결과를 보였다.

  • PDF

Web URL Page 의 Image Logging 기법 (Image Logging Technique of a Web URL Page on the Tiny Web Server)

  • 유승희;조동섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.679-682
    • /
    • 2008
  • 기존의 웹서버는 텍스트형식의 로그파일을 기록한다. 웹 서버에서 로그파일은 클라이언트의 웹서버에 대한 접속정보와 웹서버의 처리상황 등 모든 상황을 기록하고 저장한다. 이 정보를 분석하면 웹 서비스를 하는데 있어서 웹 서비스의 질을 높이는데 좋은 참고자료가 될 뿐 아니라 웹 서버에 이상이 생겼을 경우 발생한 오류를 조기에 발견하는 데에도 사용되는 중요한 자료이다. 현재 이러한 로그파일은 텍스트 파일로 저장되어있기 때문에 조작의 가능성도 있고 오랜 시간이 지나 해당 웹 페이지가 삭제되었을 경우 로그파일에 기록된 그 시각의 웹 페이지를 볼 수 없다. 본 연구에서는 로그파일에 기록된 그 시간의 웹 URL 페이지 이미지를 저장하여 이미지 로그파일을 만드는 시스템을 구현해 봄으로써 텍스트형식 로그파일의 단점을 보안하고 오랜 시간이 지난 후에도 그 웹 페이지를 볼 수 있는 기법을 연구하였다. 이 기법은 로그파일로써의 역할 뿐만 아니라 Digital Forensics 로 범죄 수사에도 많은 도움이 될 수 있고 휴대전화에서 풀 인터넷 브라우징 연구에도 적용될 수 있다.

사용자 프로파일을 이용한 웹페이지 추천 (Web Page Recommendation Using User Profile)

  • 강귀영;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.433-435
    • /
    • 2001
  • 전자상거래 사이트 내에서 제공되는 정보가 많아질수록 사용자는 많은 실패를 거친 후 자신이 원하는 정보에 도달하게 된다. 사용자가 어떤 사이트에 자주 찾아오도록 하기 위해서는 적은 노력으로도 원하는 정보에 도달할 수 있도록 도움을 주는 웹 페이지추천 기법이 필요하다. 이 기법은 사용자 프로파일의 패턴을 분석한 후 분석된 결과를 바탕으로 사용자에게 현재 있는 페이지와 가장 연관성이 높다고 판단되는 웹 페이지를 연관규칙을 응용한 방법을 이용하여 추천한다.

  • PDF