• Title/Summary/Keyword: Dynamic Web Pages

검색결과 48건 처리시간 0.026초

웹크롤러의 수집주기 최적화 (Refresh Cycle Optimization for Web Crawlers)

  • 조완섭;이정은;최치환
    • 한국콘텐츠학회논문지
    • /
    • 제13권6호
    • /
    • pp.30-39
    • /
    • 2013
  • 웹 크롤러는 서버의 부담을 최소화하면서도 최신의 데이터를 웹사이트로부터 수집하고 유지해야 한다. 빅데이터 시대와 같이 데이터가 폭발적으로 증가하는 시대에 데이터 소스로부터 자주 모든 데이터를 추출하는 것은 서버에 심각한 부담을 주게 된다. 무선통신 기술과 다양한 스마트 기기들의 확산으로 정보가 급속도로 생성되고 있으며, 어디에서나 어느 시간이나 지속적으로 생성 및 변경되고 있다. 웹크롤러는 이러한 상황을 감안하여 최신의 정보를 적은 오버헤드로 유지해 나가는 것이 중요한 이슈로 부각되고 있다. 본 논문에서는 웹사이트의 변경사항을 체크할 수 있는 효과적인 방안과 웹사이트의 수집 주기를 동적으로 변경함으로써 적은 비용으로 최신성을 유지할 수 있는 방안을 제시한다. 핵심 아이디어는 과거 히스토리로부터 웹사이트 변경이 집중되는 시간을 파악하여 웹수집 주기를 결정하는데 반영한다는 점이다. 논문에서는 특정 웹사이트의 데이터를 추출하는 Java 크롤러를 개발하고, 제안된 방식과 기존 방식의 유용성을 비교하였다. 제안된 기법을 사용하면 정적인 방식보다 서버 오버헤드를 절반정도(46.2%)로 줄이면서도 최신성을 더욱 높게 보장할 수 있게 된다.

Evaluating the web-application resiliency to business-layer DoS attacks

  • Alidoosti, Mitra;Nowroozi, Alireza;Nickabadi, Ahmad
    • ETRI Journal
    • /
    • 제42권3호
    • /
    • pp.433-445
    • /
    • 2020
  • A denial-of-service (DoS) attack is a serious attack that targets web applications. According to Imperva, DoS attacks in the application layer comprise 60% of all the DoS attacks. Nowadays, attacks have grown into application- and business-layer attacks, and vulnerability-analysis tools are unable to detect business-layer vulnerabilities (logic-related vulnerabilities). This paper presents the business-layer dynamic application security tester (BLDAST) as a dynamic, black-box vulnerability-analysis approach to identify the business-logic vulnerabilities of a web application against DoS attacks. BLDAST evaluates the resiliency of web applications by detecting vulnerable business processes. The evaluation of six widely used web applications shows that BLDAST can detect the vulnerabilities with 100% accuracy. BLDAST detected 30 vulnerabilities in the selected web applications; more than half of the detected vulnerabilities were new and unknown. Furthermore, the precision of BLDAST for detecting the business processes is shown to be 94%, while the generated user navigation graph is improved by 62.8% because of the detection of similar web pages.

동적 모바일 웹 서비스를 위한 메타모델 (A MetaModel for Dynamic Mobile Web Service)

  • 김철진;송치양
    • 한국산학기술학회논문지
    • /
    • 제16권10호
    • /
    • pp.6458-6465
    • /
    • 2015
  • 모바일 어플리케이션의 잦은 변경으로 인해 모바일 서비스의 관리가 부담이 되고 있으며, 이에 중앙관리가 용이한 모바일 웹 서비스 개발이 증가하고 있다. 모바일 웹 서비스 개발에 대해 개발자뿐 만 아니라 일반 사용자도 쉽게 개발할 수 있는 도구들이 개발되고 있다. 그러나 모바일 웹 서비스를 일반 사용자가 동적으로 구현하기 위한 표준화된 메타모델의 연구가 미흡한 상황이다. 이에 본 논문에서는 동적으로 모바일 웹 서비스를 개발할 수 있는 메타모델을 제안한다. 동적 메타모델은 XPDL 구조를 이용하여 모바일 웹 페이지와 모바일 웹 페이지 인스턴스, 그리고 동적 연결로 구성된다. 연결 메타모델에 대해 조건연결, 분기연결, 결합연결에 대해 연구하며, 최종적으로 전체 모델들을 통합하여 통합메타모델을 제안한다. 또한, 동적 메타모델의 적합성을 검증하기 위해 각 메타모델에 대해 XPDL 기반으로 사례 연구를 수행한다.

동적분류에 의한 주제별 웹 검색엔진의 설계 및 구현 (Design and Implementation of Web Directory Engine Using Dynamic Category Hierarchy)

  • 최범기;박선;박태수;송재원;이주홍
    • 인터넷정보학회논문지
    • /
    • 제7권2호
    • /
    • pp.71-80
    • /
    • 2006
  • 웹 검색엔진의 검색방법에는 키워드검색방법과 주제별검색방법이 있다. 키워드검색은 재현율(recoil)이 높지만 검색결과가 너무 많이 나오기 때문에 원하는 검색결과를 찾는 것이 어렵다. 주제별검색 역시 찾는 문서의 해당 주제가 모호하거나 주제를 정확하게 알지 못하면 문서를 찾지 못하는 경우가 있다. 즉, 검색결과의 정확율(precision)는 높으나 재현율이 떨어진다. 본 논문은 주제별검색의 문제점을 해결하기 위해서 주제와 키워드간의 관계를 퍼지논리로 정량적으로 계산하고, 이를 바탕으로 주제간의 함의(implication)관계를 유도하여 동적인 분류체계를 구성하는 새로운 웹 검색엔진을 설계하고 구현하였다. 구현된 검색엔진은 분류간의 함의관계를 유사한 하위주제로서 간주함으로써 주제별검색 결과의 재현율을 높일 수 있다.

  • PDF

고성능 웹크롤러의 설계 및 구현 (Design and Implementation of a High Performance Web Crawler)

  • 권성호;이영탁;김영준;이용두
    • 한국산업정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.64-72
    • /
    • 2003
  • 웹크롤러는 인터넷 검색엔진을 포함한 다양한 웹 응용프로그램에 활용되는 중요한 인터넷 소프트웨어 기술이다 인터넷의 급격한 성장에 따라 고성능 웹크롤러의 구현이 시급히 요구되고 있다. 이를 위해서는 웹크롤러에 대한 성능확장성에 초점을 둔 연구가 수행되어야 한다. 본 논문에서는 병렬 프로세스 기반 웹크롤러(Crawler)의 성능향상에 필수적인 동적 스케줄링의 구현 기법을 제안한다. 웹크롤러는 웹문서의 수집 성능요구를 만족시키기 위하여 일반적으로 다중 프로세스 기반으로 설계되고 있다. 이러한 다중 프로세스 기반의 설계에서 프로세스 별로 문서수집 대상을 적정하게 선택하여 할당하는 크롤 스케줄링(Crawl Scheduling)은 시스템의 성능향상에 매우 중요한 요소이다. 본 논문에서는 먼저 크롤 스케줄링에 있어 중요한 문제점들에 대한 연구 결과를 제시한 후 공유메모리 기반 동적 스케줄링 지원 기법을 고안, 이를 구현하는 웹 크롤러 시스템 구조(Architecture)를 제안하고 웹 로봇의 수행동작에 대한 분석 결과를 제공한다. 이러한 분석 결과를 기반으로 향후 웹 크롤러의 성능향상을 위한 설계 방향을 제시한다.

  • PDF

웹 응용 프로그램의 문자열 삽입 보안 취약성 분석기 개발 (Development of a String Injection Vulnerability Analyzer for Web Application Programs)

  • 안준선;김영민;조장우
    • 정보처리학회논문지A
    • /
    • 제15A권3호
    • /
    • pp.181-188
    • /
    • 2008
  • 오늘날 대부분의 웹사이트는 웹 응용 프로그램이 적절한 웹 페이지를 생성하여 전송하는 형태인 동적 웹페이지를 사용하고 있다. 이에 대하여, 취약한 웹 응용 프로그램에 악의적인 문자열을 전달하는 공격의 형태가 증가하고 있다. 본 논문에서는 대표적인 문자열 삽입 공격인 SQL 삽입(SQL Injection) 공격과 크로스 사이트 스크립팅(Cross Site Scripting, XSS) 공격에 대하여 웹 응용 프로그램내의 보안 취약성을 자동으로 찾아 주는 프로그램 정적 분석기를 개발하였다. 요약 해석을 사용한 프로그램 분석을 위하여 가능한 문자열 값을 제외 문자열들과 함께 표현하는 요약 자료 공간과 PHP 언어의 요약된 의미 규칙을 설계하였으며, 이를 기반으로 분석기를 구현하였다. 또한 개발된 분석기가 기존의 연구 결과와 비교하여 경쟁력 있는 분석 속도와 정밀도를 가짐을 실험을 통하여 보였다.

고성능 웹크롤러의 설계 및 구현 (Design and Implementation of a High Performance Web Crawler)

  • 김희철;채수환
    • 디지털콘텐츠학회 논문지
    • /
    • 제4권2호
    • /
    • pp.127-137
    • /
    • 2003
  • 웹크롤러는 인터넷 검색엔진을 포함한 다양한 웹 응용프로그램에 활용되는 중요한 인터넷 소프트웨어 기술이다. 인터넷의 급격한 성장에 따라 고성능 웹크롤러의 구현이 시급히 요구되고 있다. 이를 위해서는 웹크롤러에 대한 성능확장성에 초점을 둔 연구가 수행되어야 한다. 본 논문에서는 병렬 프로세스 기반 웹크롤러(Crawler)의 성능향상에 필수적인 동적 스케줄링의 구현 기법을 제안한다. 웹크롤러는 웹문서의 수집 성능요구를 만족시키기 위하여 일반적으로 다중 프로세스 기반으로 설계되고 있다. 이러한 다중 프로세스 기반의 설계에서 프로세스 별로 문서수집 대상을 적정하게 선택하여 할당하는 크롤 스케줄링(Crawl Scheduling)은 시스템의 성능향상에 매우 중요한 요소이라. 본 논문에서는 먼저 크롤 스케줄링에 있어 중요한 문제점들에 대한 연구 결과를 제시한 후 공유메모리 기반 동적 스케줄링 지원 기법을 고안, 이를 구현하는 웹 크롤러 시스템 구조(Architecture)를 제안한다. 본 논문에서는 동적 스케줄링 지원 기능을 갖는 웹크롤러의 설계 및 구현에 대하여 기술한다.

  • PDF

웹 서버 클러스터에서 Cyber Foraging 응용을 위한 비주기적 부하 갱신을 통한 부하 분산 기법 (Request Distribution for Fairness with a Non-Periodic Load-Update Mechanism for Cyber Foraging Dynamic Applications in Web Server Cluster)

  • ;;최원일;강정훈;옥민환;박명순
    • 정보처리학회논문지A
    • /
    • 제14A권1호
    • /
    • pp.63-72
    • /
    • 2007
  • 본 논문에서 웹 서버 클러스터 환경에서 웹 요청들의 분산을 위한 부하 분산 기법을 제안한다. 전통적인 주기적 부하 정보 갱신 기반의 부하 분산 기법에서는 동기화된 부하 정보와 동적 페이지에 포함된 스크립트들의 갱신 정보 때문에 Cyber Foraging 서비스 같은 동적 웹 응용프로그램에서는 적합하지 않다. 이를 해결하기 위해 Update-on-Finish 부하 분산 알고리즘은 비주기적인 부하 갱신 방법을 사용하고 있다. 웹 스위치는 비주기적인 부하 리포팅 후, 서버들의 실제 부하 정보를 알 수 있다. 그런후 실제 정보에 따라 부하 분산 스케줄을 재배열한다. 하지만 Update-on-Finish 알고리즘의 경우 부하 정보를 유지하기 위한 통신 부하가 크다는 문제점을 가진다. 본 논문에서는 각 서버가 K%의 작업을 마친 후 비주기적 부하 정보 보고를 통하여 부하 감소시킨 방법을 제안한다. 또한 서버의 처리능력이 다른 환경을 고려하여 서로 다른 threshold Ti값을 적용함으로써, 다양한 처리 능력을 가진 서버들을 위한 로드 밸런싱 알고리즘으로 확장하여 제안하고 있다. 시뮬레이션 결과에서 제안된 K-Percent-Finish Reporting 방법은 Update-on-Finish 방법보다 최소 50% 이상의 통신 부하를 감소시키면서, 기존 주기적 부하정보 갱신 기반의 관련 연구들보다 향상된 시스템 처리 능력을 보여주고 있다.

웹 상에서 객체지향 데이터 베이스와 통합 아키텍처 (An Architecture for Integrating OODBs with WWW)

  • Haeng-Kon Kim;Jeun-Geun Kang
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권2호
    • /
    • pp.247-258
    • /
    • 2001
  • 본 논문에서는 단일 웹 또는 웹 페이지간의 동적으로 커스터마이스가 가능한 시각정보를 어떻게 구성할 것인가에 대해 논하며 이 같은 동적 정보를 구성하기 위해 객체지향 데이터 베이스와 웹과의 통합 아키텍처를 제시한다. 웹 상에서 사용자 또는 시간에 따라 상이한 웹 뷰를 가진다. 본 논문에서는 다양한 구조적 변수와 구현 쟁점에 대해 논한다. 제시한 아키텍처는 소프트웨어 개발 환경과 IO-웹 시스템 등의 다양한 응용 영역에 매우 높은 융통성을 제공한다.

  • PDF

Clipping 기반의 무선 인터넷 사이트 구축용 변환 서버 구현 (Implementation of A Clipping-based Conversion Server for Building Wireless Internet Sites)

  • 조승호;차정훈
    • 정보처리학회논문지A
    • /
    • 제11A권2호
    • /
    • pp.165-174
    • /
    • 2004
  • 현재 유선 인터넷 컨텐츠와 비교할 때 무선 인터넷 컨텐츠가 크게 부족하여 유선 컨텐츠들을 무선 인터넷 컨텐츠로 변환시키고자 하는 요구가 높다. 본 연구의 변환 서버는 사용자 단말기로부터 요청을 자동적으로 인식하여 대상 URL 서버상의 원본 문서를 검색하여 이들을 중간 언어인 metaXML 문서로 생성하고 이를 사용자 단말기에 적합한 무선 마크업 언어 문서로 변환 출판한다. 또한, 본 변환 서버는 이미지 변환을 위하여 이미지 변환기와 기존 웹 페이지들의 재구성 저작 도구인 Clipper와 연동하여 동작한다. 대상 URL의 정적/동적 웹 페이지를 처리하는 변환 서버의 처리 능력에 대하여 성능 실험을 수행하였으며, 동적 문서에 대한 변환 실험 결과에 따르면, 변환 서버내 스레드 풀의 스레드 개수를 5개로 유지할 때 변환 서버가 가장 나은 처리량을 나타내었다.