• Title/Summary/Keyword: 웹분류

Search Result 894, Processing Time 0.025 seconds

An Ontology-based Recommendation Agent for Personalized Web Navigation (개인화 된 웹 네비게이션을 위한 온톨로지 기반 추천 에이전트)

  • 정현섭;양재영;최중민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.58-60
    • /
    • 2001
  • 본 논문에서는 온톨로지를 이용하여 웹 문서의 분류와 사용자의 정보 요구에 대한 개인화 된 정보를 제공하는 에이전트를 제안한다. 에이전트는 웹 문서들이 가지는 의미 구조를 표현한 개념 계층 즉, 온톨로지를 바탕으로 웹 문서를 분류하게 되며 온톨로지를 이용하여 사용자의 정보 요구를 정확히 파악하고 사용자의 브라우징을 돕게 된다. 온톨로지는 개념에 대한 특징 개념간의 관계 그리고 문서 분류를 위한 제약조건으로 이루어진다. 사용자의 현 위치에서의 선행 탐색을 통하여 문서를 획득하게 되며 구축된 온톨로지를 이용하여 분류한다. 에이전트는 분류된 문서에 대한 사용자의 관심분야를 파악하여 프로파일을 유지하게 되며 최종 문서의 추천은 프로파일을 바탕으로 이루어지게 된다.

  • PDF

Classification of navigation model ing for Web Application with Extended UMI (확장형 UML을 이용한 웹 애플리케이션 모델링을 위한 항해의 분류)

  • 박영주;이기열;이병정;김희천;우치수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.397-399
    • /
    • 2004
  • 웹 애플리케이션의 영역이 확장되고, 기능 역시 단순한 정보의 제공에 머무르지 않고 다양한 형태의 다이나믹한 애플리케이션을 통한 사용자와의 상호작용을 통한 새로운 기능들이 추가되고 있다. 정정 커지고 복잡해지는 렐 애플리케이션에 있어서 사용자가 자신의 목적을 위해 효과적으로 움직일 수 있는 경로인 항해 구조에 대한 관심이 커지고 있다. 그러나 이제까지의 연구들은 웹 애플리케이션의 전체적인 틀에서의 항해 모델에 대한 연구들 일 분 각 항해단계의 성격에 대한 정의와 분류는 미흡한 실정이다. 따라서 본 논문에서는 각각의 항해 단계들을 정의. 분류하고, 각 항해들의 표기법을 제시한다 이러한 항해 단계의 분류를 웹 애플리케이션의 성격에 따라 적절히 이용하여 다양한 형태의 효과적인 항해 모델을 생성, 표현할 수 있다. 마지막으로 본 논문에서의 분류를 바탕으로 간단한 모델링의 예를 보인다.

  • PDF

A Hyperlink-based Feature Weighting Technique for Web Document Classification (웹문서 자동 분류를 위한 하이퍼링크 기반 특징 가중치 부여 기법)

  • Lee, A-Ram;Kim, Han-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.417-420
    • /
    • 2012
  • 기계학습을 이용하는 문서 자동분류 시스템은 분류모델의 구성을 위해서 단어를 특징으로 사용한다. 자동분류 시스템의 성능을 높이기 위해 보다 의미있는 특징을 선택하여 분류모델을 구성하기 위한 여러 연구가 진행되고 있다. 특히 인터넷상에서 사용되는 웹문서는 단어 외에도 태그정보, 링크정보를 가지고 있다. 본 논문에서는 이 두 가지 정보를 이용하여 웹문서 자동분류 시스템의 성능을 향상 시키는 방법 제안 한다. 태그 정보와 링크 정보를 이용하여 적절한 특징을 선택하고, 각 특징의 중요도를 계산하여 가중치를 구한다. 계산된 가중치를 각 특징에 부여하여 분류 모델을 구성하고 나이브 베이지안 분류기를 통하여 성능을 평가하였다

Harmful Traffic Detection by Web Traffic Analysis (웹 트래픽 분석을 통한 유해 트래픽 탐지)

  • Shin, Hyun-Jun;Choi, Il-Jun;Chu, Byoung-Gyun;Oh, Chang-Suk
    • Journal of the Korea Society of Computer and Information
    • /
    • v.12 no.2 s.46
    • /
    • pp.221-229
    • /
    • 2007
  • Security of the port TCP/80 has been demanded by reason that the others besides web services have been rapidly increasing use of the port. Existing traffic analysis approaches can't distinguish web services traffic from application services when traffic passes though the port. monitoring method based on protocol and port analysis were weak in analyzing harmful traffic using the web port on account of being unable to distinguish payload. In this paper, we propose a method of detecting harmful traffic by web traffic analysis. To begin, traffic Capture by real time and classify by web traffic. Classed web traffic sorts each application service details and apply weight and detect harmful traffic. Finally, method propose and implement through coding. Therefore have a purpose of these paper to classify existing traffic analysis approaches was difficult web traffic classified normal traffic and harmful traffic and improved performance.

  • PDF

A Study on Subject Classification of Web-based Academic Information Resources (웹 학술정보자원의 주제분류에 관한 연구)

  • 임윤정;박경미
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2002.08a
    • /
    • pp.37-41
    • /
    • 2002
  • 최근 정보처리 기술의 발달과 인터넷의 확산으로 웹 학술 정보원의 양은 방대히 증가하였지만, 이용자들이 원하는 정보를 정확하게 찾는 것이 매우 어려워졌다. 이를 해결하기 위해서는 웹 상에서 생산되는 정보를 효과적으로 조직화하고 체계화하는 작업이 필요하다. 이에 본 논문에서는 문헌정보학 분야의 웹 학술정보자원을 선별하여 제공하는 IFL을 통해 웹 학술정보원의 주제분류체계를 제시해보았다.

  • PDF

Feature Selection and Extraction for Document Classifier for If documents based on SVM (SVM기반 정보기술 문서분류를 위한 특성 선택 및 추출 기법)

  • 강윤희
    • Proceedings of the KAIS Fall Conference
    • /
    • 2001.11a
    • /
    • pp.75-78
    • /
    • 2001
  • 본 논문에서는 웹 문서의 자동 분류를 위한 특성 선택 및 추출기법을 기술한다. 최근 인터넷의 급속한 성장과 보급으로 전자우편과 웹을 통해 제공되어지는 정보의 양이 기하급수적으로 증가함에 따라 효율적인 문서 분류의 필요성이 증가하고 있다. 본 논문에서는 웹 디렉토리 내의 문서로부터 추출된 용어 집합을 기반으로 SVM을 사용하여 학습한 후 문서 분류를 수행한다. 본 실험의 문서는 정보통신 분야 디렉토리 서비스 시스템인 itfind로부터 수집된 문서를 대상으로 하였으며 3가지 시나리오에 따라 실험을 수행하여 각 시나리오 별로 재현율/정확율 및 오분류율을 성능 요소로 계산하였다. 본 실험은 학습 벡터 구성과정에서 잡음에 의해 다른 클래스의 문서 분류에 미치는 영향을 평가하여 SVM을 기반으로 한 문서 분류 기법이 강건함을 보였다.

사용자 의도 정보를 사용한 웹문서 분류

  • Jang, Yeong-Cheol
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2008.10b
    • /
    • pp.292-297
    • /
    • 2008
  • 복잡한 시맨틱을 포함한 웹 문서를 정확히 범주화하고 이 과정을 자동화하기 위해서는 인간의 지식체계를 수용할 수 있는 표준화, 지능화, 자동화된 문서표현 및 분류기술이 필요하다. 이를 위해 키워드 빈도수, 문서내 키워드들의 관련성, 시소러스의 활용, 확률기법 적용 등에 사용자의도(intention) 정보를 활용한 범주화와 조정 프로세스를 도입하였다. 웹 문서 분류과정에서 시소러스 등을 사용하는 지식베이스 문서분류와 비 감독 학습을 하는 사전 지식체계(a priori)가 없는 유사성 문서분류 방법에 의도정보를 사용할 수 있도록 기반체계를 설계하였고 다시 이 두 방법의 차이는 Hybrid조정프로세스에서 조정하였다. 본 연구에서 설계된 HDCI(Hybrid Document Classification with Intention) 모델은 위의 웹 문서 분류과정과 이를 제어 및 보조하는 사용자 의도 분석과정으로 구성되어 있다. 의도분석과정에 키워드와 함께 제공된 사용자 의도는 도메인 지식(domain Knowledge)을 이용하여 의도간 계층트리(intention hierarchy tree)를 구성하고 이는 문서 분류시 제약(constraint) 또는 가이드의 역할로 사용자 의도 프로파일(profile) 또는 문서 특성 대표 키워드를 추출하게 된다. HDCI는 문서간 유사성에 근거한 상향식(bottom-up)의 확률적인 접근에서 통제 및 안내의 역할을 수행하고 지식베이스(시소러스) 접근 방식에서 다양성에 한계가 있는 키워들 간 관계설정의 정확도를 높인다.

  • PDF

Website Classification based on Occurrence Frequency of Medical Terms and Hyperlinks in Webpage (웹페이지의 의학용어 출현 빈도와 하이퍼링크에 기반한 웹사이트 분류)

  • Lee, In Keun;Kim, Hwa Sun;Cho, Hune
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.23 no.2
    • /
    • pp.126-132
    • /
    • 2013
  • This study proposed a method to classify internet websites based on occurrence frequency of medical terms in the webpages and website structure composed with webpages and hyperlinks. The classification was done by using the suitability measure defined by three factors: (1)occurrence frequency of medical terms in the whole terms involved in a webpage, (2)occurrence frequency of medical terms in de-duplicated terms involved in the webpage, and (3)the number of hyperlinks to reach to a specific webpage from homepage. We conducted an experiment to verify the proposed method with the 80 websites registered in directories related to medical field and 127 websites in nonmedical field directories, and the experiment result showed 82.5 % of accuracy of the classification.

A Study on the Classification Schemes of the Type of Scientific Resources on the Web for the Effective Retrieval (웹 학술정보자원의 효율적인 검색을 위한 자료유형 분류체계에 관한 연구)

  • 김소형;안혜연
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2002.08a
    • /
    • pp.27-33
    • /
    • 2002
  • 본 연구의 목적은 웹 상의 다양한 학술정보자원들을 자료유형별로 효율적인 검색이 가능하도록 다양한 형태의 웹 학술정보자원에 대한 자료유형 분류체계 방안을 제시하는데 있다. 본 연구에서는 DCMI(DublinCore Metadata Initiative)를 비롯한 국내외 주요 기관이 연구·개발한 7개의 자료유형 요소 셋을 조사·분석하여, 이를 의미적으로 매핑시키고 그 결과를 참조하여 웹 학술정보자원의 특성에 맞게 10개의 범주 내에 37개의 자료유형 요소를 도출하였다. 본 연구에서 제시하는 자료유형 분류체계는 웹 학술정보자원에 공통적으로 포함되는 요소이므로 각 학문주제별로 적용시킬 경우에는 자료유형 요소의 추가 및 변경을 요구할 수도 있다.

  • PDF

Empirical Research on Search model of Web Service Repository (웹서비스 저장소의 검색기법에 관한 실증적 연구)

  • Hwang, You-Sub
    • Journal of Intelligence and Information Systems
    • /
    • v.16 no.4
    • /
    • pp.173-193
    • /
    • 2010
  • The World Wide Web is transitioning from being a mere collection of documents that contain useful information toward providing a collection of services that perform useful tasks. The emerging Web service technology has been envisioned as the next technological wave and is expected to play an important role in this recent transformation of the Web. By providing interoperable interface standards for application-to-application communication, Web services can be combined with component-based software development to promote application interaction and integration within and across enterprises. To make Web services for service-oriented computing operational, it is important that Web services repositories not only be well-structured but also provide efficient tools for an environment supporting reusable software components for both service providers and consumers. As the potential of Web services for service-oriented computing is becoming widely recognized, the demand for an integrated framework that facilitates service discovery and publishing is concomitantly growing. In our research, we propose a framework that facilitates Web service discovery and publishing by combining clustering techniques and leveraging the semantics of the XML-based service specification in WSDL files. We believe that this is one of the first attempts at applying unsupervised artificial neural network-based machine-learning techniques in the Web service domain. We have developed a Web service discovery tool based on the proposed approach using an unsupervised artificial neural network and empirically evaluated the proposed approach and tool using real Web service descriptions drawn from operational Web services repositories. We believe that both service providers and consumers in a service-oriented computing environment can benefit from our Web service discovery approach.