• 제목/요약/키워드: 웹 그래프

검색결과 236건 처리시간 0.027초

최신 분산 그래프 처리 시스템에서의 PageRank/BFS 질의 처리 성능 평가 (Experimental Evaluation of PageRank/BFS Queries on Distributed Graph Processing Systems)

  • 이경준;김현지;이유경;이준영;김강수;한욱신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.826-828
    • /
    • 2017
  • 그래프는 객체와 객체 간의 관계를 표현하는 데에 있어 효과적인 데이터 표현 방법이다. 그래프 데이터는 웹 그래프, 사회 관계망 서비스, 신약 개발, 생명정보학 등의 다양한 분야에서 활용되고 있으며, 그래프 마이닝 응용에서 활용되기 위한 효율적인 처리 기술을 필요로 한다. 최근까지 그래프 데이터의 처리 및 분석을 위한 많은 시스템들이 개발되었다. 본 논문에서는 최신 분산 그래프 처리 시스템 중에서 대표적인 그래프 분석 질의인 페이지랭크(pagerank)와 너비 우선 탐색(breadth first search)를 수행하고 시스템의 성능을 평가한다.

중요도를 고려한 가중치 그래프에서의 빈발 순회패턴 탐사 (Discovery of Frequent Traversal Patterns on Weighted Graph with Priority)

  • 이성대;박휴찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.169-171
    • /
    • 2005
  • 그래프를 사용하는 데이터 표현법은 직$\cdot$간접적으로 실세계를 표현하는 다양한 데이터 모델 중에서 가장 일반화된 방법으로 알려져 있다. 기본적으로 그래프는 정점과 간선으로 구성되며, 정점과 간선은 그 중요도나 운영 목적에 따라 다양한 가중치가 부여될 수 있다. 특히, 이러한 그래프를 순회하는 트랜잭션들로부터 중요한 순회패턴을 탐사하는 것은 흥미로운 일이다. 본 논문에서는, 정점과 간선에 가중치가 있고 방향성을 가진 기반 그래프가 주어졌을 때, 그 그래프를 순회하는 트랜잭션들로부터 가중치를 고려하여 빈발 순회패턴을 탐사하는 방법을 제안한다. 또한, 이렇게 탐사한 결과에 가중치를 고려한 중요도를 평가하여 빈발 순회패턴들 간의 우선순위를 결정할 수 있도록 한다. 이 과정에서 발생할 수 있는 트랜잭션 노이즈는 기반 그래프의 간선 가중치의 평균과 표준편차를 이용하여 제거함으로써 보다 신뢰성 있는 빈발 순회패턴을 탐사할 수 있다. 제안한 논문은 웹 로그 마이닝 등 그래프를 이용하는 다양한 응용 분야에 적용할 수 있을 것이다.

  • PDF

웹 상에서의 상호연결망 드로잉 시스템의 설계 및 구현 (Design and Implementation of Interconnection Network Drawing System on WWW)

  • 이윤희;홍석희;이상호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.667-669
    • /
    • 1998
  • 그래프 드로잉 시스템이란 주어진 그래프에 대하여 그 그래프가 가진 어떤 특성을 가시화하여 그래픽하게 표현해 주는 소프트웨어 시스템을 말한다. 본 논문에서는 Java를 사용하여 WWW(World Wide Web) 상에서의 상호연결망 그래프의 대칭적 드로잉을 수행하는 그래프 드로잉 시스템을 소개한다. 이 시스템을 Ring, HyperCube, Butterfly와 같은 대표적인 상호연결망 그래프에 대한 기존의 드로잉과 대칭성을 잘 나타내 주는 드로잉을 동시에 보여주며, 또한 HyperCube, HyperTree, Pyramid와 같이 그 모양을 입체적으로 나타낼 수 있는 그래프에 대해서는 원근법을 사용한 3차원 드로잉을 하고 X,Y,Z 축에 따라 이를 회전시켜 그래프에 대한 이해도를 높였다.

RDF/S 데이터의 관리를 위한 그래프 데이터 모델 기반 저장 기법 (Storing Scheme based on Graph Data Model for Managing RDF/S Data)

  • 김연희;최재언;임해철
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권2호
    • /
    • pp.285-293
    • /
    • 2008
  • 차세대 웹으로 인식되고 있는 시맨틱 웹에서는 정보 리소스의 개념과 의미적 관계를 정의하는 메타데이터와 온톨로지의 역할이 무엇보다 중요시되고 있다. 따라서 RDF와 RDF 스키마 같은 시맨틱 웹 언어로 표현되어 있는 시맨틱 데이터의 효과적인 저장 및 검색 기법이 요구된다. 본 논문에서는 RDF와 RDF 스키마를 함께 고려하여 시맨틱 웹 데이터의 질의 유형을 크게 3가지로 분류하였다. 그리고 RDF와 RDF 스키마가 그래프 데이터 모델로 표현이 가능하고 다양한 질의의 형태가 그래프 모델에서 추출 가능한 경로식으로 표현될 수 있다는데 초점을 맞추고 효율적인 질의 처리를 위한 저장 기법을 제안한다. 본 논문에서 제안한 저장 구조는 RDF와 RDF 스키마에 기본적으로 기술되어 있는 클래스, 프로퍼티, 리소스에 대한 정의나 계층 정보는 물론 추출 가능한 모든 경로 정보를 유지할 수 있다. 본 논문에서 제안한 저장 기법을 통해 일반적인 질의 유형은 물론 그래프 모델 상의 복잡한 경로식으로 표현되는 질의 유형에 대해서도 테이블의 조인 횟수를 최소화하면서 특정 클래스나 프로퍼티로부터 시작하는 모든 경로에 대한 질의 처리가 가능한 장점이 있다.

  • PDF

그래프 탐색을 이용한 웹으로부터의 온톨로지 기반 규칙습득 (Rule Acquisition Using Ontology Based on Graph Search)

  • 박상언;이재규;강주영
    • 지능정보연구
    • /
    • 제12권3호
    • /
    • pp.95-110
    • /
    • 2006
  • 지능형 에이전트와 규칙기반 시스템을 이용해 보다 지능적인 웹 환경을 구축하고자 하는 노력이 시맨틱 웹의 발전과 함께 증가하고 있다. 이러한 에이전트와 규칙기반 시스템에 필요한 규칙들을 이미 많은 지식들이 산재해 있는 웹으로부터 습득할 수 있다면 보다 효율적으로 시스템을 구축하는 것이 가능하며, 이러한 응용시스템의 확장은 시맨틱 웹의 발전을 더욱 가속화하는 계기가 될 수 있을 것이다. XRML 방법론은 웹으로부터 규칙을 습득하기 위한 단계적 방법을 제시하고 있으며, 온톨로지를 이용함으로써 규칙의 구성요소들을 자동으로 추출할 수 있도록 지원한다. 그러나 추출된 규칙구성요소들을 조합하여 완전한 규칙을 만드는 과정이 규칙관리자의 수작업에 의존하고 있다. 본 연구는 온톨로지와 그래프 탐색을 사용함으로써 이 과정을 자동화하고자 하는 연구이다. 온톨로지에 있는 규칙의 일반적 패턴을 기반으로 하여 그래프 탐색을 이용해 규칙구성요소들을 조합함으로써 웹 페이지로부터 자동으로 규칙을 추출할 수 있다.

  • PDF

단어 근접도를 반영한 단어 그래프 기반 질의 확장 (Query Expansion based on Word Graph using Term Proximity)

  • 장계훈;조승현;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.754-757
    • /
    • 2010
  • 질의 확장은 초기 검색결과에서 질의와 연관된 단어를 선택하여 질의를 확장함으로써 검색 성능을 향상시키는 기법이다. 페이지 랭크(PageRank) 알고리즘은 웹문서 사이의 링크구조를 이용하여 문서들의 상대적인 중요성을 측정하기 위해 제안되었다. 본 논문에서는 문서들 사이의 관계가 아니라 문서 안에서 단어 그래프(Word Graph)를 통해 단어들 사이의 상대적인 중요성을 계산하였다. 질의와 가까이 위치한 단어들 사이의 관계를 단어 그래프에 적용하여 중요도를 계산하고 확장단어를 선택한다. 본 논문의 유효성을 검증하기 위해 웹문서 집합인 TREC WT10g 에 대해 실험하였고, 적합모델(Relevance Model)보다 MAP(Mean Average Precision)가 4.1% 향상되었다.

인터넷 정보 추출을 이용한 웹문서 구조화 (Web Site Construction Using Internet Information Extraction)

기능적 의미에 기반한 복합 웹 서비스 자동 구성 (Automated Generation of Composite Web Services based on Functional Semantics)

  • 신동훈;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제11권9호
    • /
    • pp.1310-1323
    • /
    • 2008
  • 최근 들어 복합 웹 서비스를 자동으로 구성하기 위한 많은 연구들이 진행되었다. 이들 연구의 대부분은 서비스의 기능을 고려하지 않고 단순히 웹 서비스들의 입력과 출력을 연결하여 복합 웹 서비스를 구성한다. 그러므로 사용자의 의도에 부합하지 않는 복합 웹 서비스를 생성할 수 있다. 또한 가용한 웹 서비스의 모든 조합을 고려하기 때문에 시간 복잡도가 매우 크다. 이러한 문제를 해결하기 위해, 본 논문에서는 웹 서비스의 기능적 의미를 명시적으로 기술하고 이를 기반으로 복합 웹 서비스를 자동으로 구성하는 방법을 제안한다. 제안된 방법은 서비스 간의 입, 출력 의존성 및 기능 정보를 그래프 구조를 사용하여 조직화한다. 그리고 그래프 구조에서 사용자가 요구하는 기능을 제공하는 핵심 서비스와 입, 출력 타입 간의 변환을 지원하는 부가 서비스를 찾아 이들 간의 조합으로 복합 웹 서비스를 구성한다. 제안된 방법은 웹 서비스의 기능을 고려함으로써 구성된 복합 웹 서비스의 의미적 정확성을 높이고, 의미적으로 연관성이 있는 서비스들 간의 조합만을 고려함으로써 시간 복잡도를 줄인다.

  • PDF

데이터베이스를 이용한 도메인 온톨로지의 효율적인 생성 (Efficient Creation of Domain Ontology Using DataBase)

  • 김태석;양진혁;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.485-488
    • /
    • 2005
  • 월드와이드웹(WWW) 기술은 폭발적으로 증가하고 있는 웹 데이터들의 의미적인 정보를 효과적으로 처리하기에는 많은 문제점이 있다. 이러한 문제점을 해결하기 위하여 1999년 말에 제안된 시맨틱 웹은 온톨로지를 기반으로 하고 있다. 그러나 온톨로지 생성에 관한 많은 연구들은 많은 시간과 비용이 소비된다. 이와 같은 문제를 해결하기 위하여 우리는 데이터베이스에서 온톨로지를 생성할 수 있는 방법을 제안한다. 데이터베이스는 도메인을 잘 나타내고 있는 정보의 저장소이므로 데이터베이스로부터의 온톨로지 생성은 분석, 설계 등의 사전 작업이 필요하지 않다. 우리는 데이터베이스에서 스키마를 추출, 뼈대그래프를 생성하고 개념그래프로 확장하여 도메인을 잘 나타낼 수 있는 온톨로지를 생성한다. 끝으로 알고리즘을 통한 생성을 함으로서 제안된 생성방법을 검증한다.

  • PDF

블로그 환경을 위한 포스트 랭킹 알고리즘 (Post Ranking Algorithms in Blog Environment)

  • 황원석;도영주;배덕호;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.189-193
    • /
    • 2008
  • 블로그는 개인의 생각을 온라인상의 문서인 포스트로 남기는 일종의 개인 홈페이지이다. 웹 문서와 포스트는 다른 특징을 가지고 있기 때문에 웹 문서 랭킹 알고리즘을 포스트에 적용하기에는 문제점이 존재한다. 본 논문에서는 포스트의 랭킹을 위한 포스트-블로거 그래프를 정의하고, 기존의 웹 문서 랭킹 알고리즘을 포스트-블로거 그래프에 적합하게 변형한 포스트 랭킹 알고리즘을 제안한다. 그리고 실제 블로그 데이터를 통하여 포스트 랭킹 알고리즘의 성능을 분석하고, 이를 바탕으로 블로그에 적합한 포스트 랭킹 알고리즘을 선별한다.

  • PDF