• 제목/요약/키워드: 그래프 데이터

검색결과 934건 처리시간 0.03초

인메모리 기반 병렬 컴퓨팅 그래프 구조를 이용한 대용량 RDFS 추론 (Scalable RDFS Reasoning Using the Graph Structure of In-Memory based Parallel Computing)

  • 전명중;소치승;바트셀렘;김강필;김진;홍진영;박영택
    • 정보과학회 논문지
    • /
    • 제42권8호
    • /
    • pp.998-1009
    • /
    • 2015
  • 근래에 들어 풍부한 지식베이스를 구축하기 위한 대용량 RDFS 추론에 대한 관심이 높아지면서 기존의 단일 머신으로는 대용량 데이터의 추론 성능을 향상시키기에 한계가 있다. 그래서 분산 환경에서 의 RDFS 추론 엔진 개발이 활발히 연구되고 있다. 하지만 기존의 분산 환경 엔진은 실시간 처리가 불가능 하며 구현이 어렵고 반복 작업에 취약하다. 본 논문에서는 이러한 문제를 극복하기 위해 병렬 그래프 구조 를 사용한 인-메모리 분산 추론 엔진 구축 방법을 제안한다. 트리플 형태의 온톨로지는 기본적으로 그래프 구조를 가지고 있으므로 그래프 구조 기반의 추론 엔진을 설계하는 것이 직관적이다. 또한 그래프 구조를 활용하는 오퍼레이터를 활용하여 RDFS 추론 규칙을 구현함으로써 기존의 데이터 관점과 달리 그래프 구조의 관점에서 설계할 수 있다. 본 논문에서 제안한 추론 엔진을 평가하기 위해 LUBM1000(1억 3천 3백만 트리플, 17.9GB), LUBM3000(4억 1천 3백만 트리플, 54.3GB)에 대해 추론 속도를 실험을 하였으며 실 험결과, 비-인메모리 분산 추론 엔진보다 약 10배 정도 빠른 추론 성능을 보였다.

자바 서블릿에서의 XML을 이용한 분산 데이터베이스 성능정보 표현 방법 (A Process to Display Distributed Database Performance Information Using XML in Java Servlets)

  • 김정출;김용성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.70-72
    • /
    • 2003
  • 응용프로그램사이에 데이터의 이동을 위한 형식으로 XML이 사용되고 있다. XSL 또한 웹 브라우저에서 XML 데이터를 보여주고, 응용프로그램에서 데이터를 제거하거나 추가하기 위한 표준이 되었다. 본 논문에서는 분산 서버의 관계형 데이터베이스의 성능정보를 보이기 위해 DTD를 생성하고, 데이터를 XML형식으로 변환하여, 차트나 그래프로 XSL을 이용하여 보여주는 방법을 제안한다.

  • PDF

데이터 클러스터링에서 클러스터 수 결정방안 (A Method for Determining the Number of Clusters in Data Clustering)

  • 이병수;홍지원;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1268-1269
    • /
    • 2011
  • 데이터마이닝 분야에서는 주어진 공간상에 분포되어있는 데이터들을 분석위해 다양한 클러스터링 알고리즘이 존재한다. 그러나 대부분의 클러스터링 알고리즘에서는 클러스터 전체 개수를 미리 요구한다. 이 때문에 클러스터링 알고리즘에서 클러스터 전체개수를 미리 알아내는 것은 매우 중요하다. 본 논문에서는 데이터에 분포하는 클러스터들의 개수를 데이터의 그래프 모델을 이용한 분석으로 찾아내는 방법을 제안한다.

효율적인 Regular path Query 처리에 관한 연구 조사 (A Study for Efficient Regular Path Query Evaluation)

  • 이태성;백은진;황준승;김경민;한욱신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.785-786
    • /
    • 2017
  • 본 연구는 regular path query를 효율적으로 처리하는 디스크 기반 시스템을 만들기 위해서는 그래프 데이터를 효율적으로 저장하여야하며, regular path query 수행 시 발생하는 cost가 작도로 하는 evaluation algorithm이 필요하다. 이에 본 연구에서는 그래프데이터 저장 방법을 제안하고, regular path query 수행시 발생하는 cost 및 오버헤드를 분석한다.

진적 지배자연결그래프에 관한 알고리즘 (An Algorithms on Incremental Dominator-Join Graph)

  • 심손권;유희종;신현덕;이대식;장재춘;안희학
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.313-316
    • /
    • 2003
  • 객체지향 프로그래밍 방식으로 인해 프로그램의 재사용성이 증대되었다. 객체들을 재사용함으로서 프로그램을 수정 갱신하는 일이 더욱 많아져 점진적 데이터 흐름 분석 기법은 코드 최적화의 성능을 향상하는 중요한 방안이 되었다. 이에 본 논문에서는 데이터 흐름 분석을 위한 지배자연결그래프를 점진적으로 구성하는 알고리즘을 제안하고 이의 타당성과 성능을 실험을 통하여 제시하였다.

  • PDF

텍스트 문서 분류를 위한 베이지안망 학습 (Learning Bayesian Networks for Text Documents Classification)

  • 황규백;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.262-264
    • /
    • 2000
  • 텍스트 문서 분류는 텍스트 형태로 주어진 문서를 종류별로 구분하는 작업으로 웹페이지 검색, 뉴스 그룹 검색, 메일 필터링 등이 분야에 응용될 수 있는 기반 작업이다. 지금까지 문서를 분류하는데는 k-NN, 신경망 등 여러 가지 기계학습 기법이 이용되어 왔다. 이 논문에서는 베이지안망을 이용해서 텍스트 문서 분류를 행한다. 베이지안망은 다수의 변수들간의 확률적 관계를 표현하는 그래프 모델로 DAG 형태인 망 구조와 각 노드에 연관된 지역확률분포로 구성된다. 그래프 모델을 사용할 경우 학습에 이용되는 각 속성들간의 관계를 사람이 알아보기 쉬운 형태로 학습할 수 있다는 장점이 있다. 실험 데이터로는 Reuters-21578 문서분류데이터를 이용했으며 베이안망의 성능은 나이브 베이즈 분류기와 비슷했다.

  • PDF

공간근접성 그래프를 이용한 GIS 융합 (GIS Conflation using Spatial Proximity Graph)

  • 김정옥;김지영;유기윤
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2009년도 춘계학술발표회 논문집
    • /
    • pp.3-5
    • /
    • 2009
  • 이종의 데이터 간의 불일치 때문에 매칭작업은 간단하지 않다. 이에 본 연구에서는 새로운 서로 다른 GIS 데이터의 객체 매칭 방법을 제안한다. 공간근접성 그래프를 이용하는 방법론은 해당 객체의 지리적 위치관계 정보를 바탕으로 객체 매칭을 수행한다.

  • PDF

경로 정보를 이용한 RDF와 RDF 스키마의 저장 구조 설계 (The Design of Storage Structure for Path Expressions in RDF and RDF Schema)

  • 김연희;김병곤;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.217-219
    • /
    • 2005
  • 정보의 단순한 연결을 표현하는 현재 웹 환경의 한계를 보완하기 위해 차세대 웹으로서 평가되고 있는 시맨틱 웹에서는 정보 리소스의 의미와 개념적 관계를 정의하는 메타데이터와 온톨로지의 역할이 무엇보다 중요시되고 있다. 따라서 RDF와 RDF 스키마와 같은 표준 언어로써 표현되는 메타데이터와 온톨로지의 효과적인 저장과 검색의 방법이 필요하다. RDF와 RDF 스키마는 그래프 모델로서 표현이 가능하고 다양한 질의의 형태가 그래프 형태에서 추출 가능한 경로 형식으로 표현들 수 있기 때문에 보다 효율적인 질의 처리를 위해서는 경로 정보의 저장에 대한 연구가 필요하다. 따라서 본 논문에서는 관계형 데이터베이스를 기반으로 RDF와 RDF 스키마의 기본적인 정보와 특정 클래스, 프로퍼티, 리소스로 시작하는 경로 정보를 함께 저장할 수 있는 저장 구조를 제안한다.

  • PDF

그래프 데이터 기반의 지반 탐사 시스템 (A Ground Discovery System based on Graph Data)

  • 송재오;권진관;최도진;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.499-500
    • /
    • 2018
  • 최근 지반이 가라앉아 지면에 구멍이 발생하는 싱크홀(Sink Hole)의 발생이 빈번하게 발생하고 있으며, 이에 대한 피해사례도 증가하고 있다. 이를 예방하고 대응하기 위하여 국가적으로 대대적인 지반조사를 하고 있으며 해당 지반을 탐사하기 위하여 지표투과레이더와 내시경 등을 활용한 방법을 사용하고 있다. 본 논문에서는 현재까지 가장 효율적인 방법으로 알려진 지표투과레이더의 데이터를 그래프 형태로 표현하고 분석하여 효과적으로 탐사를 할 수 있는 시스템을 제안한다.

  • PDF

개인화된 소셜 서비스를 위한 시공간 그래프 모델링 기법 (A Method for Spatio-temporal Graph Modeling for Personalized Social Service)

  • 홍지혜;박기성;김진승;이영구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.22-24
    • /
    • 2012
  • 소셜 애플리케이션은 GPS 센서가 내장된 스마트폰의 보급과 더불어 위치 기반 서비스와 융합된 형태로 발전하고 있다. 기존의 위치기반 서비스는 물류관제, 교통관제, 주문배달 등의 실시간 서비스 제공에 초점을 맞추었기 때문에, 소셜 애플리케이션에서 제공하는 취미, 선호도 기반의 추천 서비스 등의 개인화 서비스 제공에 적합하지 않다. 본 연구에서는 개인화된 소셜 애플리케이션에 적용 가능한 시공간 데이터의 그래프 모델링 기법을 제안한다. 실험을 통해 제안하는 시공간 데이터 모델링 기법의 유용성을 보인다.