• Title/Summary/Keyword: 그래프 데이터

Search Result 924, Processing Time 0.081 seconds

Batch mode Active learning in graph-based semi-supervised learning (그래프 기반 반감독 학습에서 배치모드 능동적 학습)

  • Park, Cheong-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.495-497
    • /
    • 2012
  • 클래스라벨에 대한 정보를 가진 데이터가 매우 적을 때 클래스라벨 정보가 없는 데이터로부터의 정보를 학습에 활용하는 반감독학습(semi-supervised learning) 방법들 중에서 데이터 샘플들 간의 유사도를 나타내는 그래프를 이용하는 방법이 잘 알려져 있다. 본 논문에서는 그래프 기반 반감독 학습에서 배치 모드 능동적 학습을 위한 방법을 제안하고 실제 데이터를 이용한 실험결과를 통해 제안된 방법의 성능을 입증한다.

Developing RDF Meta data Graph for Transportation Open Data Platform (교통데이터 유통을 위한 RDF 메타 데이터 그래프 구축방안)

  • Park, Eun Mi;Kang, Jung Hyun
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.20 no.6
    • /
    • pp.110-116
    • /
    • 2021
  • W3C enacted RDF(Resource Description Framework based DCAT meta data standard, which is world-widely accepted so far. To guarantee the inter-operability and integrity of data from various sources and even from various countries, it is considered that transportation meta data should also follow the DCAT standard. But still, to represent the transportation domain-specific features, it is necessary to define new properties and vocabularies in addition to the DCAT standard. This research identified the additional properties and vocabularies for transportation metadata, considering uniqueness of transportation data. The revised RDF schema and RDF graph proposed in this research should be able to lead the transportation open data platform revitalization.

Level-2 Fuzzy Graph (레벨-2 퍼지 그래프)

  • 이승수;이광형
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2001.05a
    • /
    • pp.52-55
    • /
    • 2001
  • 퍼지 그래프는 그래프에 대한 정점들과 간선들의 소속정도를 표현할 수 있도록 일반 그래프를 확장한 그래프이다. 그러나 기준 퍼지 그래프는 명확한 정점들의 집합 위에서의 관계만을 표시할 수 있다. 본 논문에서는 퍼지 집합간의 관계를 표시할 수 있도록 확장된 레벨-2 퍼지 그래프를 제안한다. 본 논문에서는 레벨-2 퍼지 그래프를 정의하고 레벨-2 퍼지 그래프에서 수정되어야 하는 연산들과 레벨-2 퍼지 그래프의 특성에 대하여 소개한다. 제안된 레벨-2 퍼지 그래프는 퍼지 데이터 비교 및 퍼지 클러스터링 분야에 적용될 수 있다.

  • PDF

In-memory Compression Scheme Based on Incremental Frequent Patterns for Graph Streams (그래프 스트림 처리를 위한 점진적 빈발 패턴 기반 인-메모리 압축 기법)

  • Lee, Hyeon-Byeong;Shin, Bo-Kyoung;Bok, Kyoung-Soo;Yoo, Jae-Soo
    • The Journal of the Korea Contents Association
    • /
    • v.22 no.1
    • /
    • pp.35-46
    • /
    • 2022
  • Recently, with the development of network technologies, as IoT and social network service applications have been actively used, a lot of graph stream data is being generated. In this paper, we propose a graph compression scheme that considers the stream graph environment by applying graph mining to the existing compression technique, which has been focused on compression rate and runtime. In this paper, we proposed Incremental frequent pattern based compression technique for graph streams. Since the proposed scheme keeps only the latest reference patterns, it increases the storage utilization and improves the query processing time. In order to show the superiority of the proposed scheme, various performance evaluations are performed in terms of compression rate and processing time compared to the existing method. The proposed scheme is faster than existing similar scheme when the number of duplicated data is large.

Indexing Mechanism for Efficient Semantic Query Processing (효율적인 시멘틱 질의 처리를 위한 인덱싱 기법)

  • Kim Hak-Soo;Cha Hyun-Seok;Son Jin-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.97-100
    • /
    • 2006
  • RDF 는 트리플의 집합으로서 그래프 데이터 모델로 표현되며, 사용자는 RDF 그래프 모델로부터 정보를 검색하기 위해 시멘틱 질의 언어를 사용한다. 그러나 이러한 접근 방식은 최악의 경우 전체 그래프 데이터 모델을 검색해야 되는 문제점이 발생한다. 이에 따라 최근의 연구에서는 시멘틱 질의를 효율적으로 처리하기 위해서 인덱스를 사용한다. 시멘틱 질의 언어(RDQL, SPARQL)의 핵심은 RDF 트리플에 대한 패턴을 기술함으로써 원하는 트리플 정보를 검색할 수 있게 하는 것이다. 따라서, 기존의 인덱스는 단일 트리플을 효율적으로 검색하는 데 초점을 둔다. 거라나 트리플 패턴의 집합으로 질의가 표현될 경우에는 트리플 패턴 사이의 상관관계 때문에 조인비용이 많이 발생하는 문제점이 있다. 본 논문에서는 조인 비용이 발생되는 문제점을 해결하기 위한 인덱싱 기법을 제안한다. RDF 그래프 모델에서 유지해야 할 정보를 줄이기 위해서 RDF 그래프 모델에 존재하는 유사한 서브 그래프를 하나의 서브 그래프로 병합한다. 병합절차를 마친 여러 서브 그래프에 존재하는 모든 경로를 인덱스에 유지 함으로써 조인 비용을 제거한다.

  • PDF

Discovery of Frequent Traversal Patterns on Weighted Graph with Priority (중요도를 고려한 가중치 그래프에서의 빈발 순회패턴 탐사)

  • Lee Seong-Dae;Park Hyu-Chan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.169-171
    • /
    • 2005
  • 그래프를 사용하는 데이터 표현법은 직$\cdot$간접적으로 실세계를 표현하는 다양한 데이터 모델 중에서 가장 일반화된 방법으로 알려져 있다. 기본적으로 그래프는 정점과 간선으로 구성되며, 정점과 간선은 그 중요도나 운영 목적에 따라 다양한 가중치가 부여될 수 있다. 특히, 이러한 그래프를 순회하는 트랜잭션들로부터 중요한 순회패턴을 탐사하는 것은 흥미로운 일이다. 본 논문에서는, 정점과 간선에 가중치가 있고 방향성을 가진 기반 그래프가 주어졌을 때, 그 그래프를 순회하는 트랜잭션들로부터 가중치를 고려하여 빈발 순회패턴을 탐사하는 방법을 제안한다. 또한, 이렇게 탐사한 결과에 가중치를 고려한 중요도를 평가하여 빈발 순회패턴들 간의 우선순위를 결정할 수 있도록 한다. 이 과정에서 발생할 수 있는 트랜잭션 노이즈는 기반 그래프의 간선 가중치의 평균과 표준편차를 이용하여 제거함으로써 보다 신뢰성 있는 빈발 순회패턴을 탐사할 수 있다. 제안한 논문은 웹 로그 마이닝 등 그래프를 이용하는 다양한 응용 분야에 적용할 수 있을 것이다.

  • PDF

Extended Multilevel Graph Partitioning Scheme for I/O Efficiency (I/O 효율성을 위해 확장된 Multilevel 그래프 분할 기법)

  • ;R.S. Ramakrishna
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.875-877
    • /
    • 2003
  • 그래프 분할문제에서 대량의 그래프 데이터를 처리하는 것은 계산에서 걸리는 시간보다 파일 입출력을 수행하는 데 걸리는 시간의 비중이 크다. 본 논문은 수행 속도와 분할 성능에 있어서 우수한 그래프 분할 알고리즘 중 하나인 Multilevel Graph Partitioning에 대해 입출력 효율을 높일 수 있도록 확장하는 기법을 제안하고 그 구현에 대해 기술한다. 그래프를 컴퓨터의 가용 메모리를 기준으로 서브 그래프로 나누어 메모리 참조의 지역성이 향상되도록 기존의 Multilevel Graph Partitioning을 확장 하였다. 기존의 방식과 제안된 방식을 테스트 그래프들에 적용하여 그 수행시간을 비교한 결과 그래프 데이터의 크기가 컴퓨터의 주 메모리의 용량에 비해 어느 수준 이상으로 커지면서 제안된 알고리즘이 기존의 방식보다 수행시간에 있어서 좋은 결과를 보인다.

  • PDF

An Efficient Technique using Graph Topology Information for Finding Graph Median (그래프 구조 정보를 이용한 효율적인 그래프 메디안 탐색 기법)

  • Park, Kisung;Yun, Youngsun;Kim, Taeyeon;Lee, Young-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1193-1195
    • /
    • 2013
  • 최근 정보 기술의 발달로 XML, 화학 복합물, 소셜 네트워크 등과 같은 구조적 정보를 갖는 빅 데이터들이 대량으로 축적되고 있다. 이러한 구조적 정보를 갖는 그래프 데이터에서 메디안을 찾기 위한 연구가 진행되고 있다. 기존에는 그래프 메디안을 효율적으로 계산하기 위해 하한값을 이용한 그래프 메디안 탐색 기법이 제안되었다. 그러나 탐색을 시작하는 버텍스를 선정하는 데에 따라 가지치기 효과가 다르게 발생하는 문제점이 있다. 본 논문에서는 버텍스의 그래프 구조 정보를 이용한 효율적인 메디안 탐색 기법을 제안한다. 제안하는 탐색 기법은 버텍스의 차수와 에지 가중치를 이용하여 그래프 메디안 예측 값을 정의하고, 그래프 메디안과 유사한 버텍스들부터 우선적으로 탐색한다. 실험을 통하여 제안하는 기법이 기존의 방법보다 최대 10%까지 수행시간을 단축함을 보인다.

The State of the Art in Visualizing Large Graph Data (대용량 그래프 데이터를 효율적으로 시각화하는 방법에 대한 최신 연구 조사)

  • Kwak, Useok;Na, In-Ju;Kim, Hyeonji;Lee, Kyeong-Jun;Seo, In;Han, Wook-Shin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.802-803
    • /
    • 2017
  • 소셜 네트워크, 웹 시멘틱, 협력 네트워크 등과 같이 다양한 응용에서 대용량 그래프 데이터를 이용한다. 최근 이러한 데이터를 분석하기 위해 대용량 그래프 데이터를 효율적으로 시각화 하는 연구가 제안되었다. 이에 본 연구에서는 대용량 그래프 데이터를 효율적으로 시각화 하는 방법에 대한 최신 연구 동향을 조사한다.

Analysis and Visualization for Protein-Protein Interaction Using LEDA (LEDA를 이용한 단백질 상호작용의 분석과 가시화)

  • 윤지현;조환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.286-288
    • /
    • 2004
  • PPI(Protein-Protein Interaction) 데이터는 생물체 내에서 서로 상호작용하는 단백질(protein)들에 대한 정보이다. 단백질 상호작용은 실제 생체 내에서 어떠한 작용이 일어나게 하는 원인이므로, 많은 생물학자들이 관심을 가지고 연구하고 있으며, 그 결과로 몇몇 데이터베이스가 만들어졌다. 이런 데이터베이스들은 다른 연구자들을 위해 데이터를 공개하고 있지만, 대부분의 데이터베이스가 탭으로 분리된 텍스트 형태로 제공한다. 하지만, 텍스트 형태의 데이터는 사람이 직관적으로 인지할 수 없기 때문에, PPI 데이터를 분석하기 쉬운 그래프 형태로 보여주는 프로그램이 필요하다. 그리고 아직 기능을 모르는 단백질이 많으므로 이를 예측하는 프로그램도 필요하다 본 논문에서는 LEDA를 이용하여 PPI 데이터를 그래프 형태로 표현하며, 이 그래프에 그래프 이론을 적용하여 단백질의 기능을 예측하는 프로그램인 Proteinca에 대해 서술한다.

  • PDF