• Title/Summary/Keyword: 그래프 데이터

Search Result 927, Processing Time 0.028 seconds

A Query Language for Quantitative Analysis on Graph Databases (그래프 데이터베이스의 양적 분석을 위한 질의 언어)

  • Park, Sung-Chan;Lee, Sang-Goo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.77-80
    • /
    • 2011
  • 그래프는 전산학의 주요 주제 중 하나이며 World Wide Web과 Social Network의 중요성이 커지면서 더욱 주목을 받고 있다. 그래프와 관련하여 그래프 데이터베이스에 대한 질의 모델에 관한 연구도 중요하게 다투어져 왔다. 하지만 이들 연구는 패턴 매칭을 통한 질의를 주로 다루었다. 하지만 그래프 데이터를 추천이나 검색 등의 응용하기 위해서는 PageRank 등 그래프 내의 연결 구조를 양으로 분석해내는 작업이 요구된다. 또한 SimRank 및 Random Walk with Restart 등 다양한 양적 분석 측도가 제안되고 있다. 이에 따라 본 연구에서는 Random Walk를 기반으로 하는 그래프에 대한 유연한 양적 분석을 지원하는 질의 언어를 제시한다. 또한 기존의 양적 분석 측도들이 본 질의 모델을 통하여 어떻게 표현되는지를 통하여 본 질의 모델의 유용성 및 확장성을 보인다.

An Efficient Graph Cycle Detection Technique based on Pregel (프리겔 기반의 효율적인 그래프 순환 검출 기법)

  • Kim, Taeyeon;Kim, Hyunwook;Park, Kisung;Lee, Young-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.152-154
    • /
    • 2013
  • 페타 바이트 이상의 규모의 빅 데이터 분석은 다양한 분야에서 연구되고 있다. 최근 소셜 네트워크, XML 등과 같은 구조적인 정보를 갖는 대용량의 그래프들을 분석하는 기술이 활발히 연구되고 있다. 이러한 대용량의 그래프를 분석하기 위한 연산중의 하나로 순환 그래프가 사용되고 있다. 대용량의 그래프 환경에서 순환을 검출하는 연산은 단일 컴퓨팅 시스템에서 처리가 불가능하거나 많은 시간 비용이 발생하여 분산처리가 필요하다. 본 논문에서는 그래프 처리에 효율적인 프리겔 프레임워크를 이용하여 효율적으로 순환을 검출하고, 중복 순환을 제거하기 위해 정규 순환 코드를 제안한다. 실험을 통하여 제안하는 기법이 대용량 그래프에서 효율적으로 순환을 찾을 수 있음을 보인다.

Question Answering over Knowledge Graphs Using Bilinear Graph Neural Network (쌍 선형 그래프 신경망을 이용한 지식 그래프 기반 질문 응답)

  • Lee, Sangui;Kim, Incheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.563-566
    • /
    • 2020
  • 지식 그래프 기반의 질문 응답 문제는 자연어 질문에 대한 이해뿐만 아니라, 기반이 되는 지식 그래프상에서 올바른 답변을 찾기 위한 효과적인 추론 능력을 요구한다. 본 논문에서는 다중 홉 추론을 요구하는 복잡한 자연어 질문에 대해 연관 지식 그래프 위에서 답변 추론을 효과적으로 수행할 수 있는 심층 신경망 모델을 제안한다. 제안 모델에서는 지식 그래프상의 추론 과정에서 추른 경로를 명확히 하기 위한 노드의 양방향 특정 전파와 이웃 노드들 간의 맥락 정보까지 각 노드의 특정값에 반영할 수 있는, 표현력이 풍부한 쌍 선형 그래프 신경망 (BGNN)을 이용한다. 본 논문에서는 오픈 도메인의 지식 베이스 Freebase와 자연어 질문 응답 데이터 집합 WebQuestionsSP를 이용한 실험들을 통해, 제안 모델의 효과와 우수성을 확인하였다.

A XML Instance Repository Model based on the Edge-Labeled Graph (Edge-Labeled 그래프 기반의 XML 인스턴스 저장 모델)

  • Kim Jeong-Hee;Kwak Ho-Young
    • Journal of Internet Computing and Services
    • /
    • v.4 no.6
    • /
    • pp.33-42
    • /
    • 2003
  • A XML Instance repository model based on the Edge-Labeled Graph is suggested for storing the XML instance in Relational Databases, This repository model represents the XML instance as a data graph based on the Edge-Labeled Graph, extracts the defined value based on the structure of data path, element, attribute, and table index table presented as database schema, and stores these values using the Mapper module, In order to support querry, XML repository model offers the module translating XQL which is a query language under XPATH to SQL, and has DBtoXML generator module restoring the stored XML instance. As a result, it is possible to represent the storage relationship between the XML instances and the proposed repository model in terms of Graph-based Path, and it shows the possibility of easy search of specific element and attribute information.

  • PDF

Graph-based modeling for protein function prediction (단백질 기능 예측을 위한 그래프 기반 모델링)

  • Hwang Doosung;Jung Jae-Young
    • The KIPS Transactions:PartB
    • /
    • v.12B no.2 s.98
    • /
    • pp.209-214
    • /
    • 2005
  • The use of protein interaction data is highly reliable for predicting functions to proteins without function in proteomics study. The computational studies on protein function prediction are mostly based on the concept of guilt-by-association and utilize large-scale interaction map from revealed protein-protein interaction data. This study compares graph-based approaches such as neighbor-counting and $\chi^2-statistics$ methods using protein-protein interaction data and proposes an approach that is effective in analyzing large-scale protein interaction data. The proposed approach is also based protein interaction map but sequence similarity and heuristic knowledge to make prediction results more reliable. The test result of the proposed approach is given for KDD Cup 2001 competition data along with those of neighbor-counting and $\chi^2-statistics$ methods.

Proposing the Methods for Accelerating Computational Time of Large-Scale Commute Time Embedding (대용량 컴뮤트 타임 임베딩을 위한 연산 속도 개선 방식 제안)

  • Hahn, Hee-Il
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.52 no.2
    • /
    • pp.162-170
    • /
    • 2015
  • Commute time embedding involves computing the spectral decomposition of the graph Laplacian. It requires the computational burden proportional to $o(n^3)$, not suitable for large scale dataset. Many methods have been proposed to accelerate the computational time, which usually employ the Nystr${\ddot{o}}$m methods to approximate the spectral decomposition of the reduced graph Laplacian. They suffer from the lost of information by dint of sampling process. This paper proposes to reduce the errors by approximating the spectral decomposition of the graph Laplacian using that of the affinity matrix. However, this can not be applied as the data size increases, because it also requires spectral decomposition. Another method called approximate commute time embedding is implemented, which does not require spectral decomposition. The performance of the proposed algorithms is analyzed by computing the commute time on the patch graph.

Better Foreground Segmentation for 3D Face Reconstruction using Graph Cuts (3차원 얼굴 복원을 위한 그래프 컷 기반의 전경 물체 추출 방법)

  • Park, An-Jin;Hong, Kwang-Jin;Jung, Kee-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.459-464
    • /
    • 2007
  • 영상기반의 3자원 복원(reconstruction)에 대한 연구가 컴퓨터 성능의 발전과 다양한 영상기반의 복원 알고리즘의 연구로 인해 최근 좋은 결과를 보이고 있으나, 이는 얼굴영역과 같은 목적이 되는 영역이 각 입력영상으로부터 미리 정확하게 추출되어 있다고 가정하기 때문이다. 일반적으로 목적이 되는 영역을 추출하기 위해 차영상이 많이 이용되고 있지만 차영상은 잡음과 구멍(hole)과 같은 오 추출된 영역이 발생하기 때문에 목적이 되는 영역을 3차원으로 복원을 할 때 심각한 오류를 초래할 수 있다. 전경물체(목적이 되는 영역)을 정확하게 추출하기 위해 최근 그래프 컷(graph cut)을 이용한 방법이 다양하게 시도되고 있다. 그래프 컷은 데이터 항(data term)과 스무드 항(smooth term)으로 구성된 에너지 함수를 전역적으로 최소화하는 방법으로 여러 공학적 문제에서 좋은 결과를 보이고 있지만, 에너지 함수의 데이터 항을 설정할 때 필요한 사전정보를 자동으로 얻기가 어렵다. 스테레오 비전의 깊이 정보가 최근 전경 물체 추출을 위한 사전정보로 많이 이용되고 있고 그들의 실험환경에서는 좋은 결과를 보이지만, 3차원 얼굴 복원에서 얼굴의 대부분이 동질의 영역을 가지고 있기 때문에 깊이 정보를 구하기 어려워 정확한 사전정보를 구하기가 어렵다. 본 논문에서는 3차원 얼굴 복원을 효과적으로 하기 위한 그래프 컷 기반의 전경 물체 추출 방법을 제안한다. 에너지 함수의 데이터 항을 설정하기 위해 전경 물체에 대한 사전정보를 추출해야 하며, 이를 위해 차영상을 이용하여 대략적인 전경 물체 추출하고, 사전정보에 대한 오류를 줄이기 위해 잡음과 그림자 영역을 제거한다. 잡음과 그림자 영역을 제거하면 구멍이 발생하거나 실루엣이 손상되는 문제가 발생한다. 손상된 정보는 근접한 픽셀이 유사하지 않을 때 낮은 비용을 할당하는 에너지 함수의 스무드(smooth) 항에 의해 에지 정보를 기반으로 채워진다. 결론적으로 제안된 방법은 스무드 항과 대략적으로 설정된 데이터 항으로 구성된 에너지 함수를 그래프 컷으로 전역적으로 최소화함으로써 더욱 정확하게 목적이 되는 영역을 추출할 수 있다.

  • PDF

Artificial neural network for classifying with epilepsy MEG data (뇌전증 환자의 MEG 데이터에 대한 분류를 위한 인공신경망 적용 연구)

  • Yujin Han;Junsik Kim;Jaehee Kim
    • The Korean Journal of Applied Statistics
    • /
    • v.37 no.2
    • /
    • pp.139-155
    • /
    • 2024
  • This study performed a multi-classification task to classify mesial temporal lobe epilepsy with left hippocampal sclerosis patients (left mTLE), mesial temporal lobe epilepsy with right hippocampal sclerosis (right mTLE), and healthy controls (HC) using magnetoencephalography (MEG) data. We applied various artificial neural networks and compared the results. As a result of modeling with convolutional neural networks (CNN), recurrent neural networks (RNN), and graph neural networks (GNN), the average k-fold accuracy was excellent in the order of CNN-based model, GNN-based model, and RNN-based model. The wall time was excellent in the order of RNN-based model, GNN-based model, and CNN-based model. The graph neural network, which shows good figures in accuracy, performance, and time, and has excellent scalability of network data, is the most suitable model for brain research in the future.

Learning Distribution Graphs Using a Neuro-Fuzzy Network for Naive Bayesian Classifier (퍼지신경망을 사용한 네이브 베이지안 분류기의 분산 그래프 학습)

  • Tian, Xue-Wei;Lim, Joon S.
    • Journal of Digital Convergence
    • /
    • v.11 no.11
    • /
    • pp.409-414
    • /
    • 2013
  • Naive Bayesian classifiers are a powerful and well-known type of classifiers that can be easily induced from a dataset of sample cases. However, the strong conditional independence assumptions can sometimes lead to weak classification performance. Normally, naive Bayesian classifiers use Gaussian distributions to handle continuous attributes and to represent the likelihood of the features conditioned on the classes. The probability density of attributes, however, is not always well fitted by a Gaussian distribution. Another eminent type of classifier is the neuro-fuzzy classifier, which can learn fuzzy rules and fuzzy sets using supervised learning. Since there are specific structural similarities between a neuro-fuzzy classifier and a naive Bayesian classifier, the purpose of this study is to apply learning distribution graphs constructed by a neuro-fuzzy network to naive Bayesian classifiers. We compare the Gaussian distribution graphs with the fuzzy distribution graphs for the naive Bayesian classifier. We applied these two types of distribution graphs to classify leukemia and colon DNA microarray data sets. The results demonstrate that a naive Bayesian classifier with fuzzy distribution graphs is more reliable than that with Gaussian distribution graphs.

Constructing a Knowledge Graph for Improving Quality and Interlinking Basic Information of Cultural and Artistic Institutions (문화예술기관 기본정보의 품질개선과 연계를 위한 지식그래프 구축)

  • Euntaek Seon;Haklae Kim
    • Journal of the Korean Society for information Management
    • /
    • v.40 no.4
    • /
    • pp.329-349
    • /
    • 2023
  • With the rapid development of information and communication technology, the speed of data production has increased rapidly, and this is represented by the concept of big data. Discussions on quality and reliability are also underway for big data whose data scale has rapidly increased in a short period of time. On the other hand, small data is minimal data of excellent quality and means data necessary for a specific problem situation. In the field of culture and arts, data of various types and topics exist, and research using big data technology is being conducted. However, research on whether basic information about culture and arts institutions is accurately provided and utilized is insufficient. The basic information of an institution can be an essential basis used in most big data analysis and becomes a starting point for identifying an institution. This study collected data dealing with the basic information of culture and arts institutions to define common metadata and constructed small data in the form of a knowledge graph linking institutions around common metadata. This can be a way to explore the types and characteristics of culture and arts institutions in an integrated way.