• 제목/요약/키워드: 그래프 구축

검색결과 289건 처리시간 0.023초

사이버 침해정보 연관 그래프 구축 및 활용방안 연구 (A Study on Building a Cyber Incidents Information based Relational Graph and Using Plan)

  • 이슬기;조혜선;김병익;신영상;이태진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.771-772
    • /
    • 2015
  • 사이버 침해사고 정보를 공유하는 체계가 전 세계적으로 확산되고 있는 추세이다. 상호 네트워크 통신을 위하여 필요한 인터넷기반정보와 사이버 침해사고 관련 정보를 획득하기 위한 채널 다양하게 존재하고 공공의 이익을 목적으로 공유되고 있으며 침해정보에 대한 세부적인 분석정보 또한 오픈소스 프로젝트를 통해 손쉽게 획득할 수 있다. 한국인터넷진흥원에서는 공인된 사용자 혹은 기관을 대상으로 침해사고에 활용된 악성정보를 공유하고 있다. 본 논문은 이러한 인터넷기반정와 침해사고와 관련된 연관정보를 활용한 사이버 침해정보 연관 그래프 구축방안에 대하여 논하며 그 활용방안이 어떠한 것이 있는지 제안한다.

한국 영화배우 소셜 네트워크 데이터 분석을 통한 중심성 변화 연구 (Understanding Temporal Change of Centrality by Analyzing Social Network among Korean actors)

  • 최준영;이오준;정재은;용환성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.37-40
    • /
    • 2019
  • 이 논문에서는 한국 영화의 출연 배우들을 노드로 하여, 동반 출연의 경우에 엣지를 설정하여 그래프를 구축하는 방법을 보인다. 이렇게 구축한 그래프를 통하여, 논문에서 정의한 '중심 지수'를 각각의 배우에 대해 구하고, 이를 바탕으로 중심성 수치에 따른 순위를 매겨 그 분포를 조사하고, 또한 연도별 중심 배우의 변화를 살펴본다. 마지막으로 6단계 분리 이론과 접목하여 사회적 집단의 범위를 수치적으로 한정하는 방안을 제시한다.

  • PDF

방향 비순환 그래프의 중심성을 이용한 위키데이터 기반 분류체계 구축 (Taxonomy Induction from Wikidata using Directed Acyclic Graph's Centrality)

  • 전희선;김현호;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.582-587
    • /
    • 2021
  • 한국어 통합 지식베이스를 생성하기 위해 필수적인 분류체계(taxonomy)를 구축하는 방식을 제안한다. 위키데이터를 기반으로 분류 후보군을 추출하고, 상하위 관계를 통해 방향 비순환 그래프(Directed Acyclic Graph)를 구성한 뒤, 국부적 도달 중심성(local reaching centrality) 등의 정보를 활용하여 정제함으로써 246 개의 분류와 314 개의 상하위 관계를 갖는 분류체계를 생성한다. 워드넷(WordNet), 디비피디아(DBpedia) 등 기존 링크드 오픈 데이터의 분류체계 대비 깊이 있는 계층 구조를 나타내며, 다중 상위 분류를 지닐 수 있는 비트리(non-tree) 구조를 지닌다. 또한, 위키데이터 속성에 기반하여 위키데이터 정보가 있는 인스턴스(instance)에 자동으로 분류를 부여할 수 있으며, 해당 방식으로 실험한 결과 99.83%의 분류 할당 커버리지(coverage) 및 99.81%의 분류 예측 정확도(accuracy)를 나타냈다.

  • PDF

인메모리 기반 병렬 컴퓨팅 그래프 구조를 이용한 대용량 RDFS 추론 (Scalable RDFS Reasoning Using the Graph Structure of In-Memory based Parallel Computing)

  • 전명중;소치승;바트셀렘;김강필;김진;홍진영;박영택
    • 정보과학회 논문지
    • /
    • 제42권8호
    • /
    • pp.998-1009
    • /
    • 2015
  • 근래에 들어 풍부한 지식베이스를 구축하기 위한 대용량 RDFS 추론에 대한 관심이 높아지면서 기존의 단일 머신으로는 대용량 데이터의 추론 성능을 향상시키기에 한계가 있다. 그래서 분산 환경에서 의 RDFS 추론 엔진 개발이 활발히 연구되고 있다. 하지만 기존의 분산 환경 엔진은 실시간 처리가 불가능 하며 구현이 어렵고 반복 작업에 취약하다. 본 논문에서는 이러한 문제를 극복하기 위해 병렬 그래프 구조 를 사용한 인-메모리 분산 추론 엔진 구축 방법을 제안한다. 트리플 형태의 온톨로지는 기본적으로 그래프 구조를 가지고 있으므로 그래프 구조 기반의 추론 엔진을 설계하는 것이 직관적이다. 또한 그래프 구조를 활용하는 오퍼레이터를 활용하여 RDFS 추론 규칙을 구현함으로써 기존의 데이터 관점과 달리 그래프 구조의 관점에서 설계할 수 있다. 본 논문에서 제안한 추론 엔진을 평가하기 위해 LUBM1000(1억 3천 3백만 트리플, 17.9GB), LUBM3000(4억 1천 3백만 트리플, 54.3GB)에 대해 추론 속도를 실험을 하였으며 실 험결과, 비-인메모리 분산 추론 엔진보다 약 10배 정도 빠른 추론 성능을 보였다.

단어 동시출현관계로 구축한 계층적 그래프 모델을 활용한 자동 키워드 추출 방법 (Automatic Keyword Extraction using Hierarchical Graph Model Based on Word Co-occurrences)

  • 송광호;김유성
    • 정보과학회 논문지
    • /
    • 제44권5호
    • /
    • pp.522-536
    • /
    • 2017
  • 키워드 추출은 주어진 문서로부터 문서의 주제나 내용에 관련된 단어들을 추출해내는 방법으로 대량의 문서를 다루는 텍스트마이닝 연구들이 전처리에서 공통적으로 거치는 대표 자질 추출에서 중요하게 활용될 수 있다. 본 논문에서는 하나의 문서의 주제에 적합한 키워드를 추출하기 위해 문서에 출현한 단어들 사이의 동시출현관계, 동시출현 단어 쌍 사이의 출현 종속 관계, 단어들 사이의 공통 부분단어 관계 등의 다양한 관계들을 특징으로 활용하여 구축한 계층적 그래프 모델을 제안하고, 그래프를 구성하는 정점(Vertex)들의 중요도를 평가할 때 입력 간선(Edge)에 의한 영향뿐만 아니라 출력 간선에 의한 영향도 고려한 새로운 중요도 산출 방법을 제안하며, 이를 토대로 점진적으로 키워드를 추출해내는 방안을 제안한다. 그리고 제안한 방법의 정확성과 주제적 포괄성 검증을 위해 다양한 분야의 주제를 가진 문서 데이터에 다양한 평가방법을 적용해 기존의 방법보다 전체적으로 더 나은 성능을 보임을 확인하였다.

Easier-to-use 매쉬업을 위한 시맨틱 기반 자동 Open API 조합 알고리즘 (Semantic-based Automatic Open API Composition Algorithm for Easier-to-use Mashups)

  • 이용주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권5호
    • /
    • pp.359-368
    • /
    • 2013
  • 매쉬업은 공개된 Open API를 이용하여 두 가지 이상의 서로 다른 자원을 섞어서 완전히 새로운 서비스를 만드는 웹 애플리케이션이다. 지난 몇 년간 매쉬업에 대한 관심도가 매우 높아 졌지만 수많은 API들을 매쉬업 속으로 결합할 때 여러 가지 이슈들이 존재한다. 특히, 조합 가능한 API들이 매쉬업 개발자에 의해 수동으로 통합될 때 이는 더욱 심각해진다. 본 논문에서는 Open API 자동 조합을 위한 하나의 새로운 알고리즘을 제안한다. 제안된 알고리즘은 오퍼레이션 연결 그래프 구축 및 조합 후보군 탐색으로 구성되어 있다. 우리는 Open API 입출력 사이의 시맨틱 유사도를 기반으로 오퍼레이션 연결 그래프를 구축하고, 원하는 목표를 만족하는 출력을 산출할 수 있는 사이클 없는 방향성 그래프(DAG)를 생성한다. 또한, DAG들을 효율적으로 생성하기 위해 조합에 도움이 되지 않은 API들은 사전에 신속히 필터링되는 전략을 수립한다. 본 논문에서 제안된 알고리즘은 ProgrammableWeb.com 사이트로부터 REST와 SOAP API 집합을 다운로드 받아 실험 분석을 수행하였다.

그래프이론을 이용한 낙동강 유역의 습지네트워크 구축모델 개발 (Development for Wetland Network Model in Nakdong Basin using a Graph Theory)

  • 노백호
    • 한국습지학회지
    • /
    • 제15권3호
    • /
    • pp.397-406
    • /
    • 2013
  • 습지보전계획을 수립하는데 있어 식생의 온전성, 멸종위기종 출현여부 등 대상지역 위주의 습지평가방법에서 점차 주변지역이나 광역적인 위상관계, 연결성을 고려한 경관생태학적 접근방법에 의한 습지평가 필요성이 제기되고 있다. 이에 본 연구에서는 낙동강 유역에 분포하는 407개 습지를 대상으로 경관생태학적 접근방법과 그래프이론에 의해 습지생태네트워크 구축모형을 제시하였다. 습지의 물질순환, 철새이동루트 등 현지조사 자료가 부족한 낙동강 유역의 네트워크 분석에는 평면네트워크 그래프 모델을 적용하였으며, 연결성 분석은 임계거리를 15km로 설정하여 습지군집 5개와 핵심습지 4개를 도출하였다. 이진모형과 확률모형에 의한 통합연결성지수와 연결가능성지수를 계산한 결과, 5개 습지군집 및 핵심습지와 취약습지를 검증할 수 있었으며, 낙동강본류와 금호강지류에 위치한 습지군집이 습지생태네트워크에 있어 중요한 역할을 담당하고 있다. 본 연구를 통해 얻은 낙동강 유역의 습지군집과 네트워크, 취약습지 분포특성은 유역 단위의 습지보전 관리계획 수립, 습지복원사업을 실시하는데 기초자료로 활용할 수 있다.

Automatic Construction of SHACL Schemas for RDF Knowledge Graphs Generated by R2RML Mappings

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.9-21
    • /
    • 2020
  • RDF 지식 그래프의 사용이 늘어나면서 표준화된 RDF 스키마 표현 형식의 부재가 데이터 상호 교환·운용성을 저해한다는 문제가 제기되어 왔다. 이를 위해 W3C는 RDF 그래프에 대한 구조 묘사 및 검증을 지원하는 SHACL 명세를 개발하였다. 관계형 데이터베이스(RDB)는 구조화된 지식 그래프를 얻는 주요 원천 중 하나이다. RDB로부터 RDF 그래프를 생성하는 방법은 통상 W3C에 의해 표준화된 R2RML 명세를 따른다. 그러나 R2RML 방식으로 생성한 RDF 그래프에 대한 스키마를 생성하기 위해서는 전문가에 의한 별도의 수작업이 요구된다. 본 논문에서는 R2RML 매핑에 의해 구축된 RDF 그래프에 대한 SHACL 스키마를 자동 생성하는 방법을 제안한다. 제안하는 방법의 특징은 R2RML 매핑 문서만으로 SHACL 스키마를 생성할 수 있다는 것이다. 본 논문은 제안하는 방법의 구현 사항들을 상세히 기술하며 구현 결과물을 W3C의 R2RML 테스트 케이스에 적용한 결과를 제시한다.

분산된 대사 네트워크에 대한 경로탐색을 위한 분산 알고리즘 (Distributed Algorithm to search paths in distributed metabolic pathway networks)

  • 이선아;이건명
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.349-352
    • /
    • 2005
  • 이 논문에서는 분산된 생물학의 대사 네트워크들이 있을 때, 이를 통합하지 않은 상태에서 경로검색을 하는 분산 알고리즘을 제안한다. 대사 네트워크는 여러 데이터베이스에 존재하며 서로 중복되는 데이터를 가지고 있다. 제안한 방법은 네트워크 사이의 중첩이 있는 부분을 하이퍼 노드로 하고, 네트워크 자체는 하이퍼 에지로 하는 추상 하이퍼 그래프를 만들어서, 이를 이용한 상위수준의 경로를 구축한다. 각 네트워크내의 중첩된 영역간의 경로를 미리 계산해 둔 다음, 상위수준의 경로에 기반하여 분산된 대사네트워크 간에 존재하는 경로를 검색한다. 추상 하이퍼 그래프는 데이터베이스를 하이퍼 노드로 하는 것에 대한 경로탐색을 한 다음, 그 경로에 따라 데이터베이스 내에 존재하는 대사경로를 탐색한다. 이때 존재하는 대사경로가 많기 때문에 각각의 대사경로를 하이퍼 노드로 하는 추상 하이퍼 그래프를 만들어 경로를 탐색하고 나서 그 하위 노드에 대해 경로탐색을 한다. 이는 분산된 네트워크를 통합할 저장 공간 및 탐색시간을 줄일 수 있다는 장점이 있다.

  • PDF

사용자 그래프 기반 한국어 가짜뉴스 판별 방법 (Korean Fake News Detection with User Graph)

  • 강명훈;서재형;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.97-102
    • /
    • 2021
  • 최근 급격한 정보기술의 발달로 가짜뉴스가 사회문제로 대두되고 있다. 한국어 가짜뉴스 문제를 딥러닝으로 해결하기 위해서 기존의 연구들은 본문 기반의 가짜뉴스 탐지를 진행하였으며 최근에는 기사 본문 외의 보조적 정보를 활용하는 방법으로 연구가 진행되고 있다. 그러나 기존의 방식과 개선된 방식들 모두 적절한 가짜뉴스 탐지 방법을 제시하지 못하여 모델이 산출한 가짜뉴스 표현 벡터의 품질을 보장할 수 없었다. 또한 한국어 가짜뉴스 문제를 해결함에 있어서 적절한 공개 데이터셋 또한 제공되지 않았다. 따라서 본 논문은 한국어 가짜뉴스 탐지 문제에서 독자 반응정보를 추가하여 효과적인 학습을 할 수 있는 '사용자 그래프 기반 한국어 가짜뉴스 판별 방법'과 해당 모델이 적절히 학습할 수 있는 간이 데이터셋 구축 방법을 제안한다.

  • PDF