• 제목/요약/키워드: 관계그래프

검색결과 689건 처리시간 0.026초

1997 외환위기 지식그래프: 디지털 아카이브의 관계 중심적 접근 (A Knowledge Graph of the Korean Financial Crisis of 1997: A Relationship-Oriented Approach to Digital Archives)

  • 이유경;김학래
    • 한국기록관리학회지
    • /
    • 제20권4호
    • /
    • pp.1-17
    • /
    • 2020
  • 정보기술의 발전에 따라 아카이브의 디지털화가 가속화되고 있다. 그런데 전통적인 방식의 디지털 아카이브는 기록을 효과적으로 검색하고 연계하고 이해하는 데 한계가 있다. 본 논문은 디지털 아카이브의 활용성을 극대화하기 위한 방안으로 관계 중심의 지식그래프 방식을 제안한다. 디지털 아카이브의 사례인 '1997 외환위기 아카이브'의 특징을 검토하고, 아카이브에 포함된 모든 개체와 개체 사이의 관계는 RiC-O(Records in Contexts-Ontology) 기반의 지식그래프로 구축한다. 본 연구의 결과인 외환위기 지식그래프는 1997 외환위기 아카이브의 모든 개체를 기계가 처리할 수 있는 형식으로 구축한다. 디지털 아카이브와 비교해 지식그래프 접근은 개체의 정보, 개체 사이의 관계를 정확히 탐색할 수 있고, 이를 통해 의미검색, 지능형 서비스에 활용될 수 있다.

자연어 인터페이스를 위한 관계에 대한 자연어 표현 자동 수집 방법 (Automatic Collecting of Natural Language Expressions of Relations for Natural Language Interface)

  • 한용진;박세영;박성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.221-224
    • /
    • 2011
  • 관계에 대한 다양한 자연어 표현을 다루는 것은 구조 정보에 대한 자연어 질의 인터페이스 연구의 중요한 문제 중에 하나이다. 이러한 문제를 해결하기 위한 기존의 연구들은 자연어 질의 인터페이스를 대상 분야에 적합하게 구축하기 위한 수작업에 의존하였다. 이러한 접근은 소규모 구조 정보에 대한 자연어 질의 인터페이스 구축 시 효율적으로 적용될 수 있다. 하지만 최근에는 RDF와 OWL과 같은 그래프 구조 정보가 다양한 분야에서 대량으로 생성되고 있다. 수작업에 의존하는 접근을 통해 이러한 대량의 그래프 구조 정보에 대한 자연어 인터페이스를 구축하기에는 어려움이 있다. 본 논문은 자연어 인터페이스에 대한 자연어 표현의 다양성 문제를 해결하기 위해 자동으로 관계에 대한 자연어 표현을 수집하는 방법을 제안한다. 그래프 구조 정보에서 관계는 두 객체를 연결하는 유일한 에지(edge)로 표현된다. 제안한 방법은 주어진 에지로 연결되는 서로 다른 객체 쌍을 말뭉치(corpus)에서 검색하고 검색된 객체 쌍 주변에서 빈번하게 등장하는 자연어 표현을 수집한다. 자동으로 수집한 자연어 질의 표현을 자연어 인터페이스에 적용한 결과 수작업에 의존하는 기존 연구들과 비교할 만한 실험 결과를 보였다.

고등학생들의 그래프 능력과 과학 탐구 능력 및 과학 학업 성취도의 관계 (Relationships of Graphing Ability to Science-Process Skills and Academic Achievement of High School Students)

  • 김태선;고수경;김범기
    • 한국과학교육학회지
    • /
    • 제25권5호
    • /
    • pp.624-633
    • /
    • 2005
  • 본 연구는 그래프 능력과 과학 탐구 능력 및 과학 학업 성취도의 상관 관계를 알아본 것이다. 그래프 능력과 과학 탐구 능력인 정적인 .41의 상관을 보였으며 이러한 결과는 선행연구의 결과들을 지지하는 것이다. 또한 그래프 능력은 과학 학업 성취도와 거의 통계적으로 상관이 없는 것으로 밝혀졌다. 그래프는 과학 학습에서 중요한 의사소통의 도구이다. 또한 그래프 능력은 과학 탐구 능력과 어느 정도 상관관계도 보이고 있다. 따라서 고등학생들의 그래프 능력의 부족한 부분을 신장시켜 과학 학습에 장애가 되지 않도록 해야 될 것이다.

상호참조 정보와 대화 그래프를 활용한 대화 관계추출 모델 (Dialogue Relation Extraction using Dialogue Graph)

  • 임정우;손준영;김진성;허윤아;서재형;장윤나;박정배;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.385-390
    • /
    • 2022
  • 관계추출은 문서 혹은 문장에서 자동으로 엔티티들간의 관계를 추출하는 기술로, 비정형 데이터를 정형데이터로 변환하기에 자연어 처리 중에서도 중요한 분야중 하나이다. 그 중에서도 대화 관계추출은 기존의 문장 단위의 관계추출과는 다르게 긴 길이에 비해 적은 정보의 양, 빈번하게 등장하는 지시대명사 등의 특징을 가지고 있어 주어와 목적어 사이의 관계를 예측하기에 어려움이 있었다. 본 연구에서는 이러한 어려움을 극복하기 위해 대화의 특성을 고려한 대화 그래프를 구축하고 이를 이용한 모델을 제안한다. 제안하는 모델은 상호참조 정보와 문맥정보를 더 반영한 그래프를 통해 산발적으로 퍼져있는 정보를 효율적으로 수집하고, 지시대명사로 인해 어려워진 중요 발화 파악 능력을 증진시켰다. 또한 이를 실험적으로 보이기 위하여 대화 관계추출 데이터셋에 실험해본 결과, 기존 베이스라인 보다 약 10 % 이상의 높은 F1점수를 달성하였다.

  • PDF

효율적인 시멘틱 질의 처리를 위한 인덱싱 기법 (Indexing Mechanism for Efficient Semantic Query Processing)

  • 김학수;차현석;손진현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.97-100
    • /
    • 2006
  • RDF 는 트리플의 집합으로서 그래프 데이터 모델로 표현되며, 사용자는 RDF 그래프 모델로부터 정보를 검색하기 위해 시멘틱 질의 언어를 사용한다. 그러나 이러한 접근 방식은 최악의 경우 전체 그래프 데이터 모델을 검색해야 되는 문제점이 발생한다. 이에 따라 최근의 연구에서는 시멘틱 질의를 효율적으로 처리하기 위해서 인덱스를 사용한다. 시멘틱 질의 언어(RDQL, SPARQL)의 핵심은 RDF 트리플에 대한 패턴을 기술함으로써 원하는 트리플 정보를 검색할 수 있게 하는 것이다. 따라서, 기존의 인덱스는 단일 트리플을 효율적으로 검색하는 데 초점을 둔다. 거라나 트리플 패턴의 집합으로 질의가 표현될 경우에는 트리플 패턴 사이의 상관관계 때문에 조인비용이 많이 발생하는 문제점이 있다. 본 논문에서는 조인 비용이 발생되는 문제점을 해결하기 위한 인덱싱 기법을 제안한다. RDF 그래프 모델에서 유지해야 할 정보를 줄이기 위해서 RDF 그래프 모델에 존재하는 유사한 서브 그래프를 하나의 서브 그래프로 병합한다. 병합절차를 마친 여러 서브 그래프에 존재하는 모든 경로를 인덱스에 유지 함으로써 조인 비용을 제거한다.

  • PDF

흐름 그래프 형태를 이용한 함수형 프로그램 유사성 비고 (A Program Similarity Check by Flow Graphs of Functional Programs)

  • 서선애;한태숙
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권4호
    • /
    • pp.290-299
    • /
    • 2005
  • 컴퓨터와 소프트웨어의 사용이 증가하면서, 프로그램 소스의 도용(표절)이 사회적인 문제로 부각되고 있다. 이런 문제를 해결하고자 프로그램의 문법 구조를 비교하여 표절을 찾아내는 방법론이 제안되었지만, 간단한 프로그램 수정에도 표절을 찾아내지 못하는 한계를 가지고 있다 이 연구에서는, 문법 구조적인 정보 뿐 아니라, 프로그램식 간의 수행시 의존 관계를 드러내는 그래프를 이용한 프로그램 표절 감지 시스템을 제안한다. 이 방법론은 문법 정보 뿐 아니라, 수행시 의존 관계까지 비교 대상에 을림으로써, 수행시 의콘 관계를 변화시키지 못하는 프로그램 수정에 대해서도 프로그램 표절을 판별할 수 있다. 또한, 이 연구에서는 표절 프로그램이란 무엇인가를 엄밀하게 정의하고 이 표절 프로그램의 정의와 연구에서 제안된 표:늰 감별 그래프와의 관계를 보였다. 즉, 두 프로그램이 표절이라는 것은 표절 감별 그래프가 일치한다는 긴과 필요 충분 관계가 있음을 증명하였다. 또한 제안된 표절 감별 방법론을 실제적인 프로그래밍 언어인 IML 에 대해서 구현하였다. 구현된 도구를 통해서 실제 표절된 프로그램들을 감별한 결과, 기존의 방법에서 찾기 어려운 프로그램 표절을 제안된 방법론이 다룰 수 있음을 확인하였다.

그래프 데이터베이스를 활용한 공간 데이터 통합 방안 연구: 부동산 분야를 중심으로 (A Study on Spatial Data Integration using Graph Database: Focusing on Real Estate)

  • 김주영;박슬아;유기윤
    • 한국지리정보학회지
    • /
    • 제26권3호
    • /
    • pp.12-36
    • /
    • 2023
  • 그래프 데이터베이스는 다양한 유형의 데이터와 그 관계를 그래프로 모델링하여 적재하기 때문에 복잡한 관계로 연결될 수 있는 부동산 데이터를 관리하고 분석하는데 효과적일 수 있으나, 현재 제공되는 그래프 데이터베이스의 제한적인 공간 기능으로 인해 활발히 활용되지 못하고 있다. 이러한 배경에서, 본 연구에서는 다양한 부동산 공간 관련 질문들에 대응할 수 있도록 그래프 데이터베이스를 활용한 Uniform Grid 기반 부동산 공간 데이터 관리 방안을 제안한다. 핵심 데이터를 선정하기 위하여 부동산 커뮤니티의 관련 질의를 분석하였으며, 국가지점번호를 단위 Grid로 설정하고 다양한 부동산 관련 데이터들을 연결한 그래프 스키마를 구성하여 테스트 데이터베이스를 구축하였다. 데이터베이스 검증을 위해, Jackpine 벤치마크를 활용하여 기본 위상관계 및 공간함수를 테스트하였고, 나아가 다양한 시나리오 기반 질의 테스트를 수행함으로써 제안한 방법의 적절성을 검증하고자 하였다. 그 결과, 제안한 방법은 총 29개의 공간 위상관계와 공간함수 중 25개의 기능을 성공적으로 수행하였고, 25개의 기능과 15개의 시나리오에 대해 약 97%의 정확도를 달성하였다. 본 연구는 그래프 데이터베이스의 제한적인 공간 기능을 고려하여, 부동산 관련 공간 질문에 대응할 수 있는 효율적인 데이터 통합방안을 제안하였다는 점에서 의의를 가진다. 그러나 그리드 기반 인덱스 사용으로 인한 잘못된 공간 위상관계 생성 문제 및 리스트 비교에 따른 질의의 비효율성에 대한 한계점이 존재하며, 이는 후속 연구에서 개선할 필요가 있다.

단어 동시출현관계로 구축한 계층적 그래프 모델을 활용한 자동 키워드 추출 방법 (Automatic Keyword Extraction using Hierarchical Graph Model Based on Word Co-occurrences)

  • 송광호;김유성
    • 정보과학회 논문지
    • /
    • 제44권5호
    • /
    • pp.522-536
    • /
    • 2017
  • 키워드 추출은 주어진 문서로부터 문서의 주제나 내용에 관련된 단어들을 추출해내는 방법으로 대량의 문서를 다루는 텍스트마이닝 연구들이 전처리에서 공통적으로 거치는 대표 자질 추출에서 중요하게 활용될 수 있다. 본 논문에서는 하나의 문서의 주제에 적합한 키워드를 추출하기 위해 문서에 출현한 단어들 사이의 동시출현관계, 동시출현 단어 쌍 사이의 출현 종속 관계, 단어들 사이의 공통 부분단어 관계 등의 다양한 관계들을 특징으로 활용하여 구축한 계층적 그래프 모델을 제안하고, 그래프를 구성하는 정점(Vertex)들의 중요도를 평가할 때 입력 간선(Edge)에 의한 영향뿐만 아니라 출력 간선에 의한 영향도 고려한 새로운 중요도 산출 방법을 제안하며, 이를 토대로 점진적으로 키워드를 추출해내는 방안을 제안한다. 그리고 제안한 방법의 정확성과 주제적 포괄성 검증을 위해 다양한 분야의 주제를 가진 문서 데이터에 다양한 평가방법을 적용해 기존의 방법보다 전체적으로 더 나은 성능을 보임을 확인하였다.

그래프 구조를 이용한 카테고리 구조로부터 상하위 관계 추출 (Graph-based ISA/instanceOf Relation Extraction from Category Structure)

  • 최동현;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권6호
    • /
    • pp.464-469
    • /
    • 2010
  • 상하위 관계 자동 추출은 분류체계를 자동 구축하는 데 있어서 핵심적인 내용이며, 이렇게 자동으로 구축된 분류 체계는 정보 추출과 같은 여러 가지 분야에 있어서 중요하게 사용된다. 본 논문에서는 카테고리 구조로부터 상하위 관계를 추출하는 방식에 대하여 제안한다. 본 논문에서는 판별하고자 하는 카테고리 구조뿐만이 아닌, 그와 관련된 다른 카테고리 구조까지 고려하여 카테고리 이름에 나타난 토큰들간의 수식 그래프를 구축한 후, 그래프 분석 알고리즘을 통하여 각 카테고리 구조가 상하위 관계일 가능성에 대한 점수를 매긴다. 실험 결과, 본 알고리즘은 기존의 연구로 상하위 관계임을 판별할 수 없었던 일부 카테고리 구조에 대하여 성공적으로 상하위 관계인지를 판별하였다.

토픽맵과 카산드라를 이용한 그래프 구조와 트랜잭션 동시 처리 기법 (Technique for Concurrent Processing Graph Structure and Transaction Using Topic Maps and Cassandra)

  • 신재현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권3호
    • /
    • pp.159-168
    • /
    • 2012
  • SNS, 클라우드, Web3.0과 같은 새로운 IT환경은 '관계(relation)'가 중요한 요소가 되고 있다. 그리고 이들 관계(relation)는 거래, 즉, 트랜잭션을 발생시킨다. 그러나 우리가 사용하고 있는 관계형 데이터베이스(RDBMS)나 그래프 데이터베이스는 관계(relation)를 나타내는 그래프 구조와 트랜잭션을 동시에 처리하지 못한다. 본 논문은 확장 가능한 복잡 네트워크 시스템에서 활용할 수 있는 그래프 구조와 트랜잭션을 동시에 처리할 수 있는 방법을 제안한다. 제안 기법은 토픽맵의 데이터 모델을 응용하여 그래프 구조와 트랜잭션을 동시에 저장하고 탐색한다. 토픽맵은 시멘틱 웹(Web3.0)을 구현하는 온톨로지 언어 중 하나로써, 정보자원들 사이의 연관 '관계(relation)'를 통해 정보의 네비게이터로써 활용되고 있다. 또한 본 논문에서는 컬럼형 데이터베이스인 카산드라를 이용하여 제안 기법의 아키텍처를 설계, 구현하였다. 이는 분산처리를 이용하여 빅데이터 레벨의 데이터까지 처리할 수 있도록 하기 위함이다. 마지막으로 대표적인 RDBMS인 오라클과 제안 기법을 동일한 데이터 소스, 동일한 질문에 대해 저장 및 질의를 하는 과정을 실험으로 보였다. 이는 조인(join) 없이 관계(relation)를 표현함으로써 RDBMS의 역할까지 충분히 대체 가능함을 보이고자 한다.