• 제목/요약/키워드: 개체 연결

검색결과 238건 처리시간 0.038초

문서 임베딩을 이용한 소셜 미디어 문장의 개체 연결 (Document Embedding for Entity Linking in Social Media)

  • 박영민;정소윤;이정엄;신동수;김선아;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.194-196
    • /
    • 2017
  • 기존의 단어 기반 접근법을 이용한 개체 연결은 단어의 변형, 신조어 등이 빈번하게 나타나는 비정형 문장에 대해서는 좋은 성능을 기대하기 어렵다. 본 논문에서는 문서 임베딩과 선형 변환을 이용하여 단어 기반 접근법의 단점을 해소하는 개체 연결을 제안한다. 문서 임베딩은 하나의 문서 전체를 벡터 공간에 표현하여 문서 간 의미적 유사도를 계산할 수 있다. 본 논문에서는 또한 비교적 정형 문장인 위키백과 문장과 비정형 문장인 소셜 미디어 문장 사이에 선형 변환을 수행하여 두 문형 사이의 표현 격차를 해소하였다. 제안하는 개체 연결 방법은 대표적인 소셜 미디어인 트위터 환경 문장에서 단어 기반 접근법과 비교하여 높은 성능 향상을 보였다.

  • PDF

RoBERTa-catSeqE: 개체 연결을 이용한 RoBERTa기반 키워드 추출 (RoBERTa-catseqE: Neural keyphrase Extraction with Entity linking using RoBERTa)

  • 이정두;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.486-490
    • /
    • 2020
  • 키워드 구문 추출(Keyphrase extraction)은 각 문서에서 내용과 주제를 포괄하는 핵심 단어 또는 구문을 추출하는 것을 말한다. 이는 뉴스나 논문에서 중요한 정보를 추출하는 데 매우 중요한 역할을 한다. 본 논문에서는 기존 catSeq 모델에 한국어로 학습한 RoBERTa 언어 모델을 적용하고 개체 연결 정보를 활용해 기존 키워드 생성 디코더와 개체 연결된 단어의 키워드 여부 분류 디코더, 즉 듀얼 디코더를 사용하는 모델을 제안하고 직접 구축한 한국어 키워드 추출 데이터에 대한 각 모델의 성능을 비교한다.

  • PDF

위키피디아 기반의 효과적인 개체 링킹을 위한 NIL 개체 인식과 개체 연결 중의성 해소 방법 (A Method to Solve the Entity Linking Ambiguity and NIL Entity Recognition for efficient Entity Linking based on Wikipedia)

  • 이호경;안재현;윤정민;배경만;고영중
    • 정보과학회 논문지
    • /
    • 제44권8호
    • /
    • pp.813-821
    • /
    • 2017
  • 개체 링킹은 입력된 질의에 존재하는 개체를 표현한 개체 표현(entity mention)을 지식베이스에 존재하는 개체와 연결하여 의미를 파악하는 연구이다. 개체 링킹에 관한 연구는 지식 베이스 구축 문제, 다중 표현 문제, 개체 연결 중의성 문제, NIL 개체 인식 문제가 존재한다. 본 연구에서는 지식 베이스 구축 문제와 다중 표현 문제를 해결하기 위해 위키피디아를 기반으로 개체 이름 사전을 구축한다, 또한, 문맥 유사도, 의미적 관련성, 단서 단어 점수, 개체 표현의 개체명 타입 유사도, 개체 이름 매칭 점수, 개체인기도 점수 자질들을 기반으로 SVM(support vector machine)을 학습하여, NIL 개체를 인식하는 문제와 개체 연결 중의성을 해소하는 방법을 제안한다. 구축한 지식 베이스를 기반으로 제안한 두 방법을 순차적으로 적용하였을 때 좋은 개체 링킹 성능을 얻었다. 개체 링킹 시스템의 성능은 NIL 개체 인식 성능이 83.66%, 중의성 해소 성능이 90.81%의 F1 점수를 보였다.

효과적인 지식확장을 위한 LOD 클라우드에서의 변화수용적 심층검색 (Change Acceptable In-Depth Searching in LOD Cloud for Efficient Knowledge Expansion)

  • 김광민;손용락
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.171-193
    • /
    • 2018
  • 본 연구는 시멘틱 웹의 실질적 구현체인 LOD 클라우드에서 연결정책을 활용함으로써 LOD들간 연결을 효과적으로 제공하고 LOD의 변경된 내용을 검색결과에 빠짐없이 반영할 수 있는 방안을 제시한다. 현재 LOD 클라우드에서는 개체간 연결은 를 이용하여 개체들이 동일함을 명시적으로 기술하는 방식으로 이루어져 있다. 하지만, 이러한 명시적 연결방식은 LOD 클라우드 규모의 방대함에도 불구하고 개체간 동일성을 개체단위에서 파악하여야 하는 어려움이 있으며 주기적으로 LOD에 추가하여야 함에 따라 검색 시 개체들이 누락되는 한계가 있다. 이를 극복하기 위하여 본 연구에서는 명시적 연결을 생성하는 대신 LOD별로 연결하고자 하는 LOD와의 연결정책을 수립하여 LOD와 함께 공개하는 방식을 제안한다. 연결정책을 활용함으로써 연결하여야 할 동일개체를 검색시점에서 파악할 수 있으므로 추가되었던 개체들을 누락됨 없이 검색결과에 포함시킬 수 있고 LOD 클라우드에서의 연결성도 효과적으로 확충할 수 있다. 확충된 연결성은 정보의 지능적 처리의 선행과정인 지식확장의 근간이 된다. 연결정책은 연결하고자 하는 소스와 타겟 LOD의 주어 개체들간의 동일성을 평가하는데 도움이 되는 술어 쌍을 명세하는 방식으로 수립하며 검색 시 이러한 술어쌍에 대응하는 RDF 트리플을 검색하고 이들의 목적어들이 충분히 동일한 것인가를 평가하여 주어개체들의 동일수준을 판단한다. 본 연구에서는 이러한 연결정책을 이용하여 여러 LOD들을 심층적으로 검색하는 시스템을 구현하였다. 검색과정에서는 기존 명시적 연결들도 함께 활용하도록 구현하였다. 검색시스템에 대한 실험은 DBpedia의 주요 LOD들을 대상으로 진행하였다. 실험결과 연결대상 개체들의 목적어들이 0.8 ~ 0.9의 유사수준을 가지는 경우 적정한 확장성을 가지고 충분히 신뢰적인 개체들을 적절하게 포함하는 것으로 확인하였다. 또한, 개체들은 8개 이상의 동일연결을 제공하여야 검색결과가 신뢰적으로 활용될 수 있을 것으로 파악되었다.

LOD 클라우드에서의 연결정책 기반 동일개체 심층검색 및 정제 시스템 구현 (Implementation of Policy based In-depth Searching for Identical Entities and Cleansing System in LOD Cloud)

  • 김광민;손용락
    • 인터넷정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.67-77
    • /
    • 2018
  • 본 연구에서는 동일연결트리플들을 생성하는 대신 각 LOD마다 연결정책을 수립, 공개하고 검색 시점에서 참조하는 방식으로 개체간의 동일성을 파악하는 방안과 이러한 연결정책을 명세하기 위한 어휘를 제안하였다. 또한, 연졀정책이 운영되는 환경에서 여러 LOD들에 걸친 심층검색이 실질적으로 진행되는 것을 확인하기 위하여 PISC(Policy based In-depth Searching and Cleansing)을 구현하였으며 이를 Github에 공개하였다. LOD 클라우드는 여러 LOD들의 자발적인 참여로 이루어짐에 따라 검색된 개체들의 동일성에 대한 평가가 필요하다. 이에, PISC는 개체간 동일성 평가를 통하여 사용자가 요구한 동일수준 이상의 개체들로 정제된 검색결과를 제공한다. 검색결과로는 RDF로 모델링된 개체별 상세 검색내용과 이에 대한 의미적 구조인 온톨로지를 함께 제공된다. PISC에 대한 실험은 DBpedia의 5개 LOD를 대상으로 진행하였으며 소스와 타겟 RDF 트리플 목적어의 유사도를 0.9 정도로 요구할 경우 검색결과가 적절한 확장률과 포함률을 가지는 것으로 확인하였다. 또한, 연결정책에는 3개 이상의 타겟LOD를 명세할 경우 동일성이 충분히 검증된 개체들을 확보할 수 있는 것으로 확인하였다.

시멘틱 그래프 기반의 사회연결망 영향력 시각화를 위한 연구 (A Framework Based on A Semantic Graph for Visualization of Influence On A Social Network)

  • 장석현;이경원;장선희
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 2부
    • /
    • pp.432-438
    • /
    • 2007
  • 이 연구는 정보 간의 관계에서 도출되는 특징을 적합하게 보여줄 수 있는 시각화를 위한 선행연구이다. 정보의 관계에 주목하는 이유는 관계 구조를 통해 정보의 성격과 특징을 파악할 수 있기 때문이다. 정보의 관계는 사회연결망 분석을 통해서 파악할 수 있다. 정보를 구성하는 개체와 개체 사이의 관계는 다양한 요소를 지니고 있으며, 연결망의 관계 분석 지표를 통해 관계의 성격과 특징을 도출해 낼 수 있다. 이 연구에서는 사회연결망에서 관계의 성격을 도출하는데 중요한 지표로 다뤄지는 영향력을 연구범위로 설정하고, 연결망 내의 관계의 요인과 영향력의 지표를 분류하고 연결한다. 이를 통해 사회연결망에서 영향력을 나타내는 관계의 요소를 중심으로 관계의 시각화 과정에 있어 적합한 시각화 프로세스를 온톨로지 개념을 사용하는 시멘틱 그래프에 적용해 보았다. 영향력의 각 관계 요소는 공통적인 개념과 성격, 측정 요소를 통하여 노드와 링크의 네트워크 형태의 그래프로 형성되었다. 영향력 시멘틱 그래프는 사회연결망의 영향력 요소를 이해하고, 분석하는데 유용하게 사용될 수 있음을 확인할 수 있다. 또한 시멘틱 그래프의 적용 범위를 연결망 시각화 전반을 확장하여, 합리적이고 효율적인 시각화 프로세스의 설정이 가능함을 알 수 있다.

  • PDF

연결요소 특징을 이용한 복잡한 문서영상의 구조 분석 (A new segmentation method for non-manhattan layout document images using connected component)

  • 이상협;이경무
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1997년도 학술대회
    • /
    • pp.71-74
    • /
    • 1997
  • 본 논문은 일반적으로 제약 없는 형식 문서 즉, 논-맨하탄(non-manhattan) 형식의 이진문서영상을 분석하는 기법으로서, 연결요소기법에 기반한 특징추출과 이를 이용한 영역분리 및 분류에 관한 새로운 방법을 제안한다. 제안한 방식은 바텀-업(bottom-up)방식으로서 먼저 처리속도의 고속화와 축소시 특징 영역보존을 위해 임계치 축소기법을 사용하고, 축소된 이진 문서영상내의 각 연결된 검은 화소의 집합을 개체화하고 개체의 특성에 따라 텍스트, 신성분, 해프톤, 도형 그리고 표 등으로 분류한다. 영역분류는 두단계로 이루어지는데, 1차분류에서는 우선, B/W 비, 면적, 외각 테두리의 높이와 너비 비, 테두리선유무 등의 특징을 이용하여 해프톤, 수평 수직선, 테두리(표 및 도형)영역을 분리한다. 이후 2차 분류에서는 문자성분의 수평결합을 통한 텍스트행 성분을 추출한다. 마지막 후처리 과정으로 표분석 알고리듬을 통하여 테두리 영역중 표와 도형을 정확히 구분하고, 또한 도형에 관련한 문서성분을 해당 도형 개체에 연결하는 작업을 수행함으로써 완벽한 영역분류를 한다. 다양한 문서영상을 이용한 시뮬레이션을 통해 제안한 알고리듬의 성능을 입증한다.

  • PDF

다중성 인스턴스 추상화에 기반한 통신망 관리 시스템 설계 모델 형식론 (The Formalism of Design Model of Network Management System based on Multiplicity Instance Abstraction)

  • 박수현
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1999년도 춘계학술대회 논문집
    • /
    • pp.11-19
    • /
    • 1999
  • Farmer 모델은 시스템 개체구조(System Entity Structure)의 개념을 도입한 지식표현을 위해 사용되는 프레임 구조모델로서 다중성 추상화 개념(Multiplicity Instance Concept)은 하나의 개체를 구성하기 위하여 동일한 형태의 구성요소가 여러 번 발생하는 경우에 이의 대표적인 요소만을 표시하는 추상화 개념이다. 다중성 추상화 개념에서 정의된 대표개체는 자신의 인스턴스들을 가질수 있다. 이들 인스턴스들은 IM-컴포넌트 타입 개체노드 및 OM-컴포넌트 타입 개체노드이며 다중성 인스턴스 링크를 이용하여 대표개체와 연결된다.

  • PDF

ROCH: 워게임 모의개체 간 역할기반 협력 구현 방안 연구 (Implementation of Role-based Command Hierarchy Model for Actor Cooperation)

  • 김정윤;김희수;이상진
    • 한국시뮬레이션학회논문지
    • /
    • 제24권4호
    • /
    • pp.107-118
    • /
    • 2015
  • 군 워게임 분야에서 많은 에이전트 협력과 관련된 연구들이 제시되었고, 그러한 연구들은 주어진 목표를 달성하기 위해 존재하는 한 팀을 이루는 모의개체간 협업을 위한 기법들을 다루고 있다. 급격히 변화하는 전장을 모의하기 위해서, 실제 전장상황에서 빈발하는 임무 인계를 반영하기 위해 하나의 모의개체는 다른 개체의 역할을 인계 받을 수 있어야 하며, 이를 위해 개체는 자신의 과업과 느슨하게 연결되어 있어야 한다. 이 요건을 만족함으로써 모의상황에서 파괴된 개체가 자신의 과업을 수행하지 못할 경우 다른 개체에게 자신의 과업을 전달하는 것을 가능케 한다. 그러나 개체와 과업간의 긴밀한 연결은 긴박한 전장상황에서의 임무 승계를 반영하는 것을 저해한다. 기존의 문제점으로서, 기존의 연구 및 워게임들은 설계단계에서 과업을 개체에 엄격하게 지정함으로써 그러한 느슨한 연계를 어렵게 한다. 이 결함을 극복하기 위해 역할기반명령계층(ROCH) 모델은 실행상태에서 개체의 주변 상황에 근거하여 역할을 동적으로 할당한다. 이 모델에서 역할(Role)은 개체와 과업을 분리한다. 본 논문에서는 하나의 개체와 다른 부하 개체들 간의 역할과의 연결이 긴밀하지 않도록 출판/구독(publish/subscribe)패턴을 활용하여 ROCH 모델을 하나의 컴포넌트로 구현한다.

월동 전후 물장군(Lethocerus deyrollei: 물장군과, 노린재목) 개체군의 형태적 특징 (Morphological Characteristics between New-born and Over-wintered Populations of the Giant Water Bug (Lethocerus deyrollei: Belostomatidae, Hemiptera))

  • 김선이;윤태중;김동건;조신일;배연재
    • 한국응용곤충학회지
    • /
    • 제47권2호
    • /
    • pp.111-115
    • /
    • 2008
  • 본 실험은 월동 전후 물장군 개체군의 형태적 차이를 구명하고자 경기도 교동도에서 채집된 월동 전후 관계가 명확한 성충 개체들(월동 전후 개체군)과 실험실에서 사육으로 얻은 성충 개체들(사육개체군)을 대조군으로 이용하여 일반적인 외부형태를 비교 관찰하였다. 관찰의 결과, 월동 전후 개체군간의 외부구조에 있어서의 근본적인 차이는 발견되지 않았으나, 앞다리 밑마디의 연결 부위에 위치한 앞가슴 배면의 가장자리와 앞다리 넓적마디의 종아리마디 연결 부위는 월동 후 개체군에서 크게 마모되어 있었다. 또한 월동 전 개체군에서는 가운데 다리 발톱 길이가 2번째 발목마디의 1/2이상이었으나, 월동 후 개체군에서는 1/2미만이었다. 반날개(hemelytra)로 되어 있는 물장군 앞날개 막질부분의 가장자리는 월동 후 개체군에서 크게 찢겨 마모되었고, 날개와 마찰이 일어나는 배마디 등면 중 5번째 배마디 표면의 털의 수가 월동 후 개체군에서 현저히 감소하였다.