• Title/Summary/Keyword: 개체 기반

Search Result 921, Processing Time 0.027 seconds

Named Entity Tagged Corpus Augmentation Using Co-hyponym Replacement (형제어 대체를 이용한 개체명 말뭉치 확장)

  • Kim, Jae-Kyun;Kim, Chang-Hyun;Cheon, Min-Ah;Park, Hyuk-Ro;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.179-183
    • /
    • 2020
  • 말뭉치는 기계학습 및 심층학습을 위한 필수 자원이다. 한국어 개체명의 경우 학습에 사용할 잘 정제된 개체명 부착 말뭉치가 충분하지 않다. 말뭉치 정제 작업은 시간적, 경제적으로 많은 비용이 소모된다. 따라서 본 논문에서는 적은 양의 말뭉치를 이용하여 말뭉치를 자동적으로 확장하는 방법을 제안한다. 특별히 소규모 말뭉치에 속하는 문장의 단어에 대한 형제어들을 선정하여 형제어의 확률추출을 기반으로 대체함으로써 새로운 문장을 생성함으로써 말뭉치 확장하는 방법이다. 본 논문에서는 확장된 말뭉치를 이용해서 대부분의 시스템에서 성능이 향상됨을 확인할 수 있었다. 앞으로 단어의 삭제 및 삽입 등 다양한 방법으로 좀 더 다양한 문장을 생성할 수 있을 것으로 생각합니다.

  • PDF

COVID-19 Korean Fake News Detection using Named Entity and User Reproliferation Information (개체명 및 사용자 재확산 정보를 이용한 한국어 COVID-19 가짜 뉴스 검출)

  • Park, Chaewon;Kang, Jiwon;Lee, Daeun;Lee, Munyoung;Han, Jinyoung
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.85-90
    • /
    • 2021
  • 코로나바이러스감염증-19로 인한 팬데믹 상황이 지속되면서 감염증 정보의 불확실성으로 인해 코로나 관련 루머가 온라인상에서 빠르게 전파되고 있다. 이러한 코로나 관련 가짜 뉴스를 사전에 탐지하기 위해, 본 연구에서는 한국어 코로나 가짜 뉴스 데이터셋을 구축하고, 개체명과 사용자 재확산 정보를 이용한 한국어 가짜 뉴스 탐지 모델을 제안한다. 가짜 뉴스 팩트체킹 언론인 서울대팩트체크센터에서 코로나 관련 루머 및 가짜 뉴스에 대한 검증 기사를 수집한 후, 기사로부터 개체명 추출 모델을 통해 주제 키워드를 추출하고, 이를 이용해 유튜브 상의 사용자 재확산 정보를 수집하여 데이터셋을 구성하였다. BERT 기반의 제안 모델을 다양한 비교군과 비교하였고, 특성 조합에 따른 실험을 통해 각 특성 정보(기사 텍스트, 개체명 데이터, 유튜브 데이터)가 가짜 뉴스 탐지 성능에 미치는 영향을 알아보았다.

  • PDF

Korean Spatial Elements Extraction using BERT (BERT 모델을 이용한 한국어 공간 개체 추출)

  • Shin, Hyeong Jin;Yuk, Dae Bum;Lee, Jae Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.478-480
    • /
    • 2019
  • 텍스트에서 공간 정보를 추출하기 위해 그동안 통계 및 확률 기반 방법, 심층학습 방법 등이 연구되어 왔다. 본 연구에서는 최근 자연언어처리에서 우수한 성능을 보이고 있는 BERT 모델을 적용하여 공간 개체 정보를 추출한다. 공간 개체 추출은 공간 관계에 관련된 속성 추출을 함께 고려한 결합(joint) 모델로 구성하였으며, 한국어를 대상으로 BERT 기학습된 언어모델인 korBERT를 이용하였다. 실험결과, 기존의 방법들에 비해 1.9% 포인트 이상 증가한 성능을 보였다.

  • PDF

RoBERTa-catseqE: Neural keyphrase Extraction with Entity linking using RoBERTa (RoBERTa-catSeqE: 개체 연결을 이용한 RoBERTa기반 키워드 추출)

  • Lee, Jeong-Doo;Na, Seung-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.486-490
    • /
    • 2020
  • 키워드 구문 추출(Keyphrase extraction)은 각 문서에서 내용과 주제를 포괄하는 핵심 단어 또는 구문을 추출하는 것을 말한다. 이는 뉴스나 논문에서 중요한 정보를 추출하는 데 매우 중요한 역할을 한다. 본 논문에서는 기존 catSeq 모델에 한국어로 학습한 RoBERTa 언어 모델을 적용하고 개체 연결 정보를 활용해 기존 키워드 생성 디코더와 개체 연결된 단어의 키워드 여부 분류 디코더, 즉 듀얼 디코더를 사용하는 모델을 제안하고 직접 구축한 한국어 키워드 추출 데이터에 대한 각 모델의 성능을 비교한다.

  • PDF

A Study on Logical Cooperative Entity-Based Multicast Architecture Supporting Heterogeneous Group Mobility in Mobile Ad Hoc Networks (Mobile Ad Hoc 네트워크에서 이질적 그룹 이동성을 지원하는 논리적 협업 개체 기반의 멀티캐스트 구조 연구)

  • Kim, Kap-Dong;Kim, Sang-Ha
    • The KIPS Transactions:PartC
    • /
    • v.14C no.2
    • /
    • pp.171-178
    • /
    • 2007
  • In mobile ad hoc networks, an application scenario requires mostly group mobility behavior in the mix of group moving nodes and individually moving nodes. The nodes of those applications tend to belong to the movement group with similar movement behavior. Group mobility is one of the good methods to improve scalability, and reduces the protocol overhead. In this paper, we propose the multicast architecture which regards nodes that have equal group mobility in the heterogeneous group mobility network as the single entity with the multiple interfaces and composes multicast tree, The logical cooperative entity-based multicast architecture accommodates the scalability, the multicast tree simplification, and the protocol overhead reduction which arc obtained from the hierarchical multicast architecture, while it maintains the nat multicast architecture for the data transmission. It also prevents the concentration of the energy consumption dispersing data forwarding load into the several ingress/egress nodes. Results obtained through simulations show that logical cooperative entity based multicast protocol with multiple interfaces offers the protocol scalability and the efficient data transmission.

Dynamic Crowd Simulation by Emotion-based Behavioral Control of Individuals (개체의 감정기반 행동제어를 통한 동적 군중 시뮬레이션)

  • Ahn, Eun-Young;Kim, Jae-Won;Han, Sang-Hoon;Moon, Chan-Il
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.11
    • /
    • pp.1-9
    • /
    • 2009
  • In virtual environments, such as computer game and animation, we need to enhance naturalness of crowd simulation. So, we propose a method to generate dynamically moving crowd patterns by applying emotional factors to the individual characters of a crowd in the determination of their behavior. The proposed method mimics human behavior and controls each character in a group to decide its own path according to its individual status. And it is able to generate various moving patterns as a result of letting the individuals go to another group depending upon their conditions. In this paper, some temperament and feeling factors are defined and determination rules for calculating the emotional status are also proposed. Moreover we use a fuzzy theory for accurate representation of the ambiguous expressions such as feeling bad, feeling good and so on. Our experiments show that the suggested method can simulate virtual crowd in more natural and diverse ways.

Knowledge Embedding Method for Implementing a Generative Question-Answering Chat System (생성 기반 질의응답 채팅 시스템 구현을 위한 지식 임베딩 방법)

  • Kim, Sihyung;Lee, Hyeon-gu;Kim, Harksoo
    • Journal of KIISE
    • /
    • v.45 no.2
    • /
    • pp.134-140
    • /
    • 2018
  • A chat system is a computer program that understands user's miscellaneous utterances and generates appropriate responses. Sometimes a chat system needs to answer users' simple information-seeking questions. However, previous generative chat systems do not consider how to embed knowledge entities (i.e., subjects and objects in triple knowledge), essential elements for question-answering. The previous chat models have a disadvantage that they generate same responses although knowledge entities in users' utterances are changed. To alleviate this problem, we propose a knowledge entity embedding method for improving question-answering accuracies of a generative chat system. The proposed method uses a Siamese recurrent neural network for embedding knowledge entities and their synonyms. For experiments, we implemented a sequence-to-sequence model in which subjects and predicates are encoded and objects are decoded. The proposed embedding method showed 12.48% higher accuracies than the conventional embedding method based on a convolutional neural network.

Observer based consensus of nonlinear multi-agent systems (비선형 다개체 시스템의 관측기 기반의 일치)

  • Lee, Sungryul
    • Journal of IKEEE
    • /
    • v.22 no.1
    • /
    • pp.121-126
    • /
    • 2018
  • This paper addresses the consensus problem for nonlinear multi-agent systems using observer based controller. In order to solve this problem, the high gain approach is combined with the previous low gain controller. Also, it is shown that the proposed observer based controller can always guarantee the consensus of nonlinear systems with lower triangular nonlinearity.

Automatic Extraction of Ground Points from LIDAR data (라이다 데이터로부터 지표점의 자동 추출)

  • 이임평
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2004.03a
    • /
    • pp.374-379
    • /
    • 2004
  • 지표점의 추출은 DTM 생성을 위한 가장 중요한 과정이다 기존의 추출 방법은 대부분 점기반방법으로 분류될 수 있다. 점기반방법은 모든 점을 개별적으로 각각의 점이 지표를 구성하는지를 시험한다. 이 때 시험의 회수는 점의 개수와 동일하기 때문에, 특히 다량의 점을 포함한 데이터를 처리하려면 시험과 관련되어 심각한 계산량이 유발되어 시험에 보다 정교한 기준과 전략을 사용하는데 어려움이 있었다. 이로 인해 많은 연구에도 불구하고 아직 만족할만한 결과를 제공하는 방법이 개발되지 못하였다. 이에 본 연구는 시험하는 개체의 수를 줄이면서 보다 안정적인 결과를 얻을 수 있도록 점이 아닌 피쳐에 기반한 방법을 제안한다. 여기서, 피쳐란 점을 그룹핑하여 얻을 수 있는 개체를 의미한다. 제안된 방법은 먼저 점들로부터 표면패치들을 생성하고, 이어서 표면패치들로부터 표면집단들을 구성한다. 표면집단들로부터 지표를 구성하는 표면집단을 식별한 후 식별된 표면집단에 포함된 모든 점들을 지표점으로 명시한다. 제안된 방법을 항공라이다 실측데이터에 적용하여 제안된 방법의 뛰어난 성능을 실험적으로 증명하였다.

  • PDF

Competitive Co-Evolving Neural Network : Host and Parasites (기생체 숙주 이론 기반의 경쟁 공진화 신경망)

  • 박정은;박민재;오경환
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.142-144
    • /
    • 2003
  • 유전자 알고리즘을 사용하여 신경망의 가중치를 학습하는 방법은 역전파 알고리즘이 가지는 여러 가지 문제점을 해결하기 위해 제안되었으나, 유전자 알고리즘 역시 전역 탐색이 아니기 때문에 실세계의 데이터에 적용하기 어려운 가장 큰 장애 요소인 지역 최소점 문제를 완벽하게 해결할 수는 없다. 이러한 지역 최소점 문제를 완화하기 위해 본 논문에서는 기생체-숙주 공진화 현상을 기반으로 한 유전자 알고리즘을 사용한 경쟁 공진화 신경망 학습 방법을 제시하고 있다. 경쟁 공진화는 서로 다를 개체간의 경쟁적인 진화를 통해 궁극적으로 보다 적합도가 높은 개체가 생성되는 이론을 기반으로 하고 있다. 이러한 경쟁 공진화를 통한 신경망 가중치의 학습이 일반적인 유전자 알고리즘을 사용하여 신경망을 학습시키는 것보다 더욱 우수한 가중치 집단을 탐색할 수 있음을 두 종류의 기계 학습 데이터를 통해 입증하였다.

  • PDF