• Title/Summary/Keyword: 의미 분류 모델

Search Result 327, Processing Time 0.03 seconds

Text Classification using Cloze Question based on KorBERT (KorBERT 기반 빈칸채우기 문제를 이용한 텍스트 분류)

  • Heo, Jeong;Lee, Hyung-Jik;Lim, Joon-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.486-489
    • /
    • 2021
  • 본 논문에서는 KorBERT 한국어 언어모델에 기반하여 텍스트 분류문제를 빈칸채우기 문제로 변환하고 빈칸에 적합한 어휘를 예측하는 방식의 프롬프트기반 분류모델에 대해서 소개한다. [CLS] 토큰을 이용한 헤드기반 분류와 프롬프트기반 분류는 사전학습의 NSP모델과 MLM모델의 특성을 반영한 것으로, 텍스트의 의미/구조적 분석과 의미적 추론으로 구분되는 텍스트 분류 태스크에서의 성능을 비교 평가하였다. 의미/구조적 분석 실험을 위해 KLUE의 의미유사도와 토픽분류 데이터셋을 이용하였고, 의미적 추론 실험을 위해서 KLUE의 자연어추론 데이터셋을 이용하였다. 실험을 통해, MLM모델의 특성을 반영한 프롬프트기반 텍스트 분류에서는 의미유사도와 토픽분류 태스크에서 우수한 성능을 보였고, NSP모델의 특성을 반영한 헤드기반 텍스트 분류에서는 자연어추론 태스크에서 우수한 성능을 보였다.

  • PDF

A Semantic Classification Model for Educational Resource Repositories (교육용 자원 저장소를 위한 의미적 분류 모델)

  • Choi, Myoung-Hoi;Jeong, Dong-Won
    • Journal of KIISE:Databases
    • /
    • v.34 no.1
    • /
    • pp.35-45
    • /
    • 2007
  • This paper proposes a classification model for systematical management of resources in educational repositories. A classification scheme should be provided to systematically store and manage, precisely retrieve, and maximize the usability of the resources. However, there is little research result on the classification scheme and classification model for educational repository resources. It causes several issues such as inefficient management of educational resources, incorrect retrieval, and low usability. However, there are different characteristics between the educational resource information and information of the previous fields. Therefore, a novel research on the classification scheme and classification model for the resources in educational repositories is required. To achieve the goal for efficient and easy use of the educational resources, we should manage consistently the resources according to the classification scheme accepting several views. This paper proposes a classification model to systematically manage and increase the usability of the educational resources. In other words, the proposed classification model can manages dynamically the classification scheme for the resources in educational repositories according to various views. To achieve the objectives, we first define a proper classification scheme for the implementation resources based on the classification scheme in relevant scientific technology fields. Especially, we define a novel classification model to dynamically manage the defined classification scheme. The proposed classification scheme and classification model enable more precise and systematic management of implementation resources and also increase the ease of usability.

Frame-semantics and Argument Disambiguation of Korean FrameNet using Bi-directional LSTM (중첩 분할된 양방향 LSTM 기반의 한국어 프레임넷의 프레임 분류 및 논항의 의미역 분류)

  • Hahm, Younggyun;Shin, Giyeon;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.352-357
    • /
    • 2018
  • 본 논문에서는 한국어 프레임넷 분석기를 구축하기 위하여 한국어 프레임넷 데이터를 가공하여 공개하고, 한국어 프레임 분류 및 논항의 의미역 분류 문제를 해결하기 위한 방법을 제안한다. 프레임넷은 단어 단위가 아닌 단어들의 범위로 구성된 범위에 대해 어노테이션된 코퍼스라는 점에 착안하여, 어휘 및 논항의 내부 의미 정보와 외부 의미 정보, 그리고 프레임과 각 의미역들의 임베딩을 학습한 중첩 분할된 양방향 LSTM 모델을 사용하였다. 이를 통해 한국어 프레임 분류에서 72.48%, 논항의 의미역 분류에서 84.08%의 성능을 보였다. 또한 본 연구를 통해 한국어 프레임넷 데이터의 개선 방안을 논의한다.

  • PDF

A Dual Graph Data Model for the Representation of Image Information (이미지 정보를 표현하기 위한 이중 그래프 데이터 모델)

  • 박미화;엄기현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.262-264
    • /
    • 1998
  • 이미지 데이터베이스를 구성하여 사용자가 원하는 정보를 추출하는 의미 기반 검색을 지원하기 위해서는 이미지 내용에 관한 의미 정보들이 데이터 모델로 구조화되어야 한다. 본 논문에서는 다양한 정적 이미지 내용 정보들을 분류하고 그를 체계적으로 표현하기 위한 이미지 데이터 모델을 소개한다. 특히 본 이미지 데이터 모델은 그래프 이론을 이용하여 이미지내에 포함된 시각 객체들의 내용 정보를 표현하고 객체들간의 의미 관계를 정의한다. 이는 이미지 내용에 대한 정확한 정보 표현과 질의에 대한 이미지 검색 효율을 향상시킬 수 있으며 객체들간의 의미 관계를 이용한 질의와 검색을 가능하게 한다.

Methodology of Developing Train Set for BERT's Sentence Similarity Classification with Lexical Mismatch (어휘 유사 문장 판별을 위한 BERT모델의 학습자료 구축)

  • Jeong, Jaehwan;Kim, Dongjun;Lee, Woochul;Lee, Yeonsoo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.265-271
    • /
    • 2019
  • 본 논문은 어휘가 비슷한 문장들을 효과적으로 분류하는 BERT 기반 유사 문장 분류기의 학습 자료 구성 방법을 제안한다. 기존의 유사 문장 분류기는 문장의 의미와 상관 없이 각 문장에서 출현한 어휘의 유사도를 기준으로 분류하였다. 이는 학습 자료 내의 유사 문장 쌍들이 유사하지 않은 문장 쌍들보다 어휘 유사도가 높기 때문이다. 따라서, 본 논문은 어휘 유사도가 높은 유사 의미 문장 쌍들과 어휘 유사도가 높지 않은 의미 문장 쌍들을 학습 자료에 추가하여 BERT 유사 문장 분류기를 학습하여 전체 분류 성능을 크게 향상시켰다. 이는 문장의 의미를 결정짓는 단어들과 그렇지 않은 단어들을 유사 문장 분류기가 학습하였기 때문이다. 제안하는 학습 데이터 구축 방법을 기반으로 학습된 BERT 유사 문장 분류기들의 학습된 self-attention weight들을 비교 분석하여 BERT 내부에서 어떤 변화가 발생하였는지 확인하였다.

  • PDF

A Word Semantic Similarity Measure Model using Korean Open Dictionary (우리말샘 사전을 이용한 단어 의미 유사도 측정 모델 개발)

  • Kim, Hoyong;Lee, Min-Ho;Seo, Dongmin
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2018.05a
    • /
    • pp.3-4
    • /
    • 2018
  • 단어 의미 유사도 측정은 정보 검색이나 문서 분류와 같이 자연어 처리 분야 문제를 해결하는 데 큰 도움을 준다. 이러한 의미 유사도 측정 문제를 해결하기 위하여 단어의 계층 구조를 사용한 기존 연구들이 있지만 이는 단어의 의미를 고려하고 있지 않아 만족스럽지 못한 결과를 보여주고 있다. 본 논문에서는 국립국어원에서 간행한 표준국어대사전에 50만 어휘가 추가된 우리말샘 사전을 기반으로 하여 한국어 단어에 대한 계층 구조를 파악했다. 그리고 단어의 용례를 word2vec 모델에 학습하여 단어의 문맥적 의미를 파악하고, 단어의 정의문을 sent2vec 모델에 학습하여 단어의 사전적 의미를 파악했다. 또한, 구축된 계층 구조와 학습된 word2vec, sent2vec 모델을 이용하여 한국어 단어 의미 유사도를 측정하는 모델을 제안했다. 마지막으로 성능 평가를 통해 제안하는 모델이 기존 모델보다 향상된 성능을 보임을 입증했다.

  • PDF

Ontology Model based on Harmonized Commodity Description and Coding System Codes (품목분류코드 기반의 온톨로지 모델)

  • Kim, Dong Kyoo;Son, Jiseong;Baik, Doo-Kwon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.132-135
    • /
    • 2010
  • FTA(Free Trade Agreement)는 체결국들의 자유로운 물자 이동을 기반으로 무역의 활성화와 외국자본의 직접투자를 통해 경제성장을 가져오는 중요한 협정이다. 그러나 FTA 협정의 체결조건에 따라 품목별 세율 등의 정보가 달라진다. 국제통일상품분류체계(Harmonized Commodity Description and Coding System)코드도 마찬가지로 국제 공동코드 영역인 6 자리까지 동일 하나, 7 ~ 10 자리까지는 각 국가에 의해 운영관리 되어, 국가별로 품목분류 방식이 달라진다. 또한, 품목분류코드가 갱신 될 때마다 연관 정보를 사용자에게 제공하고 있다. 그러나 우리나라와 FTA 체결국간 세부품목분류 방식이 달라 품목분류방식의 의미에 따라 담당자가 한 건씩 비교하고 맵핑하여, 많은 시간과 인력이 소모된다. 따라서, 의미를 갖는 품목분류코드를 맵핑하면서 발생하는 문제들이 있다. 이를 해결하기 위해, 이 논문에서는 품목분류코드 기반의 온톨로지 모델을 제안한다.

Development of an Automatic Classification Model for Construction Site Photos with Semantic Analysis based on Korean Construction Specification (표준시방서 기반의 의미론적 분석을 반영한 건설 현장 사진 자동 분류 모델 개발)

  • Park, Min-Geon;Kim, Kyung-Hwan
    • Korean Journal of Construction Engineering and Management
    • /
    • v.25 no.3
    • /
    • pp.58-67
    • /
    • 2024
  • In the era of the fourth industrial revolution, data plays a vital role in enhancing the productivity of industries. To advance digitalization in the construction industry, which suffers from a lack of available data, this study proposes a model that classifies construction site photos by work types. Unlike traditional image classification models that solely rely on visual data, the model in this study includes semantic analysis of construction work types. This is achieved by extracting the significance of relationships between objects and work types from the standard construction specification. These relationships are then used to enhance the classification process by correlating them with objects detected in photos. This model improves the interpretability and reliability of classification results, offering convenience to field operators in photo categorization tasks. Additionally, the model's practical utility has been validated through integration into a classification program. As a result, this study is expected to contribute to the digitalization of the construction industry.

Design of Content-based Image Retrival System using Multilevel Metadata (다계층 메타데이타 기반 이미지 내용검색 시스템 설계)

  • 신용수;홍성용;나연묵
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.142-144
    • /
    • 2002
  • 대부분의 내용기반 이미지 검색 시스템은 이미지의 특징 벡터인 색상, 모양, 그리고 질감에 의해서 유사한 이미지를 검색하는 기법을 제공하고 있다. 최근 이러한 내용기반 이미지 검색 기술은 의료 영상 이미지와 같은 다양한 분야에 적용되고 있으며, 이에 따라서 의료 이미지를 분석하여 저장, 검색하기 위한 데이터베이스 시스템이 증가하고 있다. 그러나, 대량의 이미지로부터 원하는 이미지를 검색하기 위해서는 이미지의 메타데이타를 효율적으로 표현해야 하며, 의미성과 이미지의 특징 데이터를 통합적으로 저장 관리 할 수 있는 이미지 데이터베이스를 설계하고 구축해야만 한다. 본 논문에서는 기존의 내용기반 이미지 검색 기법을 살펴보고. 이미지를 내용기반으로 분류하고 저장할 수 있는 데이터베이스 시스템을 설계하여 효율적인 의미기반 검색을 지원말 수 있는 모델을 제시한다. 다계층 메타데이타 레이어 구조로 이미지에 대한 개념 지식 모델을 표현하고, 이미지내의 객체를 메타데이타로 표현하여 분류할 수 있는 모델을 제안한다. 또한, 이미지 내용검색을 지원하기 위한 시스템 구조를 설계하고, 메타데이타가 저장되기 위한 관계형 모델을 스타 스키마의 형태로 제시한다. 제안된 방법은 의미적인 이미지 내용 검색 방법의 지원에 활용될 수 있다.

  • PDF

Deep Learning Methods for Explainable Image Recognition (설명 가능한 이미지 인식을 위한 채널 주의 기반 딥러닝 방법)

  • BaiNa;Inwhee Joe
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.586-589
    • /
    • 2024
  • 본 실험 연구에서는 주의 메커니즘과 컨볼루션 신경망을 결합하여 모델을 개선하는 방법을 탐색하는 딥 러닝 기술을 소개한다. 이 기술은 지도 학습 방식을 위해 공개 데이터 세트의 쓰레기 분류 데이터를 사용하고, Grad-CAM 기술과 채널 주의 메커니즘 SE 를 적용하여 모델의 분류 의사 결정 과정을 더 잘 이해하기 위해 히트 맵을 생성한다. Grad-CAM 기술을 사용하여 히트 맵을 생성하면 분류 중에 모델이 집중하는 영역을 시각화할 수 있다. 이는 모델의 분류 결정을 설명하는 방법을 제공하여 다양한 이미지 카테고리에 대한 모델 결정의 기초를 더 잘 이해할 수 있다. 실험 결과는 전통적인 합성곱 신경망과 비교하여 제안한 방법이 쓰레기 분류 작업에서 더나은 성능을 달성한다는 것을 보여준다. 주의 메커니즘과 히트맵 해석을 결합함으로써 우리 모델은분류 정확도를 향상시킬 수 있다. 이는 실제 응용 분야의 이미지 분류 작업에 큰 의미가 있으며 해석 가능성에 대한 딥 러닝 연구 진행을 촉진하는 데 도움이 된다.