• 제목/요약/키워드: 표적 마스킹

검색결과 4건 처리시간 0.019초

Deep Learning-based Target Masking Scheme for Understanding Meaning of Newly Coined Words

  • Nam, Gun-Min;Kim, Namgyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.157-165
    • /
    • 2021
  • 최근 대량의 텍스트 분석을 위해 딥 러닝(Deep Learning)을 활용하는 연구들이 활발히 수행되고 있으며, 특히 대량의 텍스트에 대한 학습 결과를 특정 도메인 텍스트의 분석에 적용하는 사전 학습 언어 모델(Pre-trained Language Model)이 주목받고 있다. 다양한 사전 학습 언어 모델 중 BERT(Bidirectional Encoder Representations from Transformers) 기반 모델이 가장 널리 활용되고 있으며, 최근에는 BERT의 MLM(Masked Language Model)을 활용한 추가 사전 학습(Further Pre-training)을 통해 분석 성능을 향상시키기 위한 방안이 모색되고 있다. 하지만 전통적인 MLM 방식은 신조어와 같이 새로운 단어가 포함된 문장의 의미를 충분히 명확하게 파악하기 어렵다는 한계를 갖는다. 이에 본 연구에서는 기존의 MLM을 보완하여 신조어에 대해서만 집중적으로 마스킹을 수행하는 신조어 표적 마스킹(NTM: Newly Coined Words Target Masking)을 새롭게 제안한다. 제안 방법론을 적용하여 포털 'N'사의 영화 리뷰 약 70만 건을 분석한 결과, 제안하는 신조어 표적 마스킹이 기존의 무작위 마스킹에 비해 감성 분석의 정확도 측면에서 우수한 성능을 보였다.

신조어의 의미 학습을 위한 딥러닝 기반 표적 마스킹 기법 (Deep Learning-based Target Masking Scheme for Understanding Meaning of Newly Coined Words)

  • 남건민;서수민;곽기영;김남규
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.391-394
    • /
    • 2021
  • 최근 딥러닝(Deep Learning)을 활용하여 텍스트로 표현된 단어나 문장의 의미를 파악하기 위한 다양한 연구가 활발하게 수행되고 있다. 하지만, 딥러닝을 통해 특정 도메인에서 사용되는 언어를 이해하기 위해서는 해당 도메인의 충분한 데이터에 대해 오랜 시간 학습이 수행되어야 한다는 어려움이 있다. 이러한 어려움을 극복하고자, 최근에는 방대한 양의 데이터에 대한 학습 결과인 사전 학습 언어 모델(Pre-trained Language Model)을 다른 도메인의 학습에 적용하는 방법이 딥러닝 연구에서 많이 사용되고 있다. 이들 접근법은 사전 학습을 통해 단어의 일반적인 의미를 학습하고, 이후에 단어가 특정 도메인에서 갖는 의미를 파악하기 위해 추가적인 학습을 진행한다. 추가 학습에는 일반적으로 대표적인 사전 학습 언어 모델인 BERT의 MLM(Masked Language Model)이 다시 사용되며, 마스크(Mask) 되지 않은 단어들의 의미로부터 마스크 된 단어의 의미를 추론하는 형태로 학습이 이루어진다. 따라서 사전 학습을 통해 의미가 파악되어 있는 단어들이 마스크 되지 않고, 신조어와 같이 의미가 알려져 있지 않은 단어들이 마스크 되는 비율이 높을수록 단어 의미의 학습이 정확하게 이루어지게 된다. 하지만 기존의 MLM은 무작위로 마스크 대상 단어를 선정하므로, 사전 학습을 통해 의미가 파악된 단어와 사전 학습에 포함되지 않아 의미 파악이 이루어지지 않은 신조어가 별도의 구분 없이 마스크에 포함된다. 따라서 본 연구에서는 사전 학습에 포함되지 않았던 신조어에 대해서만 집중적으로 마스킹(Masking)을 수행하는 방안을 제시한다. 이를 통해 신조어의 의미 학습이 더욱 정확하게 이루어질 수 있고, 궁극적으로 이러한 학습 결과를 활용한 후속 분석의 품질도 향상시킬 수 있을 것으로 기대한다. 영화 정보 제공 사이트인 N사로부터 영화 댓글 12만 건을 수집하여 실험을 수행한 결과, 제안하는 신조어 표적 마스킹(NTM: Newly Coined Words Target Masking)이 기존의 무작위 마스킹에 비해 감성 분석의 정확도 측면에서 우수한 성능을 보임을 확인하였다.

  • PDF

불균일 클러터 환경에서 다중 표적탐지 성능 향상을 위한 반복 백색화 투영 통계 기법 (Iterative Pre-Whitening Projection Statistics for Improving Multi-Target Detection Performance in Non-Homogeneous Clutter)

  • 박혁;강진환;김상효
    • 대한전자공학회논문지SP
    • /
    • 제49권4호
    • /
    • pp.120-128
    • /
    • 2012
  • 본 논문에서는 불균일한 클러터 환경에서 다중 표적탐지 성능을 향상시키기 위한 변형된 반복 백색화 투영 통계(modified iterative pre-whitening projection statistics: MIPPS) 기법을 제안하였다. MIPPS 기법은 항공기용 레이더에서 사용하는 시공간 적응 처리(space-time adaptive processing) 알고리듬의 불균일성 검출(non-homogeneity detection: NHD) 기법으로 반사신호 세기가 서로 다른 다수의 표적이 근접거리에 혼재되어 있는 환경에서 우수한 표적탐지 성능을 나타낸다. 모의실험을 통해 기존의 다양한 NHD 기법들의 성능을 분석하고, 본 논문에서 제안하는 MIPPS 기법이 강한 표적신호에 의해 야기되는 마스킹 효과(masking effect)를 최소화하면서 반사신호 세기가 약한 표적에 대한 평균 탐지 확률을 향상시킬 수 있음을 확인하였다.

제트 엔진 변조신호에서 주파수 마스킹을 이용한 표적의 특징 추출 및 식별 (Feature Extraction and Classification of Target from Jet Engine Modulation Signal Using Frequency Masking)

  • 김시호;김찬홍;채대영
    • 한국전자파학회논문지
    • /
    • 제25권4호
    • /
    • pp.459-466
    • /
    • 2014
  • 본 논문은 항공기의 JEM(Jet Engine Modulation) 신호를 분석하여 표적을 식별하는 방법에 관한 것이다. 제트 엔진의 각 단의 날개 수 정보로부터 계산된 하모닉 주파수 마스크를 이용하여 스펙트럼을 분석함으로써 엔진 기종을 식별하는 방법을 제안한다. 기존의 방법처럼 각 단의 쵸핑(chopping) 주파수를 찾기 위한 복잡한 논리적 알고리즘이나 스펙트럼 비교 방법처럼 미리 모사된 엔진 스펙트럼 DB(Database)를 필요로 하지 않으며, 엔진 DB의 날개 수 정보를 이용하여 추출한 하모닉 성분을 비교함으로써 식별이 가능하다는 장점을 가진다. 또한, 정밀 축회전속도(spool rate)를 찾는 방법을 제시함으로써 날개 수 추정이나 하모닉 주파수의 위치 계산에서 오류를 줄일 수가 있다.