• 제목/요약/키워드: characteristic vectors

검색결과 113건 처리시간 0.019초

Out-of-Vocabulary 단어에 강건한 병렬 Tri-LSTM 문장 임베딩을 이용한 감정분석 (Sentiment Analysis using Robust Parallel Tri-LSTM Sentence Embedding in Out-of-Vocabulary Word)

  • 이현영;강승식
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.16-24
    • /
    • 2021
  • word2vec 등 기존의 단어 임베딩 기법은 원시 말뭉치에 출현한 단어들만을 대상으로 각 단어를 다차원 실수 벡터 공간에 고정된 길이의 벡터로 표현하기 때문에 형태론적으로 풍부한 표현체계를 가진 언어에 대한 단어 임베딩 기법에서는 말뭉치에 출현하지 않은 단어들에 대한 단어 벡터를 표현할 때 OOV(out-of-vocabulary) 문제가 빈번하게 발생한다. 문장을 구성하는 단어 벡터들로부터 문장 벡터를 구성하는 문장 임베딩의 경우에도 OOV 단어가 포함되었을 때 문장 벡터를 정교하게 구성하지 못하는 문제점이 있다. 특히, 교착어인 한국어는 어휘형태소와 문법형태소가 결합되는 형태론적 특성 때문에 미등록어의 임베딩 기법은 성능 향상의 중요한 요인이다. 본 연구에서는 단어의 형태학적인 정보를 이용하는 방식을 문장 수준으로 확장하고 OOV 단어 문제에 강건한 병렬 Tri-LSTM 문장 임베딩을 제안한다. 한국어 감정 분석 말뭉치에 대해 성능 평가를 수행한 결과 한국어 문장 임베딩을 위한 임베딩 단위는 형태소 단위보다 문자 단위가 우수한 성능을 보였으며, 병렬 양방향 Tri-LSTM 문장 인코더는 86.17%의 감정 분석 정확도를 달성하였다.

PCA 기반 변환을 통한 다해상도 피처 맵 압축 방법 (A Feature Map Compression Method for Multi-resolution Feature Map with PCA-based Transformation)

  • 박승진;이민훈;최한솔;김민섭;오승준;김연희;도지훈;정세윤;심동규
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.56-68
    • /
    • 2022
  • 본 논문에서는 VCM을 위한 다해상도 피처 맵에 대한 압축 방법을 제안한다. 제안하는 압축 방법은 PCA 기반의 변환을 통해 다해상도 피처 맵의 채널 및 해상도 계층 간 중복성을 제거하며 변환에 사용된 기저 벡터와 평균 벡터 그리고 변환을 통해 얻어진 변환 계수를 각각의 특성에 따라 VVC 기반 부호화기와 DeepCABAC을 통하여 압축한다. 제안하는 방법의 성능을 측정하기 위하여 OpenImageV6와 COCO 2017 validation set에 대하여 객체 검출 성능을 평가하며, MPEG-VCM 앵커 및 본 논문에서 제안하는 피처 맵 압축 앵커 대비 bpp와 mAP를 BD-rate 관점에서 비교한다. 실험 결과, 제안하는 방법은 OpenImageV6에서 피처 맵 압축 앵커 대비 25.71%의 BD-rate 성능 향상을 보이며, 특히 COCO 2017 validation set의 크기가 큰 객체들에 대해서 MPEG-VCM 앵커 대비 최대 43.72%의 BD-rate 성능이 향상됨을 보인다.

피부색소 흡수 스펙트럼을 이용한 카메라 RGB 신호의 피부색 성분 분석 (Analysis of Skin Color Pigments from Camera RGB Signal Using Skin Pigment Absorption Spectrum)

  • 김정엽
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권1호
    • /
    • pp.41-50
    • /
    • 2022
  • 본 논문에서는 멜라닌과 헤모글로빈 등의 피부 색상을 구성하는 주요한 요소들을 카메라의 RGB 신호로부터 직접 계산하는 방법을 제안한다. 피부 색상의 주요한 요소들은 통상적으로 특정한 장비를 이용하여 분광 반사도를 측정하고, 측정된 빛의 일부 파장에서의 값들을 중심으로 재구성하는 방법을 사용한다. 이와 같은 방법으로 산출된 값들은 멜라닌 지수, 홍반 지수와 같은 것들이 있으며, 분광반사도 측정 장치나 다중스펙트럼 카메라 등의 특수한 장비를 필요로 한다. 일반적인 디지털 카메라로부터 이와 같은 성분요소들에 대한 직접적인 계산방법은 찾아보기 어려우며, 독립성분 분석(Independent Component Analysis)을 이용하여 멜라닌과 헤모글로빈의 농도를 간접적으로 계산하는 방법은 제안되어 있다. 이 방법은 일정한 RGB 영상의 영역을 대상으로 하여, 주성분 분석(Principal Component Analysis)과 유사한 방식으로 멜라닌과 헤모글로빈의 특성벡터를 추출하고, 농도를 계산할 수 있다. 이 방법의 단점은 일정한 영역의 화소 그룹을 입력으로 이용하기 때문에 화소단위의 직접적인 계산이 어렵고, 추출된 특성벡터는 최적화 방식으로 구현하기 때문에 실행할 때마다 다른 값으로 계산되는 경향이 있다. 최종적인 계산은 특성벡터 자체를 활용하지 않고, RGB 좌표계로 다시 변환하여 멜라닌과 헤모글로빈의 성분을 나타내는 영상 형태로 결정된다. 이 방법의 단점을 개선하기 위하여 제안하는 방법은 특성벡터를 활용하여 RGB 좌표계가 아닌 특징 공간에서 멜라닌과 헤모글로빈의 성분 값을 계산하는 것과, 일반적인 디지털 카메라를 이용하여 피부색에 해당하는 분광 반사도를 계산하는 방법, 분광 반사도를 이용하여 멜라닌과 옥시헤모글로빈, 디옥시헤모글로빈, 카로티노이드 등의 피부색소를 구성하는 세부 성분들의 계산방법 등이다. 제안한 방법은 분광 반사도 측정 장치나 다중 스펙트럼 카메라 등의 특수한 장비를 필요로 하지 않으며, 기존 방법과는 달리 화소단위의 직접적인 계산이 가능하고, 반복 실행에도 동일한 특성을 얻을 수 있다. 제안한 방법은 기존에 비하여 성능의 안정성을 나타내는 표준편차가 15% 수준으로 낮게 나타나 6배 정도의 안정적인 성능을 가진 것으로 추정된다.