• 제목/요약/키워드: 벡터유사도

검색결과 733건 처리시간 0.023초

단어 임베딩 및 벡터 유사도 기반 게임 리뷰 자동 분류 시스템 개발 (Development of An Automatic Classification System for Game Reviews Based on Word Embedding and Vector Similarity)

  • 양유정;이보현;김진실;이기용
    • 한국전자거래학회지
    • /
    • 제24권2호
    • /
    • pp.1-14
    • /
    • 2019
  • 게임은 소프트웨어 특성상 출시 후 사용자들의 반응을 빠르게 파악하여 개선하는 것이 중요하다. 하지만 구글 플레이 앱 스토어 등 사용자들이 게임을 다운로드하고 리뷰를 올릴 수 있는 대부분의 사이트들은 게임 리뷰에 대한 매우 제한적이고 모호한 분류 기능만을 제공한다. 따라서 본 논문에서는 사용자들이 사이트에 올린 게임 리뷰를 보다 명확하고 운영에 유용한 주제들로 자동 분류하는 시스템을 개발한다. 본 논문에서 개발한 시스템은 리뷰에 포함된 단어들을 대표적인 단어 임베딩 모델인 word2vec을 사용하여 벡터들로 변환하고, 이 벡터들과 각 주제 간 유사도를 측정하여 해당 리뷰를 관련된 주제로 분류한다. 특히 분류 성능에 직접적인 영향을 미치는 벡터 간 유사도 측정 방법을 선택하기 위해 본 연구에서는 대표적인 벡터 간 유사도 측정 방법인 유클리디안 유사도, 코사인 유사도, 확장된 자카드 유사도의 성능을 실제 데이터를 사용하여 비교하였다. 또한 어떤 리뷰가 둘 이상의 주제에 해당하는 경우를 위해 임계값에 기반한 다중 분류 방법을 사용하였다. 구글 플레이 앱스토어의 실제 데이터를 사용한 실험 결과 본 시스템은 95%까지의 정확도를 보임을 확인하였다.

그래디언트 히스토그램을 이용한 3차원 물체 도면의 유사도 비교 (Similarity Comparison of 3D Object Drawings using Gradient Histogram)

  • 김만정;김현승;박인규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.10-12
    • /
    • 2016
  • 본 논문에서는 선 드로링 도면 간의 유사도 정도를 비교하여 도면으로 표현된 3차원 물체의 유사도 측정 알고리즘을 제안한다. 앞면, 뒷면, 좌측면, 우측면, 윗면, 아래면의 선 드로잉 영상으로 표현된 총 여섯 개의 영상을 한 물체의 대표 영상으로 이용한다. 데이터베이스의 3차원 물체 영상들은 전처리를 거친 후 각 영상의 여덟 방향의 그래디언트(gradient) 히스토그램을 측정하고 각 영상을 히스토그램의 기술자 벡터로서 표현하여 저장한다. 입력 영상 역시 같은 방식으로 기술자 벡터를 구하고 이를 비교될 영상의 기술자와 비교하여 유사도를 측정한다. 이와 같은 방식으로 가장 유사한 영상 집합을 가지는 N개의 물체를 탐색하여 시각적으로 제시한다.

  • PDF

복호화기 측의 예측을 이용한 움직임 벡터 부호화 (Motion Vector Coding using Decoder-side Estimation)

  • 원광현;양정엽;전병우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2008년도 추계학술대회
    • /
    • pp.131-134
    • /
    • 2008
  • H.264/AVC 부호화 표준은 움직임 벡터를 부호화하기 위해 인접 블록이 가지는 다수의 움직임 벡터 중에서 확률적으로 해당 움직임 벡터와 가장 유사한 중간값을 예측 움직임 벡터로 사용한다. 이러한 방법은 다수의 움직임 벡터 중에서 어떤 움직임 벡터가 예측값으로 사용되었는지에 대한 추가 정보 없이 비트량을 효과적으로 감소시킬 수 있는 장점이 있으나, 중간값을 이용한 예측 움직임 벡터는 해당 움직임 벡터를 부호화하는데 소요되는 비트량을 항상 최소로 만드는 최적 예측값이 아니라는 단점이 있다. 이러한 문제를 해결하기 위해 다수의 인접 블록이 가지는 움직임 벡터 중에서 특정 움직임 벡터가 예측값으로 사용되었는지 표현하는 정보를 복호화기에 알려주도록 하여 항상 최적의 예측 움직임 벡터를 선택함으로써 부호화 효율을 향상시킬 수 있으나, 이에 대한 추가 정보를 부호화해야 하는 문제점이 발생하게 된다. 본 논문에서는 부호화기가 부호화 효율 측면에서 가장 우수한 움직임 벡터를 예측값으로 선택하고, 이를 복호화기가 스스로 예측함으로써 인접 블록이 가지는 다수의 움직임 벡터 중에서 특정 움직임 벡터가 예측값으로 사용되었는지에 대한 정보없이 움직임 벡터 부호화에 소요되는 비트량을 효과적으로 감소시키는 움직임 벡터 부호화 방법을 제안한다. 제안한 부호화기는 율-왜곡 측면에서 가장 우수한 예측 움직임 벡터를 선택하고, 복호화기는 부호화기가 선택한 예측 움직임 벡터를 정합 기술을 사용하여 스스로 예측한다. 실험 결과는 제안 방법이 QCIF 및 CIF 영상에서 약 2.2%의 전체 비트량을 감소시킬 수 있음을 보여준다.

  • PDF

III-Conditioned 정방행렬의 단측 역행렬 산출용 유사 인공신경망 알고리듬 (A Neural-like Algorithm to Compute One-Sided Inverse of III-Conditioned Matrices)

  • 문병수;양성운;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.321-323
    • /
    • 1998
  • 이 논문에서는 크기가 큰 III-Conditioned Matrices 정방행렬의 좌측 또는 우측 역행렬 계산시 계산상의 정확도를 향상시키는 알고리듬에 대하여 기술한다. 이 알고리듬은 대상 행렬의 행벡터들을 Input으로 하고 해당 Input 벡터가 몇번째 행 벡터인지를 나타내는 단위 벡터를 Target 벡터로 하며 초기 Weight 값으로 Pivoting을 겸한 Gauss소거법을 적용하여 얻은 역행렬을 사용하는 Single Layer 인공신경망에 적용하는 역전파 알고리듬과 흡사한 것이다. 각각의 Input 행 벡터에 대하여 역행렬의 열 벡터들이 점진적으로 직교가 되거나 평행이 되도록 근접시키므로써 모든 Input 행 벡터들이 열벡터들에 비교적 균일하게 직교 또는 평행이 되도록 학습시키는 알고리듬이다.

  • PDF

Word2vec을 활용한 문서의 의미 확장 검색방법 (Semantic Extention Search for Documents Using the Word2vec)

  • 김우주;김동희;장희원
    • 한국콘텐츠학회논문지
    • /
    • 제16권10호
    • /
    • pp.687-692
    • /
    • 2016
  • 기존의 문서 검색 방법론은 TF-IDF와 같은 벡터공간모델을 활용한 키워드 기반 방법론을 사용한다. 키워드 기반의 문서검색방법론으로는 문제가 몇몇 문제점이 나타날 수 있다. 먼저 몇 개의 키워드로 전체의 의미를 나타내기 힘들 수 있다. 또 기존의 키워드 기반의 방법론을 사용하면 의미상으로 비슷하지만 모양이 다른 동의어를 사용한 문서의 경우 두 문서 간에 일치하는 단어들의 특성치만 고려하여 관련이 있는 문서를 제대로 검색하지 못하거나 그 유사도를 낮게 평가할 수 있다. 본 연구는 문서를 기반으로 한 검색방법을 제안한다. Centrality를 사용해 쿼리 문서의 특성 벡터를 구하고 Word2vec알고리즘을 사용하여 단어의 모양이 아닌 단어의 의미를 고려할 수 있는 특성 벡터를 만들어 검색 성능의 향상과 더불어 유사한 단어를 사용한 문서를 찾을 수 있다.

SURF 알고리즘을 이용한 직교식 스테레오 카메라 영상의 칼라 불균형 보정 방법 (Color balancing of the half-mirror-based stereo image by using SURF algorithm)

  • 이예홍;신형철;손광훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.133-136
    • /
    • 2011
  • 본 논문에서는 SURF 알고리즘을 이용한 직교식 스테레오 카메라 영상의 칼라 불균형 보정 방법 제안한다. 제안 방법에서는 SURF 알고리즘을 이용하여 스테레오 좌, 우 영상의 대응점을 찾은 후, 찾은 대응점들의 칼라 보정 벡터를 영상 획득 모델을 기반으로 계산한다. 영상 전체에서 다양한 칼라 대응점 정보를 추출하기 위하여 본 논문에서는 분할영상을 이용하여 칼라 대응점 정보를 추출한다. 추출된 대응점 정보는 초기 칼라 보정 벡터로 변환할 수 있으며 좌, 우 영상의 모든 픽셀에 대하여 색정보가 가장 유사한 대응점의 보정 벡터를 사용하여 칼라 불균형을 보정한다. 초기 보정 벡터를 이용한 칼라 불균형 보정 후 존재하는 노이즈을 제거하기 위하여 유사한 색공간에 위치한 칼라 보정 벡터에 가우시안 필터를 적용한다. 실험 결과로 원본 영상과 보정된 영상의 칼라 히스토그램을 비교하였으며, 분할 영역의 수에 따른 보정 결과도 비교 제시하였다. 실험 결과는 제안한 방법이 직교식 스테레오 카메라 영상에 효과적인 칼라 불균형 보정 방법임을 보여준다.

  • PDF

SOFM 벡터 양자화기와 프랙탈 혼합 시스템의 영상 왜곡특성 향상에 관한 연구 (A Study on the Enhancement of Image Distortion for the Hybrid Fractal System with SOFM Vector Quantizer)

  • 김영정;김상희;박원우
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.41-47
    • /
    • 2002
  • 프랙탈 영상압축은 원 영상블록과 가장 유사한 영역을 원영상 내에서 찾는 자기유사성에 기반한 축소변환을 이용하여 영상데이터를 압축시키는 방법이다. 프랙탈은 영상데이터를 압축하는 효율적인 방법으로 인정을 받고 있으나 상대적으로 높은 영상 왜곡률과 부호화 시간이 오래 걸리는 단점을 가지고 있다. 본 논문은 프랙탈의 영상 왜곡률 특성을 개선하기 위하여 프랙탈과 벡터양자화기를 혼합하였으며, 벡터양자화기의 클러스터링 알고리듬으로는 개선한 Self Organizing Feature Map(SOFM)을 사용하였다. 제안된 시스템의 성능평가를 위하여 일반적인 SOFM을 사용한 시스템 그리고 프랙탈을 단독으로 사용한 시스템과 비교하여 전체적인 성능 향상 정도를 확인하였다. 그 결과 개선한 경쟁학습 SOFM을 사용한 벡터양자화기와 프랙탈 혼합시스템이 일반적인 SOFM을 사용한 벡터양자화기와 프랙탈 혼합시스템보다 영상 왜곡특성이 향상된 것을 확인하였다.

  • PDF

다단계정렬을 활용한 효율적인 문서 유사도 비교법 (An effective method for comparing similarity of document with Multi-Level alignment)

  • 서종규;황혜련;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.402-405
    • /
    • 2012
  • 문서와 문서간의 유사도들 측정하는 방법 은 크게 지문법 (fingerprint)을 이용한 방법과 서열 정렬(sequence alignment)알고리즘을 이용한 방법이 있다. 두 방법은 각각 속도와 정확도라는 장점을 가지고 있다. 다단계정렬(MLA, Multi-Level alignment))는 이러한 두 방법을 조합하여 탐색 속도와 정확도 사이의 비중을 사용자가 결정할 수 있도록 하기 위한 방법이다.[1] 다단계 정렬은 두 문서를 단위 블록(basis block)로 나누고 블록 간의 벡터를 비교하여 유사도를 측정하게 되는데, 본 연구에서는 초성 추출 및 어간 추출을 통해 단위 블록의 벡터를 빠른 시 간에 생성하고 비교하는 방법과 다단계 탐색을 통해 정확도를 유지하면서 빠르게 유사도를 측정하는 방식에 대해 설명한다. 실험결과 제안 방법을 통해 다단계 정렬 방법을 이용한 대용량 문서 비교의 속도가 2 배 이상 빨라짐을 보인다.

청각 기억 게임을 위한 리듬 유사도 측정 기술 (Measurement of Rhythmic Similarity for Auditory Memory Game)

  • 김주완;이세원;박호종
    • 한국음향학회지
    • /
    • 제30권3호
    • /
    • pp.136-141
    • /
    • 2011
  • 본 논문에서는 청각 기억 게임을 위하여 두 개의 소리 파형을 비교하여 파형의 리듬 유사도를 정량적으로 측정하는 기술을 제안한다. 제안한 방법은 두 입력 파형에 대하여 에너지 변화, 에너지 피크의 지속 시간, 음색 등을 분석하여 각 파형에 포함된 비트 위치를 검출하고, 두 파형의 템포 차이와 비트 수의 차이를 보상하는 과정을 통하여 두 파형의 리듬 벡터를 각각 정의한다. 다음, 두 리듬 벡터 사이의 차이와 비트 수의 차이를 적용하여 두 입력 파형의 리듬 유사도를 정량적으로 표현하는 식을 정의한다. 제안한 방법으로 측정한 리듬 유사도와 주관적 청취 평가로 측정한 리듬 유사도를 비교하였으며, 두 방법에 의한 리듬 유사도가 상관도 0.86을 가지는 것을 확인하였다.

의료영상 이미지를 이용한 유전병변 정합 알고리즘 (Genetic lesion matching algorithm using medical image)

  • 조영복;우성희;이상호;한창수
    • 한국정보통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.960-966
    • /
    • 2017
  • 제안 논문에서는 의료영상 이미지를 입력받아 병변 추출이 가능한 알고리즘을 제안한다. 의료영상 이미지의 병변을 추출하기 위해 SIFT 알고리즘을 이용해 특징점들을 추출한다. 특징점의 강도를 높이기 위해 벡터 유사도를 이용해 입력 영상과 병변이미지를 정합하고 병변을 추출한다. 벡터 유사도 정합을 통해 빠르게 병변을 도출할 수 있다. 국소적인 특징점 쌍으로부터 방향 벡터를 생성하기 때문에 방향 자체는 국소적인 특징만을 나타내지만 두 영상 간에 존재하는 다른 벡터들 간의 유사도를 비교하고 전역적인 특징으로 확장될 수 있는 장점을 갖는다. 또한 병변 정합 오류율은 평균 1.02%, 처리속도는 특징점 강도 정보를 사용하지 않을 때보다 약 40%가 향상됨을 실험을 통해 보였다.