• Title/Summary/Keyword: Context-based Similarity

검색결과 87건 처리시간 0.026초

Empirical Comparison of Word Similarity Measures Based on Co-Occurrence, Context, and a Vector Space Model

  • Kadowaki, Natsuki;Kishida, Kazuaki
    • Journal of Information Science Theory and Practice
    • /
    • 제8권2호
    • /
    • pp.6-17
    • /
    • 2020
  • Word similarity is often measured to enhance system performance in the information retrieval field and other related areas. This paper reports on an experimental comparison of values for word similarity measures that were computed based on 50 intentionally selected words from a Reuters corpus. There were three targets, including (1) co-occurrence-based similarity measures (for which a co-occurrence frequency is counted as the number of documents or sentences), (2) context-based distributional similarity measures obtained from a latent Dirichlet allocation (LDA), nonnegative matrix factorization (NMF), and Word2Vec algorithm, and (3) similarity measures computed from the tf-idf weights of each word according to a vector space model (VSM). Here, a Pearson correlation coefficient for a pair of VSM-based similarity measures and co-occurrence-based similarity measures according to the number of documents was highest. Group-average agglomerative hierarchical clustering was also applied to similarity matrices computed by individual measures. An evaluation of the cluster sets according to an answer set revealed that VSM- and LDA-based similarity measures performed best.

상황과 정보 집적도를 고려한 유사도 기반의 맞춤형 지식 생성프레임워크 (Customized Knowledge Creation Framework using Context- and intensity-based Similarity)

  • 손미애;이현정
    • 인터넷정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.113-125
    • /
    • 2011
  • 정보의 출처와 형식이 다양해지고 정보의 양 또한 많아짐에 따라 소셜 웹에서의 맞춤형 지식 생성은 더욱 어려워지고 있다. RSS(Really Simple Syndication)가 정보 수집 방법의 개선에 일조했으나, 웹에 산재된 정보를 찾아 필요한 정보들만으로 구성된 맞춤형 지식을 생성하는 것은 여전히 사용자들의 몫으로 남아 있다. 본 논문에서는 맞춤형 지식 생성의 용이성을 제고하기 위해 상황 기반 유사도를 이용한 맞춤형 지식생성 프레임워크를 제안하였다. 본 프레임워크는 기본적으로 사례 기반추론의 절차를 따르지만, 기존 사례 기반의 유사도 계산 방식이 문법적 추론에 기반했던 것과 달리, 온톨로지를 활용한 의미적 유사도를 이용한 사례 기반 추론을 활용한다. 또한 사용자 요구를 만족하는 유사사례의 보정을 위해 온톨로지를 활용한 정보 집적도 기반의 유사도 방법론을 제안하였다. 본 프레임워크에서는 첫째 비구조적인 웹 정보를 사례 형태의 구조적 정보로 변환하고, 둘째 사용자의 요구에 적합한 의미론적 유사사례를 찾은 후 셋째, 선택된 유사사례의 정보 집적도를 고려한 보정을 통해 맞춤형 지식을 생성하는 과정을 거친다. 본 논문에서는 유사도 계산에 일반적으로 활용되는 여러 방법론들과 비교를 통하여 제안한 온톨로지 기반 의미적 유사도 계산 방법론의 타당성을 입증하였다.

Gated Recurrent Unit Architecture for Context-Aware Recommendations with improved Similarity Measures

  • Kala, K.U.;Nandhini, M.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권2호
    • /
    • pp.538-561
    • /
    • 2020
  • Recommender Systems (RecSys) have a major role in e-commerce for recommending products, which they may like for every user and thus improve their business aspects. Although many types of RecSyss are there in the research field, the state of the art RecSys has focused on finding the user similarity based on sequence (e.g. purchase history, movie-watching history) analyzing and prediction techniques like Recurrent Neural Network in Deep learning. That is RecSys has considered as a sequence prediction problem. However, evaluation of similarities among the customers is challenging while considering temporal aspects, context and multi-component ratings of the item-records in the customer sequences. For addressing this issue, we are proposing a Deep Learning based model which learns customer similarity directly from the sequence to sequence similarity as well as item to item similarity by considering all features of the item, contexts, and rating components using Dynamic Temporal Warping(DTW) distance measure for dynamic temporal matching and 2D-GRU (Two Dimensional-Gated Recurrent Unit) architecture. This will overcome the limitation of non-linearity in the time dimension while measuring the similarity, and the find patterns more accurately and speedily from temporal and spatial contexts. Experiment on the real world movie data set LDOS-CoMoDa demonstrates the efficacy and promising utility of the proposed personalized RecSys architecture.

HMM 기반의 TTS를 위한 상호유사도 비율을 이용한 결정트리 기반의 문맥 군집화 (Decision Tree Based Context Clustering with Cross Likelihood Ratio for HMM-based TTS)

  • 정치상;강홍구
    • 한국음향학회지
    • /
    • 제32권2호
    • /
    • pp.174-180
    • /
    • 2013
  • 본 논문은 HMM 기반의 TTS 시스템을 위하여 상호유사도 비율을 이용한 결정트리 기반의 문맥 군집화 알고리즘을 제안한다. 기존의 알고리즘들은 유사한 통계적 특성을 가지는 문맥종속 HMM을 하나로 묶고 있다. 그러나 기존의 알고리즘들은 결정트리의 나누어진 노드간의 통계적 유사도를 고려하지 않음으로 인하여 최종 노드 사이의 통계적인 차이를 보장하지 못한다. 제안한 알고리즘은 분리된 노드들 간의 통계적 유사도를 최소화하여 모델 파라미터의 신뢰도를 향상시킨다. 실험 결과를 통해 제안한 알고리즘이 기존의 알고리즘들에 비해 우수한 성능을 나타낸다는 것을 확인할 수 있다.

문맥가중치가 반영된 문장 유사 척도 (Context-Weighted Metrics for Example Matching)

  • 김동주;김한우
    • 전자공학회논문지CI
    • /
    • 제43권6호
    • /
    • pp.43-51
    • /
    • 2006
  • 본 논문은 영한 기계번역을 위한 예제기반 기계번역에서 예제 문장의 비교를 위한 척도에 관한 것으로 주어진 질의 문장과 가장 유사한 예제 문장을 찾아내는데 사용되는 유사성 척도를 제안한다. 제안하는 척도는 편집거리 알고리즘에 기반을 둔 것으로 표면어가 일치하지 않는 단어에 대해 기본적으로 단어의 표제어 정보와 품사 정보를 이용하여 유사도를 계산한다. 편집거리 척도는 비교 단위의 순서에 의존적이기는 하지만 순서만 일치하면 동일한 유사성 기여도를 갖는 것으로 판단하기 때문에 완전 문맥을 반영하지는 못한다. 따라서 본 논문에서는 완전 문맥 반영을 위해 추가적으로 이들 정보 외에 일치하는 단위 정보를 갖는 연속된 단어들에 대해 연속 정보를 반영한 문맥 가중치를 제안한다. 또한 비유사성 정도를 의미하는 척도인 편집거리 척도를 유사성 척도로 변경하고, 문맥 가중치가 적용된 척도를 문장 비교에 적용하기 위하여 정규화를 수행하며, 이를 통하여 유사도에 따른 순위를 결정한다. 또한 언어적 정보를 이용한 기존 방법류들에 대한 일반화를 시도하였으며, 문맥 가중치가 적용된 척도의 우수성을 증명하기 위해 일반화된 기존 방법류들과의 비교 실험을 수행하였다.

컨텍스트 기반 사용자 간 소셜 네트워크 구성 방법 (Context-based Social Network Configuration Method between Users)

  • 한종현;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.11-14
    • /
    • 2009
  • 본 논문에서는 사용자의 컨텍스트 및 프로파일을 이용하여 사용자들 간의 소셜 네트워크를 구성하는 방법을 제안한다. 최근 협업 시스템과 관련하여 소셜 네트워크에 대한 관심이 증대되고 있다. 하지만 기존 연구의 경우, 사용자 로그 및 프로파일과 같은 정적인 데이터에 기반하고 있어서 동적으로 변화하는 환경에서의 소셜 네트워크를 구성하기 어렵다. 따라서 제안된 방법은 유비쿼터스 컴퓨팅 환경에서 정적인 사용자 프로파일과 함께 사용자의 행동을 반영하는 컨텍스트를 이용하여 소셜 네트워크를 구성한다. 컨텍스트 도메인 지식 모델의 계층적 구조 특성을 이용하여 컨텍스트들 간의 유사도를 계산하고, 컨텍스트 모델의 카테고리에 가중치를 부여하여 컨텍스트들 간의 관계성을 계산한다. 제안된 방법의 유용성을 검증하기 위해 사용자의 컨텍스트 변화에 따른 소셜 네트워크의 동적 구성을 실험하였다. 제안된 방법을 활용하여 사용자들의 행동에 동적으로 반응하는 관계 분석이 가능하게 될 것으로 기대된다.

  • PDF

Systematic Elicitation of Proximity for Context Management

  • Kim Chang-Suk;Lee Sang-Yong;Son Dong-Cheul
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제6권2호
    • /
    • pp.167-172
    • /
    • 2006
  • As ubiquitous devices are fast spreading, the communication problem between humans and these devices is on the rise. The use of context is important in interactive application such as handhold and ubiquitous computing. Context is not crisp data, so it is necessary to introduce the fuzzy concept. The proxity relation is represented by the degree of closeness or similarity between data objects of a scalar domain. A context manager of context-awareness system evaluates imprecise queries with the proximity relations. in this paper, a systematic proximity elicitation method are proposed. The proposed generation method is simple and systematic. It is based on the well-known fuzzy set theory and applicable to the real world applications because it has tuning parameter and weighting factor. The proposed representations of proximity relation is more efficient than the ordinary matrix representation since it reflects some properties of a proximity relation to save space. We show an experiments of quantitative calculate for the proximity relation. And we analyze the time complexity and the space occupancy of the proposed representation method.

스마트폰 기반의 이동상황 판별을 위한 유클리디안 거리유사도의 응용 (Application of Euclidean Distance Similarity for Smartphone-Based Moving Context Determination)

  • 장영환;김병만;장성봉;신윤식
    • 한국산업정보학회논문지
    • /
    • 제19권4호
    • /
    • pp.53-63
    • /
    • 2014
  • 이동 컴퓨팅 환경에서 사용자 움직임 판별은 해결해야 할 중요한 이슈중의 하나이다. 본 논문에서는 유클리디안 거리 유사도를 이용하여 스마트폰 사용자의 움직임을 인식하고 판별하기 위한 방법을 제시한다. 제안된 방법에서는 GPS와 가속 센서를 이용하여 데이터를 수집하고, 수집된 데이터를 이용하여, 사용자의 정지, 걷기, 뛰기, 차량이동을 판별한다. 제안된 방법의 타당성과 효율성을 검증하기 위하여, 안드로이드 시스템에 유클리디안 거리 유사도의 여러 변형을 이용한 응용프로그램을 구현하여 그 정확도를 측정하였다. 실험 결과, 사용자 움직임 종류를 90% 이상의 정확도를 가지고 판별해 내었다.

A Semantic Representation Based-on Term Co-occurrence Network and Graph Kernel

  • Noh, Tae-Gil;Park, Seong-Bae;Lee, Sang-Jo
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제11권4호
    • /
    • pp.238-246
    • /
    • 2011
  • This paper proposes a new semantic representation and its associated similarity measure. The representation expresses textual context observed in a context of a certain term as a network where nodes are terms and edges are the number of cooccurrences between connected terms. To compare terms represented in networks, a graph kernel is adopted as a similarity measure. The proposed representation has two notable merits compared with previous semantic representations. First, it can process polysemous words in a better way than a vector representation. A network of a polysemous term is regarded as a combination of sub-networks that represent senses and the appropriate sub-network is identified by context before compared by the kernel. Second, the representation permits not only words but also senses or contexts to be represented directly from corresponding set of terms. The validity of the representation and its similarity measure is evaluated with two tasks: synonym test and unsupervised word sense disambiguation. The method performed well and could compete with the state-of-the-art unsupervised methods.