• 제목/요약/키워드: similarity comparison

검색결과 749건 처리시간 0.023초

KNN-based Image Annotation by Collectively Mining Visual and Semantic Similarities

  • Ji, Qian;Zhang, Liyan;Li, Zechao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권9호
    • /
    • pp.4476-4490
    • /
    • 2017
  • The aim of image annotation is to determine labels that can accurately describe the semantic information of images. Many approaches have been proposed to automate the image annotation task while achieving good performance. However, in most cases, the semantic similarities of images are ignored. Towards this end, we propose a novel Visual-Semantic Nearest Neighbor (VS-KNN) method by collectively exploring visual and semantic similarities for image annotation. First, for each label, visual nearest neighbors of a given test image are constructed from training images associated with this label. Second, each neighboring subset is determined by mining the semantic similarity and the visual similarity. Finally, the relevance between the images and labels is determined based on maximum a posteriori estimation. Extensive experiments were conducted using three widely used image datasets. The experimental results show the effectiveness of the proposed method in comparison with state-of-the-arts methods.

A Study on Finding the Rail Space in Elevators Using Matched Filter

  • Song, Myong-Lyol
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.57-65
    • /
    • 2019
  • In this paper, we study on finding the rail space in elevators by analyzing each image captured with CCD camera. We propose a method that applies one-dimensional matched filter to the pixels of a selected search space in the vertical line at a horizontal position and decides the position with the thickness of the space being represented by a black thick line in captured images. The pattern similarity representing how strongly the associated image pixels resemble with the thick line is defined and calculated with respect to each position along the vertical line of pixels. The position and thickness of the line are decided from the point having the maximum in pattern similarity graph. In the experiments of the proposed method under different illuminational conditions, it is observed that all the pattern similarity graphs show similar shape around door area independent of the conditions and the method can effectively detect the rail space if the rails are illuminated with even weak light. The method can be used for real-time embedded systems because of its simple algorithm, in which it is implemented in simple structure of program with small amount of operations in comparison with the conventional approaches using Canny edge detection and Hough transform.

학습률 향상을 위한 딥러닝 기반 맞춤형 문제 추천 알고리즘 (Deep learning-based custom problem recommendation algorithm to improve learning rate)

  • 임민아;황승연;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.171-176
    • /
    • 2022
  • 최근 딥러닝 기술의 발전과 함께 추천 시스템의 영역도 다양해졌다. 본 논문은 학습률 향상을 위한 알고리즘을 연구하였으며 Word2Vec 모델의 성능 특징과 비교를 통해 단어에 따른 유의어 결과를 연구하였다. 문제 추천 알고리즘은 Word2Vec 모델의 특징인 텍스트 간 의미 반영 및 유사성 테스트를 통해 표현된 값으로 구현됐다. Word2Vec 의 학습 결과를 통해 텍스트 유사도 값을 이용해 문제 추천을 진행하였으며 유사도가 높은 문제를 추천할 수 있다. 실험 과정에서 정량적인 데이터양으로는 정확성이 낮아지는 결과를 보았으며 데이터 셋의 데이터양이 방대할수록 정확성을 높일 수 있음을 확인하였다.

How to quantify the similarity of 2D distributions: Comparison of spatial distribution of Dark Matter and Intracluster light

  • Yoo, Jaewon;Ko, Jongwan;Sabiu, Cristiano G.;Chun, Kyungwon;Shin, Jihye;Hwang, Ho Seong;Smith, Rory;Kim, Hyowon
    • 천문학회보
    • /
    • 제46권2호
    • /
    • pp.67.4-68
    • /
    • 2021
  • In studying the dynamical evolution of galaxy clusters, one intriguing approach is to compare the spatial distributions of various components, such as the dark matter, the member galaxies, the gas, and the intracluster light (ICL; the diffuse light from stars, which are not bound any individual cluster galaxy). If we find a visible component whose spatial distribution coincides with the dark matter distribution, then we could draw a dark matter map without requiring laborious weak lensing analysis. Furthermore, if the component traces the dark matter distribution better for more relaxed galaxy cluster, we could use the similarity as a dynamical stage estimator of the galaxy cluster. We present a novel new methodology to quantify the similarity of two or more 2-dimensional spatial distributions. We apply the method to a sample of galaxy clusters at different dynamical stages simulated within N-cluster Run, which is an N-body simulation using the galaxy replacement technique. Among the various components (stellar particles, galaxies, ICL), the velocity defined ICL+ brightest cluster galaxy (BCG) component traces the dark matter best. Between the sample galaxy clusters, the relaxed clusters show stronger similarity of the spatial distribution between the dark matter and ICL+BCG than the dynamically young clusters.

  • PDF

비교가치이론과 온라인 비교도전 광고 (Theory of Comparison Value and Online Comparison Challenge Advertising)

  • 이재원;이재규
    • 경영과학
    • /
    • 제20권2호
    • /
    • pp.197-204
    • /
    • 2003
  • Comparison challenge approach is proposed as a form of challenger-activated. just-in-time Internet advertising. To develop a framework for a comparison challenge, we propose a theory of comparison value. A comparison is regarded valuable if a comparison opportunity is available and if the comparison is relevant and informative, has an appropriate level of detail, and is advantageous and trustworthy. Based on this theory, the CompareMe and CompareThem strategies are devised, and comparable objects are classified in terms of price and performance dominance as well as the scope of proximity. The idea is demonstrated with a comparison of PCs from five leading manufacturers. To assist in the planning of the comparison challenge, a mathematical programming model was formulated to maximize the value of comparison under the constraints of the comparison opportunity and budget. The model is applied to eight scenarios in terms of the range of comparing objects. The models under various scenarios are tested and contrasted with the real-world example of PCs. We found the ad effect of comparison challenge to be substantially better than banners (4.75 times) and similarity-based comparisons (2.77 times), providing customers with better performance and reduced prices.

계산속도 및 정확도의 적응적 제어가 가능한 다단계 문서 비교 시스템 (Multi-Level Sequence Alignment : An Adaptive Control Method Between Speed and Accuracy for Document Comparison)

  • 서종규;탁해성;조환규
    • 정보과학회 논문지
    • /
    • 제41권9호
    • /
    • pp.728-743
    • /
    • 2014
  • 유사한 문서를 비교하는 방법으로는 지문법과 서열 정렬법이 널리 알려져 있다. 지문법은 계산속도가 빠른 대신 정확도가 떨어지며, 서열정렬법은 계산속도가 느린 대신 정확도가 높다. 다단계 정렬은 두 방법의 비중을 조절하여 문서 유사도를 비교할 수 있는 새로운 방법의 문서 유사도 측정 방법으로, 각 방법의 장점을 얻으면서 동시에 단점을 보완하도록 고안되었다. 특히 두 비교 방법의 비중을 "블록크기"라는 단일 변수를 이용하여 조절할 수 있도록 한 것이 제안 시스템의 핵심이다. 다단계 정렬은 문서를 일정한 길이의 블록으로 나누어 지문을 추출하고 블록간의 유사도를 계산한 다음 그 결과를 서열정렬법으로 다시 한 번 탐색하는 과정을 거친다. 이때 문서가 분할되는 과정에서 유사구간이 두 개 이상의 블록으로 나누어지는 현상이 발생하기도 한다. 이 논문에서는 다단계 정렬방법에 대해 설명하고, 유사도 비교 성능 개선을 위한 단편화 제거 기법과 휴리스틱 비교법에 대해 설명하고 실험적으로 그 결과를 보인다.

프로그램 유사도 평가를 이용한 유사 프로그램의 그룹 짓기 (Grouping of Similar Programs using Program Similarity Evaluation)

  • 유재우;김영철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권1호
    • /
    • pp.82-88
    • /
    • 2004
  • 프로그램 과제물과 같은 많은 프로그램을 모두 일일이 비교하는 것은 비용이 많이 든다. 더군다나 검수자가 과제물을 검사한다든가, 점수를 부여하고자 한다면 더욱 많은 시간이 요구된다. 물론 검수자가 많은 시간을 두고 평가해도 객관성이 떨어질 수도 있다. 이러한 문제점은 프로그램 과제물에 대해서 유사한 프로그램으로 서로 묶어 놓는다면 쉽게 해결할 수 있다. 즉, 유사한 프로그램으로 서로 묶어놓고 검사한다면 쉽게 검사나 평가가 가능하다. 본 논문에서는 많은 프로그램에 대해서 유사성이 높은 프로그램으로 그룹 짓기(grouping)를 수행하는 알고리즘을 제시하고 구현한다. 그룹 짓기 알고리즘은 (9)에서 제시한 프로그램 유사도 평가 알고리즘을 이용하여 유사도를 측정한 후, 유사성이 높은 프로그램을 그룹 짓기를 수행한다. 이 그룹 짓기 알고리즘을 이용하면 n개의 프로그램에 대해서 최대 n(n-1)/2 번에서 최소 (n-1)번까지 비교 횟수를 줄일 수가 있다. 본 논문의 실험 및 평가 부분에서는 실제로 모 대학의 과제물 10개를 추출하여 유사성을 기준으로 실험 평가한 결과를 보여준다.

태그를 이용한 웹 페이지간의 유사도 측정 방법 (Measuring Web Page Similarity using Tags)

  • 강상욱;이기용;김현규;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권2호
    • /
    • pp.104-112
    • /
    • 2010
  • 소셜 북마킹(social bookmarking)은 현재 웹에서 가장 활발한 트렌드 중의 하나이다. 소셜 북마크 시스템을 통해 사용자들은 원하는 웹 페이지에 그의 주제 또는 내용을 나타내는 태그(tag)들을 부착할 수 있다. 지금까지의 연구들은 주로 이러한 정보를 웹 검색을 향상시키는 데 사용해왔다. 본 논문에서는 웹 페이지에 부착된 태그들을 사용하여 두 웹 페이지 간의 의미적 유사도를 측정하는 방법을 제안한다.웹 페이지는 다양한 종류의 멀티미디어 데이터로 구성되어 있기 때문에, 웹 페이지 내부에 포함된 데이터를 사용하여 웹 페이지 간의 유사도를 측정하는 것은 매우 어려운 일이다. 하지만 사용자들에 의해 웹 페이지에 부착된 태그들을 사용하면 웹 페이지 간의 유사도는 매우 효과적으로 측정될 수 있다. 본 논문에서는 WSET (Web Page Similarity Based on Entire Tags)라 하는, 태그에 기반하여 웹 페이지 간의 유사도를 측정하는 새로운 방법을 제안한다. 실험 결과는 제안하는 방법이 기존 방법에 비해 더 좋은 결과를 나타냄을 보였다.

절대 유사 임계값 기반 사례기반추론과 유전자 알고리즘을 활용한 시스템 트레이딩 (System Trading using Case-based Reasoning based on Absolute Similarity Threshold and Genetic Algorithm)

  • 한현웅;안현철
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제26권3호
    • /
    • pp.63-90
    • /
    • 2017
  • Purpose This study proposes a novel system trading model using case-based reasoning (CBR) based on absolute similarity threshold. The proposed model is designed to optimize the absolute similarity threshold, feature selection, and instance selection of CBR by using genetic algorithm (GA). With these mechanisms, it enables us to yield higher returns from stock market trading. Design/Methodology/Approach The proposed CBR model uses the absolute similarity threshold varying from 0 to 1, which serves as a criterion for selecting appropriate neighbors in the nearest neighbor (NN) algorithm. Since it determines the nearest neighbors on an absolute basis, it fails to select the appropriate neighbors from time to time. In system trading, it is interpreted as the signal of 'hold'. That is, the system trading model proposed in this study makes trading decisions such as 'buy' or 'sell' only if the model produces a clear signal for stock market prediction. Also, in order to improve the prediction accuracy and the rate of return, the proposed model adopts optimal feature selection and instance selection, which are known to be very effective in enhancing the performance of CBR. To validate the usefulness of the proposed model, we applied it to the index trading of KOSPI200 from 2009 to 2016. Findings Experimental results showed that the proposed model with optimal feature or instance selection could yield higher returns compared to the benchmark as well as the various comparison models (including logistic regression, multiple discriminant analysis, artificial neural network, support vector machine, and traditional CBR). In particular, the proposed model with optimal instance selection showed the best rate of return among all the models. This implies that the application of CBR with the absolute similarity threshold as well as the optimal instance selection may be effective in system trading from the perspective of returns.

잠재의미분석을 활용한 성격검사문항의 의미표상과 요인구조의 비교 (A Comparison between Factor Structure and Semantic Representation of Personality Test Items Using Latent Semantic Analysis)

  • 박성준;박희영;김청택
    • 인지과학
    • /
    • 제30권3호
    • /
    • pp.133-156
    • /
    • 2019
  • 본 연구는 수검자가 검사 문항을 어떻게 이해했는지를 조사하기 위해 검사문항의 의미표상을 탐구하였다. 잠재의미분석을 활용하여 성격검사문항과 성격요인의 의미표상 간 유사도를 나타내는 의미유사도 행렬을 제안하였고, 이를 기존의 탐색적 요인분석 결과와 비교하였다. 이를 위해 예비 연구에서 대학생 154명을 대상으로 제한된 맥락에서 성격의 5요인을 각각 묘사하는 지문을 수집하였고, 이를 바탕으로 5차원의 축소하여 의미공간을 구성하였다. 연구 1에서는 간편형 한국어 BFI의 요인부하량 행렬과, 예비 연구에서 구성한 의미공간에서 생성한 의미유사도 행렬을 비교하여, 두 행렬이 높은 정적 상관이 있음을 보여주었다. 연구 2에서는 의미유사도를 기반으로 성격검사문항을 생성하고, 수검자의 반응을 수집하여 탐색적 요인분석을 통해 요인구조를 도출하여 두 행렬이 유사함을 보였다. 결론적으로 본 연구는 성격검사에 대한 수검자의 반응 없이 검사문항의 의미표상을 분석하여 구성타당도를 추론할 수 있는 방법을 제안하였고, 성격검사의 요인구조를 검사문항과 성격요인의 의미표상 간 유사도로 해석할 수 있음을 보여주었다. 이러한 결과는 성격검사 개발에 실용적인 도움을 줄 수 있을 것이다.