• Title/Summary/Keyword: 코사인유사도

Search Result 145, Processing Time 0.031 seconds

Survey on Top-k Related Pair Search Method Using Cosine Similarity (코사인 유사도 기법을 이용한 top-k 관련쌍 검색 방법 조사)

  • Kim, Sungchul;Kim, Jeong-Hwan;Kim, Na-Yeong;Kim, Taehoon;Yu, Hwanjo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.808-809
    • /
    • 2017
  • 유사도 검색은 전통적으로 데이터베이스 그리고 웹검색 분야의 핵심이었으나, 대용량 데이터의 등장으로 검색의 정확도뿐만이 아니라 효율성 측면에서의 요구가 증가하며 여전히 다양한 분야에서 활발히 연구되고 있다. 아이템간의 유사도를 측정하기 위한 방법론 중 코사인 유사도 방법론은 고차원공간에서의 활용이 유리하다는 이점 때문에 가장 널리 활용되고 있는 방법론으로, 정보검색, 장바구니 분석, 생물정보학 등 다양한 분야에서 활용되고 있다. 본 논문에서는 코사인 유사도를 소개하고, 연관성 분석 측면에서 코사인 유사도를 사용한 기존의 연구들을 소개한다.

The Lowest Price Matching Service Using Cosine Similarity Analysis (코사인 유사도 분석을 이용한 최저가 매칭 서비스)

  • Yoo, Songeun;Kang, Byungoh;Kim, Jimin;Lee, Ganghyeok;Lee, Minwoo;Koh, Seokju
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.624-629
    • /
    • 2020
  • 최근 온라인 쇼핑 시장이 커지면서 소비자들은 다양한 물건을 온라인에서 쉽게 접근하고 구매할 수 있게 되었다. 이와 함께 인터파크의 '톡집사', 네이버 쇼핑 등에서는 다양한 쇼핑몰의 가격 정보를 모아서 소비자들이 합리적인 가격에 상품을 구매할 수 있도록 도와주고 있다. 이에 본 논문에서는 이러한 가격 비교 시스템을 활용하여 판매자들을 대상으로 서비스하는 시스템을 제안한다. 문서 유사도를 비교하기 위하여 쓰이던 코사인 유사도 분석 기법을 쇼핑몰 상품명 분석에 이용할 수 있도록 한다. 실제 상품명 정보를 이용해 코사인 유사도 분석을 실행하고 코사인 유사도 분석 결괏값으로 관련성이 낮은 상품을 배제한다. 나머지 상품의 정보를 바탕으로 최저가 분석을 수행하여 적정 판매가격을 추출하여 제시한다. 따라서 제안하는 방식을 적용하여 상품 분석을 시행하면 비슷한 범주에 있는 상품들을 추출한 뒤 최적의 가격을 제시할 수 있을 것이다.

  • PDF

A Study on Integrating Similarities (유사도 통합에 관한 연구)

  • Kim, Sunkyung;Park, Ji Su;Shon, Jin Gon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.53-56
    • /
    • 2020
  • 유사도는 두 객체의 비슷한 정도를 실수로 나타낸 것이며 반대 개념인 다른 정도를 나타내는 것을 거리라 한다. 실세계에서 정확히 같은 것은 존재하기 힘들기 때문에 많은 응용 분야에서 유사도나 거리를 이용한다. 거리 중 대표적인 것으로 유클리드 공간에서 두 점 사이의 직선거리이다. 이 거리를 유클리드 거리라고 한다. 코사인 유사도는 벡터 공간에서 두 벡터 사이각의 코사인 값이다. 이외에도 용도에 따라 다양한 거리 또는 유사도가 연구되고 있다. 수학적으로 유사도는 이변수 함수로 나타낸다. 앞선 연구에서 민코프스키는 맨하탄 거리, 유클리드 거리 등을 매개변수 p를 이용하여 하나의 식으로 통합하였다. 이러한 유사도 통합은 유사도에 대한 새로운 통찰력을 제공하고 또 다른 응용을 제공한다. 본 논문은 기존 유사도의 의미를 개관하고 추가적인 매개변수를 도입하여 민코프스키 거리와 코사인 유사도를 통합한 식을 제시한다.

SNS news Recommendation by Using Cosine Similarity (코사인 유사도 기법을 이용한 뉴스 추천 시스템)

  • Kim, Simon;Kim, Hyung-Jun;Han, In-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.163-166
    • /
    • 2013
  • 사용자별로 SNS/RSS 구독 뉴스 분석을 통해 사용자가 관심이 있는 새로운 뉴스를 추천해 주는 시스템을 설계하고 구현한다. 뉴스 추천 시스템의 설계를 위해 전체 시스템에서 사용자와 서버에서의 작업을 명세하고, 이중에 주요 기능을 담당하는 부분을 구현한다. 구현된 주요 기능은 선호 문서가 들어왔을 때 특징을 추출하고 이를 저장하는 것과 새로운 문서가 들어왔을 때 선호 문서군과 얼마나 유사한지 판별하여 문서에 대한 추천 여부를 결정하는 것이다. 선호 문서의 특징 추출에 대해서는 형태소 분석을 통해 단어와 빈도를 추출하고 이를 누적하여 저장한다. 또한, 새로운 문서가 들어왔을 때 코사인 유사도를 계산하여 사용자가 선호하는 학습문서와의 유사도 비교를 통해 문서 추천 여부를 결정한다. 구현된 시스템에서 실제로 연관된 선호 문서군을 학습시키고, 연관된 새로운 문서 혹은 연관되지 않은 새로운 문서에 대한 추천 여부를 비교하는 것으로 시스템 정확도를 파악한다.

  • PDF

Sentence Similarity Analysis using Ontology Based on Cosine Similarity (코사인 유사도를 기반의 온톨로지를 이용한 문장유사도 분석)

  • Hwang, Chi-gon;Yoon, Chang-Pyo;Yun, Dai Yeol
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.441-443
    • /
    • 2021
  • Sentence or text similarity is a measure of the degree of similarity between two sentences. Techniques for measuring text similarity include Jacquard similarity, cosine similarity, Euclidean similarity, and Manhattan similarity. Currently, the cosine similarity technique is most often used, but since this is an analysis according to the occurrence or frequency of a word in a sentence, the analysis on the semantic relationship is insufficient. Therefore, we try to improve the efficiency of analysis on the similarity of sentences by giving relations between words using ontology and including semantic similarity when extracting words that are commonly included in two sentences.

  • PDF

Behavior-based Authentication Study By Measuring Cosine Similarity (코사인 유사도 측정을 통한 행위 기반 인증 연구)

  • Gil, Seon-Woong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.165-168
    • /
    • 2020
  • 사용자 행위 기반 인증 기술은 다른 인증 기술들에 비해서 인증의 인식률을 높이는데 많은 데이터의 장기간 추출이 필요하다. 본 논문은 터치 센서와 자이로스코프를 이용하여 그동안의 행위 기반 인증 연구에서 사용 되었던 행위 특정 데이터들 중에서 핵심적인 최소한의 데이터들만을 사용하였다. 측정한 데이터들의 검증에는 그간 사용자 행위 기반 인증 연구에서 이용되지 않고 문서 검색의 유사도 측정에 사용되었던 코사인 유사도를 사용하였다. 이를 통해 최소한의 특정 데이터와 기준이 되는 데이터의 코사인 유사도 비교 검증만을 통해서도 인증 범위에 적용되는 임계값을 조절하는 방식을 동해서 최초 EER 37.637%에서 최종 EER 1.897%의 높은 검증 성능을 증명하는데 성공하였다.

A Behavior-based Authentication Using the Measuring Cosine Similarity (코사인 유사도 측정을 통한 행위 기반 인증)

  • Gil, Seon-Woong;Lee, Ki-Young
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.20 no.4
    • /
    • pp.17-22
    • /
    • 2020
  • Behavior-based authentication technology, which is currently being researched a lot, requires a long extraction of a lot of data to increase the recognition rate of authentication compared to other authentication technologies. This paper uses the touch sensor and the gyroscope embedded in the smartphone in the Android environment to measure five times to the user to use only the minimum data that is essential among the behavior feature data used in the behavior-based authentication study. By requesting, a total of six behavior feature data were collected by touching the five touch screen, and the mean value was calculated from the changes in data during the next touch measurement to measure the cosine similarity between the value and the measured value. After generating the allowable range of cosine similarity by performing, we propose a user behavior based authentication method that compares the cosine similarity value of the authentication attempt data. Through this paper, we succeeded in demonstrating high performance from the first EER of 37.6% to the final EER of 1.9% by adjusting the threshold applied to the cosine similarity authentication range even in a small number of feature data and experimenter environments.

A Comparative Study of Teachers' and Students' Preference of Socio-Scientific Issues Topics (교사와 학생의 사회적-과학적 쟁점(Socio-Scientific Issues) 주제 선호도 분석)

  • Hyun Ju Park
    • Journal of Science Education
    • /
    • v.47 no.2
    • /
    • pp.180-191
    • /
    • 2023
  • The purpose of this study was to investigate the preferred SSI topics of students and teachers in elementary, middle, and high schools. It analyzed the similarity of students' and teachers' preferred SSI topics by school level using the cosine similarity measure. A total of 566 students and 327 teachers from elementary, middle, and high schools participated in the study. Sixty topics were identified and listed in the areas of environment, science and technology, health and medicine, and other social issues based on the literature and SSI programs. Students and teachers were asked to select five of their favorite topics. The data was collected online using SurveyMonkey. The collected data was divided into six groups of students and teachers, and the frequency of topic selection was analyzed within each group. The topic preference similarity was analyzed by calculating vector values based on the frequency of the selected topics and measuring the cosine similarity between students, teachers, and teachers and students by school level. The results are as follows: First, the cosine similarity of SSI Preferred Topics between students' school-level cohorts was higher between middle and high school students (0.982) than between elementary and middle school students (0.651) or between elementary and high school students (0.662). Second, the cosine similarity of SSI Preferred Topics between teachers' school-level cohorts was similar for all comparison groups between elementary, middle, and high school. Third, the SSI topic preference similarity between students and teachers by school level had a higher cosine similarity between the elementary student and teacher cohorts (0.974) than the other school level comparisons, middle school (0.621) or high school (0.645). Access to topics of interest to students in SSI education is strongly associated with motivation and persistence in learning, as well as an enjoyable learning experience and positive attitudes toward learning. Therefore, when designing SSI lessons, it is important to examine topics from the perspective of student interest, especially if the teacher has selected SSI topics that are different from students' preferences. Careful instructional design will be needed to overcome the gap.

Retrieval Effectiveness of Query Expansion depending on Term Weights (가중치에 따른 질의확장의 검색효율성)

  • 최성환
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2002.08a
    • /
    • pp.259-264
    • /
    • 2002
  • 기존의 질의확장 혹은 적합성 피드백 연구에서 코사인 정규화를 사용하여 검색성능을 향상시킨 연구들이 많다. 본 논문에서 실험한 결과를 근거로 하였을 때 이는 낮은 검색성능을 보였던 것이 검색공간의 확장으로 성능이 크게 향상되었을 가능성이 있다. 실험결과 가중치 유사도 모델간의 커다란 차이는 보이지 않고 코사인정규화 가중치 알고리즘에서 상당한 성능향상이 있었다. 그러나 기존의 코사인정규화 가중치 알고리즘을 이용한 전역적 질의확장의 경우 성능 향상률은 높으나 원질의어를 이용하여 가장 좋은 성능을 보였던 가중치 알고리즘들의 검색성능과 비교하면 오히려 낮은 성능을 보였다.

  • PDF

A Theoretical Study on the Photothermal Displacement Method for Wave Shape of Pump Beam (가열빔의 파형에 따른 광열변위법에 대한 이론적 연구)

  • 전필수
    • Journal of Energy Engineering
    • /
    • v.9 no.2
    • /
    • pp.138-145
    • /
    • 2000
  • 고체재료의 열확산계수나 열전도계수와 같은 열물성을 비접촉식 방법으로 측정하기 위하여 광열변위법에 대한 이론적인 해석을 수행하였다. 가열빔의 파형을 코사인파, 삼각파 그리고 사각파로 가정하여 2차원 열전도 방정식과 열탄성 방정식의 엄밀해를 구하였고, 이를 가열빔으로부터 직접 구한 실제파의 결과와 비교하였다. 코사인파의 결과가 다른 파형에 비하여 실제파와 가장 유사한 것으로 보아 비교적 해석이 복잡한 실제파를 코사인파로 가정하여도 무방하다.

  • PDF