• 제목/요약/키워드: 유사도측정

검색결과 1,381건 처리시간 0.037초

사용자 유사도 기반 경로 예측 기법 (User Similarity-based Path Prediction Method)

  • 남수민;이석훈
    • 한국정보기술학회논문지
    • /
    • 제17권12호
    • /
    • pp.29-38
    • /
    • 2019
  • 라이프로그를 이용한 경로 예측 기법은 정확한 경로 예측을 위하여 많은 양의 학습 데이터를 요구하며, 학습 데이터가 부족할 경우 경로 예측 성능이 저하된다. 학습 데이터 부족은 사용자의 이동 패턴이 유사한 다른 사용자의 데이터를 이용하여 해결이 가능하다. 따라서 이 논문은 사용자 유사도 기반 경로 예측 알고리즘을 제안한다. 이를 위하여 제안 알고리즘은 경로를 3단 그리드 패턴으로 학습하고 코사인 유사도 기법을 이용하여 사용자 간 유사도를 측정한다. 이후, 측정된 유사도를 학습된 모델에 적용하여 경로를 예측한다. 평가를 위하여 기존 경로 예측 기법들과 제안 기법의 경로 예측 정확도를 측정 및 비교한다. 그 결과, 제안 기법의 정확도는 66.6%로 다른 기법들에 비해 평균 1.8% 더 높은 정확도를 가진 것으로 평가된다.

자동초록 작성시에 발생하는 유사의미 문장요소들의 통합에 관한 연구 (A Study on the Integration of Similar Sentences in Atomatic Summarizing of Document)

  • 이태영
    • 한국문헌정보학회지
    • /
    • 제34권2호
    • /
    • pp.87-115
    • /
    • 2000
  • 유사문장의 식별 및 통합을 위하여 문장의 구성성분, 품사, 절유형, 위치 등이 미치는 영향을 조사하고 유사도측정 공식과 통합방안을 모색하였다. 문법적 요인보다는 문장간에 일치하는 단어의 수가 유사성에 영향을 미치며 표제어와 기능절도 관여되었다. 문장간의 유사도 측정 공식은 설튼의 유사도 측정식과 코싸인계수를 혼합하여 사용하였다. 유사문장들의 통합에서 절들의 대체 방법을 사용하였는데 앞으로는 단어들의 대체 방법으로 전환하여야 할 것이다.

  • PDF

의미적으로 확장된 문장 간 유사도를 이용한 한국어 텍스트 자동 요약 (Korean Text Automatic Summarization using Semantically Expanded Sentence Similarity)

  • 김희찬;이수원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.841-844
    • /
    • 2014
  • 텍스트 자동 요약은 수많은 텍스트 데이터를 처리함에 있어 중요한 연구 분야이다. 이중 추출요약은 현재 가장 많이 연구가 되고 있는 자동 요약 분야이다. 본 논문은 추출 요약의 선두 연구인 TextRank는 문장 간 유사도를 계산할 때 문장 내 단어 간의 의미적 유사성을 충분히 고려하지 못하였다. 본 연구에서는 의미적 유사성을 고려한 새로운 단어 간 유사도 측정 방법을 제안한다. 추출된 문장 간 유사도는 그래프로 표현되며, TextRank의 랭킹 알고리즘과 동일한 랭킹 알고리즘을 사용하여 실험적으로 평가하였다. 그 결과 문장 간 유사성을 고려할 때 단어의 의미적 요소를 충분히 고려하여 정보의 유실을 최소화하여야 한다는 것을 실험 결과로써 확인할 수 있었다.

WWW 탐색도구의 색인 및 탐색 기능 평가에 관한 연구 (A Comparative Study of WWW Search Engine Performance)

  • 정영미;김성은
    • 한국문헌정보학회지
    • /
    • 제31권1호
    • /
    • pp.153-184
    • /
    • 1997
  • WWW 탐색도구들은 인터넷 정보자원의 탐색에 있어서 매우 중요한 역할을 하고 있다. 본 연구에서는 주요한 WWW 탐색도구들의 성능을 평가할 목적으로 먼저 각 탐색도구의 색인 데이터베이스 특성, 탐색 기능, 적합성 순위 부여 방법 등을 비교한 후, 탐색실험을 통하여 검색효율, 중복탐색의 정도, 탐색결과의 유사도 등을 측정하였다. 탐색실험 결과 탐색질문의 유형에 관계없이 Alta Vista, HotBot, Open Text Index가 비교적 좋은 검색효율을 보였으며, 대부분의 탐색도구가 질문의 유형에 따라 검색효율에 있어서 차이를 보였다. 동일한 사이트를 중복하여 탐색하는 탐색의 중복도는 Magellan, WebCrawler, Yahoo!를 제외한 나머지 탐색도구들에서 모두 높게 나타났다. 탐색결과의 유사도를 측정한 견과 대부분의 탐색도구들이 매우 낮은 유사도를 보였다.

  • PDF

컬러 특성에 의한 영상 검색 알고리즘 (A New Image Search and Retrieval System using Color Features)

  • 이효종;이도균;송명성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.695-698
    • /
    • 2000
  • 본 논문에서는 이미지 데이터 컬러 속성을 기반으로 한 영상 검색 방법을 제안한다. 두 이미지 사이의 유사성을 측정하기 위하여 컬러 히스토그램의 분포 특성을 이미지 데이터베이스 영상과질의 영상에서 계산하여 유사도를 결정하도록 설계하였다. 두 영상의 유사도를 측정하기 위해 두영상의 R, G, B 히스토그램에 대해서 같은 값에 대한 빈도 수의 차를 거리로 측정한 후, 구해진 거리의 차를 비교한 방법과 히스토그램의 분포 곡선을 이루는 방정식을 구한 수 있도록 곡선 정합을 한 후에 두 영상의 컬러 특징 속성에 관한 특징 값의 추출을 위해서 다항식 보간법에 의한 방정식을 이용한 방법을 소개한다. 공간 데이터베이스 시스템에서 질의에 대한 효율적인 처리를 위해 R-Tree와 최대 점을 이용하여 영상을 검색한다.

  • PDF

사용자 기반의 협력필터링 시스템을 위한 유사도 측정의 최적화 (Optimization of the Similarity Measure for User-based Collaborative Filtering Systems)

  • 이수정
    • 컴퓨터교육학회논문지
    • /
    • 제19권1호
    • /
    • pp.111-118
    • /
    • 2016
  • 협력 필터링 기반의 추천시스템에서 유사도 측정은 시스템의 성능에 큰 영향을 미치는데, 이는 유사한 다른 사용자들로부터 항목을 추천받기 때문이다. 본 연구에서는 전통적인 유사도 측정 방법의 가장 큰 문제인 데이터 희소성을 극복하기 위해, 기존의 유사도 측정값과 공통평가항목수의 반영값을 최적으로 결합하는 새로운 유사도 측정방식을 제안한다. 제안 방식의 성능 평가를 위해 다양한 조건으로 실험한 결과 기존 방식들보다 우수한 예측 정확도를 나타냈으며, 구체적으로 전통적인 피어슨 상관보다 최대 약 7%, 코사인 유사도보다는 최대 약 4% 향상된 결과를 보였다.

실내 실험수로에서 초음파 산란도를 활용한 부유사량 산정 (An Experimental Study on Estimation of Suspended Sediment Discharge using Acoustic Backscatter)

  • 서강현;김동수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.174-174
    • /
    • 2016
  • 하천은 침식작용과 퇴적작용에 의해 유사를 하류방향으로 이동시킨다. 하천의 침식작용은 하상을 변화시키고 교량, 보 등의 하천 구조물의 안전성을 저해하여 국민의 재산과 생명에 막대한 피해를 입힌다. 또한 퇴적작용은 상류로부터 이동한 유사를 하도 내에 퇴적시켜 하천의 형상을 변화시키고, 통수면적을 감소시켜 홍수기에 범람 빈도와 규모를 증가시킨다. 이처럼 부유사 자료는 하천 구조물의 설계, 수자원 개발 및 관리를 위한 하천계획의 전반에 있어 매우 중요한 자료이지만, 국내의 경우 유사량 측정방법에 대한 연구가 미비하여 대부분 유사량 채집기를 활용한 직접 측정이 이루어지고 있다. 하지만 유사량 채집기를 활용한 관측은 매우 제한된 지역에서 간헐적으로 실시되고 있어 측정 자료가 부족한 실정이다. 이러한 한계를 극복하고자 간접적인 측정 방식을 개발하였으나 우리나라의 강우 특성상 홍수기를 거치면서 하천의 수리학적 특성이 변화하여 관계식의 신뢰도가 떨어지며 자주 갱신해야 한다는 어려움이 있다. 본 연구에서는 횡방향 유속과 신호대잡음비(Signal to Noise Ratio, SNR)를 측정하는 H-ADCP(SonTek, SL-3000)와 레이저 회절을 이용하여 지점의 입도분포와 부유사 농도를 측정하는 레이저부유사측정기(LISST : Laser In-Situ Scattering and Transmissometry)를 이용하여 자료를 취득하였다. 그리고 취득된 신호대잡음비, 부유사 농도간의 관계분석을 통해 회귀식을 구축한 후, 초음파 산란도로 정의되는 신호대잡음비를 활용하여 실내 실험수로의 부유사량을 산정하였고 실측 부유사량과의 비교를 통해 오차 분석을 실시하였다. 오차 분석 결과 실측 부유사량은 138.15g/s, 추정 부유사량은 165.372g/s로 신호대잡음비를 이용하여 추정한 부유사량이 약 19% 과다산정 하는 것으로 나타났다. 본 연구의 결과는 현재 우리나라에 다수 설치되어 있는 수평초음파도플러유속계(H-ADCP)를 활용한 지속적인 부유사량 관측의 토대를 마련할 것으로 사료된다.

  • PDF

코사인 유사도 기법을 이용한 top-k 관련쌍 검색 방법 조사 (Survey on Top-k Related Pair Search Method Using Cosine Similarity)

  • 김성철;김정환;김나영;김태훈;유환조
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.808-809
    • /
    • 2017
  • 유사도 검색은 전통적으로 데이터베이스 그리고 웹검색 분야의 핵심이었으나, 대용량 데이터의 등장으로 검색의 정확도뿐만이 아니라 효율성 측면에서의 요구가 증가하며 여전히 다양한 분야에서 활발히 연구되고 있다. 아이템간의 유사도를 측정하기 위한 방법론 중 코사인 유사도 방법론은 고차원공간에서의 활용이 유리하다는 이점 때문에 가장 널리 활용되고 있는 방법론으로, 정보검색, 장바구니 분석, 생물정보학 등 다양한 분야에서 활용되고 있다. 본 논문에서는 코사인 유사도를 소개하고, 연관성 분석 측면에서 코사인 유사도를 사용한 기존의 연구들을 소개한다.

트리 유사도: 상호운용성 평가도구 (Tree Similarity: Interoperability Evaluation Tool)

  • 정성훈;배재학
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.276-280
    • /
    • 2017
  • 현대사회에 존재하는 다양한 시스템들이 병합될 때는 병합을 위해서 여러 가지 방법을 사용해 볼 수 있다. 이때 시스템의 성격에 따라 더 적절한 병합 방법론이 존재할 수 있지만, 어떤 방법이 해당 시스템을 통합하는데 더 적절한지를 판단하기는 쉽지 않다. 본 논문에서는 서로 다른 시스템을 통합할 때, 그 상호운용성을 평가하기 위한 수단으로 트리의 유사도를 측정하는 방안을 제시한다. 이렇게 측정된 유사도는 0이상 1이하의 값을 가지며, 정확한 수치로 제시되기 때문에 서로 다른 통합 방법론을 평가하기 위한 계량적 근거로 사용될 수 있다. 다만 트리 구조로 나타낼 수 없는 일부 시스템들에 대해서는 적용할 수 없는 한계를 가진다.

  • PDF

구도선 기반 사진 검색 시스템의 설계 및 구현 (A Design and Implementation of Photo Searching System Based on the Compositional Line)

  • 황주연;임동섭;백두원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.637-641
    • /
    • 2009
  • 본 연구에서는 선이 사용된 사진으로 구성된 DB 에서 선의 특징 값을 고려하여 구도가 유사한 사진을 검색하는 시스템을 제안한다. 검색 방법에 사용되는 구도 유사도를 측정하는 방법을 개발하기 위해 실제로 사람이 유사한 사진을 결정할 때 어떤 특징 값이 중요한 영향을 미치는지 조사하였다. 이를 바탕으로 구도 유사도를 측정하는 방법을 개발하여 검색 시스템에 적용하였다. 제안 검색 시스템의 성능을 검증하기 위해 Precision 과 Recall을 평가한다.

  • PDF