• 제목/요약/키워드: Nearest-Neighbor Retrieval

검색결과 51건 처리시간 0.029초

사례기반 추론을 이용한 한글 문서분류 시스템 (A Hangul Document Classification System using Case-based Reasoning)

  • 이재식;이종운
    • Asia pacific journal of information systems
    • /
    • 제12권2호
    • /
    • pp.179-195
    • /
    • 2002
  • In this research, we developed an efficient Hangul document classification system for text mining. We mean 'efficient' by maintaining an acceptable classification performance while taking shorter computing time. In our system, given a query document, k documents are first retrieved from the document case base using the k-nearest neighbor technique, which is the main algorithm of case-based reasoning. Then, TFIDF method, which is the traditional vector model in information retrieval technique, is applied to the query document and the k retrieved documents to classify the query document. We call this procedure 'CB_TFIDF' method. The result of our research showed that the classification accuracy of CB_TFIDF was similar to that of traditional TFIDF method. However, the average time for classifying one document decreased remarkably.

ELIS : 효과적인 식물 잎 이미지 검색 시스템 (ELIS : An Effective Leaf Image Retrieval System)

  • 남윤영;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.118-120
    • /
    • 2005
  • 본 논문은 모양 특성을 이용한 효과적인 식물 잎 이미지 검색 시스템을 제시한다. 잎 이미지의 더 효과적인 표현을 위해 개선된 MPP 알고리즘을 제안하고, 매칭에 소요되는 시간을 줄이기 위해 기존의 Nearest Neighbor(NN) 검색을 수정한 동적인 매칭 알고리즘을 제시한다. 특히, 더 나은 정확율과 효율성을 위해, 잎 모양과 잎차례를 스케치하여 질의할 수 있도록 하였다. 실험에서는 제안한 알고리즘과 기존의 알고리즘인 Fourier Descriptor, Moment Invariants, MPP와 비교하였다. 1000여개의 식물 잎 이미지를 통한 실험결과는 제안한 방법이 기존의 기법보다 더 좋은 성능임을 보였다.

  • PDF

Bag-of-Feature 특징과 랜덤 포리스트를 이용한 의료영상 검색 기법 (Medical Image Retrieval using Bag-of-Feature and Random Forest Classifier)

  • 손정은;곽준영;고병철;남재열
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.601-603
    • /
    • 2012
  • 본 논문에서는 의료영상의 특성을 반영하여 영상의 그래디언트 방향 값을 특징으로 하는 Oriented Center Symmetric Local Binary Patterns (OCS-LBP) 특징을 개발하고 추출된 특징 값에 대해 차원을 줄이고 의미 있는 특징 단위로 재 생성하기 위해 Bag-of-Feature (BoF)를 적용하였다. 검색을 위해서는 기존의 영상 검색 방법과는 다르게, 학습 영상을 이용하여 랜덤 포리스트 (Random Forest)를 사전에 학습시켜 데이터베이스 영상을 N 개의 클래스로 자동 분류 시키고, 질의로 입력된 영상을 같은 방법으로 랜덤 포리스트에 적용하여 상위 확률 값을 갖는 2 개의 클래스에서만 K-nearest neighbor 방법으로 유사 영상을 검색결과로 제시하는 새로운 영상검색 방법을 제시하였다. 실험결과에서 본 논문의 우수성을 증명하기 위해 일반적인 유사성 측정 방법과 랜덤 포리스트를 이용한 방법의 검색 성능 및 시간을 비교하였고, 검색 성능과 시간 면에서 상대적으로 매우 우수한 성능을 보여줌을 증명하였다.

특징점 추출과 Brute-Force Matcher를 활용한 건물 검색 시스템 (Building Retrieval System using feature point extraction and Brute-Force Matcher)

  • 이아름;홍희림;손상민;고병철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.328-329
    • /
    • 2020
  • 처음 방문하는 도시에서 건물의 외형만을 보고 목적지를 찾는 것은 매우 어려운 일이다. 따라서 본 연구에서는 스마트폰 카메라로부터 촬영된 영상에서 특징점을 추출하고 이를 이미 데이터베이스에 저장된 영상과 매칭하는 작업을 통해 해당 건물의 이름이 무엇인지 알려주는 시스템을 개발하였다. Oriented fast and rotated brief 알고리즘을 이용하여 크기 변화, 회전 등에 강인한 특징점을 추출하였고 알고리즘과 Brute-Force Matcher와 K-Nearest Neighbor 방법을 이용하여 특징점을 매칭하였다. 제안된 시스템은 실제 스마트폰으로 촬영된 영상을 데이터베이스에 연동하여 실험한 결과 90% 이상의 정확도를 보여 주었다.

  • PDF

The Kernel Trick for Content-Based Media Retrieval in Online Social Networks

  • Cha, Guang-Ho
    • Journal of Information Processing Systems
    • /
    • 제17권5호
    • /
    • pp.1020-1033
    • /
    • 2021
  • Nowadays, online or mobile social network services (SNS) are very popular and widely spread in our society and daily lives to instantly share, disseminate, and search information. In particular, SNS such as YouTube, Flickr, Facebook, and Amazon allow users to upload billions of images or videos and also provide a number of multimedia information to users. Information retrieval in multimedia-rich SNS is very useful but challenging task. Content-based media retrieval (CBMR) is the process of obtaining the relevant image or video objects for a given query from a collection of information sources. However, CBMR suffers from the dimensionality curse due to inherent high dimensionality features of media data. This paper investigates the effectiveness of the kernel trick in CBMR, specifically, the kernel principal component analysis (KPCA) for dimensionality reduction. KPCA is a nonlinear extension of linear principal component analysis (LPCA) to discovering nonlinear embeddings using the kernel trick. The fundamental idea of KPCA is mapping the input data into a highdimensional feature space through a nonlinear kernel function and then computing the principal components on that mapped space. This paper investigates the potential of KPCA in CBMR for feature extraction or dimensionality reduction. Using the Gaussian kernel in our experiments, we compute the principal components of an image dataset in the transformed space and then we use them as new feature dimensions for the image dataset. Moreover, KPCA can be applied to other many domains including CBMR, where LPCA has been used to extract features and where the nonlinear extension would be effective. Our results from extensive experiments demonstrate that the potential of KPCA is very encouraging compared with LPCA in CBMR.

보로노이 다이어그램의 경계지점 최소거리 행렬 기반 k-최근접점 탐색 알고리즘 (k-NN Query Processing Algorithm based on the Matrix of Shortest Distances between Border-point of Voronoi Diagram)

  • 엄정호;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권1호
    • /
    • pp.105-114
    • /
    • 2009
  • 최근 사용자에게 자신과 가장 가까운 k 개의 주유소, 레스토랑, 은행 등의 POI(Point Of Interest) 정보를 추천해주는 위치 기반 서비스가 텔레매틱스, ITS(Intelligent Transport Systems), 키오스크(kiosk)등의 어플리케이션에서 필요로 하고 있다. 이를 위해, 보로노이 다이어그램 k-최근접점 탐색 알고리즘이 제안되었다. 이는 보로노이 다이어그램에서 각 POI의 네트워크의 거리를 미리 계산한 파일을 이용하여 k-최근접점 탐색을 수행한다. 그러나 이 알고리즘은 보로노이 다이어그램 확장에 따른 비용 문제를 야기한다. 따라서 본 논문에서는 보로노이 다이어그램의 경계지점마다 각각에 대하여 최소거리 행렬을 생성하는 알고리즘을 제안한다. 또한 k 개의 POI를 탐색하기 위해, 최소거리 행렬을 이용한 k-최근접점 탐색 알고리즘을 제안한다. 제안하는 알고리즘은 미리 계산된 경계 지점 간 최소거리 행렬을 통해 탐색하므로, k-최근 접점 탐색 시 보로노이 다이어그램의 확장비용을 최소화한다. 아울러 기존 연구와의 성능비교를 통해 제안하는 알고리즘이 기존 알고리즘에 비해 검색시간 측면에서 성능이 우수함을 보인다.

  • PDF

가중치 벡터합을 이용한 이동객체의 방향계산 및 미디어 검색방법 (A Direction Computation and Media Retrieval Method of Moving Object using Weighted Vector Sum)

  • 서창덕;한기태
    • 정보처리학회논문지D
    • /
    • 제15D권3호
    • /
    • pp.399-410
    • /
    • 2008
  • 본 논문은 기존 위치기반 서비스에서 최근접질의 및 한 지점에서의 방향성분을 고려한 최근접질의의 단점을 해소하고자 가중치 벡터합을 이용하는 새로운 검색방법을 제안한다. 검색반경으로 1차 필터링된 영역에서, 2차 필터링을 위해 이용자의 이동방향, 관심방향 및 검색각도를 조합한 방향정보를 이용한다. 이동방향은 일정구간내 존재하는 벡터들의 가중치 합으로 계산하며, 검색각도를 $0{\sim}360^{\circ}$까지 세분화하여 검색방향에 대한 범위를 조절 하도록 한다. 본 검색방법에 사용되는 데이터는 촬영위치가 기록된 정지영상 및 동영상, 업체나 관광지의 위치정보와 함께 소비자에게 제공되는 텍스트, 웹, 영상 등 각종 미디어 형태의 데이터가 될 수 있다. 제안하는 방법은 이동 중인 이용자가 현 위치를 기준으로 일정 반경 내에 있으면서 유사방향에 부합하는 미디어만을 검색하도록 함으로써, 이미 지났거나 혹은 관련 없는 방향의 미디어를 배제한 검색결과를 제공하기 때문에 기존의 위치만을 고려한 검색방법에 비해 보다 정확한 검색을 보장할 수 있으며, 방향성을 고려한 기존 최근접질의 에 비해서도 보다 유연하고 포괄적인 검색결과를 보장한다.

거리 기반 유사도 측정을 통한 유방 초음파 영상의 내용 기반 검색 컴퓨터 보조 진단 시스템에 관한 연구 (A Study of CBIR(Content-based Image Retrieval) Computer-aided Diagnosis System of Breast Ultrasound Images using Similarity Measures of Distance)

  • 김민정;조현종
    • 전기학회논문지
    • /
    • 제66권8호
    • /
    • pp.1272-1277
    • /
    • 2017
  • To assist radiologists for the characterization of breast masses, Computer-aided Diagnosis(CADx) system has been studied. The CADx system can improve the diagnostic accuracy of radiologists by providing objective information about breast masses. Morphological and texture features were extracted from the breast ultrasound images. Based on extracted features, the CADx system retrieves masses that are similar to a query mass from a reference library using a k-nearest neighbor (k-NN) approach. Eight similarity measures of distance, Euclidean, Chebyshev(Minkowski family), Canberra, Lorentzian($F_2$ family), Wave Hedges, Motyka(Intersection family), and Cosine, Dice(Inner Product family) are evaluated by ROC(Receiver Operating Characteristic) analysis. The Inner Product family measure used with the k-NN classifier provided slightly higher performance for classification of malignant and benign masses than those with the Minkowski, $F_2$, and Intersection family measures.

공간 네트워크에서 이동객체의 위치정보 관리를 위한 동적 분산 그리드 기법 (Dynamic Distributed Grid Scheme to Manage the Location-Information of Moving Objects in Spatial Networks)

  • 김영창;홍승태;조경진;장재우
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.948-952
    • /
    • 2009
  • 최근 공간 네트워크에서 대용량 이동객체의 위치정보를 관리하기 위한 DS-GRID(distributed S-GRID)가 제안되었다[1]. 그러나 DS-GRID는 균일 크기의 그리드 셀을 이용하기 때문에, 실제 응용에서 빈번히 발생하는 이동 객체의 쏠림 현상을 효율적으로 관리하지 못하는 단점을 지닌다. 이를 해결하기 위해, 본 논문에서는 이동객체의 밀도에 따라 그리드 셀을 동적으로 분할하는 동적 분산 그리드 기법을 제안한다. 아울러 이를 위한 k-최근접 질의처리 알고리즘을 제안한다. 마지막으로 성능 평가를 통해 이동객체의 쏠림 현상이 발생하였을 경우, 제안하는 동적 분산 그리드 기법이 검색 및 업데이트 성능 측면에서 DS-GRID 보다 우수함을 입증한다.

특성함수 및 k-최근접이웃 알고리즘을 이용한 국악기 분류 (Classification of Korean Traditional Musical Instruments Using Feature Functions and k-nearest Neighbor Algorithm)

  • 김석호;곽경섭;김재천
    • 한국멀티미디어학회논문지
    • /
    • 제9권3호
    • /
    • pp.279-286
    • /
    • 2006
  • 주파수 분포벡터를 이용한 분류방법을 국악기 분류 및 인식에 적용하였으며 분류에 사용되는 주파수 분포 벡터 중에서 리듬성분을 수치화한 평균피크값을 제안하였다. 대부분의 주파수 처리함수들은 주파수값의 평균, 통계적특성에 기반을 두고 있으며 국악기자동분류를 위해 신호의 평균, 분산, 영교차율, 균형주파수, 평균 피크값을 이용하여 실험하였다. 국악의 장르 구분을 위한 선행 연구로서 음악신호를 함수처리하고 k-최근접이웃 분류알고리즘을 적용하여 분류하였다. 기존의 주파수 분포벡터를 이용하여 발표되었던 서양음악의 분류 성공률 87%보다 향상된 94.44%의 성공률을 나타냈다.

  • PDF