• 제목/요약/키워드: Information retrieval techniques

검색결과 274건 처리시간 0.025초

공간관계 표현 기반 RDF 메타데이터를 이용한 의미적 이미지 검색 (Semantic Image Retrieval Using RDF Metadata Based on the Representation of Spatial Relationships)

  • 황명권;공현장;김판구
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.573-580
    • /
    • 2004
  • 현대 과학 기술의 발달로 인해, 사람들은 필요한 정보들을 웹에 보관하고 관리한다. 특히, 이미지 데이터는 복잡한 데이터를 한눈에 알아보기 쉽게 표현할 수 있기 때문에 가장 많이 사용하고 있다. 또한 스캔(scan) 기술의 발달, 핸드폰 카메라와 디지털 카메라가 보편화 되면서 누구나 손쉽게 이미지를 제작하여 웹상에 게시할 수 있게 되었다. 하지만 이렇게 많은 이미지 데이터의 생성 및 제공에 반해, 웹상에 있는 이미지를 검색하는 시스템에는 극히 원시적인 방법(text-based)을 이용하고 있는 것이 추세이다. 이에 본 논문에서 우리는 ‘공간 관계 표현 기반 RBF 메타데이터를 이용한 의미적 이미지 검색’을 제안한다. 이는 이미지에 표현되어 있는 개체들 사이의 공간적인 관계의 표현을 위하여 새로운 공간관계 어휘들을 정의하고, RDF 메타데이터에 이를 의미적으로 표현함으로써, 이미지 검색에서 더욱 정확한 응답을 제공하고, 궁극적으로 의미적 이미지 검색 시스템(Semantical Image Retrieval System)을 구축하고자 한다.

정보 특성 시각화 시스템 구축 (Implementation of an Information Feature Visualization System)

  • 조윤기;하재관;구연설
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권5호
    • /
    • pp.487-495
    • /
    • 2000
  • 정보 특성 시각화는 기존의 정보 검색 기법과 시각화 기법을 통합하여 방대하고 다양한 인터넷 정보에 대한 이해도를 높임으로써 정보 검색 시 요구되는 시간과 노력을 감소시키며, 검색된 결과에 대한 통계치를 시각적으로 보여줌으로써 검색 결과 중에 정보에 관련된 동향을 파악하는데 유용하다. 전자 도서관의 예에서 볼 수 있듯이 최근 정보 시각화에 관한 관심이 증가하면서 주로 선진국을 중심으로 여러 가지 시각화 기법에 대한 연구와 이를 적용한 검색 시스템들이 개발되고 있다. 따라서 이 논문에서는 정보의 특성을 체계적이며 시각적으로 표현하기 위해, 정보 시각화의 구성 요소를 다양한 뷰를 통해 획일화하고 구조적 정보 분류 기법을 적용한 새로운 차원의 패러다임을 제시하고, 사용자가 보다 쉽게 정보를 항해하고 정보에 대한 이해도를 향상시키기 위한 검색 도구를 개발함으로써 검색 정보에 대한 사용자 이해도와 검색의 효율을 향상시켰다.

  • PDF

R-tree에서 GeoSpatial AR 응용을 위한 공간필터링 기법 (Spatial Filtering Techniques for Geospatial AR Applications in R-tree)

  • 박장유;이성호;남광우
    • Spatial Information Research
    • /
    • 제19권1호
    • /
    • pp.117-126
    • /
    • 2011
  • 최근 스마트폰 기반의 공간정보를 서비스하는 증강현실 응용들이 보편화되고 있다. 이러한 공간정보 증강현실 응용들은 현재 위치를 기반으로 공간정보를 검색하게 되며, 이 때 카메라 뷰 앵글에 보이는 공간정보가 일차적인 중요성을 갖는다. R-tree 등 현재까지 공간 데이터베이스 분야에서 제안된 공간색인들 대부분은 최소경계사각형을 이용한 검색 알고리즘을 수행한다. 이는 전통적인 지리정보시스템, 위치기반서비스들에서는 유용하지만 증강현실 응용에서 사용되는 뷰 앵글 기반의 공간질의 특성을 반영하진 못한다. 즉, 증강현실 응용에서의 공간질의는 비 단말 노드의 최소 경계 사각형과 질의 영역사이의 데드 스페이스 영역이 발생할 가능성이 높다. 제안된 알고리즘은 삼각형 노드 필터링 기법을 사용함으로서 이러한 데드 스페이스를 검색에서 배제한 공간 검색을 수행함으로써 검색의 효율성을 높였다. 이 논문에서는 제안된 알고리즘을 PostgreSQL/PostGIS 상에서 구현하였으며, 실제 POI 데이터베이스를 이용하여 실험하였다. 실험결과 제안된 알고리즘을 사용한 공간 감액이 최소 경계 사각형을 사용하는 검색 알고리즘보다 뚜렷한 성능 향상이 있었음을 확인할 수 있었다.

Content-based image retrieval using a fusion of global and local features

  • Hee Hyung Bu;Nam Chul Kim;Sung Ho Kim
    • ETRI Journal
    • /
    • 제45권3호
    • /
    • pp.505-517
    • /
    • 2023
  • Color, texture, and shape act as important information for images in human recognition. For content-based image retrieval, many studies have combined color, texture, and shape features to improve the retrieval performance. However, there have not been many powerful methods for combining all color, texture, and shape features. This study proposes a content-based image retrieval method that uses the combined local and global features of color, texture, and shape. The color features are extracted from the color autocorrelogram; the texture features are extracted from the magnitude of a complete local binary pattern and the Gabor local correlation revealing local image characteristics; and the shape features are extracted from singular value decomposition that reflects global image characteristics. In this work, an experiment is performed to compare the proposed method with those that use our partial features and some existing techniques. The results show an average precision that is 19.60% higher than those of existing methods and 9.09% higher than those of recent ones. In conclusion, our proposed method is superior over other methods in terms of retrieval performance.

문장-질의 유사성을 이용한 웹 정보 검색의 성능 향상 (Performance Improvement of Web Information Retrieval Using Sentence-Query Similarity)

  • 박의규;나동열;장명길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.406-415
    • /
    • 2005
  • 인터넷의 발전으로 웹 상에 수많은 문서 및 정보가 존재하는 상황에서 사용자가 원하는 정보를 담은 웹 문서를 검색하여 주는 웹 정보 검색 기술은 매우 중요하게 되었다. 본 논문에서는 웹 정보 검색 시스템의 성능 향상에 효과적인 몇 가지 주요한 기술을 제안하였다. 기존 시스템들은 주로 문서와 질의의 유사도를 계산하여 이를 주요 정보로 이용하였다. 그러나 본 논문에서는 여기에서 한 걸음 더 나아가 문서 안의 각 문장들이 질의와 얼마나 유사한가를 계산하여 이를 이용하는 기법을 제안하였다. 이러한 문장-질의 유사도를 성숙된 자연어 처리 기술 없이 근사적으로 계산하는 방법을 소개하였다. 그리고 이계산 작업은 문서 수의 증가에 선형적인 계산량의 증가를 가져 옴을 보임으로써 실용적인 대용량 시스템에서도 사용할 수 있음을 보였다. 그 다음으로 제안된 주요한 기술은 출력 문서의 순위화에 계층적인 개념을 도입하는 것이다. 이 기법을 사용함으로써 상당한 성능 향상을 이룰 수 있음을 보였다. 그 외에도 웹 문서의 특징인 하이퍼 링크 정보와 타이틀 정보를 이용하여 어느 정도의 성능 개선을 가져올 수 있음을 보였다. 이러한 기술들의 타당성을 입증하기 위해 대용량 웹 정보검색 시스템을 개발하고 실험하였다.

Systematic Review of Bug Report Processing Techniques to Improve Software Management Performance

  • Lee, Dong-Gun;Seo, Yeong-Seok
    • Journal of Information Processing Systems
    • /
    • 제15권4호
    • /
    • pp.967-985
    • /
    • 2019
  • Bug report processing is a key element of bug fixing in modern software maintenance. Bug reports are not processed immediately after submission and involve several processes such as bug report deduplication and bug report triage before bug fixing is initiated; however, this method of bug fixing is very inefficient because all these processes are performed manually. Software engineers have persistently highlighted the need to automate these processes, and as a result, many automation techniques have been proposed for bug report processing; however, the accuracy of the existing methods is not satisfactory. Therefore, this study focuses on surveying to improve the accuracy of existing techniques for bug report processing. Reviews of each method proposed in this study consist of a description, used techniques, experiments, and comparison results. The results of this study indicate that research in the field of bug deduplication still lacks and therefore requires numerous studies that integrate clustering and natural language processing. This study further indicates that although all studies in the field of triage are based on machine learning, results of studies on deep learning are still insufficient.

Protein Sequence Search based on N-gram Indexing

  • Hwang, Mi-Nyeong;Kim, Jin-Suk
    • Bioinformatics and Biosystems
    • /
    • 제1권1호
    • /
    • pp.46-50
    • /
    • 2006
  • According to the advancement of experimental techniques in molecular biology, genomic and protein sequence databases are increasing in size exponentially, and mean sequence lengths are also increasing. Because the sizes of these databases become larger, it is difficult to search similar sequences in biological databases with significant homologies to a query sequence. In this paper, we present the N-gram indexing method to retrieve similar sequences fast, precisely and comparably. This method regards a protein sequence as a text written in language of 20 amino acid codes, adapts N-gram tokens of fixed-length as its indexing scheme for sequence strings. After such tokens are indexed for all the sequences in the database, sequences can be searched with information retrieval algorithms. Using this new method, we have developed a protein sequence search system named as ProSeS (PROtein Sequence Search). ProSeS is a protein sequence analysis system which provides overall analysis results such as similar sequences with significant homologies, predicted subcellular locations of the query sequence, and major keywords extracted from annotations of similar sequences. We show experimentally that the N-gram indexing approach saves the retrieval time significantly, and that it is as accurate as current popular search tool BLAST.

  • PDF

마코프 논리 기반의 시맨틱 문서 검색 (Semantic Document-Retrieval Based on Markov Logic)

  • 황규백;봉성용;구현서;백은옥
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권6호
    • /
    • pp.663-667
    • /
    • 2010
  • 본 논문은 질의 문서와 의미가 유사한 문서를 검색하는 문제를 다룬다. 이 문제에 대한 기본적인 접근법은 각 문서를 bag-of-words 형태로 표현한 후, 코사인 유사도 등의 거리 기준에 기반하여 유사 문서를 판별하는 것이다. 그러나, 이처럼 문서에 출현하는 단어에만 의존하는 검색 방법은 의미적 유사성을 제대로 반영하기 어렵다는 단점을 가진다. 본 논문에서는 이러한 문제를 극복하기 위해 데이터 기반의 감독 학습(supervised learning) 기법과 관련 온톨로지 정보를 마코프 논리(Markov logic)에 기반하여 결합한다. 구체적으로, 단어들 사이에 존재하는 관계를 표현한 온톨로지와 유사도가 태깅된 문서 데이터에서 마코프 논리 망(Markov logic network)을 학습하며, 학습된 마코프 논리 망과 문서 데이터 및 새로 주어진 질의 문서에 대한 추론을 통해 질의 문서와 의미적으로 유사한 문서를 검색하는 기법을 제안한다. 제안하는 접근법은 서울시의 민원서비스 홈페이지에서 수집된 실제 민원 데이터에 적용되었으며, 적용 결과, 단순한 문서 간 거리에 기반한 유사 문서 검색 기법에 비해 월등히 높은 정확도를 보였다.

객체지향 프로토타이핑 지원을 위한 컴퍼넌트 이해 시스템 개발에 관한 연구 (A Study on Development of Component Understanding System for Object-Oriented Prototyping)

  • 김행곤;차정은
    • 한국정보처리학회논문지
    • /
    • 제4권6호
    • /
    • pp.1519-1530
    • /
    • 1997
  • 객체지향 소프트웨어의 재사용은 사용자 관점에서 사고하도록 함으로써 기술 분업화를 가능하게 하고, 확장성과 재사용성 측면에서 개발 환경과 사용의 편리성에 대한 요구를 가장 근접하게 해결할 수 있다. 재사용의 현실화는 편리한 재사용 시스템, 특히 사용자 지향적인 검색 시스템의 제공으로 가능하다. 따라서 본 논문에서는 재사용 시스템 사용자들이 편리하고 정확하게 원하는 재사용 컴퍼넌트를 검색하고 수정하며 사용자의 관점에서 새롭게 조립할 수 있는 다중 템플리트 뷰(Multiple-Template Views : MT-Views)를 개발하였다. MT-Views는 혼합형 검색 방법에 따른 유사성 평가를 사용하여 재검색의 정보를 제공하므로써 검색의 효율성을 기하며 미숙한 사용자에 대한 편의와 검색된 부품의 이해를 위한 충분한 정보를 제공한다.

  • PDF

Pruning and Matching Scheme for Rotation Invariant Leaf Image Retrieval

  • Tak, Yoon-Sik;Hwang, Een-Jun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제2권6호
    • /
    • pp.280-298
    • /
    • 2008
  • For efficient content-based image retrieval, diverse visual features such as color, texture, and shape have been widely used. In the case of leaf images, further improvement can be achieved based on the following observations. Most plants have unique shape of leaves that consist of one or more blades. Hence, blade-based matching can be more efficient than whole shape-based matching since the number and shape of blades are very effective to filtering out dissimilar leaves. Guaranteeing rotational invariance is critical for matching accuracy. In this paper, we propose a new shape representation, indexing and matching scheme for leaf image retrieval. For leaf shape representation, we generated a distance curve that is a sequence of distances between the leaf’s center and all the contour points. For matching, we developed a blade-based matching algorithm called rotation invariant - partial dynamic time warping (RI-PDTW). To speed up the matching, we suggest two additional techniques: i) priority queue-based pruning of unnecessary blade sequences for rotational invariance, and ii) lower bound-based pruning of unnecessary partial dynamic time warping (PDTW) calculations. We implemented a prototype system on the GEMINI framework [1][2]. Using experimental results, we showed that our scheme achieves excellent performance compared to competitive schemes.