• 제목/요약/키워드: Semantic retrieval

검색결과 397건 처리시간 0.024초

이미지 데이터베이스 유사도 순위 매김 알고리즘 (A Similarity Ranking Algorithm for Image Databases)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권5호
    • /
    • pp.366-373
    • /
    • 2009
  • 이 논문은 이미지 데이터베이스를 위한 유사도 순위 매김 알고리즘을 제시한다. 이미지 검색의 문제점 중 하나가 이미지로부터 자동적으로 계산한 하위 레벨 특성과 인간 지각과의 의미 차이이며, 검색시에 이미지 유사도 측정을 위해 많은 알고리즘에서는 민코프스키 측정법($L_p$-norm)을 사용하고 있다. 그러나 민코프스키 측정법은 인간 시각 시스템의 비선형적 특성과 문맥 정보를 반영하지 못한다. 본 알고리즘에서는 인간 지각의 비선형성과 문맥 정보를 반영하는 유사도와 탐색 알고리즘을 통해 이 문제를 해결한다. 본 알고리즘을 필기체 숫자 이미지 데이터베이스에 적용하여 성능의 우수성과 효과를 증명하였다.

연관색인법(聯關索引法)의 이론(理論)과 실제(實際) (Relational indexing: theory and practice)

  • 김태수
    • 정보관리학회지
    • /
    • 제1권1호
    • /
    • pp.25-42
    • /
    • 1984
  • 정보(情報)의 축적(蓄積)과 검색(檢索)을 위한 개념(槪念) 조직과정(組織過程)에서는 개념(槪念) 뿐만 아니라 이들 개념간(槪念間)의 상관관계(相關關係)가 명확히 표현되어야 하며 이를 위해서는 인간(人間)의 사고과정(思考科程)에 기초해야 한다. 연관색인법(聯關索引法)에서는 9개의 연관기호(聯關記號)를 통하여 문신 중에서 각 개념간의 관계표현이 가능하며 이들 개념을 순열(順列)시키므로써 주제색인(主題索引)으로서의 기능을 수행할 수 있으며 기존의 색인(索引)시스템에 비해 검색효율의 개선(改善)을 초래할 수 있을 것이다.

  • PDF

계층적으로 구조화된 이러닝 시스템을 위한 질의 처리 기법 (A Query Processing Method for Hierarchical Structured e-Learning System)

  • 김연희;김지현
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.189-201
    • /
    • 2011
  • 본 논문에서는 대표적인 학습 객체 메타데이터 형식들을 통합하여 상호운용성을 제공하면서 대학 강좌를 위한 학습 객체의 메타데이터를 기술할 때 사용되는 개념과 개념들 간의 의미적 관계를 정의하는 온톨로지를 설계한다. 그리고 서로 다른 형식을 이용해 학습 객체의 메타데이터를 기술하는 여러 지역 저장소에 대해 효율적인 학습 객체 검색이 가능하도록 계층적으로 구조화된 이러닝 시스템을 구성하고 추론에 기반한 질의 처리 기법을 제안한다. 본 논문에서 제안한 계층적으로 구조화된 이러닝 시스템에서 학습 객체 온톨로지를 이용한 질의 처리 기법을 적용하면 사용자 질의에 직접적으로 관련이 있는 학습 객체와 함께 의미적 연관성이 추론된 학습 객체도 검색되어 보다 정확하고 만족도 높은 검색 서비스를 제공할 수 있다.

장면전환검출을 이용한 교양비디오 개요 검색 시스템 (The Abstraction Retrieval System of Cultural Videos using Scene Change Detection)

  • 강오형;이지현;이양원
    • 정보처리학회논문지B
    • /
    • 제12B권7호
    • /
    • pp.761-766
    • /
    • 2005
  • 본 논문에서는 교양 비디오 데이터베이스 시스템을 구축하기 위한 비디오 모델을 제안한다. 먼저, 교양 비디오의 효율적인 색인화와 검색을 위하여 교양 비디오를 의미 있는 단위로 분할하는 효율적인 장면 전환 검출 기법을 사용하였다 비디오가 대용량이며 장시간의 재생이 필요하다는 특징 때문에 전체 비디오를 시청해야하는 문제점이 있다. 이 문제점을 해결하기 위해 교양 비디오의 개요를 추출하여 시청자들에게 시간을 절약할 수 있고, 비디오 선택의 폭을 넓히도록 하였다. 비디오 개요는 개요 생성 규칙을 설정하여 중요 이벤트가 발생한 장면들을 요약한 형태이다.

TAKES: Two-step Approach for Knowledge Extraction in Biomedical Digital Libraries

  • Song, Min
    • Journal of Information Science Theory and Practice
    • /
    • 제2권1호
    • /
    • pp.6-21
    • /
    • 2014
  • This paper proposes a novel knowledge extraction system, TAKES (Two-step Approach for Knowledge Extraction System), which integrates advanced techniques from Information Retrieval (IR), Information Extraction (IE), and Natural Language Processing (NLP). In particular, TAKES adopts a novel keyphrase extraction-based query expansion technique to collect promising documents. It also uses a Conditional Random Field-based machine learning technique to extract important biological entities and relations. TAKES is applied to biological knowledge extraction, particularly retrieving promising documents that contain Protein-Protein Interaction (PPI) and extracting PPI pairs. TAKES consists of two major components: DocSpotter, which is used to query and retrieve promising documents for extraction, and a Conditional Random Field (CRF)-based entity extraction component known as FCRF. The present paper investigated research problems addressing the issues with a knowledge extraction system and conducted a series of experiments to test our hypotheses. The findings from the experiments are as follows: First, the author verified, using three different test collections to measure the performance of our query expansion technique, that DocSpotter is robust and highly accurate when compared to Okapi BM25 and SLIPPER. Second, the author verified that our relation extraction algorithm, FCRF, is highly accurate in terms of F-Measure compared to four other competitive extraction algorithms: Support Vector Machine, Maximum Entropy, Single POS HMM, and Rapier.

OPAC에 있어서 키워드/불연산자 탐색에 대한 이용자 지식수준 연구 (Knowledge Level of Users of Keyword/Boolean Searching on an Online Public Access Catalog : SELIS)

  • 구본영
    • 한국문헌정보학회지
    • /
    • 제32권4호
    • /
    • pp.249-274
    • /
    • 1998
  • SELIS(SEoul Women's University Library and Information System) OPAC에 대한 이용자의 키워드/불연산자 탐색의 지식수준을 알아보기 위하여 4가지 사항에 따라 질문지의 결과를 분석하였다. 분석한 결과를 보면 SELIS OPAC 이용시 키워드 탐색에서 불연산자의 사용이 쉽다고 생각하고 불연산자의 사용으로 검색결과를 만족하는 이용자는 그렇지 않다고 응답한 이용자 보다 키워드/불연산 탐색의 지식수준이 높은 것으로 요약할 수 있다. 설문문항에서 제시한 지식은 키워드 탐색의 특성(단일 키워드 사용, 2개 이상의 키워드 사용), 키워드 탐색 시 불연산자의 사용, 색인에 대한 지식, 불용어 리스트에 대한 지식(비통제 용어) 키워드 탐색기법(전방일치, 우측절단). 불연산자의 올바른 사용, 키워드의 브라우징으로 주제어 선정에 관한 것이다. 앞에서 제시한 이러한 지식들은 OPAC의 키워드/불연산자 탐색에서 중요한 요소로 볼 수 있다. 성공적인 탐색을 위해서는 정보검색과정에 대한 개념적인 지식 즉, 정보요구를 탐색 가능한 질의어로 바꾸는 것과 주어진 시스템에서 질문의 결과를 얻는 방법에 대한 어의적인 지식(시스템의 특징을 어떻게 언제 이용할 것인가 하는 지식) 그리고 이용자의 질문에 대한 과학적인 기술 즉, 기본적인 컴퓨터 기술과 상세한 탐색문을 작성하는 구문론적인 지식이 요구된다. 그러나 지금까지 이용자에 대한 온라인목록 탐색의 중요한 지식으로 간주해온 것은 과학적인 기술방법에 관한 지식에만 치중하고 어의적인 지식, 개념적인 지식을 강조하는 것은 부족하였다. 따라서 온라인목록 이용에 관한 교육을 너무 과학적인 기법에만 치중할 것이 아니라 어의적 지식, 구문에 관한 기술과 개념적인 지식 교육에 초점을 맞추어야 할 것이다.

  • PDF

코퍼스를 이용한 상하위어 추출 연구 (A Study of the Automatic Extraction of Hypernyms arid Hyponyms from the Corpus)

  • 방찬성;이해윤
    • 인지과학
    • /
    • 제19권2호
    • /
    • pp.143-161
    • /
    • 2008
  • 본 논문에서는 코퍼스를 이용하여 어휘들의 상하위 관계 패턴들을 추출하는 방법을 제안한다. 기존 연구들에서는 어순 교체가 자유로운 한국어의 특성으로 인해 주로 사전의 정의문을 이용하여 어휘들의 의미관계 패턴들을 추출하는 방법을 취하고 있으나, 본 논문에서는 코퍼스를 이용하여 보다 다양한 의미관계 패턴들을 추출하여 제시하고자 한다. 이를 위해 먼저 기존의 사전들을 이용해 상하위어 쌍들의 목록을 선정하였다. 다음 이 목록의 어휘 쌍들을 포함하는 문장들을 코퍼스에서 추출한 이후, 이로부터 다시 체계적으로 패턴화 할 수 있는 문장들을 추출하여 21 가지 상하위 관계 패턴들로 일반화하였다. 21가지 패턴들을 정규식으로 표현한 뒤 각각 동일한 패턴들을 가진 문장들을 코퍼스에서 다시 추출한 결과 57%의 정확률이 측정되었다.

  • PDF

시맨틱 웹을 이용한 온톨로지 기반의 정보검색 시스템 설계 및 구현 (Design and Implementation of Information Retrieval System Based on Ontology Using Semantic Web)

  • 서우진;유경택
    • 디지털융복합연구
    • /
    • 제17권1호
    • /
    • pp.209-217
    • /
    • 2019
  • 본 논문에서는 시맨틱 검색 수행을 위해 검색 도메인에 알맞은 온톨로지를 이용, 구축하고 정보에 관한 검색, 변환, 통합, 공유가 가능한 검색 엔진을 구현하여 검색 시스템의 기반을 마련하는 것을 목적으로 하였다. 기존 방식에서 벗어나 온톨로지를 활용하여 계층 관계를 추론하고, 그 계층을 근거로 개체를 추론한 다음 속성을 추출하여 사용자가 원하는 자료와 관련있는 분야를 검색하는 것이다. 이러한 방식으로 정보를 검색할 수 있도록 정보검색 시스템을 '자격증'과 관련된 키워드를 입력하여 구현하였다. 구현된 시스템은 온톨로지에서 각 속성들의 의미와 관계를 정리하여 일반인 정보검색을 사용자가 빠르고 쉽게, 정확한 검색을 할 수 있도록 하였다. 또한, 구현 결과를 2개의 다른 검색엔진과 비교하였다. 비교한 검색엔진은 대표적인 검색엔진인 '네이버'와 '다음'이다. 시맨틱 웹을 이용한 검색을 수행하기 위해 검색 도메인에 맞는 온톨로지를 이용하여 구축한 본 연구의 검색 엔진은 상당히 우수한 결과를 보여주는 것으로 평가되었다. 그러나 검색 엔진의 정확성과 신뢰성을 높이고 좀 더 포괄적인 범주의 검색어 포함하기 위해서는 더욱 정형화된 온톨로지가 필요하다고 사료된다.

다중점 적합성 피드백방법을 이용한 영역기반 이미지 유사성 검색 (Region Based Image Similarity Search using Multi-point Relevance Feedback)

  • 김덕환;이주홍;송재원
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.857-866
    • /
    • 2006
  • 질의 이미지의 시각적 특징이 사용자의 상위 수준 개념을 잘 표현하지 못하기 때문에 이미지 검색 시스템의 성능은 보통 매우 낮다. 의미적으로 유사한 이미지들이 매우 다른 시각적 특징을 보일 수도 있으며 따라서 여러 개의 군집에 분산될 수 있다. 본 논문에서는 영역기반 이미지 검색과 군집-합병을 이용한 새로운 적합성 피드백 방법을 결합한 내용기반 이미지 검색 방법을 제안한다. 주요 목표는 의미적 차이를 줄이기 위해 의미적으로 관련된 군집들을 찾는 것이다. 제안된 방법은 영역기반 군집 과정과 군집-합병 과정으로 이루어진다. 적합한 이미지들의 모든 분할된 영역들을 의미적으로 관련된 계층적인 군집으로 구성한다. 잠재된 군집의 개수를 결정하고 근접한 군집들을 합병한 후 최종 군집의 대표점들로 다중 질의를 표현한다. 군집-합병 과정에서 군집의 개수를 찾고 고차원에서 특이점 문제를 해결하기 위하여 호텔링의 $T^2$ 대신에 v개의 주성분을 이용하는 $T_v^2$를 적용하였으며 $T^2$의 성능과 $T_v^2$의 성능의 차이가 없음을 보인다. 실험 결과는 제안된 방법이 내용기반 이미지 검색 시스템의 성능을 개선하는 데 효율적임을 보여준다.

가변적인 길이의 특성 정보를 지원하는 특성 가중치 조정 기법 (A Feature Re-weighting Approach for the Non-Metric Feature Space)

  • ;김상희;박호현;이석룡;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권4호
    • /
    • pp.372-383
    • /
    • 2006
  • 이미지 데이타베이스 분야에 대한 다양한 기법들 가운데, 내용 기반 영상 검색 기법 (Content Based Image Retrieval)은 대용량의 영상을 효율적으로 검색하고 탐색할 수 있도록 한다. 기존의 내용 기반 영상 검색 시스템은 사용자가 입력한 질의 이미지에서 낮은 레벨의 특성 (low-level feature)을 추출하고 그에 기반하여 데이타베이스로부터 유사한 영상을 검색한다. 하지만 컴퓨터에서 사용하는 낮은 레벨의 특성은 실제 인간이 영상을 인식하는 방법과 다르게 영상을 인식한다는 단점이 있다. 이러한 단점을 보완하기 위하여 각 특성에 대한 가중치를 적합성 피드백 (relevance feedback)을 통하여 재조정하는 기법이 개발되었다. 기존의 특성 가중치 조정 (feature re-weighting) 기법은 모든 영상에 대하여 특성은 항상 고정된 길이의 벡터 데이타로 표현된다고 가정한다, 이러한 가정을 전제로 하여 기존의 기법은 특성 표현 (feature representation)의 각 부분을 n 차원 공간의 각 축에 할당한다. 하지만 특성 표현 기법의 발전에 따라 가변적인 길이의 벡터로 표현되는 특성이 출현하였으며 이로 인하여 기존의 제한된 길이의 벡터로 표현되는 특성 표현에 기반한 특성 가중치 조정 기법의 유효성은 감소하게 되었다. 본 논문에서는 가변적인 크기의 벡터로 표현되는 특성에 대해서도 특성 가중치를 효과적으로 조정할 수 있는 기법을 제안한다. 본 기법은 특성에 기반하여 계산된 질의 영상과 데이타베이스 내부의 영상간의 거리와 양방향 신뢰구간을 이용하여 특성 가중치를 조정한다. 이 때 각 특성의 거리 계산 방법에 대해서는 제한을 두지 않는다. 또한 각 특성의 표현에 있어서도 고정적인 크기뿐만이 아니라 가변적인 크기의 데이타 역시 사용할 수 있도록 한다. 본 논문에서는 실험을 통하여 제안한 기법의 유효성을 입증하였으며, 다른 연구 결과와의 비교를 통하여 제안한 기법의 성능이 보다 우수함을 보였다.