• 제목/요약/키워드: Semantics-based Retrieval

검색결과 54건 처리시간 0.02초

한국과 영국 사이의 국립공원 자연 경관 특색의 판별 분석 - 내용기반 영상검색의 저단계 기능 측면에서 - (Discriminant Analysis of Natural Landscape Features in National Parks between Korea and Scotland - Using Low-Level Functions of Content-Based Image Retrieval -)

  • 이덕재
    • 한국환경생태학회지
    • /
    • 제22권3호
    • /
    • pp.289-300
    • /
    • 2008
  • 질감, 모양, 색채 등 내용기반 영상검색(CBIR)의 기능을 이용하여 한국의 지리산 국립공원과 영국의 케이른고럼스 국립공원의 자연 경관에 있어서의 차이를 판별하는데 본 연구의 목적이 있다. 먼저 각 국립공원의 자연경관을 디지털 사진영상으로 촬영한 후, 전형적인 경관사진을 선별하였다. 사진영상의 저단계 기능(Low-level function)이 계량화되어 수직적으로 회전된 다섯 개의 요인으로 축약되었다. 이 중 유의한 차이를 보이지 않은 물 관련 요인이 제외된 나머지 네 개의 요인에 근거한 판별선이 케이른고럼스 경관과 지리산 경관 사이에서 도출되어, 판별함수가 두 그룹을 유의하게 분할하였다($x^2(4)$=61.433; p<0.001). 고유치 2.417과 월크스 람다 0.293에 의하여 전체 변이가 두 그룹의 판별함수 평균의 차이에서 대부분 산출되었음을 확인하였다. 또한, 네 개의 독립변수가 종속변수 전체 분산의 70.7%를 설명하는 것으로 추정되었다. 경관에 대하여 가장 큰 효과를 나타내는 변수는 원거리관련 변수(r=1.073)이며, 다음으로 근거리관련 변수(r=0.896)였으며, 전체적으로 90.7%가 타당하게 분류되었다. 이는 케이른고럼스 국립공원과 지리산 국립공원 자연경관 사이에서 사진영상의 근거리 요인뿐만 아니라, 원거리 요인이 보다 경관 차이에 유의한 판별력을 보이는 것으로 해석되므로, 국립공원의 경관정체성과 관련한 원거리 스카이라인의 시각적 중요성을 보여주는 것이라 하겠다.

멀티미디어 콘텐츠의 강화된 의미 검색을 위한 온톨로지 설계 (A Design of the Ontology for Enhanced Semantic Retrieval of Multimedia Contents)

  • 김선경;신판섭;임해철
    • 인터넷정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.107-115
    • /
    • 2012
  • 최근 정보 환경에서는 다양한 멀티미디어 콘텐츠가 주목받고 있다. 그러나 이러한 콘텐츠는 표현 형식과 내용이 방대하여 사용자가 원하는 콘텐츠를 쉽게 검색하고 활용하기가 어려웠다. 이를 해결하기 위해, 그동안 많은 연구들이 콘텐츠에 메타데이터를 추가하는 표준안을 제시하였고, 이로 인해 콘텐츠에 대한 의미 검색이 가능해졌다. 그러나 여러 가지 메타데이터 표준과 이를 따라 명세된 콘텐츠가 증가하면서 콘텐츠 간 상호운용성이 결여되기 시작했고, 사용자는 다시 검색의 어려움에 직면하게 되었다. 이러한 문제점을 개선하기 위해, 본 연구에서는 메타데이터 표준간의 상호운용성을 지원하고, 이를 구성하는 엘리먼트와 엘리먼트 사이에 표현된 의미 관계를 확장하여 시맨틱 검색이 강화된 TOFIC(The Ontology For Imagery Contents)을 제안한다. TOFIC에서는, MPEG-7과 TV-Anytime 표준 간 의미 관계를 분류하고 확장된 시맨틱을 정의하여 현재 정보 환경에 존재하는 멀티미디어 콘텐츠에 대한 일관된 의미 검색과 강화된 내용-기반 검색을 지원한다.

주제목록을 위한 한국용어열색인 시스템의 기능 (Function of the Korean String Indexing System for the Subject Catalog)

  • 윤구호
    • 한국문헌정보학회지
    • /
    • 제15권
    • /
    • pp.225-266
    • /
    • 1988
  • Various theories and techniques for the subject catalog have been developed since Charles Ammi Cutter first tried to formulate rules for the construction of subject headings in 1876. However, they do not seem to be appropriate to Korean language because the syntax and semantics of Korean language are different from those of English and other European languages. This study therefore attempts to develop a new Korean subject indexing system, namely Korean String Indexing System(KOSIS), in order to increase the use of subject catalogs. For this purpose, advantages and disadvantages between the classed subject catalog nd the alphabetical subject catalog, which are typical subject ca-alogs in libraries, are investigated, and most of remarkable subject indexing systems, in particular the PRECIS developed by the British National Bibliography, are reviewed and analysed. KOSIS is a string indexing based on purely the syntax and semantics of Korean language, even though considerable principles of PRECIS are applied to it. The outlines of KOSIS are as follows: 1) KOSIS is based on the fundamentals of natural language and an ingenious conjunction of human indexing skills and computer capabilities. 2) KOSIS is. 3 string indexing based on the 'principle of context-dependency.' A string of terms organized accoding to his principle shows remarkable affinity with certain patterns of words in ordinary discourse. From that point onward, natural language rather than classificatory terms become the basic model for indexing schemes. 3) KOSIS uses 24 role operators. One or more operators should be allocated to the index string, which is organized manually by the indexer's intellectual work, in order to establish the most explicit syntactic relationship of index terms. 4) Traditionally, a single -line entry format is used in which a subject heading or index entry is presented as a single sequence of words, consisting of the entry terms, plus, in some cases, an extra qualifying term or phrase. But KOSIS employs a two-line entry format which contains three basic positions for the production of index entries. The 'lead' serves as the user's access point, the 'display' contains those terms which are themselves context dependent on the lead, 'qualifier' sets the lead term into its wider context. 5) Each of the KOSIS entries is co-extensive with the initial subject statement prepared by the indexer, since it displays all the subject specificities. Compound terms are always presented in their natural language order. Inverted headings are not produced in KOSIS. Consequently, the precision ratio of information retrieval can be increased. 6) KOSIS uses 5 relational codes for the system of references among semantically related terms. Semantically related terms are handled by a different set of routines, leading to the production of 'See' and 'See also' references. 7) KOSIS was riginally developed for a classified catalog system which requires a subject index, that is an index -which 'trans-lates' subject index, that is, an index which 'translates' subjects expressed in natural language into the appropriate classification numbers. However, KOSIS can also be us d for a dictionary catalog system. Accordingly, KOSIS strings can be manipulated to produce either appropriate subject indexes for a classified catalog system, or acceptable subject headings for a dictionary catalog system. 8) KOSIS is able to maintain a constistency of index entries and cross references by means of a routine identification of the established index strings and reference system. For this purpose, an individual Subject Indicator Number and Reference Indicator Number is allocated to each new index strings and new index terms, respectively. can produce all the index entries, cross references, and authority cards by means of either manual or mechanical methods. Thus, detailed algorithms for the machine-production of various outputs are provided for the institutions which can use computer facilities.

  • PDF

문서분류를 위한 의미적 주제선정방법 (Semantic Topic Selection Method of Document for Classification)

  • 고광섭;김판구;이창훈;황명권
    • 한국정보통신학회논문지
    • /
    • 제11권1호
    • /
    • pp.163-172
    • /
    • 2007
  • 웹은 전세계 규모의 네트워크로써 문자, 화상, 음성 등의 미디어 정보들을 페이지 단위로 관리되며, 링크를 이용하여 분산된 정보들을 연결하고 있다. 이러한 웹의 지속적인 발전으로 무수한 정보들을 축적하고 있으며, 그 중 텍스트로 구성된 문서들이 주를 이룬다. 사용자는 이렇게 많은 정보들 중에서 자신이 원하는 특정 정보를 찾기 위해 웹을 사용한다. 그래서 웹은 사용자 요구에 적합한 정보를 검색해 주기 위해 계속적인 시도와 많은 연구들로 발전되고 있다. 확률을 이용한 방법, 통계적인 기법을 이용한 방법, 벡터 유사도를 이용한 방법, 베이지안 자동문서 분류 방법 등 기존의 방법들은 문서의 의미적인 주제나 특징을 정확하게 처리 할 수 없어 사용자는 재검색을 해야 하는 문제점을 갖는다. 특히, 국내 문서 분류를 위한 연구는 많이 이루어지지 않아 검색에 더욱 어렵다. 이러한 문제점을 보완하기 위해 본 논문에서는 국내문서의 효율적이고 의미적인 분류를 위해 출현 개념의 TF(Term Frequency)와 주변 개념들과의 관계된 정도(RV : Relation Value)를 추출한다. 그리고 추출된 키워드들을 국내 어휘 사전인 U-WIN에 매핑하여 문서의 주제를 선택하고 본문에서 제 시하는 분류방법에 의해 웹 문서를 분류한다. 이는 문서 내 개념들의 관계를 이용하여 문서의 주제를 선정하고 문서의 의미적인 분류를 가능하게 한다.