• Title/Summary/Keyword: 메타데이타 자동 생성

Search Result 12, Processing Time 0.022 seconds

Automatic Generation of RDF Metadata for Semantic Search in Semantic Web (시맨틱 웹에서 의미 검색을 위한 RDF 메타데이타 자동 생성)

  • 강상구;양재영;양승섭;최원종;최중민
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.311-320
    • /
    • 2002
  • 시맨틱 웹은 인간이 이해하는 것처럼 웹 문서의 의미를 컴퓨터가 처리할 수 있도록 하는데 있다. 그러나 인터넷 등 정보통신 기술의 발전으로 인해 정보량이 급증함으로써 이들 정보 자원을 효과적으로 검색하기에는 많은 어려움이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 주석 에디터를 사용하여 논문에 대한 RDF 메타데이타의 자동 생성 방법을 제안한다. 사용자가 논문을 주석 처리할 때, 문서에 대한 특징을 추출하고 온토로지 인터페이스를 사용하여 문서를 분류한다. 구현된 시스템을 통해 사용자는 추출된 메타데이타를 메타데이타 뷰를 통해 볼 수 있으며, HTML 뷰를 통해 메타데이타를 수동으로 수정이 가능하다. 이 메타데이타는 RDF Repository로 저장할 수 있으며, 주석 뷰를 통하여 RDF 메타데이타 생성을 확인할 수 있다. 이렇게 생성된 RDF 메타데이타는 웹 로봇이 내용의 의미 파악 및 카테고리 정보를 쉽게 알 수 있도록 해준다. 본 논문은 검색 엔진을 통하여 논문 검색시 전체 내용보다 RDF 메타데이타 정보만으로 효율적인 검색을 할 수 있는 방법에 초점을 둔다.

  • PDF

The RDF Metadata Generation System for WebSite Management (웹사이트 관리를 위한 RDF 메타데이타 생성시스템)

  • Lee, Mi-Kyung;Ha, Yan;Kim, Yong-Sung
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.4
    • /
    • pp.346-357
    • /
    • 2001
  • 웹 자원을 효율적으로 관리하기 위해서 메타데이타(metadata)의 활용이 증가하고 있으며, 이 활용 분야 중 웹사이트 관리를 위한 응용들은 표준화되지 않아서 상호호환성의 문제를 가지고 있다. 따라서 본 논문에서는 메타데이타의 표준화와 상호운영을 목적으로 하는 RDF(Resources Description Framework)를 이용하여 웹사이트 관리를 위한 메타데이타 생성 시스템을 제안한다. 제안된 시스템은 웹사이트를 기관 도메인별로 자동 분류하고, 정보를 구조적 형식으로 기술하여 효율적인 검색 환경을 제시할 수 있다. 이를 위해 더블린 코어를 기반으로 한 메타데이타 모델 및 RDF 메타데이타를 자동 생생하기 위한 사상 규칙과 알고리즘을 제시하고 시스템을 구현한다.

  • PDF

Highlight Indexing and Browsing Based on MPEG-7 (MPEG-7을 이용한 하이라이트 인덱싱과 브라우징)

  • 이창윤;임화영;김혁만
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.217-219
    • /
    • 2002
  • 스포츠 경기의 하이라이트(highlight) 브라우징을 위해 하이라이트 이벤트(주요 사건)와 하이라이트 객체(선수)를 묘사하는 하이라이트 테마를 계층구조로 정의하고, 이를 이용해 하이라이트 세그먼트를 설정하고, 자동적으로 계층구조의 하이라이트 메타데이타를 생성하는 하이라이트 인덱싱 방법을 제안하였다. 하이라이트에 관련된 모든 메타데이타는 MPEG-7으로 기술하였다. 그리고 제안한 방법으로 생성된 메타데이타를 이용한 set-top box용 하이라이트 브라우저를 구현하였다.

  • PDF

An Ontology-based Annotation System for Semantic Web (시맨틱 웹에서 온토로지를 기반한 Annotation 시스템)

  • 강상구;양재영;최중민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.298-300
    • /
    • 2002
  • 시맨틱 웹은 인간이 이해하는 것처럼 웹 문서의 의미를 컴퓨터가 이해할 수 있도록 하는데 있다. 이를 위해 본 논문에서는 Annotation Editor를 사용하여 논문에 대한 RDF 메타데이타의 자동 생성 방법을 제안한다. 사용자가 논문을 주석 처리할 때, 문서에 대한 특징을 추출하고 온토로지 인터페이스를 사용하여 문서를 분류한다. 구현된 시스템을 통해 사용자는 추출된 메타데이타를 메타데이타 뷰를 통해 수정하고 RDF Store로 저장할 수 있으며, 주석 뷰를 통하여 수동으로 RDF 메타데이타를 입력할 수 있다. 본 논문은 검색 엔진을 통하여 논문 검색 시 전체 내용보다 RDF 메타데이타 정보만으로 효율적인 검색을 할 수 있는 방법에 초점을 둔다.

  • PDF

Ontology-based Automated Metadata Generation Considering Semantic Ambiguity (의미 중의성을 고려한 온톨로지 기반 메타데이타의 자동 생성)

  • Choi, Jung-Hwa;Park, Young-Tack
    • Journal of KIISE:Software and Applications
    • /
    • v.33 no.11
    • /
    • pp.986-998
    • /
    • 2006
  • There has been an increasing necessity of Semantic Web-based metadata that helps computers efficiently understand and manage an information increased with the growth of Internet. However, it seems inevitable to face some semantically ambiguous information when metadata is generated. Therefore, we need a solution to this problem. This paper proposes a new method for automated metadata generation with the help of a concept of class, in which some ambiguous words imbedded in information such as documents are semantically more related to others, by using probability model of consequent words. We considers ambiguities among defined concepts in ontology and uses the Hidden Markov Model to be aware of part of a named entity. First of all, we constrict a Markov Models a better understanding of the named entity of each class defined in ontology. Next, we generate the appropriate context from a text to understand the meaning of a semantically ambiguous word and solve the problem of ambiguities during generating metadata by searching the optimized the Markov Model corresponding to the sequence of words included in the context. We experiment with seven semantically ambiguous words that are extracted from computer science thesis. The experimental result demonstrates successful performance, the accuracy improved by about 18%, compared with SemTag, which has been known as an effective application for assigning a specific meaning to an ambiguous word based on its context.

Integrated Information Retrieval with Metadata Interface for Heterogeneous Distributed XML Documents (메타정보 인터페이스를 이용한 이질 구조 분석 XML문서 통합 검색)

  • 류성준;황재문;김태훈;남영광
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.11
    • /
    • pp.1505-1518
    • /
    • 2004
  • We propose an extremely light DDXMI approach for semi-automated integration of both structurally and semantically heterogeneous distributed XML documents. In the proposed prototype, a DDXMI(Distributed Documents XML Metadata Interface) is defined and a user interface generator is developed. The prototype takes sources' DTDs as inputs and generates a friendly graphical user interface for the application users. The user can easily describe the semantic mapping between the integrated virtual database DTD and sources' DTDs through assigning index numbers and specifying associated function names so that the DDXMI based on the mappings is automatically generated. Quilt is selected as the XML query language which processes user queries according to the DDXMI. It is assumed that the application users know what they want from the different sources, that is, they have their own integrated database schema in their mind, and know the semantics of the involved XML databases. A small-size global DTD and a mid-size global DTB are generated to verify the rluery generation and retrieval results with 3 XML document databases, that is, Master/ph.D thesis, research reports, and journal databases. The system has been developed with JavaCC and Java Servelet.

An Implementation of XML Database System for Semantic-Based E-Catalog Image Retrieval (의미기반 전자 카탈로그 이미지 검색을 위한 XML 데이타베이스 시스템 구현)

  • Hong Sungyong;Nah Yunmook
    • Journal of Korea Multimedia Society
    • /
    • v.7 no.9
    • /
    • pp.1219-1232
    • /
    • 2004
  • Recently, the web sites, such as e-business sites and shopping mall sites, deal with lots of catalog image information and contents. As a result, it is required to support semantic-based image retrieval efficiently on such image data. This paper presents a semantic-based image retrieval system, which adopts XML and Fuzzy technology. To support semantic-based retrieval on product catalog images containing multiple objects, we use a multi-level metadata structure which represents the product information and semantics of image data. To enable semantic-based retrieval on such image data, we design a XML database for storing the proposed metadata and study how to apply fuzzy data. This paper proposes a system, generate the fuzzy data automatically to use the image metadata, that can support semantic-based image retrieval by utilizing the generating fuzzy data. Therefore, it will contribute in improving the retrieval correctness and the user's satisfaction on semantic-based e-catalog image retrieval.

  • PDF

Semi-automatic video model ins (준자동 비디오 모델링 기법)

  • 조성길;김혁만
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.112-114
    • /
    • 2002
  • 디지털 비디오의 급속한 사용으로 인해 비디오를 ;더 효과적으로 구조화하여 브라우징할 필요성이 대두되고 있다 비디오를 효과적으로 브라우징하기 위한 구조로 트리 형태의 계층구조가 주로 사용된다 트리 형태로 비디오를 계층구조화 시키기 위한 여러 가지 방법이 제안되었지만 비디오의 컨텐트가 너무 다양하기 때문에 이를 완전하게 자동화 한다는 것은 거의 불가능 하다. 본 논문에서는 내용기반 이미지 검색 기법을 이용한 클러스터링을 통해 3단계 계증구조를 자동적으로 생성한 후, 이 구조를 사용자가 수작업을 통해 원하는 형태로 전환시키는 기법을 제안한다. 또한 생성된 계층구조를 MPEG-7 메타데이타 표준으로 표현한다. 표현한다.

  • PDF

RDF 메타 데이터를 이용한 인덱스 기반의 XML/SGML 문서 검색 방법에 관한 연구

  • 오동현;김규태;정회경;이수연
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.42-44
    • /
    • 1999
  • 인터넷이 급속히 성장함에 따라 대량의 SGML/XML 문서를 보다 효과적으로 다룰 필요성이 증대하고 있다. SGML/XML 문서를 데이터베이스에 저장하는 경우에 문서를 파싱하여 파싱된 결과를 모두 분리하여 저장하고 서로의 연관관계를 모두 구분하는 경우 구조화 정보를 최대한 이용할 수 있는 등 여러 가지 장점을 지니게 된다. 하지만, 이 경우 분할단위의 폭발적인 증가로 인한 시스템 성능 저하와 내용중복으로 인한 색인저장 오버헤드가 문제이다. 이런 문제점을 해결방안의 하나로서 본 논문에서는 RDF 메타데이타를 통하여 검색시 의미가 있는 단위로 분할 단위를 축소 지정하고 이 축소된 정보를 기반으로 인덱스를 생성하여 내용중복을 방지하는 방법을 제안하였다. 이 방법은 RDF메타데이타를 통해 이루어짐으로서 웹기반에서 자동으로 이루어질 수가 있으며, 이를 통해서 기존의 방법보다 자동화된 검색을 할 수 있다.

  • PDF

Design of Mapping Structure and Implementation to transform Object-Oriented Thesaurus into RDF Schema (객체지향 시소러스를 RDF Schema로 변환하기 위한 매핑 구조의 설계 및 구현)

  • 양경아;방선이;양재동
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.289-291
    • /
    • 2002
  • 본 논문에서는 객체지향 패러다임의 구조적 특성을 적용하여 만든 시소러스를 이용하여 웹 자원의 의미적 연관성을 RDF 형식으로 표현할 수 있는 RDF 문서 자동 생성기를 소개한다. 객체지향 시소러스를 RDF 형식으로 나타내기 위해 시소러스에 사용된 객체와 관계의 내용을 명세한 네임 스페이스를 정의하여 시맨틱 웹에서 메타데이타를 기술하는 표준이 되는 RDF와 RDF Schema 형식으로 매핑할 수 있다. 이러한 연구를 통해 객체지향 시소러스의 내용을 RDF 형식으로 표현함으로써 지식베이스(KnowledgeBase)라 불리는 온톨로지를 생성할 수 있으며, 구축된 온톨로지는 시맨틱 웹 상의 에이전트나 다른 어플리케이션에 응용될 수 있다.

  • PDF