• 제목/요약/키워드: 메타데이타 자동 생성

검색결과 12건 처리시간 0.028초

시맨틱 웹에서 의미 검색을 위한 RDF 메타데이타 자동 생성 (Automatic Generation of RDF Metadata for Semantic Search in Semantic Web)

  • 강상구;양재영;양승섭;최원종;최중민
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.311-320
    • /
    • 2002
  • 시맨틱 웹은 인간이 이해하는 것처럼 웹 문서의 의미를 컴퓨터가 처리할 수 있도록 하는데 있다. 그러나 인터넷 등 정보통신 기술의 발전으로 인해 정보량이 급증함으로써 이들 정보 자원을 효과적으로 검색하기에는 많은 어려움이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 주석 에디터를 사용하여 논문에 대한 RDF 메타데이타의 자동 생성 방법을 제안한다. 사용자가 논문을 주석 처리할 때, 문서에 대한 특징을 추출하고 온토로지 인터페이스를 사용하여 문서를 분류한다. 구현된 시스템을 통해 사용자는 추출된 메타데이타를 메타데이타 뷰를 통해 볼 수 있으며, HTML 뷰를 통해 메타데이타를 수동으로 수정이 가능하다. 이 메타데이타는 RDF Repository로 저장할 수 있으며, 주석 뷰를 통하여 RDF 메타데이타 생성을 확인할 수 있다. 이렇게 생성된 RDF 메타데이타는 웹 로봇이 내용의 의미 파악 및 카테고리 정보를 쉽게 알 수 있도록 해준다. 본 논문은 검색 엔진을 통하여 논문 검색시 전체 내용보다 RDF 메타데이타 정보만으로 효율적인 검색을 할 수 있는 방법에 초점을 둔다.

  • PDF

웹사이트 관리를 위한 RDF 메타데이타 생성시스템 (The RDF Metadata Generation System for WebSite Management)

  • 이미경;하얀;김용성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권4호
    • /
    • pp.346-357
    • /
    • 2001
  • 웹 자원을 효율적으로 관리하기 위해서 메타데이타(metadata)의 활용이 증가하고 있으며, 이 활용 분야 중 웹사이트 관리를 위한 응용들은 표준화되지 않아서 상호호환성의 문제를 가지고 있다. 따라서 본 논문에서는 메타데이타의 표준화와 상호운영을 목적으로 하는 RDF(Resources Description Framework)를 이용하여 웹사이트 관리를 위한 메타데이타 생성 시스템을 제안한다. 제안된 시스템은 웹사이트를 기관 도메인별로 자동 분류하고, 정보를 구조적 형식으로 기술하여 효율적인 검색 환경을 제시할 수 있다. 이를 위해 더블린 코어를 기반으로 한 메타데이타 모델 및 RDF 메타데이타를 자동 생생하기 위한 사상 규칙과 알고리즘을 제시하고 시스템을 구현한다.

  • PDF

MPEG-7을 이용한 하이라이트 인덱싱과 브라우징 (Highlight Indexing and Browsing Based on MPEG-7)

  • 이창윤;임화영;김혁만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.217-219
    • /
    • 2002
  • 스포츠 경기의 하이라이트(highlight) 브라우징을 위해 하이라이트 이벤트(주요 사건)와 하이라이트 객체(선수)를 묘사하는 하이라이트 테마를 계층구조로 정의하고, 이를 이용해 하이라이트 세그먼트를 설정하고, 자동적으로 계층구조의 하이라이트 메타데이타를 생성하는 하이라이트 인덱싱 방법을 제안하였다. 하이라이트에 관련된 모든 메타데이타는 MPEG-7으로 기술하였다. 그리고 제안한 방법으로 생성된 메타데이타를 이용한 set-top box용 하이라이트 브라우저를 구현하였다.

  • PDF

시맨틱 웹에서 온토로지를 기반한 Annotation 시스템 (An Ontology-based Annotation System for Semantic Web)

  • 강상구;양재영;최중민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.298-300
    • /
    • 2002
  • 시맨틱 웹은 인간이 이해하는 것처럼 웹 문서의 의미를 컴퓨터가 이해할 수 있도록 하는데 있다. 이를 위해 본 논문에서는 Annotation Editor를 사용하여 논문에 대한 RDF 메타데이타의 자동 생성 방법을 제안한다. 사용자가 논문을 주석 처리할 때, 문서에 대한 특징을 추출하고 온토로지 인터페이스를 사용하여 문서를 분류한다. 구현된 시스템을 통해 사용자는 추출된 메타데이타를 메타데이타 뷰를 통해 수정하고 RDF Store로 저장할 수 있으며, 주석 뷰를 통하여 수동으로 RDF 메타데이타를 입력할 수 있다. 본 논문은 검색 엔진을 통하여 논문 검색 시 전체 내용보다 RDF 메타데이타 정보만으로 효율적인 검색을 할 수 있는 방법에 초점을 둔다.

  • PDF

의미 중의성을 고려한 온톨로지 기반 메타데이타의 자동 생성 (Ontology-based Automated Metadata Generation Considering Semantic Ambiguity)

  • 최정화;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권11호
    • /
    • pp.986-998
    • /
    • 2006
  • 인터넷의 발전으로 방대해진 정보를 컴퓨터가 이해하고 효율적으로 관리하기 위해서는 시맨틱 웹 기반의 메타데이타가 반드시 필요하다. 그러나 메타데이타 생성 시 의미 중의성을 가진 정보가 존재하며 이 문제의 해결책이 필요하다. 본 논문에서는 순차적으로 존재할 수 있는 단어들의 확률 모델을 이용하여 문서와 같은 정보에 포함된 의미가 애매한 단어를 관련성이 높은 모델의 개념으로 메타데이타를 생성하는 방법을 제안한다. 제안한 방법에서 메타데이타를 생성 할 때, 온톨로지에 정의된 개념들 간의 중의성을 고려하고 명칭(named entity)의 일부 단어에 대한 인식을 위해 은닉 마르코프 모델(Hidden Markov Model)을 사용한다. 먼저 온톨로지에 정의된 각 클래스(class)의 인스턴스(instance)를 인식하기 위한 마르코프 모델을 생성한다. 다음으로 문서로부터 의미가 애매한 단어의 의미를 파악할 수 있는 상황정보(Context)를 생성하고, 상황정보에 포함된 단어들의 순서에 대응하는 최적의 마르코프 모델을 찾아 메타데이타 생성시의 중의성 문제를 해결한다. 제안한 방법으로 전산학관련 논문에 대해 의미가 애매한 7개의 단어를 추출하여 실험하였다. 그 결과 상황정보에 존재하는 개체(entity)의 의미부류들 중 가장 빈번한 의미 부류로 애매한 단어의 의미를 선정한 SemTag보다 정확도 면에서 38%정도의 나은 성능을 나타내었다.

메타정보 인터페이스를 이용한 이질 구조 분석 XML문서 통합 검색 (Integrated Information Retrieval with Metadata Interface for Heterogeneous Distributed XML Documents)

  • 류성준;황재문;김태훈;남영광
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1505-1518
    • /
    • 2004
  • 본 논문은 구조적, 의미론적 이질성을 가진 분산 XML 문서의 통합 검색을 위해 반자동으로 생성된 인터페이스를 통해 각 지역 문서에 대한 질의를 생성하여 검색하는 방법을 제안한다. 본 시스템에서는 데이타 통합을 위한 메타데이타 인터페이스인 DDXMI(Distributed Documents XML Metadata Interface)를 정의하고, 분산 데이타에 대한 DTD를 입력으로 받아 사용자로 하여금 전역 DTD와 각 지역 DTD 간의 의미 차이를 극복하기 위한 사용자 인터페이스 생성 방법을 제안하였다. 전역 DTD와 지역 DTD의 특성을 고려하여 인덱스 매핑과 그에 필요한 함수 이름의 매핑 정보를 기반으로 DDXMI가 자동으로 생성된다. XML 질의 언어인 Quilt를 사용하여 생성된 DDXMI를 통해 각 지역 문서에 적합한 질의를 생성, 수행한다 사용자는 검색 대상 문서의 스키마와 통합스키마의 구조를 잘 알고 있다고 가정하였다. XML로 만들어진 석박사 논문, 논문지, 연구보고서에 대한 소규모, 중규모 전역 DTD를 만들어 실제로 질의를 생성하여 검색 결과를 검증할 수 있도록 하였다. 본 시스템은 JavaCC와 Java 서블릿을 이용하여 개발하였다.

의미기반 전자 카탈로그 이미지 검색을 위한 XML 데이타베이스 시스템 구현 (An Implementation of XML Database System for Semantic-Based E-Catalog Image Retrieval)

  • 홍성용;나연묵
    • 한국멀티미디어학회논문지
    • /
    • 제7권9호
    • /
    • pp.1219-1232
    • /
    • 2004
  • 최근 e-비즈니스나 인터넷 쇼핑몰 사이트에서 는 많은 양의 상품 이미지 정보와 컨텐츠를 취급하고 있으며 ,이로 인하여 이미지에 대한 효율적인 의미기반 검색의 필요성이 대두되고 있다. 본 논문에서는 XML과 퍼지기술을 이용하여 웹상의 상품 이미지를 의미적으로 검색할 수 있는 시스템에 대해 설명한다. 상품 카탈로그와 같은 다중 객체를 보유하고 있는 이미지에 대하여 의미 기반 검색을 수행할 수 있도록 상품 정보나 의미등의 메타데이타를 표현하는 다계층 메타데이타 구조를 사용한다. 이미지에 대한 의미기반 검색을 수행할 수 있도록 하기 위해 메타데이타를 저장하기 위한 XML 데이타베이스를 설계하고 퍼지 데이타를 적용할 수 있는 방법을 연구하였다. 본 논문에서 제시한 시스템은 이미지에 대한 메타데이타를 이용하여 퍼지 데이터를 자동 생성하고, 생성된 퍼지 데이타를 의미기반 이미지 검색에 사용한다. 따라서 의미기반 상품 이미지 검색에 대하여 사용자의 검색질의에 대한 정확성과 만족도를 증대 시킬 수 있다.

  • PDF

준자동 비디오 모델링 기법 (Semi-automatic video model ins)

  • 조성길;김혁만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.112-114
    • /
    • 2002
  • 디지털 비디오의 급속한 사용으로 인해 비디오를 ;더 효과적으로 구조화하여 브라우징할 필요성이 대두되고 있다 비디오를 효과적으로 브라우징하기 위한 구조로 트리 형태의 계층구조가 주로 사용된다 트리 형태로 비디오를 계층구조화 시키기 위한 여러 가지 방법이 제안되었지만 비디오의 컨텐트가 너무 다양하기 때문에 이를 완전하게 자동화 한다는 것은 거의 불가능 하다. 본 논문에서는 내용기반 이미지 검색 기법을 이용한 클러스터링을 통해 3단계 계증구조를 자동적으로 생성한 후, 이 구조를 사용자가 수작업을 통해 원하는 형태로 전환시키는 기법을 제안한다. 또한 생성된 계층구조를 MPEG-7 메타데이타 표준으로 표현한다. 표현한다.

  • PDF

RDF 메타 데이터를 이용한 인덱스 기반의 XML/SGML 문서 검색 방법에 관한 연구

  • 오동현;김규태;정회경;이수연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.42-44
    • /
    • 1999
  • 인터넷이 급속히 성장함에 따라 대량의 SGML/XML 문서를 보다 효과적으로 다룰 필요성이 증대하고 있다. SGML/XML 문서를 데이터베이스에 저장하는 경우에 문서를 파싱하여 파싱된 결과를 모두 분리하여 저장하고 서로의 연관관계를 모두 구분하는 경우 구조화 정보를 최대한 이용할 수 있는 등 여러 가지 장점을 지니게 된다. 하지만, 이 경우 분할단위의 폭발적인 증가로 인한 시스템 성능 저하와 내용중복으로 인한 색인저장 오버헤드가 문제이다. 이런 문제점을 해결방안의 하나로서 본 논문에서는 RDF 메타데이타를 통하여 검색시 의미가 있는 단위로 분할 단위를 축소 지정하고 이 축소된 정보를 기반으로 인덱스를 생성하여 내용중복을 방지하는 방법을 제안하였다. 이 방법은 RDF메타데이타를 통해 이루어짐으로서 웹기반에서 자동으로 이루어질 수가 있으며, 이를 통해서 기존의 방법보다 자동화된 검색을 할 수 있다.

  • PDF

객체지향 시소러스를 RDF Schema로 변환하기 위한 매핑 구조의 설계 및 구현 (Design of Mapping Structure and Implementation to transform Object-Oriented Thesaurus into RDF Schema)

  • 양경아;방선이;양재동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.289-291
    • /
    • 2002
  • 본 논문에서는 객체지향 패러다임의 구조적 특성을 적용하여 만든 시소러스를 이용하여 웹 자원의 의미적 연관성을 RDF 형식으로 표현할 수 있는 RDF 문서 자동 생성기를 소개한다. 객체지향 시소러스를 RDF 형식으로 나타내기 위해 시소러스에 사용된 객체와 관계의 내용을 명세한 네임 스페이스를 정의하여 시맨틱 웹에서 메타데이타를 기술하는 표준이 되는 RDF와 RDF Schema 형식으로 매핑할 수 있다. 이러한 연구를 통해 객체지향 시소러스의 내용을 RDF 형식으로 표현함으로써 지식베이스(KnowledgeBase)라 불리는 온톨로지를 생성할 수 있으며, 구축된 온톨로지는 시맨틱 웹 상의 에이전트나 다른 어플리케이션에 응용될 수 있다.

  • PDF