• 제목/요약/키워드: extraction metadata

검색결과 41건 처리시간 0.01초

사용자의 데이터 웨어하우스 접근과 활용을 위한 메타데이터 관리 사례 - K 은행 사례를 통한 메타데이터 관리의 시사점 - (A Case Study on Metadata Management for User Access to Data Warehouse - Suggestions about metadata management using K-bank case -)

  • 김기운
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.225-233
    • /
    • 2007
  • 본 연구는 데이터 웨어하우스 환경에서 어떤 메타데이터를 어떻게 관리하는 가를 알아보기 위하여, 데이터 웨어하우징을 위한 3 가지 메타데이터 관리 스키마(추출 메타데이터, 웨어하우스 메타메이터, 사용자 접근 메타데이터)를 이용한다. 특히, 3 가지 메타데이터 중에서 사용자의 데이터 웨어하우스에 대한 접근과 그 활용을 위한 웨어하우스 메타데이터와 사용자 접근 메타데이터에 초점을 두고 이들 메타데이터 관리에 대한 사례를 연구한다.

  • PDF

Automatic Extraction of Metadata Information for Library Collections

  • Yang, Gi-Chul;Park, Jeong-Ran
    • International Journal of Advanced Culture Technology
    • /
    • 제6권2호
    • /
    • pp.117-122
    • /
    • 2018
  • As evidenced through rapidly growing digital repositories and web resources, automatic metadata generation is becoming ever more critical, especially considering the costly and complex operation of manual metadata creation. Also, automatic metadata generation is apt to consistent metadata application. In this sense, metadata quality and interoperability can be enhanced by utilizing a mechanism for automatic metadata generation. In this article, a mechanism of automatic metadata extraction called ExMETA is introduced in order to alleviate issues dealing with inconsistent metadata application and semantic interoperability across ever-growing digital collections. Conceptual graph, one of formal languages that represent the meanings of natural language sentences, is utilized for ExMETA as a mediation mechanism that enhances the metadata quality by disambiguating semantic ambiguities caused by isolation of a metadata element and its corresponding definition from the relevant context. Hence, automatic metadata generation by using ExMETA can be a good way of enhancing metadata quality and semantic interoperability.

전자기록물의 메타데이터 추출 및 비교 검증 기술 연구 (Extracting and Validating Metadata in Electronic Records)

  • 최주호;이재영
    • 한국기록관리학회지
    • /
    • 제12권1호
    • /
    • pp.7-32
    • /
    • 2012
  • 전자기록물의 이관할 때, 전자기록물의 필수 메타데이터의 검증과 실제 문서에 있는 메타데이터를 이용한 검증도 중요하다. 본 연구에서는 전자기록물에 포함된 다양한 형식의 전자파일 중에서 본문파일에서 메타데이터를 추출하고 항목별로 분류한 후 이관되는 메타데이터 항목과 비교 검증을 위한 기술 개발을 연구하였다. 해외에서 개발된 추출 도구와 달리 국내 전자결재 형식을 감안하여 첨부된 본문파일에서 메타데이터를 추출하는 기술을 개발하였으며, 기록물 문서 메타항목에 저장된 원 메타데이터와 추출 메타데이터간 비교 검증을 수행하는 도구를 개발하였다.

이메일에 포함된 감성정보 관련 메타데이터 추출에 관한 연구 (Recognizing Emotional Content of Emails as a byproduct of Natural Language Processing-based Metadata Extraction)

  • 백우진
    • 정보관리학회지
    • /
    • 제23권2호
    • /
    • pp.167-183
    • /
    • 2006
  • 본 연구는 이메일에 나타난 감성정보 메타데이터 추출에 있어 자연언어처리에 기반한 방식을 적용하였다. 투자분석가와 고객 사이에 주고받은 이메일을 통하여 개인화 정보를 추출하였다. 개인화란 이용자에게 개인적으로 의미 있는 방식으로 콘텐츠를 제공함으로써 온라인 상에서 관계를 생성하고, 성장시키고, 지속시키는 것을 의미한다. 전자상거래나 온라인 상의 비즈니스 경우, 본 연구는 대량의 정보에서 개인에게 의미 있는 정보를 선별하여 개인화 서비스에 활용할 수 있도록, 이메일이나 토론게시판 게시물, 채팅기록 등의 텍스트를 자연언어처리 기법에 의하여 자동적으로 메타데이터를 추출할 수 있는 시스템을 구현하였다. 구현된 시스템은 온라인 비즈니스와 같이 커뮤니케이션이 중요하고, 상호 교환되는 메시지의 의도나 상대방의 감정을 파악하는 것이 중요한 경우에 그러한 감성정보 관련 메타데이터를 자동으로 추출하는 시도를 했다는 점에서 연구의 가치를 찾을 수 있다.

공간정보 표준 메타데이터 추출 및 변환 프로그램 개발 (Program Development for Automatic Extraction and Transformation of Standard Metadata of Geo-spatial Data)

  • 한선묵;이기원
    • 대한원격탐사학회지
    • /
    • 제26권5호
    • /
    • pp.549-559
    • /
    • 2010
  • 공간정보 시스템의 구축과 운영에서 메타데이터는 핵심 요소 중의 하나이다. 따라서 국내외 표준화 기구나 단체에서 현실적인 수요를 반영한 다양한 메타데이터를 개발 공표하고 있다. 그리나 국제 표준이나 국가 표준 등이 많은 항목으로 구성되어 있고 메타데이터 서버를 구축하는 경우에는 XML 형식으로 저장, 관리할 필요가 있기 때문에 실무 응용 시스템에서는 표준 형식을 따르기 보다는 운영 기관별로 별도의 메타데이터 사양을 설정하여 사용하는 경우가 많다. 따라서 본 연구에서는 국제 표준인 ISO/TC 19115와 TIAS.KO-10.0139와 TTAS.IS-19115와 같은 단체 메타데이터 표준으로 손쉽게 입력할 수 있도록 직접 공간자료 포맷으로부터 메타데이터 항목과 요소를 추출하여 직접 XML로 저장할 수 있는 프로그램을 개발하였다. 본 프로그램에서 공간영상정보에 대한 자료 포맷의 경우에는 ISO/TC 19115-2 메타데이터 표준 사양으로 추출, 저장할 수 있도록 하였다. 한편 메타데이터 표준간의 항목이나 요소들이 일부 상이하기 때문에 메타데이터 추출 가능과 함께 메타데이터 간의 변환 기능을 개발하여 메타데이터의 상호 운영이 가능하도록 하였다. 본 연구에서는 활용도가 높은 자료 포맷을 대상으로 하였으나 기타 자료 포맷이나 기관별 메타데이터 사양을 처리할 수 있는 확장 기능 구현을 통하여 메타데이터 표준의 활용도를 증가시킬 수 있을 것으로 기대한다.

Metadata Processing Technique for Similar Image Search of Mobile Platform

  • Seo, Jung-Hee
    • Journal of information and communication convergence engineering
    • /
    • 제19권1호
    • /
    • pp.36-41
    • /
    • 2021
  • Text-based image retrieval is not only cumbersome as it requires the manual input of keywords by the user, but is also limited in the semantic approach of keywords. However, content-based image retrieval enables visual processing by a computer to solve the problems of text retrieval more fundamentally. Vision applications such as extraction and mapping of image characteristics, require the processing of a large amount of data in a mobile environment, rendering efficient power consumption difficult. Hence, an effective image retrieval method on mobile platforms is proposed herein. To provide the visual meaning of keywords to be inserted into images, the efficiency of image retrieval is improved by extracting keywords of exchangeable image file format metadata from images retrieved through a content-based similar image retrieval method and then adding automatic keywords to images captured on mobile devices. Additionally, users can manually add or modify keywords to the image metadata.

학술논문 내에서 참고문헌 정보가 포함된 서지 메타데이터 자동 생성 연구 (Automatic Generation of Bibliographic Metadata with Reference Information for Academic Journals)

  • 정선기;신현호;지선영;최성필
    • 한국문헌정보학회지
    • /
    • 제56권3호
    • /
    • pp.241-264
    • /
    • 2022
  • 서지정보는 연구 주제의 최신 동향의 인지와 유용성을 검증하는 데에 참고할 수 있다. 즉, 각자 연구자들이 필요로 하는 문헌에 신속하게 접근하기 위해서는 학술논문에서 저자 정보, 요약, 초록, 참고문헌 등을 쉬운 방법으로 파악해야 한다. 그러나, 현재 출판되는 PDF 형식의 전자 학술논문은 출판 주체별로 고유한 양식을 띄고 있어서, 몇몇 특징에 의한 규칙 기반 추출법으로는 수많은 문헌에서 목표 정보를 추출하여 요약된 서지사항으로 자동 생성하기 어렵다. 이에 본 연구는 학술논문 서지사항 자동 생성에 있어서 양식의 다양성으로 인한 메타데이터 자동 추출의 난점을 극복할 방법을 제안한다. 제안하는 모델은 서지사항이 주로 기술되는 학술논문의 첫 페이지에서 목표 영역과 본문의 시작점을 구분할 수 있는 심층신경망 기반 모델과 앞의 모델로 추출된 서지사항을 상세한 메타데이터로 분류하고 재생성하는 규칙 기반 모델로 구성된다. 제안하는 모델은 참고문헌 요약정보를 생성하는 모델도 포함하는데, 본문의 말미와 참고문헌 시작점의 분리, 그리고 개별 참고문헌 추출을 규칙 기반 방법으로 진행하고, 추출한 각개 참고문헌의 서지정보를 분류하는 데에 심층신경망을 이용하도록 구성하였다. 추가로, 논문 자체의 서지정보를 전후처리 없이 추출/생성하는 모델의 가능성을 확인하기 위하여 참고문헌 영역까지 아우르는 모델을 구축하여 비교 실험을 진행하였다. 실험 결과 본 논문에서 제안하는 방식이 서지정보를 전후처리 하지 않고 진행한 비교 실험에 비하여 더 높은 성능을 보였다.

AI를 활용한 메타데이터 추출 및 웹서비스용 메타데이터 고도화 연구 (Metadata extraction using AI and advanced metadata research for web services)

  • 박성환
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.499-503
    • /
    • 2024
  • 방송 프로그램은 자체 방송 송출 외에도 인터넷 다시 보기, OTT, IPTV 서비스 등 다양한 매체에 제공되고 있다. 이 경우 콘텐츠 특성을 잘 나타내는 검색용 키워드 제공은 필수적이다. 방송사에서는 제작 단계, 아카이브 단계 등에서 주요 키워드를 수동으로 입력하는 방법을 주로 사용한다. 이 방식은 양적으로는 핵심 메타데이터 확보에 부족하고, 내용 면에서도 타 매체 서비스에서 콘텐츠 추천과 검색에 한계를 드러낸다. 본 연구는 EBS에서 개발한 DTV 자막방송 서버를 통해 사전 아카이빙 된 폐쇄형 자막 데이터를 활용하여 다수의 메타데이터를 확보하는 방법을 구현했다. 먼저 구글의 자연어 처리 AI 기술을 적용하여 핵심 메타데이터를 자동으로 추출하였다. 다음 단계는 핵심 연구 내용으로 우선순위와 콘텐츠 특성을 반영하여 핵심 메타데이터를 찾는 방법을 제안한다. 차별화된 메타데이터 가중치를 구하는 기술로는 TF-IDF 계산법을 응용하여 중요도를 분류했다. 실험 결과 성공적인 가중치 데이터를 얻었다. 이 연구로 확보한 문자열 메타데이터는 추후 문자열 유사도 측정 연구와 결합하면 타 매체에 제공하는 콘텐츠 서비스에서 정교한 콘텐츠 추천용 메타데이터를 확보하는 기반이 된다.

메타데이터를 활용한 기록물 자동분류 성능 요소 비교 (Comparison of Performance Factors for Automatic Classification of Records Utilizing Metadata)

  • 김영범;장우권
    • 정보관리학회지
    • /
    • 제40권3호
    • /
    • pp.99-118
    • /
    • 2023
  • 이 연구의 목적은 기록물의 맥락정보를 담고 있는 메타데이터를 활용하여 기록물 자동분류 과정에서의 성능요소를 파악하는데 있다. 연구를 위해 2022년 중앙행정기관 원문정보 약 97,064건을 수집하였다.수집한 데이터를 대상으로 다양한 분류 알고리즘과 데이터선정방법, 문헌표현기법을 적용하고 그 결과를 비교하여 기록물 자동 분류를 위한 최적의 성능요소를 파악하고자 하였다. 연구 결과 분류 알고리즘으로는 Random Forest가, 문헌표현기법으로는 TF 기법이 가장 높은 성능을 보였으며, 단위과제의 최소데이터 수량은 성능에 미치는 영향이 미미하였고 자질은 성능변화에 명확한 영향을 미친다는 것이 확인되었다.

ISAD에 기반한 공문서 메타데이터 요소 설정에 관한 연구 (A Study on Extraction of Metadata Elements Based on ISAD Rules for Official Document)

  • 남궁황
    • 정보관리학회지
    • /
    • 제21권1호
    • /
    • pp.231-251
    • /
    • 2004
  • 본 연구는 공공기관에서 생산되는 기록물로서 가장 일반적이고 대표적인 공문서를 효율적으로 관리하고 활용할 수 있도록 생산단계에서 메타데이터 정보를 획득, 관리하는데 그 목적이 있다. 공문서는 행정정보의 근원이면서 생산기관의 의사결정을 표현하고 실현하는 핵심주체로서, 생산된 공문서는 체계적으로 관리함과 동시에 효율적으로 활용할 수 있는 시스템이 구출되어야 한다. 이를 위해 공문서 관련 주요 양식의 구조 분석을 통해 항목별로 관련 데이터 요소를 추출하였으며, 추출된 요소는 국제표준기록물 기술의 데이터 요소와 상호 비교, 분석하여 공문서의 생산배경 및 의도, 특징 등이 충분히 반영된 공문서 메타데이터 요소를 영역별로 구분하여 선정하였다. 이는 향후 우리나라 환경에 적합한 표준화된 기록물 메타데이터를 구축하는데 유용한 기초자료로 활용할 수 있을 것이다.