• 제목/요약/키워드: 동영상 메타데이터

검색결과 65건 처리시간 0.025초

키밸류 저장소 성능 제어를 위한 삭제 키 분리 LSM-Tree (A Tombstone Filtered LSM-Tree for Stable Performance of KVS)

  • 이은지
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.17-22
    • /
    • 2022
  • 최근 웹 서비스의 확산과 함께 데이터의 형태는 더욱 다양해지고 있다. 이미지, 동영상, 텍스트 등 데이터를 저장하는 형태 뿐 아니라 해당 데이터를 표현하는 속성 및 메타데이터 등도 개수 및 형태가 데이터 별로 상이하다. 이러한 비정형 데이터를 효율적으로 처리하기 위해 키밸류 스토어(Key-Value Store)의 사용이 확산되고 있다. LSM-Tree(Log Structured Merge Tree)는 다양한 상용 키밸류 스토어의 핵심 자료구조이다. LSM-Tree 는 모든 쓰기 및 삭제 연산을 로그 방식으로 기록함으로써 소량의 쓰기에 높은 성능을 제공하도록 최적화 되어 있다. 그러나 최근 유효성 만료 데이터의 대용량 삭제 연산이 LSM-Tree에 특수 키밸류 데이터로 삽입됨에 따라 사용자 요청의 지연시간 및 처리속도가 저하된다는 문제점이 있다. 본 논문은 기존 LSM-Tree의 장점을 모두 유지하면서도 삭제된 키를 주요 트리 구조에서 분리하여 상기 문제를 해결하는 Filtered LSM-Tree (FLSM-Tree)를 제안한다. 제안하는 기법은 상용 키밸류 저장소인 LevelDB에 구현되었으며 성능 평가에서 읽기 성능이 최대 47% 향상됨을 보인다.

수술 동영상의 비식별화를 위한 개인식별정보 자동 검출 시스템 설계 및 구현 (Design and Implementation of Automated Detection System of Personal Identification Information for Surgical Video De-Identification)

  • 조영탁;안기옥
    • 융합보안논문지
    • /
    • 제19권5호
    • /
    • pp.75-84
    • /
    • 2019
  • 최근 의료정보기술 분야에서 비디오는 풍부한 임상정보를 포함하는 특징으로 인하여 새로운 서비스 창출 및 연구개발을 위한 중요한 데이터로서 그 가치를 새롭게 평가받고 있다. 그러나 임상정보는 개인정보를 포함하고 있어, 생명윤리 혹은 연구 윤리에 대한 고려가 필요하다. 따라서 비디오 또한 의료영상으로서 비식별화가 요구되지만 기존 방법은 주로 정형데이터와 정지영상에 특화되어 기존의 방법을 그대로 적용하기 어려운 문제가 있다. 본 논문에서는 개인정보 비식별화 처리 시스템과의 연동을 고려하여 비디오 내에서 개인식별정보를 검출하는 자동화 시스템을 제안한다. 제안 시스템은 장면분할과 체내외 영역 검출의 전처리 후에 텍스트 및 사람검출을 통한 인덱싱과정을 수행한다. 검출된 개인식별 인덱스 정보는 비식별화를 수행하는 외부 시스템 및 시각화를 위한 메타데이터로 제공된다. 제안 시스템의 효용성을 검증하기 위하여 프로토타입을 구현하고 실제 수술비디오를 대상으로 인덱싱 속도를 측정하였다. 그 결과 입력 비디오의 재생시간 대비 2배 이상의 빠른 작업속도를 보였으며, 수술교육콘텐츠 제작 및 학술용 반자동 편집시스템의 사례를 통해 빠른 의사결정을 보조할 수 있음을 확인하였다.

인공지능 맞춤 추천서비스 기반 온라인 동영상(OTT) 콘텐츠 제작 기술 비교 (Comparison of online video(OTT) content production technology based on artificial intelligence customized recommendation service)

  • 전상훈;신승중
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.99-105
    • /
    • 2021
  • 넥플릭스,유튜브로 대표되는 OTT 동영상 제작 서비스에 인공지능으로 콘텐츠를 개인별 맞춤식 추천 시스템은 보편화 되었다. 유튜브의 개인별 맞춤 추천서비스 시스템은 두 개의 신경망으로 구성되는데 신경망 하나는 추천 후보생성 모델이고 다른 하나는 순위평가 네트워크로 구성된다. Netflix의 동영상 추천 시스템은 두 개 데이터 분류 시스템으로 구성되어 있으며 콘텐츠 기반 필터링과 협업 필터링으로 나누어진다. 코로나 펜데믹으로 온라인 플랫폼 주도의 콘텐츠 제작이 활성화 되면서 인공지능을 활용한 가상 인플루언서 분야가 부각되고 있다. 가상인플루언서는 GAN(Generative Adversarial Networks) 인공지능으로 제작되는데 성격이 다른 두 시스템이 서로 경쟁하는 방식으로 학습이 반복되는 비교사(Unsupervised) 학습 알고리즘이다. 이 연구는 AI 개인별 추천 기반 플랫폼과 가상인플루언서(메타버스)가 향후 OTT의 핵심콘텐츠로의 발전 가능성도 연구해 보았다.

태깅 시스템의 태그 추천 알고리즘 (Tag Recommendation Algorithms in Tagging System)

  • 김현우;이강표;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권9호
    • /
    • pp.927-935
    • /
    • 2010
  • 웹 2.0 시대에는 웹 상의 사용자들이 수많은 멀티미디어 컨텐츠를 생성함에 따라서 멀티미디어 검색이 더욱 중요하게 되었다. URL, 사진, 동영상과 같은 웹 컨텐츠를 설명하는 간단한 키워드인 태그는, 웹 컨텐츠의 메타데이터 역할을 하고 있다. 태그가 달린 데이터의 양이 많아지면 훨씬 풍부한 메타데이터를 포함한 웹 컨텐츠를 대상으로 검색이 가능하기 때문에 태그를 이용한 검색으로 사용자가 원하는 결과를 찾을 수 있는 가능성이 높아지게 된다. 하지만 실제로 태그를 사용하는 사용자의 수는 많지 않다. 태그를 입력하는 과정이 번거롭기 때문이거나 어떠한 태그를 입력하는 것이 다른 사용자들로부터의 접근성을 높일 수 있는지 모르기 때문이다. 이러한 문제를 해결하기 위해서, 사용자의 태그 입력 과정을 도와주는 기법인 태그 추천이 연구되었다. 사용자가 어떠한 웹 컨텐츠를 게재하려고 할 때, 태그 추천 시스템이 해당 웹 컨텐츠에 적절한 태그를 추천하면, 사용자는 적절한 태그를 선택하는 것으로 태그 입력이 이루어진다. 본 연구에서는 이러한 태깅 시스템에서의 다양한 태그 추천 방법론을 분석하고, 분류하였다.

웨어러블(Wearable) MPEG 국제표준기술 (멀티미디어 통신과 제스처 인식)

  • 천승문
    • 방송과미디어
    • /
    • 제20권2호
    • /
    • pp.64-71
    • /
    • 2015
  • 웨어러블 디바이스 시장은 현재 스마트 워치를 중심으로 급속히 성장하고 있다. 웨어러블 디바이스는 심장 박동수 등 헬스케어 정보를 스마트워치나 스마트밴드의 헬스센서를 통해 얻고, 이 내용을 스마트 폰이나 서버로 전송하는 기능을 수행한다. 그리고 웨어러블 디바이스를 통해 자동차 또는 스마트폰의 메시지 통신과 통화기능까지 수행하고 있다. 현재 웨어러블 디바이스 중 하나인 스마트 글래스도 세계의 여러나라에서 개발을 시작했으며, 구글 글래스 출시 이후에 스마트 글래스의 일반인의 관심이 높아지기 시작했으며, 두 손이 자유로운 이동환경에서 동영상 촬영이나 인터넷이나 사물인터넷 통신이 가능케 하고 있다. 웨어러블 MPEG 국제표준기술은 웨어러블 기기의 가장 중요한 특징을 기초로 하고 있다. 그 중요한 특징은 웨어러블 기기에서 키보드를 사용할 수 없다는 것이다. 웨어러블 디바이스를 사용하는데 제스처, 보이스 명령어를 이용하게 되고, 이 명령어로 멀티미디어 콘텐츠를 제어하는 것이 중요한 요소기술이다. 전세계 웨어러블 디바이스 제조사 입장에서는 스마트폰 또는 다른 웨어러블 디바이스와 통신을 위해 멀티미디어 응용 어플리케이션에 대하여 상호 통신이 가능한 메타데이터 정합표준이 필요하다. 이와 관련된 파일포맷정보의 국제표준화가 시급한 상황이다. 상호 통신을 위해 웨어러블 디바이스에서 사용자로 전달되는 명령어체계는 크게 제스처 명령어, 보이스 명령어와 터치 명령어로 나눌 수 있다. 웨어러블 MPEG 국제표준기술 중에서 멀티미디어 통신과 제스처인식 분야에서는 세가지의 명령어 집합을 기준으로 웨어러블 디바이스의 멀티미디어 콘텐츠를 제어하는 것이 중요한 부분이다.

메타데이타를 삽입한 디지털 콘텐츠 생성 도구 개발 (Development of Digital Contents Authoring Tool using Metadata)

  • 천수덕;주상욱;이상준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.50-54
    • /
    • 2007
  • 정보기술은 통신 및 멀티미디어 기술의 발전에 힘입어 빠르게 발전되고 있으며, 이에 따른 데이타베이스의 기술이 공간데이타, XML, 비디오, 음성과 같은 다양한 멀티미디어 데이터 분야에 적용되고 있다. 비디오 데이타는 순차적인 특성을 가지며, 시간과 공간정보가 결합된 3차원 데이타로서 처리시간이 높은 작업이기 때문에 검색이나 브라우징이 대단히 비효율적이다. 본 논문에서는 비주얼리듬을 이용하여 비디오 데이타에서 대표 프레임(Key Frame)을 추출한 다음 XML을 이용한 태그 및 키워드 정보를 대표 프레임에 삽입하여 검색이나 브라우징을 할 수 있는 동영상 내용편집 도구(Authoring Tool for Video Contents)를 제안한다. 비주얼리듬은 3차원의 시공간적인 정보를 2차원으로 매핑한 정보로 IDCT(inverse Discrete Cosine Transform)과정 없이 픽셀 정보를 얻을 수 있어 처리속도가 빠르며 컷, 와이프, 디졸브 등의 편집효과를 효과적으로 구분할 수 있다. 그리고 XML 데이타에는 태그 및 정보와 함께 대표 프레임의 정보까지 저장되므로 유사 화면 검색이나 내용 기반 검색을 제공할 수 있다.

  • PDF

태그 동시 출현의 동적인 특징을 이용한 개선된 태그 클라우드의 태그 선택 방법 (Improved Tag Selection for Tag-cloud using the Dynamic Characteristics of Tag Co-occurrence)

  • 김두남;이강표;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권6호
    • /
    • pp.405-413
    • /
    • 2009
  • 태깅 시스템은 인터넷 사용자로 하여금 태그라고 불리는 메타데이터를 글, 사진, 동영상 등에 부여하도록 하여서 컨텐츠의 검색 및 브라우징을 편리하게 하는 시스템이다. 컨텐츠의 브라우징을 위해서 태그 클라우드라는 시각적 인터페이스가 널리 쓰이고 있다. 태그 클라우드는 가장 빈도수가 높은 태그들을 알파벳 순으로 보여주고 폰트의 크기로 그 태그들의 빈도수를 반영한다. 하지만 기존의 태그 선택 방법은 몇 가지 단점들이 알려져 있다. 그래서 이 논문은 참신한 컨텐츠들을 찾을 수 있도록 Freshness라는 태그 클라우드를 위한 새로운 태그 선택 방법을 정의하였다. Freshness는 태그 동시 발생 확률 분포(tag co-occurrence probability distribution)가 동적으로 변화하는 것을 Kullback-Leibler divergence로 평균한 값이다. Allblog, Eolin, Technorati 등 세 개의 웹사이트로부터 실제 태그 데이터를 수집하여 우리의 태그 클라우드를 생성하는 시스템, 'Fresh Tag Cloud'를 구축하였다. 이 태그 클라우드를 Allblog에서 수집한 데이터에서 전통적인 태그 클라우드와 비교했을 때 중복평균이 87.5% 감소하여서 성능이 더 향상된 것을 확인할 수 있다.

Music Player MAF 의 확장 포맷 연구 및 XMT를 이용한 저작 툴 개발 (An Extension to Music Player MAF and Implementation of its Player and Authoring tool)

  • 양찬석;임정연;김문철
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.413-418
    • /
    • 2006
  • 개인용 미디어 단말로서 MP3 플레이어는 이제 음악 파일을 감상하기 위한 일상 생활에서 중요한 휴대 필수품이 되었으며 단순히 음악을 재생하는데 그치지 않고, 각종 정보들을 표시하기 위한 작은 화면이 부착되고 있으며 더 나아가 이미지 정보나 동영상을 표현할 수 있는 기능들이 추가 되고 있다. 이처럼 변화하는 멀티미디어 서비스에 발맞추어 MPEG 에서는 Multimedia Application Format (MAF) (ISO/IEC 23000) 라는 새로운 표준안을 제안하였다. MAF 표준안의 기본 방식은 산업 현장 및 사용자의 요구에 빠르게 부응하기 위해, 기존에 존재하는 표준안들을 결합시켜 새로운 멀티미디어 파일 포맷을 정립하였다. 그 첫 번째 결과물로서, 이미 널리 쓰이고 있는 MP3 파일 포맷에 새로운 기능을 추가하기 위한 Music Player MAF 포맷의 FDIS 가 제안되었다. Music Player MAF 는 MPEG-1 Audio Layer III(MP3) 와 MPEG-7 MDS 메타데이터 정보를 결합한 파일 포맷으로. 기존 ID3 태그에서 표현되는 정보 보다 훨씬 풍부한 메타데이터 정보와 더불어 선택적으로 하나의 JPEG 이미지를 포함한 형태로 이루어져 있다. 그러나, 현재의 파일 포맷은 시간이 고려되지 않은 하나의 JPEG 이미지만을 포함할 수 있기 때문에, 오늘날 사용자가 요구하는 다양한 멀티미디어 서비스를 제공하기에는 많은 한계점을 갖고 있다. 본 논문에서는 Music Player MAF FDIS 에 제안된 세가지 형태의 Music Player MAF 파일 포맷에 관해 기술 한다. 복수의 JPEG 이미지 및 텍스트를 저장하기 위하여 각각의 파일 포맷이 갖는 문제점을 언급하고 하나 이상의 JPEG 이미지와 자막 정보를 MP3 음악 정보와 동기화 시켜 추가 할 수 있는 기능을 추가를 제안한다. 또한 제안된 파일 포맷을 쉽게 생성할 수 있도록 기존의 XMT-O 스키마를 기반으로 MAF 를 위하여 새롭게 MAF XMT 스키마를 정의하고 정의된 스키마를 기반으로 구현된 Music Player MAF 의 저작툴과 제안된 확장 뮤직 플래이어 MAF 을 위한 재생툴을 구현한다.

  • PDF

다중 얼굴 태깅 자동화 (Automatic Tagging Scheme for Plural Faces)

  • 이충연;이재동;진성아
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.11-21
    • /
    • 2010
  • 최근 웹페이지의 생성 및 웹이 가진 정보량이 기하급수적으로 늘면서 사용자의 검색 목적을 파악하여 효율을 높이기 위한 다양한 방법이 연구되고 있으며, 태깅 시스템이 하나의 대안으로 떠오르고 있다. 태깅 시스템은 인터넷 사용자로 하여금 태그라고 불리는 메타데이터를 글, 사진, 동영상 등에 부여하도록 함으로써 콘텐츠의 검색 및 브라우징을 편리하게 하는 시스템이다. 이처럼 태그는 해당 페이지의 대표 키워드를 의미하므로 콘텐츠 분류의 기준을 마련할 수 있으나, 사용자에 의해 직접 입력되어야 하는 수고가 필요하고, 또한 무분별한 태깅으로 인해 오히려 분류에 방해가 되는 등의 문제점들이 있다. 본 논문에서는 이러한 태깅의 문제를 해결하기 위한 방법으로 얼굴인식 알고리즘을 활용한 영상콘텐츠 내에서의 다중 얼굴 태깅 자동화 방법을 제시한다. 이를 위해 먼저 여러 얼굴검출 방법 중 Haar-like features와 AdaBoost 알고리즘을 이용하여 빠른 속도와 높은 정확도로 영상콘텐츠 내에서 얼굴 영역을 검출한다. 이후 PCA와 고유얼굴을 이용하여, 검출해 낸 얼굴을 데이터베이스에 미리 저장해 놓은 프로필 사진과 비교, 인식해냄으로써 해당 인물에 대한 정보를 불러와서 자동으로 태깅하는 시스템을 구현하였다. 이러한 새로운 방식의 태깅 기술은 현존하는 사진공유, 쇼핑, 검색 등의 수많은 웹서비스에 적용이 가능하며, 특히 소셜네트워크서비스에서의 사진 관리나 인물검색 등에서 활용할 때 큰 효과를 보일 것으로 기대된다.

촬영 샷 정보를 활용한 2차원 영상의 입체 변환 (Stereoscopic conversion of 2D Image using Shot Information)

  • 김제동;계이기;최황규;조병철;김만배
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2009년도 정보 및 제어 심포지움 논문집
    • /
    • pp.219-221
    • /
    • 2009
  • In this paper, we present stereoscopic conversion based on movie shot information. To overcome the low stereoscopic quality of automatic stereo conversion technologies, the usage of the shot type is expected to provide more satisfactory stereoscopic perception. In general, movie clips are produced with a variety of shot techniques such as long shot, closeup shot, medium shot, etc. Each shot has its own characteristics that can be utilized during the conversion process. Furthermore, description sceme for shot and camera information is presented in XML. XML shot editor generates XML shot data. and conversion module parses such data and converts 2D image into stereoscopic image.

  • PDF