• 제목/요약/키워드: 동영상 요약

검색결과 74건 처리시간 0.028초

멀티 모달 정보 분석을 이용한 TV 골프 방송 프로그램에서의 이벤트 검출 및 요약 (Event Detection and Summarization of TV Golf Broadcasting Program using Analyzed Multi-modal Information)

  • 남상순;김형국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.173-176
    • /
    • 2009
  • 본 논문에서는 영상 정보와 오디오 정보 분석을 이용하여 TV 골프 방송 프로그램에서 중요 이벤트 구간을 검출하고 요약 하는 알고리즘을 제안한다. 제안하는 알고리즘에서는 입력되는 TV 골프 동영상을 영상 신호와 오디오 신호로 분리한 후에, 연속적인 오디오 스트림을 내용 기반의 오디오 구간으로 분류한 뒤 오디오 이벤트 구간을 검출하고, 이와 병렬적으로 영상정보에서 선수들의 플레이 장면을 검출한다. 플레이 장면 검출에 있어서는 방송 환경이나 날씨 등의 변화하는 다양한 조건에 대해 플레이 장면에 대한 오프라인 모델과 함께 경기 내에서 발생한 온라인 모델에 대한 학습을 혼합 적용함으로써 검출 성능을 높였다. 오디오 신호로부터 관중들의 박수소리와 스윙 사운드를 통해 검출된 오디오 이벤트와 플레이 장면은 이벤트 장면 검출 및 요약본 생성을 위해 사용된다. 제안된 알고리즘은 멀티 모달 정보를 이용하여 이벤트 구간 검출을 수행함으로써 중요 이벤트 구간 검출의 정확도를 높일 수 있었고, 검출된 이벤트 구간에 대한 요약본 생성을 통해 골프 경기를 시청하는 사용자가 원하는 부분을 빠르게 브라우징하여 시청하는 것이 가능하여 높은 사용자 만족도를 얻을 수 있었다.

  • PDF

개선된 적응적 임계값 결정 알고리즘과 후처리 기법을 적용한 동영상 분할 방법 (Video Segmentation Method using Improved Adaptive Threshold Algorithm and Post-processing)

  • 원인수;이준우;임대규;정동석
    • 한국멀티미디어학회논문지
    • /
    • 제13권5호
    • /
    • pp.663-673
    • /
    • 2010
  • 급격하게 증가하고 있는 동영상의 관리 도구로써 동영상을 계층적이고 구조적으로 구분하는 동영상 분할은 색인, 요약, 검색 등 다양한 응용 분야에서 공통적으로 적용될 수 있는 핵심 기술이라 할 수 있다. 기존의 적응적 임계값을 사용하는 동영상 분할 방법은 연속되는 프레임 간의 차이 값과 일정 간격의 크기를 갖는 윈도우에서 임계값을 계산하여 동영상 분할을 수행하였다. 그러나 이 경우, 윈도우의 크기보다 전환점의 발생 간격이 짧거나, 주변의 차이 값이 변동이 많으면, 정확한 검출을 하지 못한다. 상기 문제점을 개선하기 위하여 본 논문에서는 동영상의 포맷에 따라 윈도우의 크기를 결정하고, 윈도우 안에서 가중치를 사용하여 주변 값의 변화에 민감하게 반응하는 개선된 적응적 임계값 결정 알고리즘을 제안한다. 또한 카메라 불빛과 큰 물체의 빠른 움직임 등에 의한 오검출을 줄이기 위해 후처리 기법을 적용하였다. 실험을 통해서 제안된 방법은 기존 방법과 비교하여 3.7%의 성능 향상을 보이며, 변형된 동영상에서 95.5%의 재현성을 갖는 것을 확인하였다. 따라서 제안된 동영상 분할 방법은 기존 방법과 비교하여 정확성이 높고, 다양한 변형에도 재현성을 가지므로 동영상 관리 도구로써 많은 응용 분야에 적용할 수 있다.

소셜 미디어와 중계영상을 활용한 실시간 문자 중계 시스템 (Real-time Text Scoreboard System using Social Media and Live Media)

  • 서동만;김수현;박호건;고희동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(D)
    • /
    • pp.193-195
    • /
    • 2012
  • 본 논문에서는 모바일 환경에서 이동중에 사용자에게 스포츠 경기를 관전할 수 있는 실시간 중계 시스템을 제안한다. 제안하는 시스템은 문자 중계를 기본으로 하여 소셜 미디어와 TV 중계 영상을 이용한 하이라이트 동영상 서비스와 소셜 미디어 요약 서비스를 함께 제공한다.

개인화된 비디오 요약 서비스를 위한 비디오 스플리터 (Video Splitter for Personalized Video Summary Services)

  • 김원철;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.541-543
    • /
    • 2002
  • 멀티미디어 관련 기술이 발전하고 인터넷 사용이 보편화되면서 모바일 단말기 상에서 비디오 데이터를 검색하려는 요구가 증가하고 있다. 그러나 모바일 단말기의 경우 낮은CPU 처리율이나 대역폭, 배터리 용량 등의 제약으로 인해 비디오를 그대로 검색하기에는 어려움이 많다. 최근 들어 비디오 데이터의 요약을 통해 모바일 환경의 제약점을 극복하고 효율적으로 비디오를 검색하기 위한 연구가 활발히 진행되고 있다. 본 논문에서는 기존의 단편적인 비디오 데이터 요약 기술에서 벗어나 요약된 비디오 데이터에 특징이나 중요도를 MPEG-7을 이용해서 주석 처리하여 사용자에게 보다 효과적인 검색 환경을 제공하고자 한다. 이러한 요약 방법은 모바일 환경에서 사용자의 우선 순위나 요구하는 특징에 적합한 동영상을 볼 수 있고 비디오의 전송시 모바일 장비의 성능에 따라 차별적으로 요약 정보를 제공함으로써 모바일 환경의 제약을 상당히 완화시킨다.

  • PDF

MPEG-7에 기반한 동영상 데이터베이스 (The MPEG-7 based Video Database)

  • 이순희
    • 한국컴퓨터산업학회논문지
    • /
    • 제8권2호
    • /
    • pp.103-106
    • /
    • 2007
  • 동영상 데이터베이스 시스템을 구축하려면 동영상의 샷 경계 검출이 먼저 이루어져야 한다. 그러나 이 과정이 자동화되지 않아 많은 시간과 노력이 필요하다. 샷 경계 검출 알고리즘은 많이 연구되고 있으나 영상 편집시 사용된 편집 효과의 발전에 의하여 완벽한 검출은 매우 어려운 실정이다. 따라서 정확한 샷 경계를 얻기 위해서는 수작업에 의한 검증과 수정이 꼭 필요하다. 시공간 슬라이스는 영상의 내용 변화를 요약한 한 장의 이미지이다. 편집 효과는 수직선, 사선, 곡선, 점진적 색상의 변화 등 시각적으로 인지 가능한 형태로 시공간 슬라이스에 표현된다. 따라서 영상을 재생시키지 않고도 시공간 슬라이스의 변화만으로 샷 경계를 쉽고 빠르게 찾아낼 수 있다. 이 논문에서 제안하고 구현한 시스템은 시공간 슬라이스 상에서 오검출 키 프레임을 삭제할 수 있으며 미검출 된 키 프레임을 생성할 수 있도록 하였다.

  • PDF

문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리 (Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation)

  • 이용주;손종목;강경옥;배건성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.187-191
    • /
    • 1999
  • 비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.

  • PDF

뉴스 동영상 요약을 위한 앵커 장면 자동 추출 알고리즘 (Automatic Detection of Anchorperson Shots for News Video Abstraction)

  • 정진국;이태연;낭종호;김경수;하명환;정병희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.274-276
    • /
    • 2001
  • 최근 많이 사용되는 대용량의 뉴스 비디오의 편리한 검색 및 관리 방법이 필요하게 되면서 뉴스 비디오 데이터를 자동으로 분석하여 저급 수준의 정보로부터 고급 수준의 내용 정보를 자동으로 추출하는 기술이 필요하게 되었다. 특히 뉴스를 요약하는데 있어서는 이런 기술이 더 유용하게 쓰일 수 있다. 앵커, 그래픽, 인터뷰, 기자보도, 회견/연설 장면 등이 뉴스 비디오의 고급 수준 내용 정보가 될 수 있는데 그 중에서도 앵커 장면은 뉴스의 기사를 나누는 고급 수준의 정보로서 중요한 의미를 갖게 된다. 본 논문에서는 이러한 앵커 장면을 자동으로 추출하는 방법을 제안한다. 앵커 장면의 공통된 특징을 이용하여 검출하게 되는데 첫 번째 특징은 한 뉴스 프로그램을 진행하는 앵커는 동일하다는 점이고 두 번째 특징은 동일한 스튜디오 안이라는 점이다. 본 논문에서는 앵커를 판별하는 방법으로 얼굴의 검출방법과 옷 색깔의 히스토그램 비교방법을 이용한다. 본 논문의 알고리즘을 여러 개의 KBS 9시 뉴스 비디오 데이터에 적용하여 실험한 결과 Recall과 Precision 모두 96% 이상 나오는 것을 알 수 있었다.

  • PDF

축구 동영상 요약을 위한 재연 장면 자동 추출 알고리즘 (A Replay Shot Detection Algorithm for the Soccer Video Abstraction)

  • 정진국;김주영;낭종호;김경수;하명환;정병희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.277-279
    • /
    • 2001
  • 최근 디지털 비디오 데이터의 사용이 급격히 증가하면서 저급 수준의 정보를 이용하여 고급 수준의 내용 정보를 자동으로 추출하는 기술이 필요하게 되었다. 축구와 같은 분야에서는 그 중에서도 골, 프리킥, 파울 장면 등의 고급 수준 내용 정보가 중요한 의미를 갖게 되는데 특히, 이러한 장면 중 중요하다고 여기는 장면은 재연 장면을 통하여 다시 시청자에게 보여주게 되며, 축구 비디오에 대한 요약에서는 이런 장면들이 꼭 포함되어야 한다. 본 논문에서는 이러한 축구 비디오 데이터에서 재연 장면을 자동으로 추출하는 방법을 제안한다. 기본적으로는 축구 고유의 특징들을 이용하는데 첫 번째 특징은 샷의 길이가 너무 짧거나 너무 길지 않다는 것이고, 두 번째 특징은 재연 장면이라는 것은 장면이 느리게 다시 재생되는 것이기 때문에 움직임 특징이 일반적인 장면과는 다르다는 것이다. 본 논문에서는 오브젝트의 움직임을 구분하기 위하여 재연 장면을 두 가지 종류로 나누었다. 하나는 확대 상태의 재연 장면이고 다른 하나는 축소 상태의 재연 장면이다. 본 논문의 알고리즘을 적용하여 실험한 결과 Recall과 precision 모두 77% 이상 나오는 것을 알 수 있었다.

  • PDF

개념 네트워크 기반 모바일 라이프 브라우저의 개발 (Development of Mobile Life Browser based on Concept Network)

  • 김경중;이영설;황금성;홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.71-76
    • /
    • 2006
  • 핸드폰, 스마트폰, PDA와 같은 모바일 디바이스는 위치, 전화기록, SMS, 사진, 동영상 등 사용자에 관한 다양한 정보를 지속적으로 수집하는데 유용하다. 최근, 모바일 디바이스로부터 수집된 정보를 토대로 개인의 일상을 요약하거나 상위 수준의 행동을 추론하는 등의 서비스를 제공하려는 연구가 진행되고 있다. 본 논문에서는 모바일 디바이스에서 수집된 정보를 검색, 요약, 시각화하기 위한 플랫폼인 라이프 브라우저를 제안한다. 라이프 브라우저는 디바이스에 저장된 개인 정보를 효과적으로 검색할 수 있도록 해주고, 개념 네트워크를 활용하여 개념 검색을 지원하며, 키그래프 기반 정보 요약 기능을 제공한다. 위치 정보의 레이블링을 위해 블록 기반의 Location Positioning Server가 구축되었다. 실제 3명의 사용자를 대상으로 수집한 정보를 라이프 브라우저를 통해 회상해 보는 과정을 분석해 보았고 저수준의 로그 정보를 직접 다루는 것보다 개념 네트워크 기반 라이프 브라우저를 사용하는 것이 유용함을 확인할 수 있었다.

  • PDF

압축영역에서 빠른 축소 영상 추출을 위한 다중부호 룩업테이블 설계 (Design of Multiple-symbol Lookup Table for Fast Thumbnail Generation in Compressed Domain)

  • 윤자천;설상훈
    • 방송공학회논문지
    • /
    • 제10권3호
    • /
    • pp.413-421
    • /
    • 2005
  • 최근 고화질 디지털 방송(HDTV : High Definition Television)이 일반화됨에 따라 보다 다양한 서비스애플리케이션이 개발되고 있으며, 이를 위한 빠른 동영상 처리 기술들이 요구되고 있다. 특히 HDTV 방송 프로그램에서 축소 영상을 포함한 동영상 요약 기술 및 축소 영상을 이용한 실시간 장면 전환 검출 기술 등은 빠른 축소 영상 처리 기술을 요구하고 있다. 축소 영상 추출을 위한 기술로 가장 대표적인 방법은 DC 영상 추출 방법이 있다. 본 논문에서는 MPEG-2로 압축된 동영상으로부터 DC 영상을 고속으로 추출하기 위한 방법을 제안한다 제안한 방법은 프레임 DCT 부호화 및 필드 DCT 부호화로 부호화된 블록에서 효율적으로 DC 영상을 추출하는 방법과, 가변장 부호화로 부호화된 DCT 계수 중 DC 영상 구성에 쓰이지 않는 DCT 계수들을 빠르게 분석할 수 있도록 다중부호 룩업테이블(multiple-symbol lookup table: mLUT)을 구성하는 방법이다. 제안한 방법에 의해서 기존 룩업테이블 참조휫수를 50$ \% $ 줄일 수 있었다.