• 제목/요약/키워드: video summarization

검색결과 60건 처리시간 0.022초

구조적인 유사성에 기반한 다중 뷰 비디오의 효율적인 키프레임 추출 (Structural similarity based efficient keyframes extraction from multi-view videos)

  • 후세인 탄베르;칸 살만;무함마드 칸;이미영;백성욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권6호
    • /
    • pp.7-14
    • /
    • 2018
  • 다중 뷰 비디오로부터 두드러진 정보 추출은 인터뷰, 인트라 뷰간 상관관계와 계산 비용 때문에 매우 어려운 영역입니다. 매우 높은 계산 복잡성을 지닌 멀티 뷰 비디오에서 키프레임을 추출하기 위해 개발된 몇 가지 기술이 있습니다. 이 논문에서, 우리는 내부에 존재하는 엔트로피와 복잡한 정보를 사용하여 멀티 뷰 비디오의 키프레임 추출 접근 방식을 제시합니다. 첫 번째 단계에서는 프레임 사이의 SSIM값을 기반으로 각 보기에서 전체 비디오의 대표 샷을 추출합니다. 두 번째 단계에서는 서로 다른 보기의 모든 샷 프레임에 대한 엔트로피와 복잡성 점수가 계산됩니다. 마지막으로 엔트로피와 복잡성 점수가 가장 높은 프레임은 키 프레임으로 간주됩니다. 제안된 시스템은 사용 가능한 Office벤치마크 데이터 세에서 주관적으로 평가되며, 정확성과 시간 복잡성의 측면에서 결과는 편리합니다.

MPEG-21 터미널 (MPEG-21 Terminal)

  • 손유미;박성준;김문철;김종남;박근수
    • 방송공학회논문지
    • /
    • 제8권4호
    • /
    • pp.410-426
    • /
    • 2003
  • MPEG-21은 디지털 객체를 디지털 아이템으로 정의하고 이를 네트워크 깡에서 생성, 변형, 전달, 소비를 위한 통합적 멀티미디어 프레임워크 제공을 위한 국제 표준화 작업을 진행하고 있다. 이러한 통합적 멀티미디어 프레임워크는 네트워크 상에서의 사용자로 하여금 사용자가 원하는 디지털 아이템에 범용적 접근을 가능하게 하고 사용자가 원하는 형태로 소비 할 수 있는 환경을 제공할 것으로 기대된다. 이러한 통합 멀티미디어 프레임워크를 위한 요소 기술 표준으로서 MPEG-21에서는 디지털 아이템의 선언, 식별, 권리 표현 언어, 권리 서술 사전 및 적응 방법 등에 대한 표준화 작업을 진행하였으며, 안전하고 투명한 디지털 아이템의 전달 및 거래를 가능하게 하기 위한 표준으로서 디지털 아이템 처리, 리소스에 대한 영속 관계 기술 및 지적 자산 관리 및 보호 등에 대한 표준화 작업을 진행하고 있다. 본 논문에서는 MPEG-21의 디지털 아이템 선언, 적응 및 처리에 기반한 MPEG-21 터미널(단말) 아키텍쳐를 설계하고 MPEG-21 터미널을 구현한다. 또한 구현된 MPEG-21 터미널을 검증하기 위해 비디오 요약 서비스에 대한 응용 시나리오를 구성하였다. PC 및 PDA 플랫폼을 기반으로 하는 각각의 MPEG-21 터미널 특성에 맞게 디지털 아이템을 가공한 후 특정 형태로 디지털 아이템을 처리하고 이를 상호 호환적 형태로 터미널에서 처리하여 소비되는 일련의 실험 결과를 제시한다. 본 논문은 MPEG-21 디지털 아이템의 적응 및 처리를 위해 디지털 아이템이 표준화 된 형태로 제안된 MPEG-21 터미널에 상호 호환적 형태로 소비될 수 있는 터미널 구조 및 구현, 그리고 실험 결과를 처음으로 제시 하였다는데 의미가 있다고 할 수 있겠다.

수업용 CD-ROM 제작 및 이를 적용시킨 효과적인 학습지도안 개발 -중학교 1학년 가정 한복 입기를 중심으로- (The Production of CD-ROM for the Class and the Development of Effective Master Plan Applied by It -In the Point of Wearing Korean Traditioinal Costume for First Grade of Junior Middle School Students in Home Economics Teaching-)

  • 이은선;김병미
    • 한국가정과교육학회지
    • /
    • 제11권2호
    • /
    • pp.13-26
    • /
    • 1999
  • The goals of this research are for producing and optimizing the CD-ROM, effective and practical Teaching-Learning method. It consists of Wearing Korean Traditional Costume for the First Grade of Middle School Students in Home Economics Teaching. This research’s summarization is following. First, the multi-media material. CD-ROM making use of Powerpoint. Wearing Korean Traditional Costume, is produced to help the students learn the difficult contents in terms of video and audio. Second, it is introduced the model of Open Education for increasing the efficiency of class. Third, it is developed to proceed the class with the CD-ROM and small group study of place activity. Fourth, it helps students concentrate on the class with proper sound effect whenever the slide films are changed. And it helps to link the web sites related to Korean Traditional Costume. Finally, another kinds of suggestions are following. The effective verification of this software that is tested and applied at the field for a given period will be necessary. And, it is necessary to upgrade for the CD-ROM and the supplementary teaching materials in Korean Traditional Costume education.

  • PDF

멀티카메라 기반 동영상 요약 시스템 (Video Summarization System Based on Multi-Camera)

  • 임승빈;박한샘;민준기;황금성;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.44-48
    • /
    • 2006
  • 디지털 카메라 기술의 발전과 보급으로 공공건물의 보안 카메라부터 개인 휴대 단말기의 카메라까지 동영상 데이터를 수집할 수 있는 수단이 크게 늘었으며, 그 활용 또한 매우 일반화되었다. 동영상 데이터는 문서나 음성 등의 다른 데이터보다 훨씬 구체적이고 사실적인 정보를 포함하므로 과거의 기억을 정리하고 복원하기 위한 유용한 방법이 될 수 있다. 동영상 데이터의 증가와 함께 동영상 요약에 대한 연구가 최근에 활발히 진행되고 있는데, 이들 연구의 대부분은 하나의 동영상을 요약하고 분석하기 위한 것이다. 본 논문에서는 사무실에 여러 대의 카메라를 설치하여 데이터를 저장하며, 이렇게 수집된 동영상 데이터를 효과적으로 요약하고 검색하는 시스템을 구축한다. 동일한 이벤트를 여러 방향에서 바라보고, 그 상황을 가장 잘 설명한 카메라를 선택 할 수 있다는 점에서 멀티 카메라의 사용은 장점을 갖는다. 사전에 정의된 이벤트에 따라 전문가가 어노테이션을 부여하도록 하였으며, 전문가가 설정한 유틸리티에 따라 카메라 선택 및 요약이 이루어진다. 다양한 옵션에 따라 요약된 결과로 사용자 평가를 수행하였다.

  • PDF

채팅 트래픽 분석을 통한 개인방송 하이라이트 검출 : 게임 콘텐츠를 중심으로 (Highlight Detection in Personal Broadcasting by Analysing Chat Traffic : Game Contests as a Test Case)

  • 김은율;이계민
    • 방송공학회논문지
    • /
    • 제23권2호
    • /
    • pp.218-226
    • /
    • 2018
  • 최근 개인방송 콘텐츠의 수가 급증함에 따라 시청자의 선택이 용이하도록 방송 내용 중 흥미를 끌 만한 장면을 모아 하이라이트를 제공하는 서비스에 대한 요구가 커지고 있다. 본 논문에서는 채팅 트래픽 정보가 하이라이트 검출에 유용함을 보이고 채팅 트래픽을 이용하여 하이라이트를 검출하는 방법을 제시한다. 또한, 하이라이트 검출에 있어 채팅 트래픽 사용의 효용성을 평가하기 위해 평가 방법을 제안한다. 검출 알고리즘은 시청자 선호도가 높은 게임 방송에 적용하여 그 성능을 확인하였다.

동영상 요약 시퀀스 생성을 위한 하이브리드 유사 프레임 비교 기법 (A Hybrid Comparing Method of a Similar Frame for Generating Video Summarization Sequences)

  • 옥창석;권대건;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.394-397
    • /
    • 2012
  • 멀티미디어의 규모가 급격하게 늘어나고 있는 현재, 영화와 같은 동영상은 용량에 있어 사진과 비교했을 때 상당한 크기를 가지고 있고 그만큼 많은 정보를 담고 있다. 이렇게 많은 정보를 얻기 위해 사용자들은 많은 시간을 소비해야 한다. 이러한 비효율적인 측면의 보완을 위해 동영상의 각 프레임의 유사도를 판단하여 유사한 프레임들은 하나로 모으고, 유사하지 않은 프레임들은 구분하여 요약된 시퀀스로 보여줄 수 있는 방법이 필요하다. 이러한 관점에서 봤을 때 동영상은 시간적 순서에 따라 프레임이 배열되어 있고 인근 프레임 간에는 Coherence가 존재한다는 장점이 있다. 따라서 우리는 이러한 장점을 최대한 이용하여 동영상의 요약 시퀀스를 생성하기 위해 일차적으로 필요한 유사 프레임을 비교할 수 있는 기법을 제안한다. 제안하는 기법은 각 프레임의 공간적인 정보를 활용 할 수 있는 특징점 기반의 기법과, 각 프레임의 색 분포 정보를 활용 할 수 있는 히스토그램 기반의 기법을 Hybrid하게 적용하여 유사 프레임을 판단한다. 제안한 기법을 통해 도출한 결과를 통계학적으로 검증을 위해 널리 사용되는 Precision과 Recall을 이용하여 검증한다.

한국 수학 수업의 조직 및 교수 활동 분석: LPS(Learner's Perspective Study) 수업 자료를 중심으로 (Analysis of Korean Mathematics Class Organization and Teacher's Approach and Activities: Focused on the Lessons from Learner's Perspective Study)

  • 박경미
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제17권2호
    • /
    • pp.127-145
    • /
    • 2007
  • 본 연구에서는 13개국이 참여하고 있는 수학 수업 국제 비교 연구인 LPS(Learner's perspective Study)의 한국 수업 자료를 수업 조직과 교수 활동의 측면에서 분석하였다. 한국 교사 두 명으로부터 각각 10차시씩, 총 20차시의 수업 자료를 분석한 결과 차시의 흐름에 따라 동일 교사 내에서 수업 조직과 교수 활동이 차이를 보였지만, 두 교사의 수업에 대한 전체적인 평균을 구한 결과 수업 조직과 교수 활동의 세부 항목 비중이 상당히 근접하는 것으로 드러났다. 한편 수업 조직과 교수활동 측면에서 분석한 한국의 결과를 중국(상하이, 홍콩)의 결과와 비교함으로써 우리나라 수업의 특징을 추출하고 수업 개선을 위한 제언을 제시하였다.

  • PDF

360도 영상에서 다중 객체 추적 결과에 대한 뷰포트 추출 가속화 (Acceleration of Viewport Extraction for Multi-Object Tracking Results in 360-degree Video)

  • 박희수;백석호;이석원;이명진
    • 한국항행학회논문지
    • /
    • 제27권3호
    • /
    • pp.306-313
    • /
    • 2023
  • 실사 및 그래픽 기반 가상현실 콘텐츠는 360도 영상을 기반으로 하며, 시청자의 의도나 자동 추천 기능을 통한 뷰포트 추출이 필수적이다. 본 논문은 360도 영상에서 다중 객체 추적 기반의 뷰포트 추출 시스템을 설계하고, 다중 뷰포트 추출에 필요한 병렬화된 연산 구조를 제안한다. 360도 영상에서 뷰포트 추출 과정을 ERP 좌표의 3D 구 표면 좌표 변환과 3D 구 표면 좌표의 뷰포트 내 2D 좌표 변환 과정을 순서대로 픽셀 단위의 스레드로 구성하여 연산을 병렬화하였다. 제안 구조는 항공 360도 영상 시퀀스들에 대하여 최대 30개의 뷰포트 추출 과정에 대한 연산 시간이 평가되었으며, 뷰포트 수에 정비례하는 CPU 기반 연산 시간에 비해 최대 5240배 가속화됨을 확인하였다. ERP 프레임 I/O 시간을 줄일 수 있는 고속의 I/O나 메모리 버퍼를 사용 시 뷰포트 추출 시간을 7.82배 추가 가속화가 가능하다. 제안하는 뷰포트 추출 병렬화 구조는 360도 비디오나 가상현실 콘텐츠들에 대한 동시 다중 접속 서비스나 사용자별 영상 요약 서비스 등에 활용될 수 있다.

MPEG-7 기술자를 이용한 TV 골프 프로그램의 이벤트검출 및 요약 (Semantic Event Detection and Summary for TV Golf Program Using MPEG-7 Descriptors)

  • 김천석;이희경;남제호;강경옥;노용만
    • 방송공학회논문지
    • /
    • 제7권2호
    • /
    • pp.96-106
    • /
    • 2002
  • 본 논문에서는 최근 증가하는 TV 골프 경기의 하이라이트 부분을 요약하기 위해 시청자가 관심을 갖는 주요 이벤트를 시각 특징정보들을 이용하여 자동 추출할 수 있는 알고리즘을 제시하였다. 본 알고리즘은 4단계로 구성된다. 첫 번째 단계에서는 입력된 비디오의 샷 (Shot) 및 키 프레임 (Key Frame)을 구하여 데이터베이스화하는 구조를 분석하고, 두 번째 단계에서는 이들 정보를 이용하여 하위 레벨의 특징정보를 추출한다. 세 번째 단계에서는 특징 전보들을 통합하여 샷의 의미를 부여하여, 이벤트 구성 요소들과 정합시킨다. 네 번째 단계에서는 사전에 정의된 추론 규칙과 시간 정보를 이용하여 구성 요소들을 통합하여 이벤트를 결정한다. 본 연구에서는 하위 레벨의 특징 정보를 상호 호환성과 재사용성이 가능하도록 MPEG-7 비주얼 특징 정보를 사용하였다 TV-Anytime의 하이라이트/이벤트 스키마(schema)를 이용하여 검출된 이벤트들로 구성된 요약문을 XML 문서로 작성하였다. 제안 알고리즘의 성능을 검사하기 위해 비디오 자동 요약 시스템과 브라우징을 제작하여 실험하였으며 평균 80%의 검색 율과 정확도를 얻었다.

기록관리 분야에서 한국어 자연어 처리 기술을 적용하기 위한 고려사항 (Considerations for Applying Korean Natural Language Processing Technology in Records Management)

  • 김학래
    • 한국기록관리학회지
    • /
    • 제22권4호
    • /
    • pp.129-149
    • /
    • 2022
  • 기록물은 과거와 현재를 포함하는 시간적 특성, 특정 언어에 제한되지 않는 언어적 특성, 기록물이 갖고 있는 다양한 유형을 복합적으로 갖고 있다. 기록물의 생성, 보존, 활용에 이르는 생애주기에서 텍스트, 영상, 음성으로 구성된 데이터의 처리는 많은 노력과 비용을 수반한다. 기계번역, 문서요약, 개체명 인식, 이미지 인식 등 자연어 처리 분야의 주요 기술은 전자기록과 아날로그 형태의 디지털화에 광범위하게 적용할 수 있다. 특히, 딥러닝 기술이 적용된 한국어 자연어 처리 분야는 다양한 형식의 기록물을 인식하고, 기록관리 메타데이터를 생성하는데 효과적이다. 본 논문은 한국어 자연어 처리를 기술을 소개하고, 기록 관리 분야에서 자연어 처리 기술을 적용하기 위한 고려사항을 논의한다. 기계번역, 광학문자인식과 같은 자연어 처리 기술이 기록물의 디지털 변환에 적용되는 과정은 파이썬 환경에서 구현한 사례로 소개한다. 한편, 자연어 처리 기술의 활용을 위해 기록관리 분야에서 자연어 처리 기술을 적용하기 위한 환경적 요소와 기록물의 디지털화 지침을 개선하기 위한 방안을 제안한다.