• 제목/요약/키워드: 비디오 분할

검색결과 414건 처리시간 0.032초

문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리 (Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation)

  • 이용주;손종목;강경옥;배건성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.187-191
    • /
    • 1999
  • 비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.

  • PDF

칼라 4화면 분할기의 메모리제어 알고리듬에 관한 연구 (A Study on Memory Control Algorithm of a Compact Color QUAD System)

  • 손종형;정정화
    • 한국통신학회논문지
    • /
    • 제25권1B호
    • /
    • pp.193-200
    • /
    • 2000
  • 본 논문에서는 소형으로 설계된 칼라 4화면 분할기를 위한 메모리 제어 알고리듬을 제안한다. 4화면 분할기는 크게 비디오 디코더부, 메모리부, 비디오 인코더부, OSD (On Screen Display)부, MICOM부, 제어부로 구성되어 있다. 본 논문의 칼라 4화면 분할기는 비디오 디코더부와 비디오 인코더부를 각각 원칩을 이용하여 설계하였으며, 제어부를 FPGA를 사용하여 원칩으로 제작하였다. 화면 4분할을 위해서 메모리 읽기 신호를 실 시간으로 제어하여 비디오 시스템을 제작하였다. 사용된 메모리 제어알고리듬은 비디오신호제어 및 디지털 메모리를 이용하는 다른 시스템에 적용될 수 있다.

  • PDF

장면 보존적인 뮤직비디오 생성을 위한 다단계 분할 매칭 기법 (Scene Conserved Music Video Generation Using the Multi-Level Segmentation)

  • 윤종철;이인권
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제12권3호
    • /
    • pp.27-33
    • /
    • 2006
  • 뮤직 비디오란 주어진 음악과 비디오가 동기화 된 형태의 창작물을 뜻한다. 기존의 뮤직비디오 제작방식에서는 만들어진 음악을 위해 영상 촬영에 전문적인 촬영 기술을 요구하였다. 본 논문에선 보다 쉬운 뮤직비디오 생성을 위하여 비디오와 음악의 특성을 분석하여 자동적인 뮤직비디오 생성시스템을 소개한다. 두 개체의 연속성을 보장하는 비교를 위해 우리는 각각의 객체의 흐름을 분석하고, 흐름의 유사성을 기준으로 분할하는 기법을 제시한다. 분할된 영상과 음악의 특성 비교를 통한 최적화된 매칭기법을 비롯하여, 보다 다양한 조각 생성을 위한 다중 레벨(multi-level)분할 기반의 매칭 기법을 소개한다. 본 논문의 기술을 사용하여, 일반인이 홈비디오 등을 사용하여 손쉽게 뮤직 비디오를 제작할 수 있다.

  • PDF

다중레벨(Multi-Level) 분할 매칭을 이용한 뮤직비디오 자동 생성 (Automatic Music Video Generation using the multi-level temporal segment matching)

  • 윤종철;이인권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.94-96
    • /
    • 2006
  • 뮤직 비디오란 주어진 음악과 비디오가 동기화 된 형태의 창작물을 뜻한다. 기존의 뮤직비디오 제작방식에서는 만들어진 음악을 위해 영상 촬영에 전문적인 촬영 기술을 요구하였다. 본 논문에선 보다 쉬운 뮤직비디오 생성을 위하여 비디오와 음악의 특성을 분석하여 자동적인 뮤직비디오 생성시스템을 소개한다. 두 개체의 연속성을 보장하는 비교를 위해 우리는 각각의 객체의 흐름을 분석하고, 흐름의 유사성을 기준으로 분할하는 기법을 제시한다. 분할된 영상과 음악의 특성 비교를 통한 최적화된 매칭기법 을 비롯하여 보다 다양한 조각 생성을 위한 다중 레벨(multi-level)분할 기반의 매칭 기법을 소개한다. 본 논문의 기술을 사용하여, 일반인이 홈비디오 등을 사용하여 손쉽게 뮤직비디오를 제작할 수 있다.

  • PDF

비디오 데이터 보강을 이용한 인물 개체 분할 (Human Instance Segmentation using Video Data Augmentation)

  • 전현진;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.532-534
    • /
    • 2022
  • 본 논문에서는 미생 드라마 비디오들을 토대로 구축한 비디오 인물 개체 분할 데이터 집합인 MHIS를 소개하고, 등장인물 클래스 간의 심각한 데이터 불균형 문제를 효과적으로 해결하기 위한 새로운 비디오 데이터 보강 기법인 CDVA를 제안한다. 기존의 비디오 데이터 보강 기법들과는 달리, 새로운 CDVA 보강 기법은 비디오의 시공간적 맥락을 충분히 고려해서 부족한 인물 클래스의 훈련 비디오 데이터들을 추가 생성함으로써, 비디오 개체 분할 신경망 모델의 성능을 효과적으로 개선시킬 수 있다. 본 논문에서는 정량 및 정성 실험들을 통해, 제안 비디오 데이터 보강 기법의 우수성을 입증한다.

컬러-$x^2$ 명도 히스토그램기반 FCM 클러스터링을 이용한 비디오 분할 (Video Segmentation Using a $color-x^2$ intensity histogram-based FCM Clustering)

  • 이지현;강오형;나도원;이양원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.189-192
    • /
    • 2005
  • 비디오 분할의 목적은 같은 내용들을 가지는 프레임들의 순서를 표현하는 각 샷의 비디오 순서 분할을 위한 것이다. 그리고 색인에 대한 각 샷으로부터 키 프레임을 선택한다. 존재하는 비디오 분할 방법들은 2가지 그룹들로 분류될 수 있다. 먼저 경계값이 할당되어야만 하는 샷 전환 검출(SCD) 접근과 클러스터 수의 사전 지식이 요구되는 클러스터 접근이다. 본 논문에서는 컬러-$x^2$명도 히스토그램 기반 FCM(fuzzy c-means) 클러스터링 알고리즘을 사용하는 비디오 분할 방법을 제안하였다. 이 알고리즘은 앞에서 기술한 2가지 접근의 혼합이다. 그리고 이것은 두 가지 접근들의 결점을 극복하도록 설계 되었다. 실험 결과들은 컬러-$x^2$명도 히스토그램 기반 FCM 클러스링 알고리즘이 강건하고 비디오 시퀀스들의 다양한 형태들에 응용할 수 있다고 제안한다.

  • PDF

객체기반 비디오 편집 시스템을 위한 불확실 영역기반 사용자 지원 비디오 객체 분할 기법 (Uncertain Region Based User-Assisted Segmentation Technique for Object-Based Video Editing System)

  • 유홍연;홍성훈
    • 한국멀티미디어학회논문지
    • /
    • 제9권5호
    • /
    • pp.529-541
    • /
    • 2006
  • 본 논문에서는 객체기반 비디오 부호화 또는 멀티미디어 편집을 위한 반지동 비디오 객체 분할방식을 제안한다. 반자동 객체분할은 사용자 지원에 의한 분할 방식으로, 비디오 시퀀스의 초기 프레임에서 사용자가 관심객체의 경계를 표시하고 이후의 영상 프레임의 객체를 배경으로부터 연속적으로 분리해 낸다. 제안된 방식은 부분적으로 사용자 조력에 의한 프레임내 분할과 완전 자동에 의한 프레임간 분할 처리과정으로 구성되는데, 영상 전체에 대해 연산을 수행하는 기존 방식과는 달리 객체 경계가 존재하는 영상영역 부분에서만 연산을 수행한다. 프레임내 분할은 사용자가 관심객체의 경계를 지정하고, 이 경계 주위 화소들의 유사성을 이용한 후처리에 의해 정확한 초기 객체를 구한다. 프레임간 분할에서는 이전 프레임에서 추출한 객체의 경계 정보에 근거하여 시간적 유사성을 구한 후 경계와 영역 추적에 의해 연속적으로 동영상 객체를 추출한다. 실험결과로부터 제안된 방식은 비디오 편집, 객체기반 비디오 압축 및 인덱싱 등의 멀미디어 응용에 사용 가능할 정도로 안정되고 정확한 객체추출을 수행함을 확인하였다. 이 결과를 바탕으로 다수의 편리한 기능을 포함한 비디오 편집시스템을 개발하였다.

  • PDF

Nearest Neighbor 클러스터링 방법을 이용한 비디오 스토리 분할 (Video Story Segmentation using Nearest Neighbor Clustering Method)

  • 이해만;최영우;정규식
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.101-104
    • /
    • 2000
  • 비디오 데이터의 효율적인 검색, 요약 등에 활용하기 위해서 대용량의 비디오 데이터를 프레임(Frame), 샷(Shot),스토리(Story)의 계층적인 구조로 표현하는 방법들이 요구되고 있으며, 이에 따라 비디오를 샷, 스토리 단위로 분할하는 연구들이 수행되고 있다. 본 논문은 비디오가 샷 단위로 분할되어 있다고 가정한 후, 인접한 샷들을 결합하여 의미 있는 최소 단위인 스토리를 분할하는 방법을 제안한다. 제안하는 방법은 각 샷에서 추출된 대표 프레임들을 비교하기 위한 CCV(Color Coherence Vector) 영상 특징을 추출한다. CCV 특징의 시각적인 유사도의 초기임계값과 일정한 시간 안에 반복되는 프레임들을 찾기 위한 시간적인 유사도의 시간 임계값을 설정하여NN(Nearest Neighbor) 클러스터링 방법을 이용하여 클러스터링을 한다. 클러스터링된 정보와 같은 장면이 한번이상 반복되는 스토리의 특성을 이용해 비디오를 스토리로 분할한다. 영화 비디오 데이터를 이용한 실험을 통해 제안하는 방법의 유효성을 검증하였다.

  • PDF

인물 개체 분할을 위한 맥락-의존적 비디오 데이터 보강 (Context-Dependent Video Data Augmentation for Human Instance Segmentation)

  • 전현진;이종훈;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권5호
    • /
    • pp.217-228
    • /
    • 2023
  • 비디오 개체 분할은 비디오를 구성하는 영상 프레임 각각에 대해 관심 개체 분할을 수행해야 할 뿐만 아니라, 해당 비디오를 구성하는 프레임 시퀀스 전체에 걸쳐 개체들에 대한 정확한 트래킹을 요구하기 때문에 난이도가 높은 기술이다. 특히 드라마 비디오에서 인물 개체 분할은 다양한 장소와 시간대에서 상호 작용하는 복수의 주요 등장인물들에 대한 정확한 트래킹을 요구하는 특징을 가지고 있다. 또한, 드라마 비디오 인물 개체분할은 주연 인물들과 조연 혹은 보조 출연 인물들 간의 등장 빈도에 상당한 차이가 있어 일종의 클래스 불균형 문제도 있다. 본 논문에서는 미생 드라마 비디오들을 토대로 구축한 인물 개체 분할 데이터 집합인 MHIS를 소개하고, 등장인물 클래스 간의 심각한 데이터 불균형 문제를 효과적으로 해결하기 위한 새로운 비디오 데이터 보강 기법인 CDVA를 제안한다. 기존의 비디오 데이터 보강 기법들과는 달리, 새로운 CDVA 보강 기법은 비디오들의 시-공간적 맥락을 충분히 고려해서 목표 인물이 삽입되어야 할 배경 클립 내의 위치를 결정함으로써, 보다 더 현실적인 보강 비디오들을 생성한다. 따라서 본 논문에서 제안하는 새로운 비디오 데이터 보강 기법인 CDVA는 비디오 개체 분할을 위한 심층 신경망 모델의 성능을 효과적으로 향상시킬 수 있다. 본 논문에서는 MHIS 데이터 집합을 이용한 다양한 정량 및 정성 실험들을 통해, 제안 비디오 데이터 보강 기법의 유용성과 효과를 입증한다.

내용기반 비디오 색인 및 검색을 위한 음성인식기술 이용에 관한 연구 (A Study on the Use of Speech Recognition Technology for Content-based Video Indexing and Retrieval)

  • 손종목;배건성;강경옥;김재곤
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.16-20
    • /
    • 2001
  • 비디오 프로그램 색인 및 검색에 있어서 비디오 프로그램을 의미 있는 부분으로 분할하는 것, 즉 내용기반 비디오 프로그램 분할은 중요하다. 본 논문에서는 내용기반 비디오 프로그램 분할을 위해 음성인식기술을 이용하는 새로운 방법을 제안한다. 제안한 방법은 음성신호와 캡션 (Closed Caption)의 정확한 동기를 위해 음성인식 기법을 사용한다. 실험을 통하여 내용기반 비디오 프로그램 분할을 위해 제안한 방법의 가능성을 확인하였다.

  • PDF