• 제목/요약/키워드: Videos

검색결과 1,523건 처리시간 0.027초

강아지 행동 분석을 위한 YOLOv4 기반의 실시간 객체 탐지 및 트리밍 (YOLOv4-based real-time object detection and trimming for dogs' activity analysis)

  • 오스만;이종욱;박대희;정용화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.967-970
    • /
    • 2020
  • In a previous work we have done, we presented a monitoring system to automatically detect some dogs' behaviors from videos. However, the input video data used by that system was pre-trimmed to ensure it contained a dog only. In a real-life situation, the monitoring system would continuously receive video data, including frames that are empty and ones that contain people. In this paper, we propose a YOLOv4-based system for automatic object detection and trimming of dog videos. Sequences of frames trimmed from the video data received from the camera are analyzed to detect dogs and people frame by frame using a YOLOv4 model, and then records of the occurrences of dogs and people are generated. The records of each sequence are then analyzed through a rule-based decision tree to classify the sequence, forward it if it contains a dog only or ignore it otherwise. The results of the experiments on long untrimmed videos show that our proposed method manages an excellent detection performance reaching 0.97 in average of precision, recall and f-1 score at a detection rate of approximately 30 fps, guaranteeing with that real-time processing.

음성정보 내용분석을 통한 골프 동영상에서의 선수별 이벤트 구간 검색 (Retrieval of Player Event in Golf Videos Using Spoken Content Analysis)

  • 김형국
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.674-679
    • /
    • 2009
  • 본 논문은 골프 동영상에 포함된 오디오 정보로부터 검출된 이벤트 사운드 구간과 골프 선수이름이 포함된 음성구간을 결합하여 선수별 이벤트 구간을 검색하는 방식을 제안한다. 전체적인 시스템은 동영상으로부터 분할된 오디오 스트림으로부터 잡음제거, 오디오 구간분할, 음성 인식 등의 과정을 통한 자동색인 모듈과 사용자가 텍스트로 입력한 선수 이름을 발음열로 변환하고, 색인된 데이터베이스에서 질의된 선수 이름과 상응하는 음성구간과 연결되는 이벤트 구간을 찾아주는 검색 모듈로 구성된다. 선수이름 검색을 위해서 본 논문에서는 음소 기반, 단어 기반, 단어와 음소를 결합한 하이브리드 방식을 적용한 선수별 이벤트 구간 검색결과를 비교하였다.

비디오자료의 의미추출을 위한 영상초록의 효용성에 관한 실험적 연구 (An Experimental Study on the Effectiveness of Storyboard Surrogates in the Meanings Extraction of Digital Videos)

  • 김현희
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.53-72
    • /
    • 2007
  • 본 연구에서는 12개의 표본 비디오 집단과 14명의 피조사자들을 이용하여 영상 초록 및 전체 클립 보기를 통한 색인어 및 요약문 추출의 정확도를 측정해 보았다. 측정결과 첫째, 비디오 유형에 따라 정확도가 차이가 있는 것으로 나타났으며 이는 이미지에 주로 의존하여 정보를 표출하는 비디오의 경우 텍스트 초록만으로 의미 파악을 하기에는 한계가 있으며 텍스트 초록이 영상 초록과 함께 사용되었을 때 시너지 효과를 낼 수 있음을 보여주고 있다. 둘째, 영상초록의 색인어 및 요약문 정확도가 전체 클립의 정확도 보다 떨어지지만 절반치에 근접한 것으로 나타나 영상 초록이 비디오 의미 추출에 효율적으로 활용될 수 있음을 확인하였다. 또한 영상 초록의 색인어 정확도(0.45)가 요약문 정확도(0.40) 보다더 높게 나타나 영상초록을 통해서 색인어 추출 작업을 더 효율적으로 할 수 있음을 확인할 수 있었다. 이러한 실험결과에 기초하여 영상 초록이 색인어 또는 요약문 추출 작업에 활용될 수 있을 뿐만 아니라, 디지털도서관 환경에서 텍스트 초록과 같은 다른 메타데이터 요소들과 함께 사용된다면 이용자의 적합성 판정을 좀 더 용이하게 할 것이며, 더 나아가 영상 질의의 매칭 자료로도 이용될 수 있음을 제안하였다. 끝으로 영상 초록의 품질을 높이기 위한 키프레임 추출 알고리즘 및 키프레임 배열 모형 설계 등 후속 연구에 대해서 제언하였다.

교육용 어학 영상의 내용 기반 특징 분석에 의한 샷 구분 및 색인에 대한 연구 (A Study on Shot Segmentation and Indexing of Language Education Videos by Content-based Visual Feature Analysis)

  • 한희준
    • 정보관리학회지
    • /
    • 제34권1호
    • /
    • pp.219-239
    • /
    • 2017
  • IT기술이 급속히 발달하고 스마트 기기의 개인보급이 늘어나면서 정보의 전달 매체로 시청각 자료 중에서도 특히 영상 자료가 많이 활용된다. 문헌정보서비스 콘텐츠로서 영상자료는 필수 요소가 되었으며, TV를 통한 단방향 전달, 인터넷을 통한 양방향 서비스, 도서관 시청각 자료 대출 등 다양한 방법으로 활용되고 있다. 특히 인터넷 환경에서 스마트 기기를 통한 영상서비스 관점에서 정보 제공자는 제공 정보에 대한 가공에 적은 노력과 비용을 들이고자 하고, 또한 사용자는 과도한 데이터 사용량에 대한 부담과 시간, 공간적인 제약으로 인해 원하는 부분만을 효율적으로 이용하고자 한다. 따라서 영상에 대한 내용을 유사한 부분끼리 자동으로 구분하고 요약, 색인하여 이용 편의성을 높일 필요가 있다. 본 논문에서는 교육용 어학 영상의 내용과 그 특성을 분석하여 영상을 이루는 샷을 자동으로 구분하고 비주얼 특징을 조합하여 어학 영상의 세분화된 내용 정보를 결정하고 색인하는 방법을 제안한다. 외국어 강의 영상을 이용한 실험에 의해 의미기반의 샷 결정에 높은 정확률을 보였으며, 교육용 어학 영상의 요약 서비스에 효율적으로 적용 가능함을 확인하였다.

전방향 시간 경계선을 활용한 멀티미디어 지역 서버에서의 효율적인 동영상 관리 기법 (An Efficient Video Management Technique using Forward Timeline on Multimedia Local Server)

  • 이준표;우순
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권10호
    • /
    • pp.147-153
    • /
    • 2011
  • 본 논문에서는 사용자와 근거리에 위치한 지역 서버에 동영상을 효율적으로 저장하고 삭제하기 위해 전방향 시간 경계선을 활용한 시간 기반 동영상 관리 기법 제안한다. 제안하는 기법은 사용자에 의해 요청된 동영상에 대한 최근성, 반복성, 그리고 지속성을 고려한 선호도를 기반으로 한다. 이를 위해 지역 서버는 설정된 일련의 시간 간격들의 영역인 전방향 시간 경계선을 활용한다. 지역 서버는 주기적으로 각 동영상에 대한 시간 요청 빈도수와 요청세그먼트 수를 측정한다. 측정된 데이터를 기반으로 지역 서버는 전방향 시간 경계선을 이용하여 평균 시간 요청 빈도수와 평균 요청 세그먼트를 계산한다. 계산된 평균 시간 요청 빈도수와 평균 요청 세그먼트를 활용하여 우선순위와 각 동영상에 할당되는 저장 공간의 크기가 예측된다. 우선순위는 지역 서버의 저장 공간이 부족할 경우 삭제 대상 동영상을 선정하기 위한 우선권이며 할당 저장 공간의 크기는 각 동영상에 부여된 최대 저장 크기이다. 또한 본 논문에서는 효율적인 동영상 저장을 위한 지역 서버의 저장 공간 분할 방법과 사용자들의 지속적인 동영상 요청에 따른 저장 공간의 오버플로우를 사전에 방지하기 위해 시간을 기반으로 예측되어지는 동영상 데이터 변화량을 활용한 안정적인 저장 공간 확보 기법을 제안한다. 실험을 통해 제안하는 방법이 기존의 방법들에 비해 보다 높은 적중률을 보이는 동시에 보다 적은 삭제 횟수를 보임을 확인한다. 이를 통해 제안하는 지역 서버에서의 동영상 관리 기법이 초기 지연시간을 최소화하는 동시에 네트워크 대역폭을 효율적으로 활용하는 것을 보인다.

HEVC 기반 다시점 컬러 영상 및 깊이 정보 맵 부호화 방법 (Multi-View Color Video and Depth Map Coding based on HEVC)

  • 유선미;남정학;임웅;심동규;정원식;허남호
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.83-93
    • /
    • 2012
  • 본 논문에서는 다시점의 컬러 영상 및 깊이 정보 맵을 효율적으로 압축하는 방법을 제안한다. 제안하는 다시점 컬러 영상과 깊이 정보 맵 압축 방법을 통하여, 컬러 영상과 깊이영상이 각각 동일시점 내에서 화면 간 참조를 수행함은 물론, 확장 시점의 컬러 영상과 깊이 정보 맵이 이웃한 시점의 컬러 영상과 깊이 정보 맵을 각각 참조하는 시점 간 참조를 추가적으로 수행함으로써 부호화 효율을 높일 수 있다. 제안한 방법을 통하여 실험을 수행한 결과 2시점의 경우 컬러 영상은 각 시점의 영상을 시점간 부호화 하지 않은 영상에 비하여 약 55%의 부호화 이득이 있었으며 깊이 정보 맵은 약 12%의 부호화 이득이 있었다. 3시점의 경우에는 컬러 영상에 대하여 바깥 시점은 화면 간 예측 부호화를 하지 않은 영상에 비해 54%, 중간 시점은 56%의 비트를 절약할 수 있었다. 또한, 3시점의 깊이 정보 맵에 대하여 예측 부호화를 하지 않은 영상에 비해 약 11%의 바깥 시점 부호화 성능과 13%의 중간 시점 부호화 성능을 얻을 수 있었다.

국내 비영리단체 후원모금 광고영상에 나타난 아동·청소년의 특징과 낙인 (The Characteristic and Stigma of Children and Adolescents in NPO's Fundraising Advertisement Videos in Korea)

  • 김주아;현은자
    • 한국콘텐츠학회논문지
    • /
    • 제19권2호
    • /
    • pp.424-437
    • /
    • 2019
  • 본 연구의 목적은 국내 비영리단체 후원모금 광고영상에 나타난 아동 청소년의 특징과 낙인, 그리고 아동 청소년에 대한 메시지유형을 분석하는 것이다. 분석대상은 주요 국내 비영리단체 7곳의 후원모금 광고영항 147편에 등장하는 아동 청소년 152명이다. 선행연구를 바탕으로 분석도구를 구성하였고, 예비연구를 거쳐 본 분석을 진행하였다. 연구결과는 다음과 같다. 첫째, 아동 청소년의 연령층은 아동과 유아가 많았다. 또한 비중이 높은 '주역할'이 높게 나타났고, '빈곤'의 상황이 가장 많이 묘사되었다. 가족형태는 '한 부모 가족'이 가장 많았고, 가족 안에서 '피보호자'의 역할이 높게 나타났다. 둘째, 낙인유형에서는 '일반'이 가장 높게 나타났고, 반 낙인유형에서는 '위험'과 '표시'가 가장 높은 비율을 보였다. 셋째, 메시지유형은 낙인형 메시지가 가장 높았다. 넷째, 2014년을 기준으로 낙인형 메시지와 가치 배제형 메시지는 증가하였고, 반 낙인형 메시지와 혼합형 메시지는 감소하였다. 본 연구 결과는 비영리단체 후원모금 광고영상이 아동 청소년의 인권을 보호하지 못하고 낙인과 같은 부정적인 영향을 미칠 수 있으므로, 전형적인 후원모금 광고영상 형식의 패러다임 변화가 필요함을 시사하고 있다.

유튜브 동영상 속 죽음과 삶을 통한 웰다잉(well-dying)과 웰에이징(well-aging) 연구 (A study of well-dying and well-aging through death and life in YouTube videos)

  • 권온;강경희;송현동;구진희;김광환
    • 디지털융복합연구
    • /
    • 제20권2호
    • /
    • pp.299-309
    • /
    • 2022
  • 유튜브 동영상은 해당 분야의 최신 트렌드를 확보하고 있으며 시청자의 선호도와 비선호도를 제공한다. 본 연구는 최근 죽음 관련 유튜브 동영상을 조사하고 삶, 웰다잉, 웰에이징 등과의 관련성을 탐색하여 한국인의 건강한 삶 구축에 기여하는 것을 목적한다. 조사 기간 및 대상은 2019년~2021년에 업로드 된 동영상 13편이다. 조사 결과 의사를 포함한 25인의 화자를 확보하였다. 동영상 화자들은 전문가의 입장에서 죽음 논의를 다채롭게 전개하였는데 핵심 사항으로는 삶의 진정한 가치, 두려워할 필요 없는 죽음, 희망의 소중함, 죽음의 자연스러움 등이 있었다. 삶, 죽음, 웰에이징, 웰다잉 등 4가지 기준에 의거하여 11개의 전문가 관점을 4가지 유형으로 재구성하였다. 특정 시기에 추출한 13편을 연구하였다는 제한에도 불구하고 본 연구는 유튜브 동영상이 자유로운 소통의 장(場)임을 밝혔다. 그것은 향후 우리 삶의 건강 유지와 향상, 융복합 연구 응용 등에 일정 부분 기여할 수 있다.

인물 개체 분할을 위한 맥락-의존적 비디오 데이터 보강 (Context-Dependent Video Data Augmentation for Human Instance Segmentation)

  • 전현진;이종훈;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권5호
    • /
    • pp.217-228
    • /
    • 2023
  • 비디오 개체 분할은 비디오를 구성하는 영상 프레임 각각에 대해 관심 개체 분할을 수행해야 할 뿐만 아니라, 해당 비디오를 구성하는 프레임 시퀀스 전체에 걸쳐 개체들에 대한 정확한 트래킹을 요구하기 때문에 난이도가 높은 기술이다. 특히 드라마 비디오에서 인물 개체 분할은 다양한 장소와 시간대에서 상호 작용하는 복수의 주요 등장인물들에 대한 정확한 트래킹을 요구하는 특징을 가지고 있다. 또한, 드라마 비디오 인물 개체분할은 주연 인물들과 조연 혹은 보조 출연 인물들 간의 등장 빈도에 상당한 차이가 있어 일종의 클래스 불균형 문제도 있다. 본 논문에서는 미생 드라마 비디오들을 토대로 구축한 인물 개체 분할 데이터 집합인 MHIS를 소개하고, 등장인물 클래스 간의 심각한 데이터 불균형 문제를 효과적으로 해결하기 위한 새로운 비디오 데이터 보강 기법인 CDVA를 제안한다. 기존의 비디오 데이터 보강 기법들과는 달리, 새로운 CDVA 보강 기법은 비디오들의 시-공간적 맥락을 충분히 고려해서 목표 인물이 삽입되어야 할 배경 클립 내의 위치를 결정함으로써, 보다 더 현실적인 보강 비디오들을 생성한다. 따라서 본 논문에서 제안하는 새로운 비디오 데이터 보강 기법인 CDVA는 비디오 개체 분할을 위한 심층 신경망 모델의 성능을 효과적으로 향상시킬 수 있다. 본 논문에서는 MHIS 데이터 집합을 이용한 다양한 정량 및 정성 실험들을 통해, 제안 비디오 데이터 보강 기법의 유용성과 효과를 입증한다.

한국 전통춤과 K-pop 댄스의 융합 : 2018 MMA 방탄소년단 'IDOL' 유튜브 댓글 분석 (Convergence of Korean Traditional Dance and K-Pop Dance : An Analysis of Comments on 2018 MMA BTS 'IDOL' Videos on YouTube)

  • 유지영;김미경
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권8호
    • /
    • pp.189-198
    • /
    • 2019
  • 이 연구는 2018년 12월 MMA의 인트로 공연 유튜브 댓글의 텍스트 마이닝을 통해 국내 대중의 반응을 의미화 하는것에 목적이 있다. 이를 위해 지난 10개월간 15개의 유튜브 영상에 달린 댓글을 수집하였다. 데이터의 수집은 Python과 BeautifulSoup프로그램을 통해 총 5,135개의 데이터를 크롤링하였고, 총 3차시에 걸쳐 데이터를 정제한 후 최종 5,080의 데이터를 분석자료로 활용하였다. 데이터 분석에는 텍스트 마이닝 기법이 적용되였고, 정제, 분석, 시각화의 모든 과정은 텍스톰(Textom) 프로그램을 이용하였다. 연구결과 키워드 분석에서는 '무대', '한국', '영상', '최고', '멋', '춤', '아이돌', '레전드', '사랑', '감사'등의 키워드 순으로 나타났고, '국뽕'이나 '올림픽'과 같은 키워드도 빈번하게 나타났다. N-gram 분석에서는 '한국의 아이돌 무대 중 전설로 남을법한 최고의 무대', '한국의 전통문화를 보여준 아이돌의 무대'라는 문맥의 댓글이 상위권에 랭킹되었다. 이와같은 키워드 분석결과를 바탕으로 토픽모델링을 적용하여 총 5개의 토픽에서 상위 5개의 키워드를 추출하였다. 토픽의 내용과 분포도를 분석한 결과 이 공연영상에 대한 댓글의 토픽은 크게 '공연무대에 대한 극찬', '한국전통춤을 융합하여 예술적으로 승화시킨 것에 대한 애정', '멋진 춤 영상을 올려준 것에 대한 감사한 마음'으로 크게 3가지의 반응으로 이루진 것을 확인하였다.