• Title/Summary/Keyword: Video-conference

Search Result 2,926, Processing Time 0.029 seconds

Landmark Retrieval System in-Video Using Vision API (Vision API를 활용한 영상 속 랜드마크 검색 시스템)

  • Jang, Jihoon;Moon, Mikyeong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.365-366
    • /
    • 2020
  • 인터넷의 발전으로 인터넷을 통해 미디어 콘텐츠를 제공하는 OTT 서비스의 이용자가 점점 증가하고 있다. 본 논문에서는 OTT 서비스 이용자의 검색 편의성을 위한 Vision API를 활용한 영상 속 랜드마크 검색 시스템을 제안한다. 이는 영상을 시청하는 사용자가 영상을 보다가 궁금한 장소가 있으면 따로 검색하지 않고, 바로 해당 장소의 정보를 얻도록 하는 것이다. 본 논문에서 개발한 영상 속 랜드마크 검색 시스템은 사용자가 원하는 영상을 검색 및 재생할 수 있고 재생 중 바로 화면을 캡처할 수 있다. 해당 캡처 이미지를 랜드마크를 기계 학습한 Vision API를 통해 어떤 랜드마크인지 파악하고 결과를 표시한다, 또한 동일 영상에서 다른 사용자가 검색한 이력이 있는 경우 이력을 표시하여주며, 검색한 랜드마크가 나온 다른 영상을 검색하여 보여준다.

  • PDF

Neural Network based Pixel to Intra Prediction Mode Decision (신경망 기반 원본영상에서 화면 내 예측 모드로 변환)

  • Kim, Yangwoo;Lee, Yung-Lyul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.671-672
    • /
    • 2020
  • VVC(Versertile Video Codec)의 화면 내 예측은 인코더에서 영상을 적절하게 사각형 블록으로 분할하고, 블록 주변의 먼저 재구성된 참조샘플들을 이용하여 예측블록을 형성한다. 인코더는 화면 내 예측 모드에서 각 PU(Prediction Unit)에 대하여 MIP(Matrix-based weighted Intra Prediction) 적용 여부, MIP에서 matrix의 인덱스, MRL(Multi Reference Line)의 인덱스, DC/Planar/Angular 모드에 대한 최적모드를 고려하여 각 정보를 디코더로 전송하며 각 후보모드들의 압축효율을 비교하는 과정에서 높은 연산량을 요구한다. 본 논문에서는 이러한 모드 결정은 원본영상으로도 대략적인 결정이 가능하다는 전제를 가지고 NN(Nueral Netwrok)의 일종인 CNN(Convolutional Nerual Network)를 이용하여 복잡한 모드 결정 방법을 생략하는 방법을 제안한다.

  • PDF

A Study of video encryption architecture for privacy protection (개인정보보호를 위한 영상 암호화 아키텍처 연구)

  • Kim, Jeongseok;Lee, Jaeho
    • Annual Conference of KIPS
    • /
    • 2020.05a
    • /
    • pp.138-141
    • /
    • 2020
  • 영상 감시 시스템은 광범위한 영역에서 쉽게 설치되고 있으며, 감시 지역을 녹화한 영상 정보는 대게 인터넷을 통한 클라우드 상의 저장소에서 관리하는 중앙 관리 방식을 사용하고 있다. 그러나 이러한 시스템의 주요한 문제점은 저장 영상의 전송 과정과 저장 대해서 객관적으로 신뢰할 수 있는 방법이 제공되지 않고 있으며, 개인정보보호를 위한 장치 유무와 별개로 모든 권한을 서비스 제공자에게 위임한 상태에서 운영하고 있다는 점이다. 본 연구에서는 공개키 기반 암호화와 블록체인 기반의 키 관리 시스템을 조합한 아키텍처를 이용하여 민감한 정보를 사용자가 안전하게 보호할 수 있는 방안을 제시한다. 제안하는 아키텍처에서는 대칭키를 사용한 블록 암호화(block-cipher) 과정을 통해 영상 정보를 암호화하고, 이때 사용하는 대칭키를 사용자의 공개키로 암호화하여 블록체인의 레저(ledger)로 기록하는 기법을 사용한다. 영상정보를 암호화하는 과정을 블록체인 네트워크의 특성(분산, 투명성, 데이터 변조 불가)을 활용하여 개인정보 영상의 생성부터 소멸까지 사용자가 추적이 가능하도록 한다.

Free view video synthesis using multi-view 360-degree videos (다시점 360도 영상을 사용한 자유시점 영상 생성 방법)

  • Cho, Young-Gwang;Ahn, Heejune
    • Annual Conference of KIPS
    • /
    • 2020.05a
    • /
    • pp.600-603
    • /
    • 2020
  • 360 영상은 시청자가 시야방향을 결정하는 3DoF(3 Degree of Freedom)를 지원한다. 본 연구에서는 다수의 360 영상에서 깊이 정보를 획득하고, 이를 DIBR (Depth -based Image Rendering) 기법을 사용하여 임의 시점 시청기능을 제공하는 6DoF(6 Degree of Freedom) 영상제작 기법을 제안한다. 이를 위하여 기존의 평면 다시점 영상기법을 확장하여 360 ERP 투영 영상으로부터 카메라의 파라미터 예측을 하는 방법과 깊이영상 추출 방법을 설계 및 구현하고 그 성능을 조사하였으며, OpenGL 그래픽스기반의 RVS(Reference View Synthesizer) 라이브러리를 사용하여 DIBR을 적용하였다.

Kubernetes Microservices for Video-based Member Verification Application (Kubernetes를 활용한 영상 기반 멤버 검증 어플리케이션의 분산 배치 기법)

  • Kim, Young-kee;Kum, Seung-woo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.45-46
    • /
    • 2020
  • 중앙 집중형 구조로 인터넷을 통해 온디맨드 컴퓨팅 리소스를 제공하는 클라우드 컴퓨팅 기술이 범용화 됨에 따라, 다양하고 높은 성능의 컴퓨팅 자원을 사용하는 어플리케이션이 늘고 있다. 하지만 특정 어플리케이션은 인터넷을 이용한 중앙 집중형 구조인 클라우드 컴퓨팅 자원을 사용하는 경우 서비스 품질에 영향을 받을 수 있다. 본 연구는 영상 기반 멤버 검증 어플리케이션의 운용에 있어 영상 데이터의 방대한 크기에 따른 지연시간, 네트워크 병목현상 및 영상에 포함된 얼굴 이미지로 인한 개인신상정보 관련 문제 등을 완화하기 위한 마이크로서비스화 및 분산 배치 기법을 보인다. 또한 이 멤버 검증 어플리케이션의 분산 배치 기법을 적용하여 Docker 컨테이너 단위 마이크로서비스의 배포, 스케일링, 운영을 자동화하기 위한 오픈소스 플랫폼인 Kubernetes를 활용하여 구현함으로써 검증하였다.

  • PDF

Neural Question Difficulty Estimator with Bi-directional Attention in VideoQA (비디오 질의 응답 환경에서 양방향 어텐션을 이용한 질의 난이도 분석 모델)

  • Yoon, Su-Hwan;Park, Seong-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.501-506
    • /
    • 2020
  • 질의 난이도 분석 문제는 자연어 질의문을 답변할 때 어려움의 정도를 측정하는 문제이다. 질의 난이도 분석 문제는 문서 독해, 의학 시험, 비디오 질의 등과 같은 다양한 데이터셋에서 연구되어 왔다. 본 논문에서는 질의문과 질의문에 응답하기 위한 정보들 간의 관계를 파악하는 것으로 질의 난이도 분석 문제를 접근하여 이를 BERT와 Dual Multi-head Attention을 사용하여 모델링 하였다. 본 논문에서 제안하는 모델의 우수성을 증명하기 위하여 최근 자연언어이해 부분에서 높은 성능을 보여주는 기 학습 언어 모델과 이전 연구의 질의 난이도 분석 모델과의 성능을 비교하였고, 제안 모델은 대표적인 비디오 질의 응답 데이터셋인 DramaQA의 Memory Complexity에서 99.76%, Logical Complexity에서는 89.47%의 정확도로 가장 높은 질의 난이도 분석 성능을 보여주었다.

  • PDF

Anomaly Detection of Video Wall Controller Using Discretized Logistic Mixture Distribution (이산화 된 로지스틱 혼합 분포를 이용한 비디오 월 컨트롤러의 이상 감지)

  • Kim, Sung-jin
    • Annual Conference of KIPS
    • /
    • 2021.11a
    • /
    • pp.552-554
    • /
    • 2021
  • 프리징은 컴퓨터 시스템에서 하나의 프로세스나 시스템 전체가 입력에 대한 응답이 중단되고 제어가 불가능한 상태가 되는 현상이다. 비디오 월 컨트롤러의 제어 시스템도 OS에서 동작하는 애플리케이션이므로 프리징이 발생할 수 있지만, 운영자가 멀티 스크린을 실시간으로 모니터링 하고 있더라도 프리징의 발생을 인지하기 어렵고, 프리징을 인지하였을 때는 이미 제어가 불가능한 상태이므로 비디오 월 컨트롤러를 재부팅 하는 것 외에는 대응할 수 있는 방법이 없다. 따라서 본 논문에서는 비디오 월 컨트롤러의 이상 여부를 감지하여 프리징을 방지할 수 있는 모델을 제안한다. 이상 감지모델은 이산화 된 로지스틱 혼합 분포의 우도 함수를 이용하여 비디오 월 컨트롤러의 이상 여부를 감지한다.

Through deep learning-based video processing, Design and implementation of Smart Port Parking Information System (딥 러닝 기반 영상처리를 통한 스마트 항만 주차정보시스템 설계 및 구현)

  • Koo, Changhun;Jung, Yoonjoo;Lee, Donggeon
    • Annual Conference of KIPS
    • /
    • 2021.11a
    • /
    • pp.1342-1345
    • /
    • 2021
  • 최근 울산항에는 화물차가 정해진 화물차 주차장이 아닌 항만 내외에 불법주차를 하는 사례가 빈번하게 발생하고 있다. 본 논문은 이러한 문제를 해결하고자 화물차 주차장 이용을 활성화하는 방안을 연구하였다. 이에 따라 화물차 주차장의 주차 현황을 실시간으로 제공하는 딥 러닝(YOLOv4) 기반 영상분석방식의 스마트 항만 주차정보시스템을 제안한다. 더불어, 제시한 방안을 통해 주차장 이용이 활성화 되었을 때의 사회적 가치를 산정하여 기존과 비교하였다.

Lossless Frame Memory Compression for Effective High Resolution Video Processing (효과적인 고해상도 비디오 처리를 위한 무손실 프레임 메모리 압축 기법)

  • Kim, Jongho
    • Annual Conference of KIPS
    • /
    • 2021.11a
    • /
    • pp.966-968
    • /
    • 2021
  • 본 논문에서는 효과적인 고해상도 비디오 데이터의 처리를 위하여 부호화기 내에서 참조 영상을 저장하는 프레임 메모리를 압축하는 방법을 제안한다. 프레임 메모리는 응용분야의 특성상 무손실 압축 및 저 복잡도를 갖는 방법이 요구되는데, 블록 단위의 PCT 를 이용하여 픽셀 사이의 상관도를 제거하고, 적응적 GR 부호기를 이용하여 최종 비트열을 구성하여 압축하는 방법을 제안한다. 다양한 테스트 영상을 대상으로 실험한 결과 제안하는 방법이 기존의 압축 방법에 비해 압축 성능이 우수하면서 실행 시간으로 측정한 복잡도 측면에서 유사한 성능을 나타냄을 확인하였다. 압축 성능과 복잡도의 두가지 측면을 종합적으로 판단한 결과 제안하는 방법이 기존의 방법에 비해 충분히 경쟁력이 있음을 알 수 있다.

Lie Detection of statements using voice and image data in the video (동영상에서 음성과 이미지 데이터를 이용한 진술의 거짓말 탐지)

  • Yang, Ji-Seok;Jin, Ye-Seom;Lee, Seoung-Woo;Weon, Ill-young
    • Annual Conference of KIPS
    • /
    • 2021.11a
    • /
    • pp.690-693
    • /
    • 2021
  • 경찰 수사에서 진술의 진실 여부를 인공지능 기법을 이용하여 판단하는 연구는 인적, 물적 자원의 낭비를 줄일 수 있다. 우리는 진술 동영상에서 이미지, 음성 데이터를 각각 추출하여 동시에 고려해 진술의 진실 여부를 자동으로 판단하는 시스템을 제안하였다. 실험을 통해 제안된 시스템이 유의미함을 알 수 있었다.