• 제목/요약/키워드: 입력 프레임워크

검색결과 187건 처리시간 0.026초

초협대역 비디오 전송을 위한 심층 신경망 기반 초해상화를 이용한 스케일러블 비디오 코딩 (Scalable Video Coding using Super-Resolution based on Convolutional Neural Networks for Video Transmission over Very Narrow-Bandwidth Networks)

  • 김대은;기세환;김문철;전기남;백승호;김동현;최증원
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.132-141
    • /
    • 2019
  • 매우 제한된 전송 대역을 이용하여 비디오 데이터를 전송해야 하는 필요성은, 광대역을 통한 비디오 서비스가 활성화되어 있는 현 시점에서도 꾸준히 존재한다. 본 논문에서는 초협대역 네트워크를 통한 저해상도 비디오 전송을 위해, 공간 확장형 스케일러블 비디오 코딩 프레임워크에서 기본 계층의 부호화된 프레임을 심층 신경망 기반 초해상화 기법을 이용하여 업스케일링 하여 향상 계층 부호화 시에 예측 영상으로 활용하여 부호화 효율을 높이는 방법을 제안한다. 기존의 스케일러블 HEVC (High efficiency video coding) 표준에서는 고정된 필터로 업스케일링을 하는데 비해, 본 논문에서는 초해상화 수행을 위해 학습된 심층신경망을 기존의 고정 업스케일링 필터를 대체하여 적용하는 스케일러블 비디오 코딩 프레임워크를 제안한다. 이를 위해 스킵 연결과 잔차 학습 기법 등이 적용된 심층 콘볼루션 신경망 구조를 제안하고, 비디오 코딩 프레임워크의 실제 응용 상황에 맞추어 학습시켰다. 입력 해상도가 $352{\times}288$이고 프레임율이 8fps인 영상을 110kbps로 부호화 하는 응용 상황에서, 기존의 스케일러블 HEVC 프레임워크에 비해 제안하는 스케일러블 비디오 코딩 프레임워크의 화질이 더 높고 부호화 효율이 우수함을 확인할 수 있었다.

비디오에서의 다양한 회전 각도와 회전 속도를 사용한 시 공간 자기 지도학습 (Self-Supervised Spatiotemporal Learning For Video Using Variable Rotate Angle And Speed Prediction)

  • 김태훈;황원준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.732-735
    • /
    • 2020
  • 기존에 지도학습 방법은 성능은 좋지만, 학습할 때 비디오 데이터와 정답 라벨이 있어야 한다. 그러나 이러한 데이터의 라벨을 수동으로 붙여줘야 하는 문제점과 그에 필요한 시간과 돈이 크다는 것이다. 이러한 문제점을 해결하기 위한 다양한 방법 중 자기지도학습(Self-Supervised Learning) 중 하나인 회전 방법을 비디오 데이터에 적용하여 학습하는 연구를 진행하였다. 본 연구에서는 두가지 방법을 제안한다. 먼저 기존의 비디오 데이터를 입력으로 받으면 단순히 비디오 자체를 회전시키는 것이 아닌 입력으로 들어온 비디오의 각각 프레임이 시간이 지나면서 일정한 속도로 회전을 시킨다. 이때의 회전은 총 네 가지 각도[0, 90, 180, 270]를 분류하도록 하는 방법론이다. 두 번째로 비디오의 프레임이 시간이 지나면서 변할 때 프레임 별로 고정된 각도로 회전시키는데 이때 회전하는 속도 네 가지 [1x, 0.5x, 0.25x, 0.125]를 분류하도록 하는 방법론이다. 이와 같은 제안하는 pretext task들을 통해 네트워크를 학습한 뒤, 학습된 모델을 fine tune 시켜 비디오 분류에 대한 실험을 수행 및 결과를 도출하였다.

  • PDF

소셜 네트워크 서비스 환경에서 개인정보보호를 위한 OpenAPI기반 보안 프레임워크 (An OpenAPI based Security Framework for Privacy Protection in Social Network Service Environment)

  • 윤용석;김강석;손태식
    • 정보보호학회논문지
    • /
    • 제22권6호
    • /
    • pp.1293-1300
    • /
    • 2012
  • 모바일 디바이스의 진화와 무선 네트워크의 발전으로 스마트폰 기반 모바일 소셜 네트워크 서비스의 사용자가 증가하고 있다. 또한 실시간 의사소통과 정보공유에 따른 개인정보 유출이 심각한 사회적 문제로 대두되고 있다. 이에 본 연구에서는 먼저 OpenAPI를 이용하여 소셜 네트워크 서비스 플랫폼에 연동 가능한 프레임워크를 설계하고, 개인정보보호 강화를 위해 구현된 프레임워크에 인증과 탐지 메커니즘을 제안하였다. 인증 방식으로는 아이디와 패스워드를 사용하고 탐지 방법은 사용자가 지정한 입력패턴을 분석하여 개인정보보호 가이드라인에 해당하는지 사전에 미리 검증함으로써 소셜 네트워크 서비스 환경에서의 개인정보보안을 강화하였다. 마지막으로 성능 평가를 수행하여 본 연구의 효율성 및 타당성을 입증하였다.

자연언어 데이터베이스 인터페이스 시스템을 위한 프레임워크 (A Framework for Natural Language Database Interface System)

  • 임경업;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.593-596
    • /
    • 2009
  • 자연언어 데이터베이스 인터페이스 시스템은 입력된 자연언어를 데이터베이스의 질의문(query)으로 바꿔주는 시스템으로, 데이터베이스에 잘 모르는 일반 사용자도 쉽게 데이터베이스를 이용할 수 있게 하는 장점이 있다. 본 논문에서는, 범용적인 분야의 자연언어 데이터베이스 인터페이스 시스템을 설계하기 위한 하나의 틀을 제안한다. 패턴 매칭과 구문 분석 기법을 동시에 사용하여 자연언어 처리 능력과 속도를 향상시켰으며, 패턴을 4개 분류로 나누어 의미 처리를 가능하게 하였다.

인공지능 환경에서 이닝별 데이터를 이용한 KBO 승패 예측 (KBO Win/Lose Predict Using Innings Data in AI Environments)

  • 김태훈;임성원;고진광
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1028-1030
    • /
    • 2020
  • 과거 몇 년간의 데이터를 기반으로 현재 KBO 승패를 예측하고자 하는 것으로, 경기 초반 페이스가 얼마나 승패에 영향을 미치는지 파악하고자 한다. 경기의 이닝별 데이터로 딥러닝·머신러닝을 이용해 승리 팀을 예측하여 리그 순위를 예측하고, Flask 웹 프레임워크를 통해 입력값을 받아 예측해 주는 웹사이트를 구축하였다.

단안비디오로부터 광폭 베이스라인을 갖는 라이트필드 합성기법 (Wide-baseline LightField Synthesis from monocular video)

  • 백형선;박인규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.95-96
    • /
    • 2021
  • 본 논문에서는 단안비디오 입력으로부터 각 SAI(sub-aperture image)간의 넓은 기준선을 갖는 라이트필드 합성기법을 제안한다. 기존의 라이트필드 영상은 취득의 어려움에 의해 규모가 작고 특정 물체위주로 구성되어 있어 컴퓨터 비전 및 그래픽스 분야의 최신 딥러닝 기법들을 라이트필드 분야에 적용하기 어렵다는 문제를 갖고 있다. 이러한 문제점들을 해결하기 위해 사실적 렌더링 기반의 가상환경상에서 실제환경과 유사함을 갖는 데이터를 취득하였다. 생성한 데이터셋을 이용하여 기존의 새로운 시점을 생성하는 기법 중 하나인 다중 평면 영상(Multi Plane Image) 기반 합성기법을 통해 라이트필드 영상을 합성한다. 제안하는 네트워크는 단안비디오의 연속된 두개의 프레임으로부터 MPI 추정하는 네트워크와 입력영상의 깊이 정보를 추정하는 네트워크로 구성되어 있다.

  • PDF

제스처 인식 기반의 인터랙티브 미디어 콘텐츠 제작 프레임워크 구현 (Implementation of Interactive Media Content Production Framework based on Gesture Recognition)

  • 고유진;김태원;김용구;최유주
    • 방송공학회논문지
    • /
    • 제25권4호
    • /
    • pp.545-559
    • /
    • 2020
  • 본 논문에서는 사용자의 제스처에 따라 반응하는 인터랙티브 미디어 콘텐츠를 프로그래밍 경험이 없는 사용자가 쉽게 제작할 수 있도록 하는 콘텐츠 제작 프레임워크를 제안한다. 제안 프레임워크에서 사용자는 사용하는 제스처와 이에 반응하는 미디어의 효과를 번호로 정의하고, 텍스트 기반의 구성 파일에서 이를 연결한다. 제안 프레임워크에서는 사용자의 제스처에 따라 반응하는 인터랙티브 미디어 콘텐츠를 사용자의 위치를 추적하여 프로젝션 시키기 위하여 동적 프로젝션 맵핑 모듈과 연결하였다. 또한, 제스처 인식을 위한 처리 속도와 메모리 부담을 줄이기 위하여 사용자의 움직임을 그레이 스케일(gray scale)의 모션 히스토리 이미지(Motion history image)로 표현하고, 이를 입력 데이터로 사용하는 제스처 인식을 위한 합성곱 신경망(Convolutional Neural Network) 모델을 설계하였다. 5가지 제스처를 인식하는 실험을 통하여 합성곱 신경망 모델의 계층수와 하이퍼파라미터를 결정하고 이를 제안 프레임워크에 적용하였다. 제스처 인식 실험에서 97.96%의 인식률과 12.04 FPS의 처리속도를 획득하였고, 3가지 파티클 효과와 연결한 실험에서 사용자의 움직임에 따라 의도하는 적절한 미디어 효과가 실시간으로 보임을 확인하였다.

단안 비디오로부터의 5차원 라이트필드 비디오 합성 (5D Light Field Synthesis from a Monocular Video)

  • 배규호;안드레 이반;박인규
    • 방송공학회논문지
    • /
    • 제24권5호
    • /
    • pp.755-764
    • /
    • 2019
  • 현재 사용 가능한 상용 라이트필드 카메라는 정지 영상만을 취득하거나 가격이 매우 높은 단점으로 인하여 5차원 라이트필드 비디오 취득에 어려움이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 단안 비디오로부터 라이트필드 비디오를 합성하기 위한 딥러닝 기반 기법을 제안한다. 라이트필드 비디오 학습 데이터를 취득하기 어려운 문제를 해결하기 위하여 UnrealCV를 활용하여 3차원 그래픽 장면의 사실적 렌더링에 의한 합성 라이트필드 데이터를 취득하고 이를 학습에 사용한다. 제안하는 딥러닝 프레임워크는 입력 단안 비디오에서 $9{\times}9$의 각 SAI(sub-aperture image)를 갖는 라이트필드 비디오를 합성한다. 제안하는 네트워크는 밝기 영상으로 변환된 입력 영상으로부터 appearance flow를 추정하는 네트워크, appearance flow로부터 얻어진 인접한 라이트필드 비디오 프레임간의 optical flow를 추정하는 네트워크로 구성되어 있다.

철근 배근시공도 설계 자동화 프레임워크 (A Framework for the Computer-aided Shop Drawing)

  • 맹승렬;공헌택
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.556-565
    • /
    • 2009
  • 본 논문에서는 철근 배근시공도를 자동으로 생성하기 위한 CAD 소프트웨어 프레임워크를 제안한다. 철근배근시공도는 콘크리트 구조물의 철근 배치계획을 나타내는 도면으로 시공명세와 설계규칙을 기반으로 구조도면 위에 작성되는데, 배근도 작성은 어느 정도 정형화된 작업흐름을 가지기 때문에 자동화가 가능하다. 설계 자동화 소프트웨어의 핵심은 사용자의 입력을 최소화하면서 설계명세를 자동으로 인식하여 도면의 모양과 크기, 위치 등을 결정하는 것이다. 그래픽 파이프라인을 시공명세 DB, 도면속성 추출, 속성 바인딩, 렌더링 단계로 구성하고, 속성 추출과 바인딩을 효과적으로 수행하기 위해 계층적 접근방법을 사용한다; 도면의 속성을 공통, 구조물, 도면 속성으로 구분하고 작업과정에서 자동으로 추출하며, 최종적으로 도형과 바인딩 한다. 이를 AutoCAD 환경에서 구현하였으며, 설계자의 요구에 따라 쉽게 프로그램을 수정할 수 있었다.

리눅스 기반 모바일 기기에서 사용자 응답성 향상을 위한 프레임워크 지원 선별적 페이지 보호 기법 (Framework-assisted Selective Page Protection for Improving Interactivity of Linux Based Mobile Devices)

  • 김승준;김정호;홍성수
    • 정보과학회 논문지
    • /
    • 제42권12호
    • /
    • pp.1486-1494
    • /
    • 2015
  • 스마트폰과 같은 모바일 기기가 널리 보급됨에 따라 사용자들은 모바일 기기 응용들을 사용하면서 빠른 응답성을 제공받기를 바란다. 하지만 모바일 기기 응용들은 종종 사용자가 기대하는 수준의 응답성을 제공하지 못한다. 응답성을 저해하는 주 원인들 중 하나는 과도한 페이지 폴트 발생에 따른 대화형 태스크 수행의 지연이다. 이는 대화형 태스크의 상주 페이지(resident page)들이 비대화형 태스크와의 페이지 캐시 경쟁에 의해 더욱 빈번히 희생될 페이지(victim page)으로 선정되어 스토리지로 쫓겨나기 때문이다. 이 논문은 이러한 문제를 해결하기 위해 프레임워크 지원 선별적 페이지 보호 기법을 제시한다. 제안한 기법은 프레임워크 레벨에서 대화형 태스크를 식별하고 이를 커널에 전달하여 페이지 replacement 시에 대화형 태스크의 페이지를 보호하고, 사용자 입력 처리 중에 발생하는 페이지 폴트를 줄인다. 실험 결과 제안된 기법은 기존 시스템에 비해 페이지 폴트 횟수를 37% 감소시켰고, 응답시간을 11% 단축할 수 있었다.