• 제목/요약/키워드: 객체 오디오

검색결과 94건 처리시간 0.02초

실내 환경에서 Chirp Emission과 Echo Signal을 이용한 심층신경망 기반 객체 감지 기법 (DECODE: A Novel Method of DEep CNN-based Object DEtection using Chirps Emission and Echo Signals in Indoor Environment)

  • 남현수;정종필
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.59-66
    • /
    • 2021
  • 인간은 오감 (시각, 청각, 후각, 촉각, 미각) 중 시각 및 청각 정보를 위주로 사용하여 주변 물체를 인식한다. 최신의 객체 인식과 관련한 주요 연구에서는 주로 이미지센서 정보를 이용한 분석에 초점이 맞추어져 있다. 본 논문에서는 다양한 chirp 오디오 신호를 관측공간에 방출하고 2채널 수신센서를 통해 echo를 수집하여 스펙트럼 이미지로 변화시킨 후 딥러닝을 기반으로 이미지 학습 알고리즘을 이용하여 3D 공간상의 객체 인식 실험을 진행하였다. 본 실험은 무향실의 이상적 조건이 아닌 일반적인 실내 환경에서 발생하는 잡음 및 echo가 있는 환경에서 실험을 진행하였고 echo를 통해 객체 인식률을 83% 정확도로 물체의 위치 추정할 수 있었다. 또 한 추론 결과를 관측공간과 3D Sound 공간 신호로 mapping 하여 소리로 출력하여 3D 사운드의 학습을 통해 소리를 통한 시각 정보를 얻을 수 있었다. 이는 객체 인식 연구를 위해서 이미지 정보와 함께 다양한 echo 정보의 활용이 요구된다는 의미이며 이런 기술을 3D 사운드를 통한 증강현실 등에 활용 가능할 것이다.

비디오 데이타를 위한 그리드 기반의 유사 부분 궤적 검색 기법 (Similar sub-Trajectory Retrieval Technique based on Grid for Video Data)

  • 이기영;임명재;김규호;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.183-189
    • /
    • 2009
  • 최근, PCS, PDA와 같은 이동기기 보급의 확산, GPS(Global Positioning System)의 활용, 유무선 네트워크의 급속한 발전 등으로 일반 사용자들조차 이미지, 오디오, 비디오 등과 같은 멀티미디어 데이타에 대한 활용이 증가하고 있다. 특히, 멀티미디어 데이타 중에서도 비디오 데이타는 텍스트나 이미지 데이타와는 달리 이동 객체에 대한 움직임 정보를 포함하고 있고 시간의 변화에 따라 공간의 변화를 가지는 시공간적 특성을 가진다. 객체의 공간적 위치가 시간의 흐름에 따라 계속 변하는 이동객체(Moving Object)들의 연속적인 움직임들의 모임을 궤적이라 하며, 데이타베이스에서 사용자로부터 주어진 질의 궤적과 유사한 궤적을 포함하는 데이타를 찾는 것을 유사 부분궤적 검색(Similar Sub-trajectory Retrieval)이라 한다. 그리고 이러한 유사 부분궤적 검색을 하기 위해선 사용자 질의 궤적과 주어진 유사정도(Tolerance) 내에서 유사한 데이타 궤적을 검색 할 수 있는 근사 매칭(Approximate Matching)이 가능해야 한다. 또한, 방대한 멀티미디어 데이타베이스에서 사용자가 원하는 데이타 만을 보다 빠른 시간 내에 찾을 수 있도록 기존 연구와는 다른 효과적인 검색방법이 요구된다. 이를 위해, 본 논문에서는 효과적인 검색을 위해 궤적을 그리드로 분할하여 이동 객체의 궤적에 대한 효율적인 유사 부분궤적 검색을 지원하는 새로운 그리드 기반 검색 기법을 제안한다.

  • PDF

웨이브렛 기반 무손실 압축 방법을 사용한 동영상 강의 콘텐츠 제작기 구현 (A Instructional Contents Creator using Wavelet for Lossless Image Compression)

  • 이상엽;박성원
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.71-81
    • /
    • 2011
  • 동영상 강의를 손쉽게 제작하기 위해서는 카메라 촬영 영상, 화이트 보드 영상, 첨부 비디오 영상, 도큐먼트 데이터 및 오디오가 실시간으로 결합되어 동영상으로 만들어지는 알고리즘이 필요하다. 본 연구에서는 다중 미디어 객체를 실시간으로 합성하고 해당 영상의 재생산을 위하여 웨이브렛 기반 무손실 압축을 사용하는 동영상 강의 콘텐츠 제작 시스템을 구현하였다. 상용화된 PC를 사용하여 다중 미디어 객체를 실시간으로 결합시켜주는 동영상 강의 콘텐츠 편집 시스템은 동영상 강의 콘텐츠를 제작하고자 할 때 빠르고, 쉽고, 유용하게 사용될 수 있으므로, 지속적으로 증가하고 있는 이러닝 및 모바일 러닝 분야에서 교수자에게 매우 효율적인 시스템이 될 수 있을 것이다. 뿐만 아니라 제안하는 멀티미디어 실시간 합성 기술과 무손실 압축 기술은 원격 회의, 전자상거래 등 다양한 분야로의 응용이 가능하므로 더욱 의의가 있다.

대규모 이미지 데이터베이스에서 고차원 색인 구조를 이용한 효율적인 내용 기반 검색 시스템 (An Efficient Content-based Retrieval System using High-Dimensional Index Structure Image Database)

  • 이동호;박주홍;정진완;김형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권1호
    • /
    • pp.52-65
    • /
    • 1999
  • 이미지나 비디오, 오디오와 같이 멀티미디어 데이터들은 기존의 단순한 텍스트 기반의 데이터에 비하여 대용량적인 특성과 비정형적인 특성을 가지고 있어서 검색시 많은 어려움이 따른다. 본 논문에서는 대규모의 이미지 데이터베이스에서 효율적이고 신속하게 사용자가 원하는 이미지를 검색할수 있는 내용 기반 검색 시스템을 제시한다. 이를 위해서 본 논문에서는 최근 여러 장점으로 인하여 신호 분석이나 이미지 압축 분야에 많이 사용되는 웨이브릿 변환을 이용하여 이미지 데이터로부터 내용 기반 검색에 사용되는 특징 벡터를 효율적으로 추출하는 기법과 유사성 측정 방법을 제안한다. 그리고, 이러한 특징 추출방법과 유사성 측정 방법을 이용하여 내용 기반 질의 및 검색을 수행할 경우, 검색 조건을 만족하는 객체인데 실수로 검색해내지 못하는 경우인 false dismissals 이 발생하지 않음을 보인다. 또한 대규모 이미지 데이터베이스에서 신속한 내용 기반 검색을 지원하기 위하여 고차원 데이터에 대한 효율적인 색인을 제공하는 X-tree를 이용한 이미지 색인 방법을 보이며 이것이 기존의 순차 검색이나 R*-tree를 이용한 색인 방법보다 신속하게 이미지 데이터들을 검색할 수 있다는 것을 다양한 실험을 통해 보인다. 마지막으로 QBIC에서 제안한 검색 적합성 측정 방법을 이용하여 본 논문에서 제안하는 내용 기반 이미지 검색시스템의 검색 적합성을 보인다.

검색 기능을 지원하는 SMIL 플레이어의 개발 (Development of a SMIL Player Supporting the Retrieval F acility)

  • 이훈범;백인구;한기준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.98-100
    • /
    • 2000
  • 현대 사회는 웹이라는 것을 통하여 수많은 정보들을 얻을 수 있으며 시간과 공간을 초월하고 있다. 이러한 정보들 가운데 이미지, 동영상, 오디오, 텍스트 등을 실시간으로 동시에 제공받는 것은 아직도 웹 상에서는 한계가 있다. 이러한 한계를 극복하기 위해 W3C(World Wide Web Consortium)에서 XML 어플리케이션의 하나로서 SMIL (Synchronized Multimedia Integration Language)이란 표준화한 방안과 기술을 개발하였고, 이러한 표준화된 SMIL을 바탕으로 기존의 디지털 T.V, VOD, 웹 상에서의 멀티미디어 프리젠테이션 등과 같은 분야와 연계하고자 하는 연구가 활발히 진행되고 있다. 그러나, 리얼시스템사의 G2나 애플사의 QuickTime과 같은 SMIL을 지원하는 상용 플레이어들을 비롯한 기존의 다양한 SMIL 플레이어에는 SMIL 문서를 검색할 수 있는 해결책을 제시하지 못하고 있다. 현재와 같으 기하급수적인 웹의 발전은 기본적인 웹의 기능 외에 웹에 대한 다양한 검색 기능이 제공되면서부터 이며 웹의 이러한 발전 과정을 미뤄볼 때 SMIL 또한 이러한 검색 기능의 제공은 필수적이라 할 수 있다. 그러므로, 본 논문에서는 기존의 SMIL 플레이어들이 지원하지 못했던 검색 기능을 지원하기 위해 SMIL에서 의미를 가지는 엘리먼트와 컨텐트를 가지고 인덱스를 구축하고, 또한 이를 이용하여 산재해 있는 SMIL 문서와 문서내의 미디어 객체 등에 대한 검색을 수행한 후 선별적으로 디스플레이할 수 있게 하는 검색 기능을 갖는 SMIL 플레이어를 설계 및 구현한다.

  • PDF

디지털 방송 시스템에서의 방송 데이터 처리를 위한 메시지 캐슁 기반의 데이터 캐루셀 매니저 (Data Carousel Manager based Message Caching for Broadcasting Data Process in Digital Broadcasting Systems)

  • 원재훈;김세창;고상원;전제민;김정선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (D)
    • /
    • pp.431-434
    • /
    • 2007
  • 국내외 방송환경이 디지털로 급속히 변화함에 따라서 지상파, 케이블, 위성 등의 기존 방송망을 이용하며 서비스 제공자가 제공하는 데이터 서비스를 사용자가 요청 할 때 전송하는 데이터 방송은 기존의 비디오, 오디오 방송 프로그램 이외에 방송과 관련된 데이터 또는 방송과는 직접 관련이 없는 순수한 데이터를 제공하게 되었다. 데이터 방송 표준 단체인 DVB(Digital Video Broadcasting)에서는 데이터 방송 시 데이터 전송 기법으로 데이터 스트리밍(Data Streaming), 데이터 파이핑(Data Piping), 데이터 캐루셀(Data Carousel), 멀티프로토콜 인캡슐레이션(Multiprotocol Encapsulation), 객체 캐루셀(Object Carousel)을 제안하고 있다. 본 논문에서는 데이터 방송에 사용되는 데이터를 효율적으로 관리하기 위하여 메시지 캐슁과 모듈 캐슁을 기반으로 한 데이터 캐루셀 매니저 설계와 구현에 관한 내용을 다룬다.

  • PDF

MPEG-4 IPMP 저작 도구 개발 (Development of MPEG-4 IPMP Authoring Tool)

  • 김광용;홍진우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.75-78
    • /
    • 2003
  • MPEG-4 표준은 저작자가 정지영상, 텍스트, 2D/3D 그래픽스, 오디오, 심지어 임의형의 비디오 등과 같이 다양한 형태의 객체들을 개별적으로 구성하고 이들을 시/공간자적으로 다루기 용이하게 해 준다. 이와 같은 객체 기반 코딩 특성에 의해서 대화형 방송 콘텐츠를 제작하는데 가장 유용한 방식으로 고려할 수 있다. 피러나, 콘텐츠의 제작, 전송, 소비 관전에서 고려해 달 때, 콘텐츠 제작자 또는 저작권자의 보호 및 관리가 필요하게 되었다. 이에 따라 최근에는 OPIMA (Open Platform Initiative for Multimedia Access), SDMI (Secure Digital Music Initiative) and MPEG(Moving Picture Expert Group) OPIMATfMr(Intellectual Property Management & Protection)와 같은 국제 표준 단체들이 콘텐츠 보호 및 관리에 대한 관심을 가지게 되었다. 특히, MPEG의 경우에 MPEG-4 IPMP를 표준화하여 디지털 콘텐츠와 저작권에 대한 보호를 체계적이고 효과적으로 다루는 연구를 가장 활발히 해오고 있다. 이 논문에서 우리는 MPEG-4 콘텐츠 저작자가 MPEG-4 규격에 맞게 보호화 된 객체 기반 방송용 콘텐츠를 쉽고 편리하게 제작학 수 있도록 하기 위한 MPEG씨 콘텐츠 및 저자권 보호를 위한 MPEG-4 IPMP 저작 도구를 제안하고자 한다. 제안한 MPEG-4 콘텐츠 및 저작권 보호 저작 도구는 저작자에게 친근한 사용자 인터페이스를 제공하여 편집 및 수정이 용이한 텍스트 포맷인 IPMP회된 XMT(extensible Mpeg-4 Textual format) 파일을 생성한다. 또한, 콘텐츠 전송 및 저장의 효율성을 위해 이진 포멧인 IPMP화된 MP4 파일을 생성할 수 있다.으로써, 에러 이미지가 가지고 있는 엔트로피에 좀 근접하게 코딩을 할 수 있게 되었다. 이 방법은 실제로 Arithmetic Coder를 이용하는 다른 압축 방법에 그리고 적용할 수 있다. 실험 결과 압축효율은 JPEG-LS보다 약 $5\%$의 압축 성능 개선이 있었으며, CALIC과는 대등한 압축률을 보이며, 부호화/복호화 속도는 CALIC보다 우수한 것으로 나타났다.우 $23.87\%$($18.00\~30.91\%$), 갑폭 $23.99\%$($17.82\~30.48\%$), 체중 $91.51\%$($58.86\~129.14\%$)이였으며 성장율은 사육 온도구간별 차는 없었다.20 km 까지의 지점들(지점 2에서 지점 6)에서 매우 높은 값을 보이며 이는 조석작용으로 해수와 담수가 강제혼합되면서 표층퇴적물이 재부유하기 때문이라고 판단된다. 영양염류는 월별로 다소의 차이는 있으나, 대체적으로 지점 1과 2에서 가장 낮고, 상류로 갈수록 점차 증가하며 지점 7 상류역이 하류역에 비해 높은 농도이다. 월별로는 7월에 규산염, 용존무기태질소 및 암모니아의 농도가 가장 높은 반면에 용존산소포화도는 가장 낮다. 그러나 지점 14 상류역에서는 5월에 측정한 용존무기태질소, 암모니아, 인산염 및 COD 값이 7월보다 다소 높거나 비슷하다. 한편 영양염류와 COD값은 대체적으로 8월에 가장 낮으나 용존산소포화도는 가장 높다.출조건은 $100^{\circ}C$에서 1분간의 고온단시간 추출이 적합하였다. 증가를 나타내었는데, 저장기간에 따른 물성의 변화는 숭어에 비하여 붕장어가 적었다.양식산은 aspartic acid 및 proline이 많았다. 또한 잉어는 천연산이

  • PDF

HDR/WCG 비디오와 3D 오디오를 지원하는 초고품질 방송서비스와 고정 UHD/이동 HD 방송 서비스를 제공하는 ATSC 3.0 기반 UHDTV 방송 시스템 개발 (Development of ATSC3.0 based UHDTV Broadcasting System providing Ultra-high-quality Service that supports HDR/WCG Video and 3D Audio, and a Fixed UHD/Mobile HD Service)

  • 기명석;석진욱;백승권;장대영;이태진;김휘용;오혜주;임보미;배병준;김흥묵;최진수
    • 방송공학회논문지
    • /
    • 제22권6호
    • /
    • pp.829-849
    • /
    • 2017
  • TV디스플레이 대형화, 방송과 통신의 융합화, 신호 압축 및 전송 기술의 고도화로 인해 지상파 디지털 방송은 초고품질 방송, 하이브리드 방송, 고정UHD/이동HD 동시방송을 제공할 수 있는 UHD 방송으로 진화하고 있다. 이러한 지상파 UHDTV 방송을 위한 국내 표준은 북미의 차세대 방송 표준인 ATSC3.0을 근간으로 하고 있다. ATSC3.0은 비디오 압축 표준으로 HEVC 비디오 부호화 표준을, 오디오 압축 표준으로는 MPEG-H 3D 오디오 부호화 표준을 채택하고 있다. 또한 방송망과 IP망에서의 운용을 위해 기존의 MPEG-2 TS 방식을 대신하여 IP기반의 ROUTE/DASH와 MMT를 전송 포맷으로 채택하고 있으며, 4K UHD 방송과 이동 HD 서비스를 동시에 제공하기 위한 다중화 기술을 도입하고 있다. 본 논문에서는 ATSC3.0을 기반으로 HDR/WCG 지원 고품질 비디오 서비스, 10.2채널/4객체 지원 입체음향 서비스, 고정 UHD와 이동 HD 동시방송 서비스를 제공하기 위해 필요한 오디오/비디오 부호화기, ROUTE/DASH 패키저, 다중화 시스템과 물리계층 송수신을 위한 ATSC 3.0 LDM 시스템을 구현하고, 이를 실시간 방송 송수신 환경에 적용하여 서비스 가능성을 검증하고자 하였다.

대화형 T-DMB 컨텐츠의 효율적인 전송을 위한 장면기술정보 최적화 기법 (An Optimization Technique of Scene Description for Effective Transmission of Interactive T-DMB Contents)

  • 이송록;정원식;유영재;차경애
    • 방송공학회논문지
    • /
    • 제11권3호
    • /
    • pp.363-378
    • /
    • 2006
  • 디지털멀티미디어방송(Digital Multimedia Broadcasting, DMB)은 고품질의 방송 영상 및 부가 데이터를 이동 중인 차량 내에서나 모바일폰, PDA 등과 같은 휴대형 단말에서 수신할 수 있는 이동 멀티미디어 방송 서비스이다. 미디어 및 상호작용 정보의 인코딩 규격으로는 MPEG-4 표준을 사용하며, 대화형 컨텐츠의 사용자 상호작용 등의 정보는 장면기술정보인 MPEG-4 BIFS(Binary Format for Scene)에 의해서 이루어진다. 사용자와의 상호작용이 풍부하고 장면 구성이 복잡한 컨텐츠일수록 BIFS 데이터가 전송되기 위해서 요구되는 비트율도 증가한다. 그러나 이동 단말에 고품질의 비디오 및 오디오 데이터를 전송하는 DMB 환경에서는 BIFS 스트림의 전송율은 매우 제한적이다. 한편 사용자 단말기에서 DMB 컨텐츠를 재생하려면 비디오, 오디오 등 미디어 객체들을 디코딩하기 전에 장면 구성 정보인 BIFS 스트림을 디코딩 및 파싱하여야 한다. 그러므로 MPEG-4의 높은 미디어 압축율에도 불구하고 제한된 대역폭과 장면 구성 정보 등 부가 데이터 전송 및 디코딩으로 인한 지연이 발생될 수 있다. 따라서 방송 컨텐츠의 특성 상 사용자의 임의 접근 시에도 재생될 컨텐츠의 BIFS 데이터를 파싱하여 대기 시간을 최소화하도록 초기 장면 구성 정보를 효율적으로 전송해야 한다. 본 연구에서는 지상파 DMB 대화형 컨텐츠의 장면기술정보인 BIFS 스트림을 저전송율 환경에 적응된 형태로 전달하기 위해서, 장면기술정보를 최적화하는 기법을 제안한다.

문맥을 고려한 예제 기반 동영상 검색 알고리즘 (Content Based Video Retrieval by Example Considering Context)

  • 박주현;낭종호;김경수;하명환;정병희
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권12호
    • /
    • pp.756-771
    • /
    • 2003
  • 효율적인 동영상 검색 방법은 많은 양의 동영상 데이터를 관리하는 디지털 비디오 라이브러리 시스템에서 필수적으로 요구되는 기능이다. 본 논문에서는 샷 단위 동영상을 문맥, 전경, 배경, 오디오로 나누어 비교하여 질의 동영상과 비슷한 동영상을 찾아내는 예제 기반 동영상 검색 알고리즘을 제안하였고, 제안한 알고리즘에 따라서 저작 및 검색도구를 구현하였다. 샷간의 관계 정보 즉, 문맥을 고려한다는 것은 인접한 샷들 간의 오디오, 움직임 정보들과 같은 저급 수준 내용 정보 간에 변화 패턴을 비교한다는 것이다. 두 번째 비교 요소인 전경은 움직이는 객체들의 집합을 의미하고, 세 번째 비교 요소인 배경은 전경을 제외한 나머지 비디오 정보를 의미한다. 이러한 비교 방법은 동영상 제작 과정에 근거한 것으로써 사용자로 하여금 직관적인 비교를 할 수 있게 한다. 또한 질의 신을 직접 구성할 수 있게 하였고, 각각의 비교요소에 가중치를 부여할 수 있도록 하여서 사용자의 검색의도를 자유롭게 반영할 수 있도록 하였다. 본 논문에서는 동영상이 가지고 있는 의미 정보를 검색에 완전히 반영하지는 못하지만, 문맥을 통해서 부분적인 의미 정보를 사용할 수 있도록 하였으며, 질의 신 구성과 직관적인 비교 요소를 사용함으로써 사용자의 검색 의도를 최대한 반영하고자 하였다.