• 제목/요약/키워드: 미디어 포맷

검색결과 303건 처리시간 0.023초

MPEG-I Immersive Audio 표준화 동향 (MPEG-I Immersive Audio Standardization Trend)

  • 강경옥;이미숙;이용주;유재현;장대영;이태진
    • 방송공학회논문지
    • /
    • 제25권5호
    • /
    • pp.723-733
    • /
    • 2020
  • 본 고에서는 현재 탐색단계의 표준화가 진행 중인 MPEG-I Immersive Audio 표준화 동향을 소개한다. 이 표준은 5G/6G와 같은 초연결 환경에서 킬러 어플리케이션으로 기대되는 가상현실(Virtual Reality; VR) 및 증강현실(Augmemted Reality; AR)에서, 이용자가 가상환경과 상호작용을 통해 6 자유도(Degrees of freedom; DoF)로 소리를 실감나게 느끼고 실제 환경에서 경험하는 것과 같은 공간음향 체험을 제공하는 것을 목표로 한다. 이를 위하여, MPEG Audio Working Group에서는 가상현실 및 증강현실에서 공간음향 체험을 위한 시스템 구조 및 요구사항을 정의하였다. 이를 기반으로 요구사항에 대한 제안 기술 선정을 위한 오디오 평가 플랫폼(Audio evaluation platform; AEP), 인코더 입력 포맷(Encoder input format; EIF) 및 평가 절차 등에 대한 논의를 진행하고 있으며, 본 고에서는 그 주요 내용을 요약 기술한다.

한국 전자책 문서표준(EBKS)의 개발 (Development of Electoronic Book of Korea Standard)

  • 손원성;고승규;이경호;김재경;김성혁;임순범;최윤철
    • 정보관리학회지
    • /
    • 제18권2호
    • /
    • pp.255-272
    • /
    • 2001
  • 일반적으로 종이 책을 디지털화 한 것이나 디지털화 되어 종이 책의 형식과 비슷하게 사용자에게 정보를 전달하는 방식을 전자 책이라고 한다. 인터넷의 급속한 확산과 디지털 정보 기술의 발전에 힘입어 전자 책은 세계적으로 중요한 이슈로 주목되고 있다. 전자 책은 신속한 정보 전달이 가능할 뿐 아니라 가격이 저렴하고 멀티미디어 정보와 같은 기술을 사용하여 기존 종이 책에 비해 효과적인 정보 전달이 가능하다. 그러나 현재 전자 책은 다양한 문서 포맷을 이용하여 제작되고 있으며 그 결과 업체의 중복투자 및 시장 활성화의 큰 걸림돌이 되고 있다. 본 연구에서는 위와 같은 선결과제를 해결하기 위한 한국 전자 책 문서표준(EBKS)를 개발하였고 이에 대한 명확한 논리구조를 정의하였으며, 국내 현실에 적합한 메타데이터, 원문 수준의 출력 결과를 보장하는 XSL-FO를 권고한다. 이러한 EBKS의 제정은 국내 전자 책 업계의 컨텐츠 및 관련기술에 대한 중복투자를 방지하여 전자 책 시장의 활성화에 매우 큰 기여를 할 것으로 예상한다.

  • PDF

3D-HEVC를 위한 인터-컴포넌트 부호화 방법 (Overview of Inter-Component Coding in 3D-HEVC)

  • 박민우;이진영;김찬열
    • 방송공학회논문지
    • /
    • 제20권4호
    • /
    • pp.545-556
    • /
    • 2015
  • 차세대 3차원 디스플레이 및 서비스를 지원하기 위한 HEVC 기반 3차원 비디오 코딩 표준(3D-HEVC)이 최근 완료되었다. 3D-HEVC는 소수의 텍스처 영상(Texture image)과 깊이 영상(Depth map image)으로 구성된 Multi-view plus depth (MVD) 포맷을 효율적으로 처리하기 위한 표준으로써 H.264/AVC와 HEVC에서 사용하는 단일 계층 부호화 방법과 더불어 텍스처 영상들간, 깊이 영상들간, 텍스처 영상과 깊이 영상들간의 예측을 수행하는 인터-컴포넌트 부호화 기술을 추가적으로 사용한다. 본 논문에서는 3D-HEVC 표준의 일반적인 코딩 구조, 3D-HEVC 기술의 기반이 되는 인터-컴포넌트 부호화 기술 및 인터-컴포넌트 부호화 효율에 중요한 영향을 미치는 시차 벡터(Disparity vector) 유도 기술에 대해 상세히 소개한다. 또한 본 논문에서는 3D-HEVC의 부호화 효율을 검증하기 위해 각 시점을 HEVC로 부호화한 방법과 단순 다시점 확장 표준인 MV-HEVC와의 성능평가를 수행한다.

위상 정렬을 이용한 주성분 분석법의 강인한 스테레오 음원 분리 성능유지 기법 (Robust Primary-ambient Signal Decomposition Method using Principal Component Analysis with Phase Alignment)

  • 백용현;현동일;박영철
    • 방송공학회논문지
    • /
    • 제19권1호
    • /
    • pp.64-74
    • /
    • 2014
  • 스테레오 신호에서 방향성을 갖는 주음원 성분과 배경음 성분을 분리하는 과정은 스테레오 음원을 다채널 포맷으로 변환하는 업믹스 기술의 전처리 단계로 필요하다. 이를 위하여 PCA(Principal Component Analysis)가 널리 사용되고 있으나, 기존의 방법에서는 스테레오 음원이 진폭 패닝만 되었다고 가정하고 있기 때문에 채널 신호 간 위상 차이가 발생하는 경우 성능이 저하된다. 본 논문에서는 채널 신호간의 위상차에 의한 주성분 분석 방법의 오차를 분석하고 이를 보완하여 주성분 분석법 성능 저하를 방지하는 방법을 제안한다. 제안된 알고리즘은 주파수 빈(bin) 단위에서 채널 간 위상차를 추정하여 보상하고 임계대역 단위로 주성분과 주변 성분을 분리한다. 실험 결과로부터 위상차가 있는 스테레오 음원에 대하여 제안된 알고리즘이 PCA 분리 성능의 저하를 방지 하며, 패닝 각도, PAR(Primary to Ambient energy ratio)에 영향 받지 않는 강건한 분리 성능을 보임을 확인하였다.

사물인터넷을 이용한 시각 장애자 보조 방법 (A Vision Disabled-Aid using the Context of Internet of Things)

  • 네바디타 사후;정민혁;전종훈;김상균
    • 방송공학회논문지
    • /
    • 제22권1호
    • /
    • pp.78-86
    • /
    • 2017
  • 사물인터넷은 장애인들의 삶의 질을 높이기 좋은 도구로 활용될 수 있다. 특히 시각 장애인의 경우 목적지를 찾고, 진행 경로의 장애물을 발견하여 회피하거나, 목적지로의 진행 방향을 교정하는 등의 도움이 필요하다. 이러한 필요성을 바탕으로, 본 논문에서는 사물인터넷을 이용한 기초적인 장애물 회피 및 내비게이션 시스템을 제안한다. 제안된 시스템은 RFID 리더와 초음파 센서를 탑재한 스마트 지팡이, 스마트폰, 그리고 인터넷을 포함한다. 장애물 회피를 위해 초음파 센서로부터 취득된 데이터는 국제표준데이터 포맷(ISO/IEC 23005-5)으로 변환되어 스마트폰에 전달된다. 진행경로에 설치된 RFID 태그를 이용해 시각 장애인의 위치를 파악하고, 보이스 메시지를 통해 이동 경로에 대한 정보를 알려주며, 장애물을 피하기 위한 경보를 사용자에게 전해 준다. 제안된 시스템은 대학 캠퍼스 내에서 성공적으로 테스트 검증되었다.

DMB(Digital Multimedia Broadcasting) 환경에서 GIS 기반의 교통정보 전송에 관한 연구 (A Study on Transmitting GIS-based Traffic Information using DMB(Digital Multimedia Broadcasting))

  • 이봉규;송지영
    • 한국지리정보학회지
    • /
    • 제7권2호
    • /
    • pp.29-36
    • /
    • 2004
  • 본 연구는 디지털 멀티미디어 방송(DMB) 환경 하에서의 지리정보시스템(GIS) 기반 교통정보 전송 기술을 FM DARC(FM data radio channel)와 비교 분석하여 DMB 시스템 개발에 활용하는 것을 목적으로 한다. 전국적인 지능형교통시스템(ITS) 구축의 확산과 탤레매틱스(telematics) 산업의 약진 그리고 방송과 통신의 융합(convergence) 및 유비쿼터스(ubiquitous)와 같은 통신방식의 진화에 따라 GIS 기반의 교통정보 전송에 대한 표준화와 기술 개발이 급속하게 진행되고 있다. 전송매체에 따라 GML(geography markup language)이나 TPEG(transport protocol experts group)에서 보는 바와 같이 사용되는 GIS 포맷이나 프로토콜 및 표준화는 상이하며, 이에 대한 교통이나 통신 분야의 기술개발 및 국제표준규격 등은 하루가 다르게 변모하고 있다. 따라서 본 논문에서는 방송망을 이용한 교통정보 전송 기술의 발전 동향을 간략하게 살펴보고, 교통정보 전송 기술을 중심으로 FM DARC와 DMB 시스템에서 사용되는 GIS 기반기술을 비교 분석해 보도록 한다.

  • PDF

VoIP(Voice over Internet Protocol) 품질 측정을 위한 UA(User Agent) 및 서버 기능 연구 (Implementation of QoS-Measuring System for Voice over IP)

  • 강현중;남흥우
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권1호
    • /
    • pp.137-144
    • /
    • 2007
  • 유무선 통신 기술, 디지털 미디어, 그리고 영상처리 기술의 비약적인 발전과 서비스 통합화 추세는 광대역통합망(BcN: Broadband convergence Network)과 같은 초고속 네트워크를 통하여 VoIP, IPTV와 같은 여러 형태의 새로운 서비스를 창출하게 되었다. VoIP 서비스가 기존의 공중회선 교환망에서와 같은 이윤 창출을 위해서는 기존 서비스 이상의 품질을 제공하여야 한다. 따라서 실시간 품질측정 프레임워크는 VoIP 서비스를 제공하기 위한 가장 중요한 요소라고 할 수 있다. 이를 위해 IETF (Internet Engineering Task Force)에서는 RTCP (Real-Time Transport Protocol Control Protocol)를 확장한 RTCP-Extended Reports (RTCP-XR)을 정의하였다. 그러나 RTCP-XR에서는 음성품질을 측정하기 위한 항목만을 정의하였을 뿐 실제 VoIP 품질 측정을 위한 절차와 방법은 규정하지는 않았다. 본 논문은 종단간 패킷화된 음성을 효과적으로 측정하기 위한 프레임워크 제시를 목적으로 하고 있다. 이를 위해 본 논문에서는 VoIP 품질 측정개념과 더불어 제안된 프레임워크에서 측정방법을 단계적으로 기술하였다. 아울러 RTCP-XR의 개념을 확장한 새로운 형태의 포맷을 제안하였다.

  • PDF

딥러닝 기반의 의료 OCR 기술 동향 (Trends in Deep Learning-based Medical Optical Character Recognition)

  • 윤성연;최아린;김채원;오수민;손서영;김지연;이현희;한명은;박민서
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.453-458
    • /
    • 2024
  • 광학 문자 인식(Optical Character Recognition, OCR)은 이미지 내의 문자를 인식하여 디지털 포맷(Digital Format)의 텍스트로 변환하는 기술이다. 딥러닝(Deep Learning) 기반의 OCR이 높은 인식률을 보여줌에 따라 대량의 기록 자료를 보유한 많은 산업 분야에서 OCR을 활용하고 있다. 특히, 의료 산업 분야는 의료 서비스 향상을 위해 딥러닝 기반의 OCR을 적극 도입하였다. 본 논문에서는 딥러닝 기반 OCR 엔진(Engine) 및 의료 데이터에 특화된 OCR의 동향을 살펴보고, 의료 OCR의 발전 방향에 대해 제시한다. 현재의 의료 OCR은 검출한 문자 데이터를 자연어 처리(Natural Language Processing, NLP)하여 인식률을 개선하였다. 그러나, 정형화되지 않은 손글씨(Handwriting)나 변형된 문자에서는 여전히 인식 정확도에 한계를 보였다. 의료 데이터의 데이터베이스(Database)화, 이미지 전처리(Pre-processing), 특화된 자연어 처리를 통해 더욱 고도화된 의료 OCR을 발전시키는 것이 필요하다.

멀티 스펙트럴 영상들의 압축 (Compression of Multispectral Images)

  • ;최흥국
    • 한국멀티미디어학회논문지
    • /
    • 제6권1호
    • /
    • pp.28-39
    • /
    • 2003
  • 본 논문은 고해상도에 대한 멀티 스펙트럴 영상들에 대한 압축기술에 대한 연구입니다. 원래는 원격센싱 컨텍스트에 대한 개발로 이를 식품과 의료영상에 적용하였습니다마는 이러한 가능성을 여러 컨텍스트에서 처리하는 것을 목표로 두었으며 즉, 원격센싱, 식품모니터링 그리고 의료영상의 새로운 분야로 탐구 및 적용하였다. 압축은 한 화소와 관계한 이웃 간의 화소들 간의 간단한 추정에 기반하여 나타날 수 있도록 하였다. 멀티 스펙트럴 영상들은 화소들이 같은 밴드 안에서 가까이 이웃하여 있는 어떤 상접한 정도의 관계를 해석하였으며 하나의 발견된 상관관계는 어떠한 한 밴드 내에서의 계수에 기반 한다. 그 계수와의 관계는 다른 밴드에서 계산되어진 것과 유사하다. 두 번째의 관찰에서는 개발되어진 알고리즘이 화소당 비트수를 멀티 스펙트럴 위성원격영상에서 16비트에서 4비트로 감소할 수 있었다. 따라서 다른 방법론들과 속도 및 압축률에 대해서 비교 분석하였다. 보통 그래픽 포맷인 GIF, JPEG 그리고 PCX를 사용하였으며 참조와 같이 LZW Huffman과 RLE의 알고리즘을 행하였다. 소개되어진 방법들은 압축을 줄이는 것이 선상, 프로그램 안에서 혹은 관례적인 압축 알고리즘에서 속도와 압축률에서 유사한 결과를 가져왔다.

  • PDF

개선된 적응적 임계값 결정 알고리즘과 후처리 기법을 적용한 동영상 분할 방법 (Video Segmentation Method using Improved Adaptive Threshold Algorithm and Post-processing)

  • 원인수;이준우;임대규;정동석
    • 한국멀티미디어학회논문지
    • /
    • 제13권5호
    • /
    • pp.663-673
    • /
    • 2010
  • 급격하게 증가하고 있는 동영상의 관리 도구로써 동영상을 계층적이고 구조적으로 구분하는 동영상 분할은 색인, 요약, 검색 등 다양한 응용 분야에서 공통적으로 적용될 수 있는 핵심 기술이라 할 수 있다. 기존의 적응적 임계값을 사용하는 동영상 분할 방법은 연속되는 프레임 간의 차이 값과 일정 간격의 크기를 갖는 윈도우에서 임계값을 계산하여 동영상 분할을 수행하였다. 그러나 이 경우, 윈도우의 크기보다 전환점의 발생 간격이 짧거나, 주변의 차이 값이 변동이 많으면, 정확한 검출을 하지 못한다. 상기 문제점을 개선하기 위하여 본 논문에서는 동영상의 포맷에 따라 윈도우의 크기를 결정하고, 윈도우 안에서 가중치를 사용하여 주변 값의 변화에 민감하게 반응하는 개선된 적응적 임계값 결정 알고리즘을 제안한다. 또한 카메라 불빛과 큰 물체의 빠른 움직임 등에 의한 오검출을 줄이기 위해 후처리 기법을 적용하였다. 실험을 통해서 제안된 방법은 기존 방법과 비교하여 3.7%의 성능 향상을 보이며, 변형된 동영상에서 95.5%의 재현성을 갖는 것을 확인하였다. 따라서 제안된 동영상 분할 방법은 기존 방법과 비교하여 정확성이 높고, 다양한 변형에도 재현성을 가지므로 동영상 관리 도구로써 많은 응용 분야에 적용할 수 있다.