• 제목/요약/키워드: 오디오기술

검색결과 655건 처리시간 0.028초

DirectShow를 이용한 디지털 오디오 효과 필터의 개발 (Development of Digital Audio Effect Filters Using DirectShow)

  • 박세형;구덕회;신재호;김영식;장덕호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.306-308
    • /
    • 1998
  • 본 논문에서는 멀티미디어 스트림을 제어하는 표준으로 Microsoft사에서 제안한 DirectShow의 특성을 살펴보고, 디지털 오디오 효과 필터 5가지에 대한 요소를 분석하며, 분석한 자료를 토대로 파라미터 및 기본 기능을 설계한다. 이러한 설계를 바탕으로 DirectShow를 이용하여 디지털 오디오 효과 필터를 구현한다. DirectShow는 윈도 95와 윈도 NT 기반의 멀티미디어 스트림 제어를 COM으로 구현할 수 있게 한다. 따라서 구현되는 필터의 삽입, 삭제, 변경, 등이 용이하게 된다. 이 논문에서 구현한 오디오 효과 필터 5가지는 오디오의 기본적인 특성을 이용하는 필터로서 오디오 필터 구현을 위한 핵심 기술이 많이 이용된 필터라고 할 수 있다.

  • PDF

방송 컨텐츠 보호를 위한 디지털 오디오 워터마킹 (Digital Audio Watermarking for Copyright Protection of Broadcasting Content)

  • 오현오;윤대희;석종원;홍진우
    • 방송공학회논문지
    • /
    • 제6권1호
    • /
    • pp.3-12
    • /
    • 2001
  • 디지털 오디오 워터마킹 기술은 최근 들어 많은 응용 분야에서 관심을 가지고 있는 새로운 연구분야이다. 디지털 방송의 경우도 컨텐츠에 대한 저작권 보호 필요성이 요구됨에 따라 오디오 워터마킹에 대한 관심이 고조되고 있다. 디지털 워터마킹이란 영상, 오디오 등과 같은 디지털 데이터에 보이거나 들리지 않는 정보를 은닉시키는 기술을 말한다. 대표적인 오디오 워터마킹 방법에는 대역확산 기반의 워터마킹, 반향 워터마킹, 위상 부호화 워터마킹 패치워크 워터마킹 등이 있으며, 계속해서 새로운 워터마킹 기법들이 개발되고 있다. 본 논문에서는 디지털 방송 컨텐츠의 보호를 위한 오디오 워터마킹의 적용 방법에 따른 기술적 요구사항을 알아보고, 현재 개발된 대표적인 오디오 워터마킹 방법들의 특징을 살펴본 뒤 몇 가지 항목에 대해 장단점을 비교 평가한다.

  • PDF

MPEG 오디오의 채널 확장 기술 (Channel Expansion Technology in MPEG Audio)

  • 방희석
    • 방송공학회논문지
    • /
    • 제16권5호
    • /
    • pp.714-721
    • /
    • 2011
  • MPEG 오디오에서는 오디오 신호의 효율적인 압축을 위해서 마스킹 효과, spectral band replication을 이용한 고주파 성분 합성, parametric stereo를 이용한 채널 확장 등의 기술을 이용하고 있다. 본 논문에서는 이 중 최신 기술에 해당하는 채널 확장 기술에 대해서 소개한다. 또한, MPEG 오디오 코덱 중 이 기술을 이용하는 HE-AAC v.2, MPEG Surround, Spatial Audio Object Coding(SAOC), Unified Speech and Audio Coding (USAC)에 대해 기술 소개 및 방송의 적용 예를 기술한다.

오디오 객체 부호화 표준 - MPEG SAOC (Audio Object Coding Standard Technology - MPEG SAOC)

  • 정양원;오현오
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.630-639
    • /
    • 2009
  • 본 논문에서는 최근 MPEG에서 표준화가 진행되고 있는 오디오 객체 부호화 기술 SAOC (Spatial Audio Object Coding)을 소개한다. SAOC는 이전에 MPEG에서 표준화된 PS (Parametric Stereo), MPEG Surround와 같은 파라메트릭 부호화 기술의 연장선 상에서 특히 오디오 객체 신호를 몇 개의 파라미터를 이용해 부호화함으로써, 사용자에게 음향 장면 구성의 자유도를 제공할 수 있는 객체 기반 서비스에 적합한 기술이다.

스펙트로그램을 이용한 딥 러닝 기반의 오디오 장르 분류 기술 (Audio Genre Classification based on Deep Learning using Spectrogram)

  • 장우진;윤호원;신성현;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.90-91
    • /
    • 2016
  • 본 논문에서는 스펙트로그램을 이용한 딥 러닝 기반의 오디오 장르 분류 기술을 제안한다. 기존의 오디오 장르 분류는 대부분 GMM 알고리즘을 이용하고, GMM의 특성에 따라 입력 성분들이 서로 직교한 성질을 갖는 MFCC를 오디오의 특성으로 사용한다. 그러나 딥 러닝을 입력의 성질에 제한이 없으므로 MFCC보다 가공되지 않은 특성을 사용할 수 있고, 이는 오디오의 특성을 더 명확히 표현하기 때문에 효과적인 학습을 할 수 있다. 본 논문에서는 딥 러닝에 효과적인 특성을 구하기 위하여 스펙트로그램(spectrogram)을 사용하여 오디오 특성을 추출하는 방법을 제안한다. 제안한 방법을 사용한면 MFCC를 특성으로 하는 딥 러닝보다 더 높은 인식률을 얻을 수 있다.

  • PDF

랜덤신호를 이용한 오디오 워터마킹 (Audio Watermarking by use of Random Sequences)

  • 박창목;신승원;김종원;신동환;최종욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2000년도 정기총회 및 학술대회
    • /
    • pp.37-41
    • /
    • 2000
  • 본 연구는 디지털 오디오 데이터의 전송 및 배포과정에서 필요한 워터마크기술에 관한 것이 다. 삽입 방법은 일종의 확산 스펙트럼 방식으로 특정 Key 에 의해 생성된 의사난수신호를 인간의 가청주파수모델과 오디오 신호의 특성에 따라 조작 한 후 삽입하게 된다. 이러한 주파수 조작은 데이터 은닉의 inaudibility 와 audio compression에의 견고성을 위하여 필요 한 사항이다. 워터마크 추출과정에서는 일정한 길이의 오디오 신호 앙상블 평균을 구하고, 이 신호와 워터마크와의 상호 상관함수를 구하여 워터마크의 삽입 유무를 판단하게 된다. 알고리즘의 테스트 결과 본 기술은 오디오 압축 및 오디오 조작에 강인한 것으로 나타났다.

  • PDF

청각 특성을 고려한 적응적인 오디오 음량 자동 제어 기술 개발 (Development of Adaptive Audio Loudness Control Technology based on Human Acoustic Characteristics)

  • 이영한;조충상;김제우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.125-127
    • /
    • 2018
  • 2016년 이후 방송법 개정을 통해 디지털 방송의 음량을 ITU-R / EBU에서 제안한 측정 방식을 활용하여 채널 및 프로그램 사이의 방송 음량을 맞추어 제공하고 있다. 본 논문에서는 방송 음량을 조절하는 기술 중의 하나로 ITU-R 1770-3 측정 방식을 기반으로 하여 청각적 특성을 고려한 적응적 오디오 음량 자동 제어 기술을 제안한다. 오디오 음량 자동 제어 기술은 프로그램의 음량을 기준치에 맞추는 동시에 오디오 데이터의 왜곡을 최소화해야 한다. 제안한 기술은 음량을 기준인 -24 LKFS에 맞추는 동시에 왜곡의 최소화하면서 명료도를 높이는 것을 목표로 개발되었다. 이를 위해, 가청/비가청 구간에 따라 적응적으로 이득을 조절할 수 있는 구조를 개발하였다. 제안한 방식의 성능을 확인하기 위해 주관적 음질 평가 방식을 실시하였으며 이를 통해 기존의 음량 제어 기술과 비교하여 음질이 향상됨을 확인하였다.

  • PDF

TV 광고 식별을 위한 Constant-Q 변환 기반의 오디오 핑거프린팅 방식 (Audio Fingerprinting Based on Constant Q Transform for TV Commercial Advertisement Identification)

  • 류상현;김형국
    • 한국음향학회지
    • /
    • 제33권3호
    • /
    • pp.210-215
    • /
    • 2014
  • 오디오 핑거프린팅 기술은 잡음과 에코 등으로 인한 왜곡에도 성공적으로 음원을 식별해야한다. 이러한 오디오 핑거프린팅 기술을 TV광고식별에 적용하고자 한다. 본 논문은 TV 광고 식별을 위한 강인한 오디오 핑거프린팅 방식을 제안한다. 제안된 방법에서 사용되는 Constant Q 변환 기반에서 추출된 현저한 오디오 피크 쌍 핑거프린트는 실제 다양한 잡음환경에서 오디오 핑거프린팅 시스템의 정확도를 향상시키고, 낮은 복잡도를 가진다. 실험결과는 제안된 방식이 기존의 오디오 핑거프린팅 방식에 비해 다양한 잡음환경에서도 안정적이며 신뢰할 수 있는 검색 정확도를 제공함을 보여준다.

지상파 DMB를 통한 멀티채널 오디오 서비스 검증에 관한 연구 (Verification of the Multi-channel Audio Service over T-DMB)

  • 장대영;이용주
    • 방송공학회논문지
    • /
    • 제12권3호
    • /
    • pp.222-229
    • /
    • 2007
  • 멀티미디어 부호화 기술의 발전에 따라 HDTV, DVD 등 고품질 멀티미디어 서비스가 가능하여 졌으며, 오디오의 경우 5.1채널 오디오의 사용범위가 점점 확대되어, 가정용 극장 시스템(Home Theater), 자동차용 극장 시스템(Car Theater)에 의해 일반 소비자들도 쉽게 접할 수 있는 서비스가 되었다. 지상파 DMB는 휴대용 방송 서비스로서 2005년 12월부터 본격적으로 서비스되고 있으나, 그 대역폭이 충분하지 않고 휴대용이라는 특성에 의해 멀티채널 오디오에 대한 고려를 하지 않고 있다. 최근 휴대용 방송 서비스를 위한 고효율 멀티채널 오디오 부호화 기술 표준화가 MPEG에서 추진되고 있음에 따라 DMB에서도 멀티채널 오디오 서비스에 대한 가능성이 열렸으며, 유럽에서는 이를 이용한 다양한 서비스를 시도하려고 계획하고 있다. 본 논문에서는 한국에서 서비스되고 있는 지상파 DMB를 통한 멀티채널 오디오 서비스의 가능성을 검증하기 위해 멀티채널 오디오 부호화 기술 및 검증 시스템의 구현에 대하여 기술하며, 향후 서비스 실현을 위한 가능성을 고찰하고자 한다.