• 제목/요약/키워드: 음향 향상

검색결과 1,161건 처리시간 0.031초

벡터 양자화 변분 오토인코더 기반의 폴리 음향 생성 모델을 위한 잔여 벡터 양자화 적용 연구 (A study on the application of residual vector quantization for vector quantized-variational autoencoder-based foley sound generation model)

  • 이석진
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.243-252
    • /
    • 2024
  • 최근에 연구되기 시작한 폴리(Foley) 음향 생성 모델 중 벡터 양자화 변분 오토인코더(Vector Quantized-Variational AutoEncoder, VQ-VAE) 구조와 Pixelsnail 등 생성모델을 활용한 생성 기법은 중요한 연구대상 중 하나이다. 한편, 딥러닝 기반의 음향 신호의 압축/복원 분야에서는 기존의 VQ-VAE 구조에 비해 잔여 벡터 양자화 기술이 더 적합한 것으로 보고되고 있으며, 따라서 본 논문에서는 폴리 음향 생성 분야에서도 잔여 벡터 양자화 기술이 효과적으로 적용될 수 있을지 연구하고자 한다. 이를 위하여 본 논문에서는 기존의 VQ-VAE 기반의 폴리 음향 생성 모델에 잔여 벡터 양자화 기술을 적용하되, Pixelsnail 등 기존의 다른 모델과 호환이 가능하고 연산 자원의 소모를 늘리지 않는 모델을 고안하여 그 효과를 확인하고자 하였다. 효과를 검증하기 위하여 DCASE2023 Task7의 데이터를 활용하여 실험을 진행하였으며, 그 결과 평균적으로 0.3 가량의 Fréchet audio distance 의 향상을 보이는 것을 확인하였다. 다만 그 성능 향상의 정도가 제한적이었으며, 이는 연산 자원의 소모를 유지하기 위하여 시간-주파수축의 분해능이 저하된 영향으로 판단된다.

청각 특성을 이용한 피아노 음원 압축 알고리듬 (Piano Sound Compression Algorithm Using Auditory Characteristics)

  • 김기수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.265-269
    • /
    • 1993
  • 디지틀 피아노에서 PCM 방식의 음원 합성을 위한 압축 알고리듬을 제안하였다. 디지틀 피아노는 매우 높은 음질을 필요로 한다. 따라서 FM 방식보다는 PCM 방식의 음원 합성 알고리듬이 주로 사용되어져 왔다. 그러나 PCM 방식은 많은 메모리가 필요한 단점이 있다. 본 논문에서는 피아노 음원을 청각적으로 왜곡이 없도록 압축, 저장하여 음원 데이터를 줄였다. 또한 피아노 음의 시간 영역 특성에 따라 비트 할당을 달리하여 음질을 향상시킬 수 있었다. 이와 같이 부호화할 경우 약 15 : 1 ~ 20 :1로 원음을 압축하여도 지각적으로 원음과 동일한 복원음을 얻을 수 있었다.

  • PDF

Fir filter를 이용한 MFC 수신기의 설계 (A study on the MFC-Receiver design by using the fir filter)

  • 김철기;신동찬
    • 한국음향학회지
    • /
    • 제4권2호
    • /
    • pp.3.2-3.2
    • /
    • 1985
  • 본 논문은 전 전자식 교환기에 사용되는 MFC 수신기를 설계하기 위해서 FIR-Filter를 사용한 논문이다. FIR-filter를 설계함에 있어서, Remetz Algorithm을 사용한 Mellellan의 방식이 적용되었으며 인접주파수를 정확히 구분하기 위하여 85차의 고차필터를 설계하였고, 필터의 출력 데이터 15개의 합으 로써 각 주파수에 대한 판별값으로 정하였다. 인접 주파수를 구분하는 출력 power의 결과는 최근의 FGT-MFC 수신기의 출력 power의 결과와 비교 하였을 때, S/N 비면에서 5dB 이상의 향상을 보였으 며, 133개의 입력데이타를 사용하는 FGT-MFC 수신기보다 4.2ms 빠른 응답특성을 나타냈다.

시변 방위 추정을 위한 Extended PASTd (Projection Approximation Subspace Tracking with Deflation) 알고리즘 (Extended PASTd (Projection Approximation Subspace Tracking with Deflation) Algorithm for time-varying DOA estimation)

  • 임준석;이종명
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.189-192
    • /
    • 2000
  • 본 논문은 Nonstationary 환경에서 동작하는 소나의 DOA추정의 정확도를 높이기 위하여 가변 망각인자를 도입한 새로운 Extended PASTd (Extended Projection Approximation of Subspace Tracking with deflation) 을 제안하고 기존 알고리즘과 비교함으로써 새로운 알고리즘의 향상된 성능을 보인다.

  • PDF

FPGA를 이용한 암호 알고리즘의 구현 (The Implementation of Crypto-Algorithm Using FPGA)

  • 이상덕
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.347-350
    • /
    • 1998
  • 최근 개인 휴대통신과 컴퓨터 기술의 발달로 유용한 데이터의 질적.양적 향상을 가져왔다. 이로 인해 저장중이거나 선로상에서의 전송중인 정보의 보호문제가 중요시되고 있다. 이러한 정보보호 문제가 중요시됨에 따라 정보보호를 위한 직접적인 암호화 방법중의 하나인 IDEA(International Data Encryption Algorithm)의 구현을 제안하고자 한다. IDEA는 블록 암호화 방식의 하나로서 64비트 데이터를 암호화하기 위해 128비트의 키를 사용한다. 본 논문에서 암호알고리즘 구현을 위하여 하드웨어 설계언어인 VHDL을 사용하였고, V-System을 이용하여 Simulation을 수행하였다. Coding된 알고리즘은 Synopsy를 사용하여 자동합성하였고, Xilinx사의 FPGA-4025를 Target으로 구현하였다.

  • PDF

시변 환경에 적합한 PAST알고리즘 (Auto Tuning PAST Algorithm for Time-Varying Signals)

  • 임준석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.325-328
    • /
    • 2004
  • 본 논문에서는 PAST(Projection Approximation Subspace Tracking)에 기반 한 새로운 부공간(subspace) 추적 알고리즘을 제안하고자 한다. 빠른 시분할 대상의 목표물의 방위각을 추정하는 것이 필요하다. 그러나 PAST 기법은 고속의 시분할 환경에서는 잘 동작하지 않는다 따라서 가변망각 인자를 도입하여 빠르게 변화하는 부공간의 비정재 (Nonstationary) 상태에 잘 적응시켜 PAST 성능 향상을 보고자 한다.

  • PDF

음성인식 자동시험장치 개발 (Implementation of Automatic Test System for Voice Recognition)

  • 김희경
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.219-222
    • /
    • 1998
  • 음성인식시험은 다양한 사용자의 음성을 입력으로 음성인식을 수행하고 그 결과를 이용하여 시스팀의 성능을 평가하거나, 음성의 특징을 파악하기 위한 중요한 기능으로 음성인식 서비스의 질을 향상시키기 위한 필수적인 요소이다. 본 논문에서 제시하는 음성인식 자동시험장치는 음성인식의 결과를 DTMF 신호로 처리하도록 하여 사람의 개입 없이 빠르고 정확한 결과를 통해 인식율, 인식속도 등 인식기술과 관련된 중요한 정보를 얻을 수 있도록 하였다. 본 논문에서는 한국통신의 기업체 음성다이얼서비스의 음성인식시험을 중심으로 음성인식 자동시험장치의 구성 및 기능에 대해서 설명한다.

  • PDF

다이나믹 윈도우 스위칭기법을 적용한 AC-3 오디오 필터뱅크의 성능향상에 관한 연구 (A Study on the Dynamic Window Switching MDCT for Enhanced AC-3 Audio Filterbank)

  • 김준성
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.23-26
    • /
    • 1998
  • This paper presents a technique to enhance TDAC in the AC-3 algorithm. To reduce block boundary noise without decreasing the performance of transform coding, new special window adopted. They improves the defect of the AC-3 algorithm that could not properly cancel aliasing in the tansient period. In addition, a fast MDCT calculation algorithm based on a fast Fourier Transform, is adopted.

  • PDF

반복적 스펙트럼 차감법을 이용한 잡음 음성의 무음 구간 검출 (The detection of Nonspeech Interval in Noisy Speech using Iterative Spectral Subtraction)

  • 조훈영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.391-394
    • /
    • 1998
  • 본 논문에서는 극심한 가산 잡음에 의해 손상된 음성 신호를 스펙트럼 차감법으로 개선할 때, 잡음 스펙트럼 추정을 위한 무음 구간 추정 방법을 제안한다. 스펙트럼 차감법은 잡음을 효과적으로 제거한다고 알려져 있으나, SNR 0 dB 이하의 잡음 환경에서는 무음 구간의 검출이 힘들어 잡음 스펙트럼 추정치의 정확도가 저하된다. 일반화 스펙트럼 차감법의 과차감(oversubtraction)과 잡음 스펙트럼 추정을 반복하여 얻은 무음 구간은 SNR -10 dB~ 0 dB의 낮은 SNR에서도 비교적 정확하며, 프레임 에너지를 이용한 무음 검출 방법에 비해 향상된 성능을 보였다.

  • PDF

계수 최소 자승 방법을 사용한 희소어레이의 최적화 (Optimization of Thinned Sensor Arrays Using A Weighted Leastd Square Method)

  • 장병건;전창대
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.117-120
    • /
    • 1999
  • 본 논문은 희소어레이의 패턴을 원하는 패턴과 실제 희소어레이의 패턴간의 오차의 계수적 자승치를 최소화하여 최적화하는 방법을 제시한다 센서의 간격이 어레이 중심에 관하여 대칭인 경우와 비대칭인 경우에 대하여 성능을 점검하며, 어레이 공간의 주어진 영역의 오차함수에 성능 향상을 위하여 계수를 적용한다. 주빔 부근의 측면롭의 효과적인 제어를 위하여 지수 함수적인 계수를 제안하였으며 그 결과 측면롭의 수준이 전체적으로 균등하게 분포되는 패턴을 얻을 수 있었다. 이 결과는 입력잡음신호가 어레이 공간상에 균등하게 입사될 때 효과적으로 사용될 수 있다.

  • PDF