• 제목/요약/키워드: 음향 향상

검색결과 1,161건 처리시간 0.021초

차분 특징을 이용한 평균-교사 모델의 음향 이벤트 검출 성능 향상 (Performance Improvement of Mean-Teacher Models in Audio Event Detection Using Derivative Features)

  • 곽진열;정용주
    • 한국전자통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.401-406
    • /
    • 2021
  • 최근 들어, 음향 이벤트 검출을 위하여 CRNN(: Convolutional Recurrent Neural Network) 구조에 기반 한 평균-교사 모델이 대표적으로 사용되고 있다. 평균-교사 모델은 두 개의 병렬 형태의 CRNN을 가진 구조이며, 이들의 출력들의 일치성을 학습 기준으로 사용함으로서 약-전사 레이블(label)과 비-전사 레이블 음향 데이터에 대해서도 효과적인 학습이 가능하다. 본 연구에서는 최신의 평균-교사 모델에 로그-멜 스펙트럼에 대한 차분 특징을 추가적으로 사용함으로서 보다 나은 성능을 이루고자 하였다. DCASE 2018/2019 Challenge Task 4용 학습 및 테스트 데이터를 이용한 음향 이벤트 검출 실험에서 제안된 차분특징을 이용한 평균-교사모델은 기존의 방식에 비해서 최대 8.1%의 상대적 ER(: Error Rate)의 향상을 얻을 수 있었다.

수중 주파수 선택적 채널에서 블록 인터리빙 기법을 적용한 길쌈부호화 기법의 성능 (Performance of convolutional coding using block interleaving in underwater frequency-selective channel)

  • 박지현;윤종락
    • 한국음향학회지
    • /
    • 제38권2호
    • /
    • pp.207-213
    • /
    • 2019
  • 본 논문은 수중 주파수 선택적 채널에서 블록 인터리빙 기법을 적용한 길쌈부호기법의 통신성능을 평가하였다. 블록 인터리빙은 디지털 데이터 열을 확산 분산하고 재배치하는 기법으로 주파수 선택적 채널에서 연집오류(burst error)의 집중을 분산시켜 성능을 향상하게 시키는 기법으로 블록 인터리빙 기법이 적용되고 있다. 수조 실험에서 블록 인터리빙이 적용된 길쌈부호의 성능을 평가한 결과 주파수 비 선택적 채널에서 블록 인터리빙을 적용한 길쌈부호의 성능의 차이가 없었다. 하지만 주파수 선택적 채널에서는 블록 인터리빙이 적용된 길쌈부호가 길쌈부호보다 2 dB 이득이 발생하였으며, 이로 인해 수중 음향 통신 성능향상에 기여함을 확인하였다.

복소 스펙트럼 기반 음성 향상의 성능 향상을 위한 time-frequency self-attention 기반 skip-connection 기법 연구 (A study on skip-connection with time-frequency self-attention for improving speech enhancement based on complex-valued spectrum)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권2호
    • /
    • pp.94-101
    • /
    • 2023
  • 음성 향상에서 많이 사용되는 U-Net과 같이 인코더와 디코더로 구성된 심층 신경망 모델은 skip-connection을 통해 인코더의 특징을 디코더에 연결하는 구조로 구성되어 있다. Skip-connection은 디코더에서 향상된 스펙트럼을 재구성하는데 도움을 주며 인코더를 통해 손실된 정보를 보완해줄 수 있다. 이때 skip-connection을 통해 연결되는 인코더의 특징과 디코더의 특징의 의미는 서로 다르다. 본 논문에서는 복소 스펙트럼 기반 음성 향상의 성능 향상을 위해 디코더에 연결되는 인코더의 특징을 디코더 특징의 의미에 가깝게 변환해주도록 skip-connection에 Self-Attention(SA)을 적용하는 방안을 연구하였다. SA는 시퀀스-시퀀스 문제에서 출력 시퀀스를 생성할 때, 입력 시퀀스의 가중 산술 평균을 이용하여 결정적인 부분을 집중해서 볼 수 있도록 하는 기법으로, 음성 향상 분야에서도 이를 적용함으로써 성능 향상에 효과적임을 입증하는 연구가 진행되었다. SA를 skip-connection에 적용하기 위해 인코더 특징과 디코더 특징을 이용하는 총 3가지의 방법에 대해 연구하였다. TIMIT 데이터베이스를 이용한 음성 향상 실험 결과, 제안하는 방법이 기존 skip-connection으로만 연결된 Deep Complex U-Net(DCUNET)과 비교하여 모든 성능 평가 지표에서 향상된 결과를 보였다.

음향공에 의한 LOX-RP1 고주파 음향-연소안정화에 관한 연구

  • 이길용;윤웅섭;조용호
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 2000년도 제14회 학술강연논문집
    • /
    • pp.5-5
    • /
    • 2000
  • 액체 추진 로켓 엔진의 고주파 연소 불안정 관련 이론은 대체로 연소기 내부의 음향 공명 모드와 분무 연소 과정의 상호 작용을 구동 메커니즘으로 전제하며 Rayleigh Criterion의 재해석에 기초하여 불안정성 평가를 위한 매개변수를 도입하고 연소 불안정성을 예측한다. 여기에는 음향장 분석 이론, 음향 불안정 이론, 연소응답 및 기화반응 이론 등이 포함된다. 본 연구에서는 LOX/RPl 추진제 조합의 액체 추진 로켓 엔진 연소기를 대상으로 다차원 순수 음향장 해석과 연소-음향장 분석을 통해 대상 엔진의 고주파 연소 불안정 특성을 예측하였다. 수동 제어 기기인 음향공 설치에 따른 연소기의 음향장 및 연소-음향장의 특성 변화를 고찰하고 위 결과를 종합하여 음향공의 연소 불안정 억제 성능 및 대상 엔진의 연소 불안정성을 평가하였다. 연소기 형상 및 음향공 설치에 따른 다차원 순수 음향장 해석은 상용코드인 ANSYS를 사용하여 수행하였다. 내부 유체는 압축성, 비점성 유체로 유체의 평균 유동은 무시하며 위치에 관계없이 균일한 물성치를 부여하였다. 정상상태 연소과정을 가정하고 평형 화학을 이용한 분석 결과로부터 연소 기체의 관련 물성치를 결정하였다. 연소기 길이 방향, 반경 방향, 원주 방향 격자점들의 음향 특성을 주파수 영역에 대해 해석하고 3차원 음향 모드 형상을 토대로 음향장을 분석하였다. 연소-음향장 해석은 음향 불안정 이론 중 n- $\tau$ 2 매개변수 기법을 사용하였다. 연료 액적의 분무 연소 과정을 1차원적으로 가정하고 정상상태의 평형 화학 계산 결과를 이용하여 엔진의 연소면을 1차원적으로 설정하였다. 상류 연소응답과 중립 안정 곡선을 토대로 대상 엔진의 연소 불안정 특성을 분석하였다.구 분석 결과 기술적 문제점으로는 배기 가스온도가 낮은데 따른 출구 부분의 Bearing, Sealing이 문제가 될 수 있다고 판단되며 배기 가스 자체에 대기 공기중에 함유되어 있던 습기가 얼어붙는(Icing화) 문제가 발생하기 때문에 배기가스의 Icing을 방지하기 위하여 압축기 끝단에서 공기를 추출하여 배기부분에 송출할 필요성이 있는 것으로 판단되었다. 출구가스의 기체 유동속도가 매우 빠르므로 (100-l10m.sec) 이를 완화하기 위한 디퓨저의 설계가 요구된다고 판단된다. 또 연소기 후방에 물을 주입하는 경우 열교환기 및 기타 부분품에 발생할 수 있는 부식 및 열교환 효율 저하도 간과할 수 없는 문제로 파악되었다. 이러한 기술적 문제가 적절히 해결되는 경우 비활성 가스 제너레이터는 민수용으로는 대형 빌딩, 산림, 유조선 등의 화재에 매우 적절히 사용되어 질 수 있을 뿐 아니라 군사적으로도 군사작전 중 및 공군 기지의 화재 그리고 지하벙커에 설치되어 있는 고급 첨단 군사 장비 등의 화재 뿐 아니라 대간첩작전 등에 효과적으로 활용될 수 있을 것으로 판단된다.가 작으며, 본 연소관에 충전된 RDX/AP계 추진제의 경우 추진제의 습기투과에 의한 추진제 물성 변화는 미미한 것으로 나타났다.의 향상으로, 음성개선에 효과적이라고 사료되었으며, 이 방법이 편측 성대마비 환자의 효과적인 음성개선의 치료방법의 하나로 응용될 수 있으리라 생각된다..7%), 혈액투석, 식도부분절제술 및 위루술·위회장문합술을 시행한 경우가 각 1례(2.9%)씩이었다. 13) 심각한 합병증은 9례(26.5%)에서 보였는데 그중 식도협착증이 6례(17.6%), 급성신부전증 1례(2.9%), 종격동기흉과 폐염이 병발한 경우와 폐염이 각 1례(2.9%)였다. 14)

  • PDF

코로나 표면 처리의 접착력 향상에 의한 이차원 오디오 시스템의 출력 개선 (Output Improvement of Two-dimensional Audio Actuators by Corona Surface Treatments to Increase Adhesive Properties of Piezoelectric Materials)

  • 엄기홍
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권5호
    • /
    • pp.91-97
    • /
    • 2012
  • 근래의 전기 전자 제품은 기능은 향상되는 반면 크기는 소형화되는 추세에 있다. 기존 입체 형태의 음향 신호 재생 장치로서의 엑츄에이터 대신 압전 소자를 이용한 스피커가 개발되기 시작하였다. 압전 소자는 압전 특성을 갖는 물질로서 물체의 외부에서 전압을 가할 때 기계적인 변형을 일으키는 특징(즉 피에조 특징)을 이용한다. 초기의 필름 스피커는 화학적 성질의 한계로 인하여 전도성 고분자 막을 형성하기 힘들다는 한계가 있었고, 도포한 두께를 균일하게 유지하기 힘들었으며, 음향 신호의 출력과 동작 주파수의 한계가 있다는 등의 종래 기술의 문제점을 해결하기 위해, 전도 물질과 피에조 물질(필름)의 결합력을 증가시킴으로써 전도체의 저항을 줄이고 주파수 영역을 확장하고자 한다. 피에조 필름의 표면 접착력을 향상시키고, 고분자 전도체 막의 흡착력을 증가시킴으로써 음향시스템의 출력 향상을 위해 코로나 표면처리방식에 의한 표면 특징을 변화시킴으로써 출력개선을 하였다.

다중 주파수 재생을 위한 광대역 수중 음향 신호 증폭기 설계 연구 (A study on wideband underwater acoustic signal amplifier design for generating multi-frequency)

  • 이동훈;유승진;김형문;김형남
    • 한국음향학회지
    • /
    • 제36권3호
    • /
    • pp.179-185
    • /
    • 2017
  • 본 논문에서는 수중에서 운용하는 임베디드 능동 음향탐지 시스템에 적용하기 위한 광대역 송신 전력 증폭기 설계/제작/시험 과정에서 발생된 문제를 분석하고 해결방안을 제시한다. 최근 수중음향 분야에서도 탐지 성능을 향상시키기 위해 광대역 소나(Sound Navigation and Ranging, SONAR) 신호처리 연구가 진행되고 있으며 이를 위한 광대역 수중음향 송수신 장치 개발이 이루어지고 있다. 본 논문에서는 임베디드 시스템 특성상 복잡하지 않고 구현이 간단한 2 레벨 톱니파 형태의 Class D 급 PWM(Pulse Width Modulation) 신호 생성 방식을 사용하여 광대역 수중음향 신호를 생성한 이후에, 송신 증폭기를 통하여 다양한 형태의 송신 파형을 재생하고 수중에서 실험을 하는 과정에서 두가지 이상의 주파수를 가진 소나 신호를 동시에 재생한 경우, 원신호에 두 신호의 주파수 차의 정수배만큼 더해진 기생 주파수가 나타나는 현상이 발생하여 원하지 않은 송신 음원이 재생되는 문제가 있음을 발견하였다. 이러한 문제점의 원인을 분석하기 위해 MATLAB 및 Simulink를 이용하여 송신 하드웨어 및 PWM 제어 과정을 모델링하고 시뮬레이션 하였으며, 시뮬레이션을 통해 문제점을 재현하고 해결방안을 제시한다.

환경인식 기반의 향상된 Minimum Statistics 잡음전력 추정기법 (Improved Minimum Statistics Based on Environment-Awareness for Noise Power Estimation)

  • 손영호;최재훈;장준혁
    • 한국음향학회지
    • /
    • 제30권3호
    • /
    • pp.123-128
    • /
    • 2011
  • 본 논문에서는 다양한 잡음 환경에서 음성향상을 위한 Minimum Statistics (MS) 잡음전력 추정 기법을 제시한다. 기존의 방법에서는 최소값 추적을 위해서 유한한 서치 (search)윈도우를 사용하여 최적으로 신호의 파워 스펙트럼을 수무딩하고 최소 확률을 적용하는 것을 기본으로 한다. 본 논문에서 제안된 알고리즘은 기존의 최소값 서치 윈도우가 다양한 잡음 환경에 상관없이 고정된 사이즈를 사용하는 것에 환경인식 정보를 적용하여 서치 윈도우 사이즈가 Gaussian mixture model(GMM)기반의 잡음 분류 알고리즘을 이용한 결과 값의 비교로 잡음 환경에 따라 변화 하도록 한다. 제안된 음성 향상 기법은 ITU-T P.862 perceptual evaluation of speech quality (PESQ)를 이용하여 평가하였고 기존의 MS방법보다 향상된 결과를 보였다.

잡음환경에 강인한 HMM기반 화자 확인 시스템에 관한 연구 (Speaker Verification System Based on HMM Robust to Noise Environments)

  • 위진우;강철호
    • 한국음향학회지
    • /
    • 제20권7호
    • /
    • pp.69-75
    • /
    • 2001
  • 화자확인에서 화자내 변이, 잡음환경, 그리고 학습환경과 인식 환경의 불일치는 화자확인 시스템이 실용화될 수 없는 가장 큰 원인이다. 본 연구에서는, 실제 환경에 강인한 화자 확인 시스템의 구현에 초점을 맞추어 음성 전처리 과정인 잡음환경에 강인한 끝점추출 알고리즘, 잡음제거 및 마이크특성 보상기법, LPG(Linear Predictive Coefficient)켑스트럼 가중치에 의한 화자간 변별력 향상 기법을 제안한다. 실험 결과, LPC잔차신호(residue)를 이용한 끝점추출 알고리즘을 사용한 경우 약 17.65% 가량의 끝점 추출 에러율을 향상시켰으며, 제안한 잡음제거 및 마이크특성 보상기법을 사용한 경우 다른 마이크 환경에서 화자 오인식율이 약 36.93% 가량 개선되었다. 또한, 제안한 LPC켑스트럼 가중치에 의한 화자간 변별력 향상 기법은 평균 화자 오인식율을 약 6.515% 향상시켰다.

  • PDF

특이치 분해를 이용한 신호 향상 과정 중 유색잡음 하에서 주기신호의 주파수 및 갯수추정

  • 백성준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1991년도 학술발표회 논문집
    • /
    • pp.32-37
    • /
    • 1991
  • 고해상도 신호처리의 기본적인 문제는, 관찰 데이터의 개수가 작고 신호 대 잡음비(SNR)가 낮아서, 푸리에 분석기법에 의해 주기신호가 분해되지 않는 경우에, 신호의 파라미터를 추정하는 것이라 할 수 있다. 주기신호의 주파수 추정 문제에서는 일반적으로 주기신호의 개수를 알고 있다고 가정하는데, 주기신호의 개수가 사전에 알려져 있지 않은 경우, 주파수 추정은 결국 주기신호의 개수결정문제가 되어, EVD나 SVD를 이용한 개수 결정방법이 활발히 연구되어 왔다. 고해상도 신호처리에서는 EVD나 SVD의 비선형 특성 상임게치 신호 대 잡음비가 존재하며 이 SNR보다 낮은 경우 심각한 왜곡현상을 보이게 되어, 주파수 추정 또는 주기신호의 개수결정에 큰 오차를 보이게 된다. 주기신호의 개수를 사전에 알고 있는 경우, 임게치 SNR를 낮추려는 노력으로는 overdetermined over-ranked structured correlation matrix의 rank reduction과 averaging을 이용한 신호 향상방법(signal enhancement)이 연구되어 왔다. 그러나 사전에 주기신호의 개수를 알아야만 하는 결점이 있고, 잡음이 백색이여야 하는 제약이 있었다. 일반적으로 환경 잡음은 유색이고, 주기신호의 개수를 사전에 모르는 경우이므로, 낮은 SNR에서의 주파수 추정문제는 유색잡음을 고려한 신호향상으로 임게치 SNR을 낮추고 주기신호의 개수를 결정한 후 주파수 추정이 이루어져야 한다. 본 논문에서는 이를 위해 광대협 유색잡음에서의 신호향상과 그 과정 중 중 주기신호의 개수를 결정하는 알고리즘ㅇ르 제시하고자 한다.

  • PDF

Push-to-talk 통신을 위한 진폭 및 위상 복원 기반의 단일 채널 음성 향상 방식 (A single-channel speech enhancement method based on restoration of both spectral amplitudes and phases for push-to-talk communication)

  • 조혜승;김형국
    • 한국음향학회지
    • /
    • 제36권1호
    • /
    • pp.64-69
    • /
    • 2017
  • 본 논문에서는 PTT(Push-To-Talk) 기반의 무선 통신을 위한 진폭 및 위상 복원 기반의 단일 채널 음성 향상 방식을 제안한다. 제안한 방식은 신호의 진폭만을 대상으로 음성 향상을 진행했던 기존의 방식들과 달리, 음성 신호의 진폭과 위상을 분리하여 각각 향상시켜 다시 결합함으로써 더욱 양질의 음성을 제공한다. 본 논문에서 제안하는 방식의 성능을 평가하기 위해 동적 잡음 환경에서의 단계별 비교 실험을 실시하였으며, 실험 결과를 통해 제안한 방식이 다양한 잡음 환경에서 양질의 음성을 제공하는 것을 확인할 수 있다.