• 제목/요약/키워드: 음향출력

검색결과 394건 처리시간 0.025초

주파수 이동 되먹임 레이저에서 발생하는 Comb의 대역폭 (Comb Bandwidth generating in Frequency-shifted Feedback Laser)

  • 지명훈;황대석;김규식;이영우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.535-538
    • /
    • 2002
  • 공진기내에 음향광학소자(AOM)를 사용하여 FSF(Frequency-shifted feedback) 레이저를 수치해석 하였다. 출력 스펙트럼의 Comb 대역폭은 첨두 스펙트럼 세기에서의 순간 발진 주파수와 내부공진기 전계의 Wigner-Ville 분포로부터 유도된 순간 스펙트럼 세기의 식을 이용하여 분석한다. Comb 대역폭은 포화-확산된 대역폭과 FSF 동작에 유도되는 전체 공진 모드의 곱으로 정의된다.

  • PDF

인공현실감 기술을 이용한 자동차 주행환경의 개발

  • 윤정선;김창수;조영건;김철중
    • 대한인간공학회:학술대회논문집
    • /
    • 대한인간공학회 1996년도 춘계학술대회논문집
    • /
    • pp.270-275
    • /
    • 1996
  • 본 연구에서는 인공현실감 기술을 이용하여 일종의 시뮬레이터라고 할 수 있는 자동차 주행환경을 개발하였다. 이 시스템은 Pentium PC에서 구현되었고 운전을 위하여 스티어링 휠, 클러치, 브레이크, 액 셀을 사용하였으며 속도출력을 위하여 스피드메타를 사용하였다. 이러한 입출력 장치를 하나의 통합된 모듈로 만들어서 8255 인터페이스 카드를 통하여 컴퓨터와 접속시켰다. 음향효과를 위하여 MIDI 인터페 이스, 샘플러, 스피커를 사용하였고 효과음은 샘플링하여 사용하였다. 이 밖에도 3차원 그래픽 디스플레 이를 위하여 CrystalEyes가 사용되었다. 가상세게 모델링을 위한 소프트웨어로는 Superscape VRT4.0이 사용되었다. 그래픽으로는 도심 시내 주행환경을 구현하였고, 모든 객체들은 실물 크기 비율로 그렸다. 자동차의 운전 메카니즘은 자동차 동역학을 모델링하여 계산하였다. 이러한 시스템은 주행시 운전자의 자세 및 생리신호를 측정하기 위한 환경으로 사용될 수 있으며 또한 교통안전표지나 신호등과 같은 도로 환경의 인간공학적 평가를 위해서도 사용될 수 있다.

  • PDF

SAW 온도센서용 음향 반사판 분석 및 무선 온도 측정 (Analysis of Acoustic Reflectors for SAW Temperature Sensor and Wireless Measurement of Temperature)

  • 김기복;김성훈;정재기;신범수
    • 비파괴검사학회지
    • /
    • 제33권1호
    • /
    • pp.54-62
    • /
    • 2013
  • 본 연구는 비접촉 무전원 표면탄성파(surface acoustic wave, SAW) 온도센서를 개발하기 위하여 수행되었다. 단일전극 구조의 IDT(inter-digital transducer)와 434 MHz의 공진주파수를 가지는 SAW 소자를 $128^{\circ}$ rot-X $LiNbO_3$ 압전기판위에 반도체 공정으로 제작하였다. SAW 온도센서의 음향 반사판에 따른 반사 신호의 특성을 분석하기 위하여 다양한 형태의 음향 반사판을 제작하여 표면탄성파 신호의 반사특성을 분석한 결과 빗살형 전극형태의 반사판이 가장 양호한 반사특성을 나타내었다. SAW 온도센서를 구동하기 위한 신호를 송신하고 온도에 따른 SAW 센서의 출력신호를 수신하기 위하여 다이폴 안테나와 마이크로프로세서에 기반한 무선 송수신 시스템을 제작하였다. $40{\sim}80^{\circ}C$의 온도 범위에서 개발된 SAW 온도센서와 무선 송수신 시스템을 평가한 결과 온도증가에 따라 SAW 온도센서의 공진 주파수가 선형적으로 감소하였으며 결정계수가 0.99 이상으로 정확한 무선 온도측정이 가능한 것으로 나타났다.

잔향음 우세 수조 환경에서의 수중음향 통신성능 분석 (Underwater acoustic communication performance in reverberant water tank)

  • 최강훈;황인성;이상국;최지웅
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.184-191
    • /
    • 2022
  • 천해에서의 음파는 긴 지연시간을 가지는 다중경로를 통해 전달되며 이러한 특성은 통신에서 Inter-Symbol Interference(ISI)을 야기하기 때문에 성능을 악화시킨다. 본 논문에서는 잔향음 우세 환경에서의 통신성능을 분석하고 다중경로 지연시간과의 상관관계를 파악하기 위해 5 × 5 × 5 m3 수조에서 다양한 심볼 전송속도(100 sym/s to 8000 sym/s)를 갖는 Binary Phase-Shift Keying(BPSK) 신호를 이용하여 실험을 수행하였다. 제어가능한 수조 환경에서의 음향 채널은 수조 내 경계면 및 벽면에서의 다중반사로 인해 밀집한 다중경로 특성을 가지며 약 40 ms 이하의 최대 초과 지연과 8 ms 이하의 Root Mean Squared(RMS) 지연확산을 보였다. 본 논문에서는 4가지 통신 복조 기법을 이용하여 Bit Error Rate(BER) 성능과 출력 Signal-to-Noise Ratio(SNR) 성능을 분석하며 잔향음 우세 환경에서의 심볼 시간과 RMS 지연확산의 비율인 Symbol interval to Delay spread Ratio in reverberant environment(SDRrev)을 정의하여 통신성능이 보장될 수 있는 기준 심볼 전송속도를 제시한다.

시뮬레이터를 이용한 대역통과 필터 제작 (A Study on the fabrication of Bandpass filter Using a Simulator)

  • 유일현
    • 한국음향학회지
    • /
    • 제19권2호
    • /
    • pp.33-39
    • /
    • 2000
  • 낮은 형상요소를 갖는 표면탄성파 대역통과 필터의 주파수 특성을 구현하기 위하여 35° Y-cut Quartz 표면에 빗살무늬 변환기를 형성시켜 모의실험을 수행하였으며, 전극재료로는 Al을 이용하였다. 이 모의실험에서 얻은 조건들로부터 필터를 설계하였으며, 필터의 입력단에는 apodization weighted형 빗살무늬 변환기를 이용하고, 출력단에는 withdrawal weighted형 빗살무늬 변환기로 필터를 구성하였다. 또한, 입·출력 빗살무늬 변환기의 전극 수는 리플의 영향을 최소화하기 위해 Kaiser-Bessel 창함수를 이용하였으며, 각각 2200쌍과 1000쌍으로 하였다. 그리고, 빗살무늬 변환기 전극의 폭은 6㎛, 간격은 5.75㎛ 및 두께는 표면탄성파 파장과의 비를 고려해 6000Å으로 할 때 최적의 결과를 얻을 수 있었으며, 구경은 임피던스 정합을 위해 2mm로 하였다. 제작한 표면탄성파 대역통과 필터의 중심주파수는 70MHz, 형상요소는 1.3이하, 1.5dB에서의 통과 대역은 1.3MHz, 저지대역은 -45dB, 삽입손실은 19dB, 통과 대역폭 내의 리플은 1dB정도로 측정되었다. 따라서, 제작한 필터의 주파수 응답과 특성은 설계조건과 잘 일치하였다.

  • PDF

화자 검증을 위한 마스킹된 교차 자기주의 인코딩 기반 화자 임베딩 (Masked cross self-attentive encoding based speaker embedding for speaker verification)

  • 서순신;김지환
    • 한국음향학회지
    • /
    • 제39권5호
    • /
    • pp.497-504
    • /
    • 2020
  • 화자 검증에서 화자 임베딩 구축은 중요한 이슈이다. 일반적으로, 화자 임베딩 인코딩을 위해 자기주의 메커니즘이 적용되어졌다. 이전의 연구는 마지막 풀링 계층과 같은 높은 수준의 계층에서 자기 주의를 학습시키는 데 중점을 두었다. 이 경우, 화자 임베딩 인코딩 시 낮은 수준의 계층의 영향이 감소한다는 단점이 있다. 본 연구에서는 잔차 네트워크를 사용하여 Masked Cross Self-Attentive Encoding(MCSAE)를 제안한다. 이는 높은 수준 및 낮은 수준 계층의 특징 학습에 중점을 둔다. 다중 계층 집합을 기반으로 각 잔차 계층의 출력 특징들이 MCSAE에 사용된다. MCSAE에서 교차 자기 주의 모듈에 의해 각 입력 특징의 상호 의존성이 학습된다. 또한 랜덤 마스킹 정규화 모듈은 오버 피팅 문제를 방지하기 위해 적용된다. MCSAE는 화자 정보를 나타내는 프레임의 가중치를 향상시킨다. 그런 다음 출력 특징들이 합쳐져 화자 임베딩으로 인코딩된다. 따라서 MCSAE를 사용하여 보다 유용한 화자 임베딩이 인코딩된다. 실험 결과, VoxCeleb1 평가 데이터 세트를 사용하여 2.63 %의 동일 오류율를 보였다. 이는 이전의 자기 주의 인코딩 및 다른 최신 방법들과 비교하여 성능이 향상되었다.

혼합 가우시안 군집화를 이용한 상태공유 음향모델 최적화 (A Study on the Optimization of State Tying Acoustic Models using Mixture Gaussian Clustering)

  • 안태옥
    • 대한전자공학회논문지SP
    • /
    • 제42권6호
    • /
    • pp.167-176
    • /
    • 2005
  • 본 논문은 음성인식에 쓰이는 음향모델의 모델링 방법 중 결정트리 상태공유 모델링(DTST)을 기반으로 출력 확률 분포의 혼합 가우시안 수를 줄여 모델을 최적화하는 방법을 제안한다. DTST는 음성학적 지식을 포함할 수 있는 질의어 집합과 유사도를 기반으로 한 결정 방법을 이용하는 것이다. 이때 상태들의 출력 확률 분포의 혼합 가우시안 수를 늘려 인식률을 증가시킬 수 있게 된다. 본 논문에서는 인식률이 최대가 되는 지점에서 혼합 가우시안들을 군집화 하여 그 수를 줄이고자 한다. 군집화 시에 필요한 거리 측정 방법은 유클리드(Euclidean)와 바타챠랴(Bhattacharyya) 방법을 이용하였고, 새로운 가우시안은 거리가 최소가 되는 두 가우시안으로부터 평균과 분산을 다시 계산하여 생성하였다. 증권상장 회사명(STOCKNAME) 1,680개의 단어 데이터베이스를 구성하여 실험한 결과 바타챠랴 방법은 $97.2\%$의 인식률을 유지하면서 전체 혼합 가우시안 수의 비율을 $1.0\%$로 감소시켰고, 유클리드 방법은 $96.9\%$의 인식률을 유지하면서 혼합 가우시안 수의 비율을 $1.0\%$로 감소시켜 모델을 최적화할 수 있었다.

Lexicon transducer를 적용한 conformer 기반 한국어 end-to-end 음성인식 (Conformer with lexicon transducer for Korean end-to-end speech recognition)

  • 손현수;박호성;김규진;조은수;김지환
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.530-536
    • /
    • 2021
  • 최근 들어 딥러닝의 발달로 인해 Hidden Markov Model(HMM)을 사용하지 않고 음성 신화와 단어를 직접 매핑하여 학습하는 end-to-end 음성인식 방법이 각광을 받고 있으며 그 중에서도 conformer가 가장 좋은 성능을 보이고 있다. 하지만 end-to-end 음성인식 방법은 현재 시점에서 어떤 자소 또는 단어가 나타날지에 대한 확률에 대해서만 초점을 두고 있다. 그 이후의 디코딩 과정은 현재 시점에서 가장 높은 확률을 가지는 자소를 출력하거나 빔 탐색을 사용하며 이러한 방식은 모델이 출력하는 확률 분포에 따라 최종 결과에 큰 영향을 받게 된다. 또한 end-to-end 음성인식방식은 전통적인 음성인식 방법과 비교 했을 때 구조적인 문제로 인해 외부 발음열 정보와 언어 모델의 정보를 사용하지 못한다. 따라서 학습 자료에 없는 발음열 변환 규칙에 대한 대응이 쉽지 않다. 따라서 본 논문에서는 발음열 정보를 담고 있는 Lexicon transducer(L transducer)를 이용한 conformer의 디코딩 방법을 제안한다. 한국어 데이터 셋 270 h에 대해 자소 기반 conformer의 빔 탐색 결과와 음소 기반 conformer에 L transducer를 적용한 결과를 비교 평가하였다. 학습자료에 등장하지 않는 단어가 포함된 테스트 셋에 대해 자소 기반 conformer는 3.8 %의 음절 오류율을 보였으며 음소 기반 conformer는 3.4 %의 음절 오류율을 보였다.

강인 음성 인식을 위한 가중화된 음원 분산 및 잡음 의존성을 활용한 보조함수 독립 벡터 분석 기반 음성 추출 (Speech extraction based on AuxIVA with weighted source variance and noise dependence for robust speech recognition)

  • 신의협;박형민
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.326-334
    • /
    • 2022
  • 이 논문에서는 배경 잡음이 포함되는 환경에서 강인한 음성 인식을 하기 위한 전처리 단계로서 쓰이는 목표 음성 향상 방법을 제안한다. 보조 함수 기반의 독립 벡터 분석(Auxiliary-function-based Independent Vector Analysis, AuxIVA) 기법을 기반으로 가중 공분산 행렬에서 시간에 따라 변하는 분산에 의해서 가중치가 결정된다. 목표 음성에 대한 시간-주파수별 기여도를 나타내는 마스크를 통해 분산의 크기를 조절한다. 이러한 마스크는 음성 향상을 위해서 학습된 신경망 혹은 목표 화자로부터의 직선 성분의 기여도를 찾기 위한 확산성으로부터 추정할 수 있다. 이에 더하여 둘러싼 잡음에 대한 출력들은 서로 다차원 독립 성분 분석을 도입하여 의존성을 주어 안정적으로 노이즈 성분을 추출할 수 있다. 이 AuxIVA 기반의 목표 음성 추출 알고리즘은 또한 노이즈에 대해서 비음수 행렬 분해(Non-negative Matrix Factorization, NMF)를 비음수 텐서 분해(Non-negative Tensor Factorization, NTF)로 확장하여 독립 단순 행렬 분석(Independent Low-Rank Matrix Analysis, ILRMA)의 틀에서도 수행될 수 있다. 이러한 확장을 통해서 여전히 잡음 출력 채널에서의 채널간 의존성을 유지할 수 있다. CHiME-4데이터셋에 대한 실험 결과는 소개된 알고리즘에 대한 효과를 보여준다.

KZK 모델을 이용한 파라메트릭 어레이 음향 신호 처리 (Audio Signal Processing using Parametric Array with KZK Model)

  • 이종현;;이재일;김원호;배진호
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.139-146
    • /
    • 2009
  • 본 논문에서는 파라메트릭 어레이를 이용한 음향신호에 대한 수치 모델링 기법 및 분석 결과를 제시한다. 사용된 음성 파라메트릭 배열의 분석 수치모델은 KZK(Khokhlov-Zabolotskaya-Kuznetsov)로서 KZK수치모델은 시간영역의 차분방정식 알고리즘을 사용하며 파라메트릭배열의 정확한 응답특성이 분석이 가능하다. 시간영역기반의 KZK모델은 음원의 크기와 전송주파수의 영향을 받으며, 가청신호응답은 출력레벨과 빔폭의 크기를 포함한다. 음성신호에 대하여 파라메트릭 배열을 효율적으로 적용시키기 위해서는 고려해야할 요소는 표본화 주파수, 트랜스듀서의 반경 및 변조방식 파라미터 등이 있다. 본 논문에서는 다양한 요소 중 표본화 주파수에 따른 응답신호의 왜곡 분석 및 실험 결과를 시뮬레이션을 통해 제시하였다.

  • PDF