• Title/Summary/Keyword: 잡음비

검색결과 3,040건 처리시간 0.036초

시역전 처리에서 센서 배열 최적화에 관한 연구 (Optimization of Array Configuration in Time Reversal Processing)

  • 주재훈;김재수;지윤희;정재학;김덕영
    • 한국음향학회지
    • /
    • 제29권7호
    • /
    • pp.411-421
    • /
    • 2010
  • 수중음향에서 시역전 처리는 잔향음 제거 및 표적반향음 향상, 수중감시, 수중통신 등 다양한 분야에서 응용되고 있다. 특히, 근래에 활발히 연구되는 수중통신에서 시역전 처리를 이용해 신호를 시-공간적으로 집속함으로써 신호 대 잡음 비를 증가시켜 전송거리를 높임과 동시에 비트 오차율을 상당히 개선하였다. 본 논문에서는 시역전 처리에서의 센서 배열 최적화에 대한 두 가지 이슈를 다루었다. 먼저, 다양한 해양환경에서의 센서 배열에 대한 최적 센서 수에 대해 연구하였다. 두번째는 주어진 센서 수에 대해 최적의 센서 배치를 결정하는 알고리즘을 개발하였다. 센서 배열 최적화 알고리즘을 집속점과 관심영역에서 음향에너지 대비를 최대화시키는 센서 위치와 수를 목적함수로 하는 유전알고리즘을 기초로 하여 구체화하였다. 또한, 시역전과 신호처리 과정이 동일한 원리로 수행되는 정합장 처리를 이용하여 모의실험 결과에 대한 타당성을 실제 해양 실험데이터를 통해 검증 하였다. 최적화의 결과로 집속점에서 음향에너지가 기존의 센서배치 보다 최대 3 dB정도 향상되는 것을 확인하였다.

주파수 영역에서의 Gaussian Mixture Model 기반의 동시통화 검출 연구 (Frequency Domain Double-Talk Detector Based on Gaussian Mixture Model)

  • 이규호;장준혁
    • 한국음향학회지
    • /
    • 제28권4호
    • /
    • pp.401-407
    • /
    • 2009
  • 본 논문에서는 주파수 영역에서의 가우시안 혼합 모델 (Gaussian Mixture Model, GMM) 기반의 새로운 동시통화 검출 (Double-talk Detection, DTD) 알고리즘을 제안한다. 구체적으로 주파수 영역에서의 음향학적 반향억제 (Acoustic Echo Suppression, AES)를 위한 동시 통화 검출 알고리즘을 구성하기 위해 기존의 시간 영역에서의 동시통화 검출에 사용되는 상호 상관계수를 이산 푸리에 변환을 통해 16개 채널의 주파수 영역으로 변환하였다. 이러한 주파수 영역에서의 상호 상관계수를 GMM의 보다 효과적인 구성을 위해 통계적 분류 특성에 근거하여 우수한 7개를 선별하였다. 본 논문은 이러한 특징 벡터로 패턴인식에서 우수한 성능을 보이는 GMM을 구성하였으며 원단화자만 있는 구간, 동시통화 구간, 근단 화자만 있는 구간을 우도 (Likelihood) 비교에 따라 분류함으로써 별도의 원단 화자 신호에 대한 음성 검출기 (Voice Activity Detector, VAD)의 사용 없이 잡음환경과 반향 경로 변화에서 강인한 동시통화 검출 알고리즘을 제안한다. 다양한 실험 결과 제안된 방법은 기존의 상호 상관계수를 고정된 문턱 값과 가부 비교하여 동시 통화 구간을 검출하는 hard decision 방법에 비해 검출 오류 확률 (Detection Error Probability)을 비교한 결과 우수한 성능을 보였다.

프리엠퍼시스를 이용한 CPSP 기반의 도달시간차이 추정 성능 개선 (Performance Improvement of CPSP Based TDOA Estimation Using the Preemphasis)

  • 권홍석;배건성
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.461-470
    • /
    • 2009
  • 본 연구에서는 CPSP (Cross Power Spectrum Phase) 함수를 이용한 프레임 기반의 TDOA (Time Difference of Arrival) 추정시 나타나는 문제점들을 분석하고 연구하였다. 구형 윈도우함수를 이용해서 음성신호의 프레임을 추출할 때 나타나는 스펙트럼 누설현상은 CPSP 스펙트럼의 추정을 부정확하게 한다. 또한 스펙트럼 누설을 줄이기 위하여 구형이 아닌 다른 윈도우함수를 사용하여 프레임을 추출하면 프레임의 끝부분에서 발생하는 윈도우함수 가중치의 불일치 때문에 신호를 왜곡시킨다. 이 문제점들은 CPSP 기반의 TDOA 추정성능을 감소시킨다. 본 논문에서는 음성신호의 프리엠퍼시스를 이용하여 이러한 문제점들을 완화시키는 방법을 제안한다. 프리엠퍼시스된 음성신호의 다이나믹 레인지를 줄여줌으로써 스펙트럼 누설을 감소 시킨다. 제안한 프리엠퍼시스 방법을 검증하기 위하여, 다양한 잡음 및 잔향환경에서 TDOA 추정실험을 수행하였다. 실험결과 프라엠퍼시스된 마이크 출력에 구형 윈도우함수를 적용시켜 CPSP를 구할 경우 프리엠퍼시스를 하지 않거나 다른 윈도우를 사용하는 경우에 비해 TDOA 추정성능이 향상됨을 확인하였다.

HE-AAC 부호화의 저비트율에서 음질향상 기법 (Quality Improvement of Low-Bitrate HE-AAC Encoder)

  • 김정근;이재성;이태진;강경옥;박영철
    • 한국음향학회지
    • /
    • 제27권2호
    • /
    • pp.66-74
    • /
    • 2008
  • 본 논문에서는 HE-AAC (High Efficiency Advanced Audio Coding) 오디오 부호화기의 저주파 대역과 고주파 대역을 담당하고 있는 AAC부호화기와 SBR (Spectral Band Replication) 부호화기에 대해 낮은 비트율에서 효과적인 개선 방법을 제안한다. AAC 부호화기가 담당하는 저주파 대역에서 과도신호가 발생하는 부분의 프리에코를 줄이기 위하여 적용 주파수범위가 저주파 대역 방향으로 선택적으로 확장되는 eTNS (exteded Temporal Noise Shaping) 방법을 고안하였다. 또한 SBR에 의해 부호화되는 고주파 대역에서 톤 성분 복원 시에 잡음층 (Noise floor)이 추가 발생되지 않도록 정현파 모델을 통해 톤을 사전 인지하고 인지된 톤들의 주파수를 QMF 밴드의 중앙으로 재배치하여 성능 향상을 이루었다. 제안한 방법들을 사용하여 복호화한 샘플 음원들에 대해 주/객관적 음질평가를 실시한 결과, 표준 HE-AAC에 비해 향상된 결과를 보여주었다.

이중 분기 디코더를 사용하는 복소 중첩 U-Net 기반 음성 향상 모델 (Complex nested U-Net-based speech enhancement model using a dual-branch decoder)

  • 황서림;박성욱;박영철
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.253-259
    • /
    • 2024
  • 본 논문에서는 이중 분기 디코더를 갖는 복소 중첩 U-Net 기반의 새로운 음성 향상 모델을 제안하였다. 제안된 모델은 음성 신호의 크기와 위상 성분을 동시에 추정할 수 있도록 복소 중첩 U-Net으로 구성되며, 디코더는 스펙트럼 사상과 시간 주파수 마스킹을 각각의 분기에서 수행하는 이중 분기 디코더 구조를 갖는다. 이때, 이중 분기 디코더 구조는 단일 디코더 구조에 비하여, 음성 정보의 손실을 최소화하면서 잡음을 효과적으로 제거할 수 있도록 한다. 실험은 음성 향상 모델 학습을 위해 보편적으로 사용되는 VoiceBank + DEMAND 데이터베이스 상에서 이루어졌으며, 다양한 객관적 평가 지표를 통해 평가되었다. 실험 결과, 이중 분기 디코더를 사용하는 복소 중첩 U-Net 기반 음성 향상 모델은 기존의 베이스라인과 비교하여 Perceptual Evaluation of Speech Quality(PESQ) 점수가 0.13가량 증가하였으며, 최근 제안된 음성 향상 모델들보다도 높은 객관적 평가 점수를 보였다.

거미의 감각기관을 모사한 초민감 균열기반 진동압력센서 (Ultrasensitive Crack-based Mechanosensor Inspired by Spider's Sensory Organ)

  • 오수연;김태일
    • 마이크로전자및패키징학회지
    • /
    • 제31권1호
    • /
    • pp.1-6
    • /
    • 2024
  • 거미는 진동감각기관을 통하여 미세한 진동까지도 감지해낸다. 뛰어난 진동 감지 능력을 활용해 먹이나 포식자가 발생시키는 진동을 감지하여 공격을 계획하거나 위협을 파악하며 생존에 활용한다. 본 논문은 거미의 진동감각기관을 모사하여 개발된 초민감 진동압력센서에 대해 기술한다. 거미가 진동을 감지하는데 사용하는 감각기관에 위치한 작은 틈에 착안하여 센서에 균열을 생성하였고, 균열의 깊이를 제어하여 외부로부터 오는 압력이나 진동을 매우 민감하게 감지할 수 있는 센서를 개발하였다. 이 센서는 10 N의 인장응력을 적용하여 2%의 변형률에서 게이지 계수가 16000에 도달한다. 이는 높은 신호대잡음비를 가져 정확하게 원하는 진동을 인식할 수 있는 소자로서 외력(압력, 진동)과 생체 신호측정 등 다양한 평가를 통해 센서의 높은 민감도를 증명하였다. 이를 통하여 생체모사 기술을 활용한 새로운 센서의 개발 및 다양한 산업 분야로의 응용 가능성을 제시한다.

온라인 시계열 자료를 위한 익스트림 러닝머신 적용의 최근 동향 (Recent Trends in the Application of Extreme Learning Machines for Online Time Series Data)

  • 윤여창
    • 한국빅데이터학회지
    • /
    • 제8권2호
    • /
    • pp.15-25
    • /
    • 2023
  • 익스트림 러닝머신은 다양한 방식의 예측 분야에서 주요 분석 방법을 제공하고 있다. 시계열 자료의 복잡한 패턴을 학습하고 잡음이 포함되어 있는 데이터이거나 비선형인 경우에도 최적의 학습을 통하여 정확한 예측을 할 수 있다. 이 연구에서는 온라인 시계열 자료를 분석하는 도구로서 주로 연구되고 있는 기계학습 모형들의 최근 동향들을 기존 알고리즘을 이용한 응용 특성들과 함께 제시한다. 지속적이고 폭발적으로 발생하는 대규모 온라인 데이터를 효율적으로 학습시키기 위해서는 다양하게 진화 가능한 속성에서도 잘 수행될 수 있는 학습 기술이 필요하다. 따라서 이 연구를 통하여 시계열 예측 분야에서 빅데이터가 적용되는 최신 기계 학습 모형에 대한 포괄적인 개요를 살펴보고, 빅데이터에 대한 기계 학습의 주요 과제 중 하나인 온라인 데이터를 학습하는 최신 모형들의 일반적인 특성과 온라인 시계열 자료를 얼마나 효율적으로 학습하고 예측에 활용할 수 있는지에 대하여 논의하고 그 대안을 제시한다.

합성곱 순환 신경망 모델을 이용한 의사 레이블링 기법 기반 능동소나 표적 식별 약지도 딥러닝 알고리즘 연구 (A study on the weakly-supervised deep learning algorithm for active sonar target recognition based on pseudo labeling using convolutional recurrent neural network model)

  • 유예나;이원녕;이석진
    • 한국음향학회지
    • /
    • 제43권5호
    • /
    • pp.502-510
    • /
    • 2024
  • 본 논문은 음향 신호처리에 널리 사용되는 합성곱 순환 신경망(Convolutional Recurrent Neural Network, CRNN) 모델을 기반으로 의사 레이블링 기법을 적용하여 소량 및 불균형 능동소나 데이터를 효과적으로 활용할 수 있는 능동소나 표적 식별을 위한 약지도 딥러닝 알고리즘을 제안한다. 두 가지의 서로 다른 신호대잡음비와 클러터 환경을 가정하여 생성한 능동소나 시뮬레이션 데이터를 학습 및 테스트 과정에 사용하였으며, 시뮬레이션 데이터에 단시간 푸리에 변환(Short Time Fourier Transform, STFT)을 적용하여 얻은 스펙트로그램을 알고리즘 학습을 위한 특징 인자로 사용하였다. 본 논문에서 제안하는 알고리즘은 학습 데이터와 무관한 테스트 데이터를 사용하여 표적과 비표적 F1 점수를 지표로 성능을 평가하였으며, 그 결과 합성곱 순환 신경망 모델이 일반적인 음향 신호 처리뿐만 아니라 능동소나 표적 식별에서도 유의미한 성능을 보이는 것을 확인하였다. 또한 의사 레이블링 기법이 합성곱 순환 신경망 모델을 이용한 능동소나 표적 식별 알고리즘의 성능 개선에 도움을 주는 것을 확인할 수 있었다.

PET/CT 검사에서 영상의 질을 유지하기 위한 적정한 $^{18}F$-FDG 투여량의 평가 (Evaluation of Reasonable $^{18}F$-FDG Injected Dose for Maintaining the Image Quality in 3D WB PET/CT)

  • 문아름;이혁;곽인석;최성욱;석재동
    • 핵의학기술
    • /
    • 제15권2호
    • /
    • pp.36-40
    • /
    • 2011
  • PET/CT 검사에서 환자에게 주입되는 $^{18}F$-FDG 투여량은 장비업체에서 제시하는 권고치와 각 병원에서 적용하는 기준치가 서로 다르다. 기준치의 차이로 인한 부적절한 $^{18}F$-FDG 투여량은 환자의 피폭선량을 증가시키고 영상의 질을 감소시킬 수 있다. 본 실험에서는 PET/CT 검사에서 영상의 질을 유지하면서 환자의 피폭선량을 감소시킬 수 있는 적정한 $^{18}F$-FDG 투여량에 대한 평가를 하고자 한다. 모형 실험은 NEMA NU2-1994를 이용하여 열소와 배후 방사능비를 4:1로 유지한 상태에서 열소의 방사능 농도를 1, 3, 5, 7, 9 MBq/kg으로 증가시키며 $^{18}F$-FDG를 주입하였다. CT를 이용한 투과촬영 후 2분 30초/bed의 방출영상을 3차원 (3D) 모드로 획득하였다. 열소와 배후방사능 부위에 각각 관심영역을 설정하고 최대 표준섭취계수(Standard Uptake Value maximum, $SUV_{max}$)를 얻은 후 해당 위치에서의 신호대 잡음비(Signal to Noise Ratio, SNR)를 비교 분석하였다. 임상실험은 2009년 11월부터 2010년 8월까지 내원한 환자를 대상으로 PET/CT 검사를 시행한 환자영상에서 간병변이 없는 97명의 환자를 선별하여 간(liver)과 대퇴부(thigh) 영역에 관심영역을 설정하고 $SUV_{max}$를 측정하여 투여량에 따른 영상의 차이를 비교 분석하였다. 모형 실험에서 단위 질량 당 주입된 방사능 농도는 1, 3, 5, 7, 9 MBq/kg으로 $SUV_{max}$는 23.1, 24.1, 24.3, 22.8, 23.6, SNR은 0.48, 0.54, 0.56, 0.55, 0.55로 나타났다. 5 MBq/kg 이하의 방사능 농도에서는 투여량의 증가에 따라 $SUV_{max}$와 SNR이 증가하지만 7 MBq/kg 이상에서는 감소하였다. 임상 실험의 경우는 단위 질량 당 주입된 방사능 농도가 4.72, 5.34, 6.16, 7.41, 8.68 MBq/kg으로 증가할수록 $SUV_{max}$는 2.68, 2.67, 2.26, 1.88, 1.95, SNR이 0.52, 0.53, 0.46, 0.46, 0.44로 5 MBq/kg의 투여량을 초과할 경우 모형 실험에서와 같은 감소양상을 보였다. 환자의 체중을 고려한 $^{18}F$-FDG 투여량의 증가는 일정 범위 내에서 영상의 질을 향상시키지만 그 범위를 초과할 경우 우발동시계수 및 산란계수의 증가로 인하여 오히려 영상의 질이 저하된다. 실험 결과로부터 3D PET/CT 검사 시 단위질량 당 주입된 방사능 농도 5 MBq/kg이 최적의 주입선량이라는 것을 알 수 있다.

  • PDF

삼차원 자기공명영상법의 뇌 구조 영상을 위한 최적화 연구: 센스인자 변화에 따른 신호변화 평가 (Optimizations of 3D MRI Techniques in Brain by Evaluating SENSE Factors)

  • 박명환;이진완;이강원;류창우;장건호
    • Investigative Magnetic Resonance Imaging
    • /
    • 제13권2호
    • /
    • pp.161-170
    • /
    • 2009
  • 목적 : 평행영상(Parallel imaging)기법의 개발로 긴 촬영시간 때문에 종종 사용되지 못하던 삼차원 영상기법이 최근 들어 환자 병을 진단하는데 새로이 사용되고 있다. 이 연구의 목적은 최근에 뇌 영상에서 개발되어 이용되고 있는 삼차원 자기공명영상을 사람의 뇌에서 짧은 시간 내에 얻을 수 있도록 2차원 평행영상 기법을 사용한 최적화 방법을 연구하는데 있다. 대상 및 방법 : 검사 장비는 3.0T 자기공명영상장치를 이용하였으며 8-채널 SENSE(sensitivity encoding) 머리 코일을 이용하였다. 팬텀 및 3명의 사람 머리에서 영상을 얻었다. 세 가지의 삼차원 영상법인 3D T1WI, 3D T2WI 및 3D FLAIR 영상 방법에 대하여 평행인자(SENSE factor)의 변화에 따른 팬텀 영상을 얻었다. 각각의 영상법에서 영상획득에 적당한 SENSE 인자를 찾기 위해 Phase encoding 방향과 Slice encoding 방향을 조합한 SENSE 인자를 변화시키면서 영상을 얻었다. 영상분석을 위하여 특정영역(ROI)를 설정한 후에 신호대 잡음비 (Signal-to-noise ratio, SNR), 감소분율(Percent Signal Reduction Rate, %R), 대조도(contrast-to-noise ratio, CNR)를 계산하였다. 결과 : 팬텀을 이용한 SENSE 인자 변화에 따른 SNR 및 %R 값의 변화 결과 3D T1WI 방법에서 SENSE 인자를 사용한 것들 중에서 SENSE 인자를 총 3인 경우 약 0.2%의 신호 감소가 나타났고 영상시간은 5분 이내였다. 3D T2WI 방법의 경우 SENSE 인자를 사용한 것들 중에서 SENSE 인자를 총 3인 경우에 약 1.0% 신호 감소가 나타났고 영상 시간은 약 5분 이내였다. 3D FLAIR 방법의 경우 SENSE 인자를 사용한 것들 중에서 SENSE 인자를 4를 사용한 경우에 약 0.2% 신호 감소가 나타났고 영상시간은 약 6분이었다. 사람을 대상으로 할 경우 3D T1W 및 3D T2W영상에서 SNR 및 CNR은 SENSE 인자를 3으로 한 경우에서 SENSE 인자를 4로 한 경우 보다 높게 나타났다. 3D FALIR 영상의 경우 CNR은 SENSE 4에서는 SENSE 3에 비하여 낮았다. 결론 : 본 연구에서는 3가지 3차원 영상법을 실제 임상적용이 가능한 시간 영역에서 SENSE 인자를 변화 시키면서 치적의 영상을 얻도록 하는 연구를 실시한 결과 SNR 감소를 최소화 하면서 영상획득 시간을 약 5분에서 6분 정도 소요되는 2차원 SENSE 인자를 찾았다. 이를 뇌 영상에 적용하였을 경우 SENSE 인자를 적용하지 않은 경우와 비교하면 신호 감소는 최소화 하면서 영상의 질은 큰 영향을 주지 않은 것으로 나타났다. 3D T1W및 3D T2W는 SENSE 인자를 3으로 3D FLAIR인자는 SENSE 인자를 4로 하는 것이 환자를 대상으로 한 뇌 영상에 적합하다고 생각된다. 앞으로는 이들 영상법이 뇌 영상뿐만 아니라 다른 영역의 영상에 적용을 위한 최적화가 필요하다고 생각된다.

  • PDF