• 제목/요약/키워드: Log-Ratio Method

검색결과 214건 처리시간 0.024초

Multimodal audiovisual speech recognition architecture using a three-feature multi-fusion method for noise-robust systems

  • Sanghun Jeon;Jieun Lee;Dohyeon Yeo;Yong-Ju Lee;SeungJun Kim
    • ETRI Journal
    • /
    • 제46권1호
    • /
    • pp.22-34
    • /
    • 2024
  • Exposure to varied noisy environments impairs the recognition performance of artificial intelligence-based speech recognition technologies. Degraded-performance services can be utilized as limited systems that assure good performance in certain environments, but impair the general quality of speech recognition services. This study introduces an audiovisual speech recognition (AVSR) model robust to various noise settings, mimicking human dialogue recognition elements. The model converts word embeddings and log-Mel spectrograms into feature vectors for audio recognition. A dense spatial-temporal convolutional neural network model extracts features from log-Mel spectrograms, transformed for visual-based recognition. This approach exhibits improved aural and visual recognition capabilities. We assess the signal-to-noise ratio in nine synthesized noise environments, with the proposed model exhibiting lower average error rates. The error rate for the AVSR model using a three-feature multi-fusion method is 1.711%, compared to the general 3.939% rate. This model is applicable in noise-affected environments owing to its enhanced stability and recognition rate.

강인한 음성인식을 위한 켑스트럼 거리와 로그 에너지 기반 묵음 특징 정규화 (Cepstral Distance and Log-Energy Based Silence Feature Normalization for Robust Speech Recognition)

  • 신광호;정현열
    • 한국음향학회지
    • /
    • 제29권4호
    • /
    • pp.278-285
    • /
    • 2010
  • 훈련 환경과 인식 환경의 차이가 음성인식 성능저하의 주요요인이다. 이러한 환경의 불일치를 줄이기 위한 방법으로 다양한 묵음특징 정규화 방법이 제안되고 있다. 기존의 묵음특징 정규화 방법은 낮은 SNR (Signal-to-Noise Ratio)에서 묵음구간의 에너지 레벨이 증가하여 음성/묵음 분류의 정확도가 떨어짐으로 인해 인식성능이 저하되는 문제점이 있었다. 본 논문에서는 로그 에너지와 음성/묵음(또는잡음)의 켑스트럼 특징의 분포 특성의 차이를 나타내는 켑스트럼 유클리디언(Euclidean) 거리를 결합하여 음성/묵음을 분류하는 묵음특징 정규화 방법 (Cepstral distance and Log-energy based Silence Feature Normalization)을 제안하였다. 제안한 방법은 높은 SNR에서는 로그 에너지 특징이 잡음의 영향을 적게 받는 특성을 반영하여 기존의 묵음 특징 정규화 (Silence Feature Normalization)방법의 우수성을 그대로 유지하는 반면, 낮은 SNR에서는 로그 에너지 대신 음성/묵음 분류의 분별력이 우수한 켑스트럼 거리 정보를 이용함으로써 인식성능을 향상시킬 수 있다. 인식실험결과 기존의 SFN-I/II, CSFN 방법에 비해 전반적으로 향상된 인식성능을 얻을 수 있어 그 유효성을 확인할 수 있었다.

모티리움엠정(말레인산 돔페리돈 12.72 mg)에 대한 디엠정의 생물학적동등성 평가 (Bioequivalence Assessment of DM Tablet to Motilium-$M^{(R)}$ Tablet)

  • 조성완;김영일;이종오;방준석;정지훈
    • 한국임상약학회지
    • /
    • 제18권2호
    • /
    • pp.106-113
    • /
    • 2008
  • The aim of this study was to evaluate the bioequivalence of two domperidone preparations. Bioequivalence assessment was conducted on 34 healthy volunteers who received two tablets (Domperidone Maleate, 12.72 mg/tablet) in the fasting state, in a randomized balanced $2{\times}2$ cross-over study design. This whole study was performed according to the implementation guidelines of the Korea Food Drug Administration. After dosing of two tablets, blood samples were collected serially for a period of 36 hours. Plasma was analyzed for domperidone by using LC/MS/MS assay method. The analysis system was validated in specificity, accuracy, precision, and linearity. $AUC_t$, (the area under the plasma concentration-time curve from the zero-time to 36 hr) was calculated through the trapezoidal rule. $C_{max}$ (maximum plasma drug concentration) and $T_{max}$ (time to reach $C_{max}$) were compiled from the plasma domperidone concentration-time data of each volunteer. No significant sequence effect was found for the bioavailability parameters indicating that the cross-over design was properly performed. The 90%-Confidence intervals of the $AUC_t$ ratio and the $C_{max}$ were from log 0.8007 to log 1.1240 and log 0.8645- log 1.2483, respectively. These values were within the acceptable bioequivalence intervals between 0.80 and 1.25. Therefore, this study demonstrated that two formulations have bioequivalence with respect to the rate and extent of absorption.

  • PDF

다변량 통계 기법을 이용한 물리검층 자료로부터의 암석물리학상 결정 (Automatic Electrofacies Classification from Well Logs Using Multivariate Statistical Techniques)

  • 임종세;김정환;강주명
    • 지구물리와물리탐사
    • /
    • 제1권3호
    • /
    • pp.170-175
    • /
    • 1998
  • 이 연구는 다변량 통계 기법을 이용한 물리검층 자료로부터의 암석물리학상 결정으로 암상을 예측하는 것이다. 기술 통계 분석으로 물리검층 자료의 특성을 파악하고 주성분 분석에 의한 다변량 검층 자료들의 상관도 분석을 통해 변수들을 변환시켜 새로운 변수인 주성분을 구하고 변수들의 차원을 축소한다. 통계적 방법에 의한 주성분 검층 자료의 구획에 의한 효율적 자료 축소와 계산의 효율성을 높여 양질의 해석결과를 얻을 수 있다. 구획된 주성분 검층 자료로부터 계보적 군집 분석에 의해 암석물리학상을 결정한다. 최적 암석물리학상의 수는 전체 변동과 군집내의 변동사이의 비와 코어자료 등에 의해 비교 결정된다. 이 연구에서 개발된 암석물리학상 결정법을 국내대륙붕 물리검층자료에 적용한 결과 결정된 암석물리학상은 시추 코어 및 시추 암편 분석에 의한 암상 구분화와 잘 일치하였다. 이러한 연구는 저류층 특성인자의 신뢰성 있고 정량적인 평가로 유전 개발 및 생산 계획 시 유용한 도구로 활용될 수 있을 것이다.

  • PDF

건강한 지원자에 있어서 리세드로네이트 35 mg 함유 악토넬정과 리세넬정의 약물 동력학적 비교 (Pharmacokinetic Comparison of Actonel and Risenel Tablet Containing Risedronate sodium in Healthy Volunteers)

  • 최성업;김영일;박영준;이종오;송진호;조성완
    • 한국임상약학회지
    • /
    • 제19권1호
    • /
    • pp.23-31
    • /
    • 2009
  • The aim of this study was to evaluate the pharmacokinetic parameters of two risedronate preparations. The clinical assessment was conducted on 46 healthy volunteers who received one tablet (Risedronate sodium 35 mg/tablet) in the fasting state, in a randomized balanced $2{\times}2$ cross-over study design. After dosing of one tablet containing 35 mg risedronate sodium, blood samples were collected serially for a period of 48 hours. Plasma was analyzed for risedronate by using LC/MS/MS assay method. The analysis system was validated in specificity, accuracy, precision, and linearity. $AUC_t$, (the area under the plasma concentration-time curve from the zero-time to 48 hr) was calculated through the trapezoidal rule. $C_{max}$ (maximum plasma drug concentration) were compiled from the plasma risedronate concentration-time data of each volunteer. No significant sequence effect was found for the pharmacokinetic parameters indicating that the cross-over design was properly performed. The 90 % - Confidence intervals of the $AUC_t$ ratio and the $C_{max}$ were from log 0.8752 to log 1.1888 and log 0.8457 to log 1.1478, respectively. These values were within the acceptable intervals between 0.80 and 1.25. Therefore, this study demonstrated that no statistically significant difference was identified with respect to the rate and extent of absorption.

  • PDF

고차 변조 방식을 사용하는 MIMO 시스템을 위한 낮은 복잡도를 갖는 연판정 알고리즘 (Soft-Decision Algorithm with Low Complexity for MIMO Systems Using High-Order Modulations)

  • 이재윤;김경택
    • 한국통신학회논문지
    • /
    • 제40권6호
    • /
    • pp.981-989
    • /
    • 2015
  • 최적 ML(Maximum Likelihood) 기법 및 sphere decoding(SD), QRM-MLD(QR decomposition with M-algorithm Maximum Likelihood Detection) 기반의 준 최적 검출 기법을 적용한 MIMO(Multiple-Input Multiple-Output) 시스템에서의 LLR(Log Likelihood Ratio) 계산은 변조 차수 및 송/수신 안테나의 수가 증가할수록 그 복잡도가 지수적으로 증가하여 구현 및 성능 면에서 큰 문제점을 야기한다. 본 논문에서는 고차 변조 방식 기반의 $N_T{\times}N_R$ MIMO시스템 수신기의 QRM-MLD 기반 MIMO 검출기에서 연판정 시 아주 낮은 복잡도로 1dB 이내의 ML 검출 기법에 대한 오류 성능 접근도를 갖는 LLR 계산 방법을 제시하고, 컴퓨터 시뮬레이션을 통해 여러 M 값에 대한 MIMO 시스템의 BER(Bit Error Rate) 결과를 도출하고 분석하여 제시된 방법의 유효성을 검증한다.

GPS Integrity Monitoring Method Using Auxiliary Nonlinear Filters with Log Likelihood Ratio Test Approach

  • Ahn, Jong-Sun;Rosihan, Rosihan;Won, Dae-Hee;Lee, Young-Jae;Nam, Gi-Wook;Heo, Moon-Beom;Sung, Sang-Kyung
    • Journal of Electrical Engineering and Technology
    • /
    • 제6권4호
    • /
    • pp.563-572
    • /
    • 2011
  • Reliability is an essential factor in a navigation system. Therefore, an integrity monitoring system is considered one of the most important parts in an avionic navigation system. A fault due to systematic malfunctioning definitely requires integrity reinforcement through systematic analysis. In this paper, we propose a method to detect faults of the GPS signal by using a distributed nonlinear filter based probability test. In order to detect faults, consistency is examined through a likelihood ratio between the main and auxiliary particle filters (PFs). Specifically, the main PF which includes all the measurements and the auxiliary PFs which only do partial measurements are used in the process of consistency testing. Through GPS measurement and the application of the autonomous integrity monitoring system, the current study illustrates the performance of the proposed fault detection algorithm.

SCP 복합지반 침하거동예측을 위한 새로운 침하모델의 개발 (Development of New Settlement Model for Prediction of Settlement Characteristics of SCP Composite Ground)

  • 유상호;박현일;임종철;박이근
    • 한국지반공학회논문집
    • /
    • 제25권8호
    • /
    • pp.23-32
    • /
    • 2009
  • 본 연구에서는 모래 다짐말뚝 공법의 설계 및 시공단계에서 침하거동 예측에 활용될 수 있는 합리적이고 간편한 해석기법을 제안하였으며, 모델 계수값들은 유전자 알고리즘에 근거한 최적화 과정을 통하여 구할 수 있다. 제안된 기법의 검증을 위하여 0(무치환), 20, 36 및 56%의 다양한 모래 치환율에 대한 SCP 복합지반의 침하거동에 관한 실내압밀실험이 수행되었다. 제안된 모델은 각 치환율에 대하여 간극비-대수응력 관계 및 시간-압축 관계에서 계측값과 매우 일치되는 경향성을 보였다.

음성 향상 전처리와 문턱값 갱신을 적용한 향상된 음성검출 방법 (An Improved VAD Algorithm Employing Speech Enhancement Preprocessing and Threshold Updating)

  • 이윤창;안상식
    • 한국통신학회논문지
    • /
    • 제28권11C호
    • /
    • pp.1161-1168
    • /
    • 2003
  • 본 논문에서는 음성검출의 성능을 향상시킬 목적으로 정합 필터를 이용한 음성향상 전처리 과정을 통하여 SNR을 개선한 후, 이를 LLR(Log Likelihood Ratio) 검사에 의한 최적 결정방법을 적용하여 확률적인 모델을 기준으로 하는 향상된 음성검출 방법을 제안한다. 또한 기존의 음성검출 방법들에서는 제시되지 않았던 문턱값 갱신 알고리즘을 제안하며, 이 방법을 통해서 기존의 방법들에서 성능이 좋지 않았던 낮은 SNR 환경에서도 음성검출을 할 수 있게 되었다. 마지막으로 컴퓨터 시뮬레이션을 통하여 이미 상용화되어 널리 이용중인 G.729B(ITU-TG.729 Annex B)의 음성검출 결과와 비교를 통해서 제안한 음성검출 방법의 성능의 우수성을 검증하며, 실제적인 환경에도 적용이 가능함을 보인다.

Clipping Value Estimate for Iterative Tree Search Detection

  • Zheng, Jianping;Bai, Baoming;Li, Ying
    • Journal of Communications and Networks
    • /
    • 제12권5호
    • /
    • pp.475-479
    • /
    • 2010
  • The clipping value, defined as the log-likelihood ratio (LLR) in the case wherein all the list of candidates have the same binary value, is investigated, and an effective method to estimate it is presented for iterative tree search detection. The basic principle behind the method is that the clipping value of a channel bit is equal to the LLR of the maximum probability of correct decision of the bit to the corresponding probability of erroneous decision. In conjunction with multilevel bit mappings, the clipping value can be calculated with the parameters of the number of transmit antennas, $N_t$; number of bits per constellation point, $M_c$; and variance of the channel noise, $\sigma^2$, per real dimension in the Rayleigh fading channel. Analyses and simulations show that the bit error performance of the proposed method is better than that of the conventional fixed-value method.