• 제목/요약/키워드: Mel

검색결과 581건 처리시간 0.021초

감정 음성 인식을 위한 강인한 음성 파라메터 (Robust Speech Parameters for the Emotional Speech Recognition)

  • 이규현;김원구
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.681-686
    • /
    • 2012
  • 본 논문에서는 강인한 감정 음성 인식 시스템을 개발하기 위하여 감정의 영향을 적게 받는 음성 파라메터에 대한 연구를 수행하였다. 이러한 목적을 위하여 다양한 감정이 포함된 데이터를 사용하여 감정이 음성 인식 시스템과 음성 파라메터에 미치는 영향을 분석하였다. 본 연구에서는 멜 켑스트럼, 델타 멜 켑스트럼, RASTA 멜 켑스트럼, 루트 켑스트럼, PLP 계수와 성도 길이 정규화 방법에서 주파수 와핑된 멜 켑스트럼 계수를 사용하였다. 또한 신호 편의 제거 방법으로 CMS 방법과 SBR 방법이 사용되었다. 실험결과에서 성도정규화 방법을 사용한 RASTA 멜 켑스트럼, 델타 멜 켑스트럼 및 CMS 방법을 사용한 경우가 HMM 기반의 화자독립 단독음 인식 실험 결과에서 가장 우수한 결과를 나타내었다.

청크 기반 시계열 음성의 감정 인식 연구 (A Study on Emotion Recognition of Chunk-Based Time Series Speech)

  • 신현삼;홍준기;홍성찬
    • 인터넷정보학회논문지
    • /
    • 제24권2호
    • /
    • pp.11-18
    • /
    • 2023
  • 최근 음성 감정 인식(Speech Emotion Recognition, SER)분야는 음성 특징과 모델링을 활용하여 인식률을 개선하기 위한 많은 연구가 진행되고 있다. 기존 음성 감정 인식의 정확도를 높이기 위한 모델링 연구 이외에도 음성 특징을 다양한 방법으로 활용하는 연구들이 진행되고 있다. 본 논문에서는 음성 감정이 시간 흐름과 연관이 있음을 착안하여 시계열 방식으로 음성파일을 시간 구간별로 분리한다. 파일 분리 이후, 음성 특징인 Mel, Chroma, zero-crossing rate (ZCR), root mean square (RMS), mel-frequency cepastral coefficients (MFCC)를 추출하여서 순차적 데이터 처리에 사용하는 순환형 신경망 모델에 적용하여 음성 데이터에서 감정을 분류하는 모델을 제안한다. 제안한 모델은 librosa를 사용하여 음성 특징들을 모든 파일에서 추출하여, 신경망 모델에 적용하였다. 시뮬레이션은 영어 데이터 셋인 Interactive Emotional Dyadic Motion Capture (IEMOCAP)을 이용하여 recurrent neural network (RNN), long short-term memory (LSTM) and gated recurrent unit(GRU)의 모델들의 성능을 비교 및 분석하였다.

화자 검증 시스템을 위한 PCA 기반 MFDWC 특징 파라미터 (A PCA-based MFDWC Feature Parameter for Speaker Verification System)

  • 함성준;정호열;정현열
    • 한국음향학회지
    • /
    • 제25권1호
    • /
    • pp.36-42
    • /
    • 2006
  • 본 논문에서는 화자검증 시스템의 성능향상을 위해서 주성분 분석 (PCA) 기반 Mel-Frequency Discrete Wavelet Coefficients (MFDWC) 추출방법을 제안한다. 제안된 방법에서는 멜척도 (Mel-scale)를 근사화한 각 레벨 (level)의 각 노드 (node) 에너지를 계산하기 위해 기존의 평균치 대신 주성분 분석을 이용한 첫 번째 eigenvector를 이용한다. 이 eigenvecto.의 제곱의 합은 1로서 일반적인 가중 함수 (weighting function)의 조건을 만족하고, 또한 각 화자마다 서로 다른 값을 갖게 되므로, 화자의 특징을 더 잘 나타내는 MFDWC를 추출할 수 있다. 화자검증은 Gaussian Mixture Model (GMM) 기반의 백그라운드 모델과 화자 모델과의 점수를 비교하는 이진 결정 (binary decision) 방법을 이용하여 Universal 백그라운드 모델 (UBM)과 각 화자 모델의 값을 프레임단위로 비교하여 대상 화자의 수락/거부 여부를 결정하는 방법을 채택하였다. 특징 파라미터에 따른 화자 검증 성능변화를 확인하기 위하여 제안된 화자종속 가중함수를 이용한 MFDWC를 특징 파라미터로 이용한 경우와 Mel-Frequency Cepstral Coefficients (MFCC), Linear Predictive Cepstral Coefficients (LPCC), 기존의 MFDWC를 특징 파라미터로 이용한 경우에 대하여 성능비교실험을 수행한 결과 각각 $0.80\%,\;5.14\%,\; 6.69\%$의 향상된 성능을 나타내어 제안한 방법의 유효성을 확인할 수 있었다.

인삼(Panax ginseng) 열매로부터 분리한 ginsenoside의 동정 및 암세포독성 효과 (Ginsenosides from the fruits of Panax ginseng and their cytotoxic effects on human cancer cell lines)

  • 곽정은;이영근;황보전;김형근;오선민;이대영;백남인
    • Journal of Applied Biological Chemistry
    • /
    • 제61권4호
    • /
    • pp.371-377
    • /
    • 2018
  • 인삼(Panax. ginseng) 열매를 80% MeOH 수용액으로 3회 반복 추출한 뒤, 감압 농축한 추출물을 EtOAc, n-BuOH과 $H_2O$ 층으로 계통 분획을 실시하였다. EtOAc분획에 대하여 $SiO_2$ 및 ODS column chromatography를 반복실시하여 5종의 ginsenoside 화합물을 분리 및 정제하였다. NMR, IR, FAB/MS 데이터를 해석하여, 각각 ginsenoside F1 (1), ginsenoside F2 (2), ginsenpside F3 (3), ginsenoside Ia (4) 및 notoginsenoside Fe (5)로 구조 동정 하였다. 화합물 2-5는 인삼열매에서는 이번에 처음 분리 보고되었다. 분리한 5종의 화합물을 인체 암세포주(HCT-116, SK-OV-3, HeLa, HepG2, SK-MEL-5)에 처리하여 세포독성을 측정하였다. 이 중 화합물 2, 4, 및 5가 인체 암세포주에 대해 세포독성을 저해시키는 것을 알 수 있었다. 화합물 2는 SK-MEL-5, HepG2, HeLa세포에서 $IC_{50}$값이 82.8, 86.8, $78.3{\mu}M$로 확인되었다. 화합물 4는 HCT-116, SK-MEL-5, SK-OV-3, HepG2, HeLa 세포에서 $IC_{50}$ 값이 24.5, 25.4, 26.3, 22.0, $24.9{\mu}M$로 확인되었다. 화합물 5는 SK-MEL-5 세포에서 $IC_{50}$ 값이 $81.7{\mu}M$로 확인되었다. 인삼 열매에서 분리한 화합물2, 4, 및 5가 암세포주에 대해 강한 세포독성을 나타내는 것을 확인하였으며, 이 화합물들은 공통적으로 3번 수산기에 glucopyranose를 가지고 있음을 확인하였다.

숨은마코프모형을 이용하는 음성구간 추출을 위한 특징벡터 (A New Feature for Speech Segments Extraction with Hidden Markov Models)

  • 홍정우;오창혁
    • Communications for Statistical Applications and Methods
    • /
    • 제15권2호
    • /
    • pp.293-302
    • /
    • 2008
  • 본 논문에서는 숨은마코프모형을 사용하여 음성구간을 추출하는 경우에 사용되는 새로운 특징벡터인 평균파워를 제안하고, 이를 멜주파수 켑스트럴 계수(met frequency cepstral coefficients, MFCC)와 파워계수와 비교한다. 이들 세 가지 특징벡터의 수행력을 비교하기 위하여 일반적으로 추출이 상대적으로 어렵다고 알려진 파열음을 가진 단어에 대한 음성 데이터를 수집하여 실험한다. 다양한 수준의 잡음이 있는 환경에서 음성구간을 추출하는 경우 MFCC나 파워계수에 비해 평균파워가 더 정확하고 효율적임을 실험을 통해 보인다.

K-L 전개를 이용한 연속 숫자음 인식에 관한 연구 (A Study on Connected Digits Recognition Using the K-L Expansion)

  • 김주곤;오세진;황철준;김범국;정현열
    • 융합신호처리학회논문지
    • /
    • 제2권3호
    • /
    • pp.24-31
    • /
    • 2001
  • K-L 전개 방법은 특징의 차원을 효과적으로 압축하므로 인식 처리에서 계산량을 줄일 수 있는 방법으로 잘 알려져 있다. 본 논문에서는 한국어 인식 시스템의 인식 정도를 개선하기 위해, 음성의 특징 파라미터에 대하여 효과적으로 K-L전개를 적용하는 방법(K-L 계수)을 제안한다. 그리고 제안한 방법으로 얻어진 새로운 음성 특징 파라미터를 이용하여 화자 독립 연속 숫자음 인식실험을 수행하고, 기존의 Mel-cepstrum과 회귀계수의 인식 결과와 비 교, 분석하였다. 인식 실험 결과, 제안한 K-L 계수를 이용한 방법이 기존의 방법보다 높은 인식률을 얻어 제안한 방법의 유효성을 확인할 수 있었다.

  • PDF

차량 추적을 위한 이동형 자동차 배출가스 측정시스템(MEL) 구축 (A Mobile Emission Laboratory for Car Chasing Experiment)

  • 이석환;김홍석;이승재;배귀남
    • 한국자동차공학회논문집
    • /
    • 제19권1호
    • /
    • pp.109-116
    • /
    • 2011
  • To measure the traffic pollutants with high temporal and spatial resolution under real conditions a mobile emission laboratory (MEL) was designed and built in KIST with close-cooperation with KIMM and Yonsei university. The equipment of the mini-van provides gas phase measurements of CO, NOx, $CO_2$, THC (Total hydrocarbon) and number density & size distribution measurements of fine and ultra-fine particles by a fast mobility particle sizer (FMPS) and a condensation particle counter (CPC). The inlet sampling port above the bumper enables the chasing of different type of vehicles. This paper introduces the construction and technical details of the MEL and presents data from the car chasing experiment of diesel and CNG city bus. The dilution ratio was increased rapidly according to the chasing distance. Most particles from the diesel city bus were counted under 300 nm and the peak concentration of the particles was located between 40-60 nm. However, the most particles from the CNG city bus were nano particle counted under 50 nm.

A Study on Stable Motion Control of Humanoid Robot with 24 Joints Based on Voice Command

  • Lee, Woo-Song;Kim, Min-Seong;Bae, Ho-Young;Jung, Yang-Keun;Jung, Young-Hwa;Shin, Gi-Soo;Park, In-Man;Han, Sung-Hyun
    • 한국산업융합학회 논문집
    • /
    • 제21권1호
    • /
    • pp.17-27
    • /
    • 2018
  • We propose a new approach to control a biped robot motion based on iterative learning of voice command for the implementation of smart factory. The real-time processing of speech signal is very important for high-speed and precise automatic voice recognition technology. Recently, voice recognition is being used for intelligent robot control, artificial life, wireless communication and IoT application. In order to extract valuable information from the speech signal, make decisions on the process, and obtain results, the data needs to be manipulated and analyzed. Basic method used for extracting the features of the voice signal is to find the Mel frequency cepstral coefficients. Mel-frequency cepstral coefficients are the coefficients that collectively represent the short-term power spectrum of a sound, based on a linear cosine transform of a log power spectrum on a nonlinear mel scale of frequency. The reliability of voice command to control of the biped robot's motion is illustrated by computer simulation and experiment for biped walking robot with 24 joint.

Multicopy Streptomyces 플라스미드 pJY711의 재조합 유도체의 특성 (Characterization of Recombinant Derivatives of pJY711 of Multicopy Streptomyces Plasmid)

  • 염도영;공인수;유주현
    • 미생물학회지
    • /
    • 제28권1호
    • /
    • pp.35-40
    • /
    • 1990
  • Thiostrepton 내성 유전자(tsr)를 포함하는 multi-copy 재조합 플라스미드 pJY7J2의 제한효소 절단지도를 작성하였다. pJY, 712는 Streptomyces에서 넓은 host range를 나타내었으며 cloning 목적에 사용할 수 있는 단일 BgtIl 제한효소 인식부위를 갖고 있었다. 플라스미드 pJY 712는 lethal zygosis(Ltz+) 현상을 보였다. pJY 712의 혁질전환빈도는 S. lividans에서 $5.0\times 10^{4}$ TFU였다. pJY 712의 Bell 제한효소 인식부위에 tyrosmase 유전자(mel)를 삽입하여 플라스미드 PJY713을 제조하였다. met 유전자를 포함한 재조합 플라스미드 pJY 714는 pJY 713의 일부분(1.9kb BgllI-BelI 단편)을 제거하여 제고하였다.

  • PDF

Cytotoxic Activity of Leguminous Seed Extracts against Human Tumor Cell Lines

  • Lee, Hoi-Seon;Lee, Jeong-Ock;Lee, Hee-Kwon;Oh, Jong-Hwan;Ahn, Young-Joon
    • Applied Biological Chemistry
    • /
    • 제41권4호
    • /
    • pp.246-250
    • /
    • 1998
  • The cytotoxic activity of methanol extracts of 25 leguminous seeds in vitro was evaluated by sulforhodamine B assay, using the five human solid A549 lung, SK-OV-2 ovarian, SK-MEL-2 melanoma, XF-498 CNS and HCT-15 colon tumor cell lines. The responses varied with both cell line arid leguminous seed used. Extracts of Canavalia lineata and Glycine soja revealed potent cytotoxic activity against A549 arid SK-MEL-2 cell lines. Moderate activity was observed in the extracts of Cassia obtusifolia and Glyeine max var. chungtae, and C. lineata and Vigna angulasis against SK-MEL-2 and HCT-15 cell lines, respectively. The other seed extracts were ineffective against model tumor cell lines. Because of their potent cytotoxic activities, the activity of each solvent fraction from C. lineata and G. soja was determined and the potent activity was produced from their chloroform fractions. As a naturally occurring therapeutic agent, leguminous seeds described could be useful for developing new types of anti-tumor agents.

  • PDF