• Title/Summary/Keyword: Simulation speech

검색결과 302건 처리시간 0.024초

동적 세그멘테이션을 이용한 폴리포닉 오디오 신호의 정현파 모델링 (Sinusoidal Modeling of Polyphonic Audio Signals Using Dynamic Segmentation Method)

  • 장호근;박주성
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.58-68
    • /
    • 2000
  • 본 논문에서는 폴리포닉 오디오 신호에 대한 정현파 모델링 방법을 제안한다. 정현화 모델링을 폴리포닉 오디오 신호에 적용하는데 있어서 가장 큰 문제점은 스펙트럼 분석을 위한 분석 윈도우의 크기를 결정할 수 없다는 것이다. 또한 고음질의 합성음을 위해서는 악기음의 특성을 결정짓는 어택이 잘 보존되어야 한다. 본 논문에서는 입력 신호를 6개의 옥타브 벤드 구조의 다중 해상도 필터 뱅크를 통과시키고, 각 서브벤드 신호에 대해 서로 다른 크기의 분석 윈도우를 적용시킴으로써 폴리포닉 오디오 신호에 대한 분석 윈도우 크기 결정 문제를 해결한다. 정현파 모델링에서 발생하는 어택과 같은 천이 구간에서의 퍼짐 현상을 개선하기 위해 각 서브밴드 신호에 동적 세그맨테이션 방법을 적용하여 천이 구간 근처에서는 분석과 합성 프레임 크기를 작게 하는 방법을 사용한다. 이 방법을 통해 서브밴드 신호의 구간별 시간-주파수 특성에 따라 적절한 크기의 윈도우를 선택할 수 있다. 동적 세그멘테이션 방법으로는 기존의 방법보다 계산량과 성능 면에서 더 나은 특성을 보이는 방법을 제안한다. 여러가지 폴리포닉 오디오 신호에 대한 시뮬레이션 결과 제안한 정현파 모델링 방법이 음질의 손상 없이 원래 신호를 잘 복원할 수 있음을 확인하였다.

  • PDF

최근 우리나라 e-Learning 시장의 주요 동향 및 향후 전망 (Some Problems of e-Learning Market in Korea)

  • 윤영한
    • 통상정보연구
    • /
    • 제9권2호
    • /
    • pp.103-120
    • /
    • 2007
  • The knowledge based economy requires more and more people to learn new knowledge and skills in a timely and effective manner. These needs and new technology such as computer and Internet are fueling a transition in e-learning. According to specialist's opinion, imagination experience studying is generalized, and learning environment that language barrier by studying, multi-language studying Machine that experience past things that disappear through simulation, and travel area, and experience future changed state disappears is forecasting to come. This is previewing finally that it may become future education that education and IT, element of entertainment is combined. Already, became story that argument for party satellite of e-Learning existence passes one season already. e-Learning is utilized already in all educations that we touch by effectiveness by corporation's competitive power improvement and implement of lifelong education in educational institutions through present e-Learning. It is obvious that when see from our viewpoint which is defining e-Learning by one industry and rear by application to education as well as one new growth power about these, e-Learning industry becomes very important means that can solve dilemma of growth real form. Only, special quality of digital industry that e-Learning is being same with other digital industry and repeat putting out a fire rapidly, and is repeating sudden change that these evolution is not gradual growth of accumulation and improvement of technology that is appearing consider need to. In the meantime, we need to observe about evolution of Information Technology. Because there is some scholars who e-Learning's concept foresees to evolve by u-Learning.(although, a person who see that these concept is not more in marketing terminology by some scholars' opinion is). This u-Learning's concept means e-Learning that take advantage of ubiquitous technology as Ubiquitous-Learning's curtailment speech. Ubiquitous, user means Information-Communication surrounding that can connect to network freely regardless of place without feeling network or computer. There is controversy about introduction time regarding these direction, but e-Learning is judged to evolve by u-Learning necessarily. Because keep in step and age that study all contents that learner wants under environment of 3A (any time, any whrer, any device) by individual order thoroughly is foreseen to come in ubiquitous learning environment that approach more festinately.

  • PDF

M-채널 서브밴드 QMF 필터뱅크를 이용한 웨이브릿변환기반 적응 음향반향제거기 (An Adaptive AEC Based on the Wavelet Transform Using M-channel Subband QMF Filter Banks)

  • 안주원;권기룡;문광석;김문수
    • 한국멀티미디어학회논문지
    • /
    • 제3권4호
    • /
    • pp.347-355
    • /
    • 2000
  • 본 논문에서는 M-채널 서브밴드 QMF 필터 뱅크를 이용한 웨이브릿 변환기반 적응 음향반향제거기를 제안한다. 제안한 적응 음향반향제거기는 웨이브릿변환 필터뱅크의 적은 계산량, 서브밴드 처리 및 웨이브릿 서브밴드 필터의 직교성에 의해 정상상태 성능을 향상시키고, 실시간 처리가 가능하도록 구현한다. 각 서브밴드에서 적응필터의 계수적응을 위한 알고리듬으로는 실시간 반향제거와 하드웨어 구현시 비용감소를 위하여 계산량이 적고 구현이 간단한 LMS 적응 알고리듬을 사용한다. 제안한 적응 음향반향제거기의 성능평가를 위한 실험으로서 백색 가우시안 잡음 및 주변잡음을 포함한 실제의 음성신호를 입력신호로 반향제거 기에 인가하여 반향성능을 평가하였다. 실험 결과로서 제안한 음향반향제거기는 웨이브릿 완전복원 필터뱅크에 의해 수렴후 점근적 에러가 적고, 적은 계산량을 요구하며 안정한 수렴성능을 나타내었다.

  • PDF

웨이브렛 변환을 이용한 DCT 적응 서브 밴드 필터 알고리즘 (A DCT Adaptive Subband Filter Algorithm Using Wavelet Transform)

  • 김선웅;김성환
    • 한국음향학회지
    • /
    • 제15권1호
    • /
    • pp.46-53
    • /
    • 1996
  • 적응 LMS 알고리즘은 그 구조적 간결성으로 인해 많은 방면엣 활용되어 오고 있다. 이 논문에서는 입력 신호를 임의의 대역폭을 가진 서브밴드로 분할하여 처리한다. 각 서브밴드엣 신호의 동적범위가 줄어들 수 있으며 각 대역에서 독립적으로 수행되는 적응 필터링은 이로 인해 기존의 LMS 필터링보다 빠른 수렴 속도를 얻을 수 있다. 각 대역에서의 적응 필터링은 DCT 변환을 잉용하여 입력 신호의 백색화후 수행되며 이에 따라 탭입력 공분산 행렬의 고유치 분포율이 작아져 빠른 수렴 속도를 얻게 된다. 최종적으로, 각 서브밴드에서 필터링된 출력신호는 전 대역에 걸쳐 주파수 성분을 가지도록 합성 과정을 거쳐야 한다. 이 과정에서 웨이브렛 필터 뱅크는 스펙트럼 상에 간섭이 없는 완벽한 신호 복원을 가능하게 한다. 전산 모의 실험에서 가산성 백색 잡음이 가해진 음성신호 입력의 경우 제안된 알고리즘은 신호대 잡음비가 높아질수록 기존의 정규화 LMS(normalized LMS)보다 우수한 성능을 보였다.

  • PDF

마이크로폰 어레이를 위한 최적 패턴 형성 (Optimum Pattern Synthesis for a Microphone Array)

  • 장병건;권태능;변윤식
    • 한국음향학회지
    • /
    • 제16권1호
    • /
    • pp.47-53
    • /
    • 1997
  • 이 논문은 원거리회의 환경에서 음성신호와 같은 광대역 신호를 다룰 수 있는 마이크로폰 어레이의 빔패턴(beam pattern)을 형성하는 효과적인 방법에 대하여 서술한다. 어레이의 변수를 반복적으로 변화시킴으로써, 측면롭의 높이를 조정하여 일정한 수준의 측면롭을 형성하며, 갱신된 측면롭을 대수적으로 찾지 않고 수치적으로 찾는 접근방법을 제안하였다. 어레이 계수나 마이크로폰 간격을 어레이변수로 사용하였으며, 마이크로폰 어레이 가시범위에 공간적으로 균일하게 입력되는 방향성잡음 또는 배경잡음을 효과적으로 줄일 수 있는 Dolph-Chebyshev형태의 최적화패턴을 형성하였다. 어레이 계수보다 마이크로폰 간격을 변화시키는 것이 광대역신호를 더 효과적으로 다룰 수 있는 최적화 패턴을 제공하는 것이 판명되었다. 또한 방향조정(scanning)상황 하에서 측면롭에 강한(robust)패턴을 형성할 수 있는 방법을 제안하였으며, 컴퓨터 실험결과를 제시하였다.

  • PDF

Convolutive 암묵신호분리방법에 기반한 음향반향 제거 (Acoustic Echo Cancellation Based on Convolutive Blind Signal Separation Method)

  • 이행우
    • 한국전자통신학회논문지
    • /
    • 제13권5호
    • /
    • pp.979-986
    • /
    • 2018
  • 본 논문은 암묵신호분리방법을 이용한 음향반향 제거에 관한 것이다. 이 방법은 동시통화 중에도 반향제거 성능이 저하되지 않는다. 폐쇄된 반향환경에서 음향신호의 혼합모델은 다채널이기 때문에 convolutive 암묵신호분리방법을 적용하며 신호분리를 위해 분리계수를 직접 계산하지 않고 역방향 모델을 이용하여 혼합계수를 산출하는 방식으로 이루어진다. 계수 갱신은 2차 통계적 성질을 기반으로 반복적인 계산에 의해 수행됨으로서 근단화자 신호를 추정해낸다. 제안한 암묵신호분리의 성능을 검증하기 위해 많은 시뮬레이션을 수행하였다. 시뮬레이션 결과, 이 방법을 사용한 음향반향제거기는 동시통화의 유무에 상관없이 안전하게 동작하고, 일반적인 적응 FIR 필터구조에 비해 PESQ가 0.6점 향상되는 것으로 나타났다.

Signal Enhancement of a Variable Rate Vocoder with a Hybrid domain SNR Estimator

  • Park, Hyung Woo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.962-977
    • /
    • 2019
  • The human voice is a convenient method of information transfer between different objects such as between men, men and machine, between machines. The development of information and communication technology, the voice has been able to transfer farther than before. The way to communicate, it is to convert the voice to another form, transmit it, and then reconvert it back to sound. In such a communication process, a vocoder is a method of converting and re-converting a voice and sound. The CELP (Code-Excited Linear Prediction) type vocoder, one of the voice codecs, is adapted as a standard codec since it provides high quality sound even though its transmission speed is relatively low. The EVRC (Enhanced Variable Rate CODEC) and QCELP (Qualcomm Code-Excited Linear Prediction), variable bit rate vocoders, are used for mobile phones in 3G environment. For the real-time implementation of a vocoder, the reduction of sound quality is a typical problem. To improve the sound quality, that is important to know the size and shape of noise. In the existing sound quality improvement method, the voice activated is detected or used, or statistical methods are used by the large mount of data. However, there is a disadvantage in that no noise can be detected, when there is a continuous signal or when a change in noise is large.This paper focused on finding a better way to decrease the reduction of sound quality in lower bit transmission environments. Based on simulation results, this study proposed a preprocessor application that estimates the SNR (Signal to Noise Ratio) using the spectral SNR estimation method. The SNR estimation method adopted the IMBE (Improved Multi-Band Excitation) instead of using the SNR, which is a continuous speech signal. Finally, this application improves the quality of the vocoder by enhancing sound quality adaptively.

FDBM의 음원분리 성능평가 (Evaluation of a signal segregation by FDBM)

  • 이채봉
    • 한국전자통신학회논문지
    • /
    • 제8권12호
    • /
    • pp.1793-1802
    • /
    • 2013
  • 음원분리 방법으로는 여러 가지가 제안되고 있으나 그 중에서도 주파수영역 두 귀 모델(Frequency Domain Binaural Model : FDBM)은 저 연산량과 울림 제거에 효과적이다. FDBM에 의한 두 귀 보청 시스템은 SNR이나 기여도 함수(Coherence function)에 의한 평가로 하기 때문에 인간의 청취특성을 고려하지 않고 있다. 본 논문에서는 음질의 문제 해결을 위하여 FDBM의 음원분리 성능평가를 하였다. SNR, 기여도 함수, PESQ의 세 가지 수법을 이용하여 기본 특성에 대하여 시뮬레이션을 통하여 확인하였다. 모든 결과가 FDBM에 의해 좌우 채널간 평가치의 차가 작게 되었고, 좌우 채널이 거의 같은 레벨까지 개선되었음을 확인하였다. 그리고 음원방향을 바꾸고 음원 수를 증가시킨 경우에도 일정한 개선이 보였다. SNR과 기여도 함수, PESQ의 결과를 비교하면 PESQ의 평가에서는 입력 SNR를 변동시킨 경우에도 거의 모든 조건에서 분리에 의한 평가가 개선되었다.

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

  • 안성만;정여진;이재준;양지헌
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.71-88
    • /
    • 2017
  • 언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.

Maxwell 3D를 이용한 경두개 자기 전극 시뮬레이션에 관한 연구 (A Study on Transcranial Magnetic Electrode Simulation Using Maxwell 3D)

  • 이근용;윤세진;정진형;김준태;이상식
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권6호
    • /
    • pp.657-665
    • /
    • 2019
  • 본 연구는 전 세계적으로 문제가 대두되고 있는 고령화 사회로 인한 신경성 퇴행 질환인 치매 및 근육통증 치료방법인 경두개 자기 전극에 관한 연구를 진행하였다. 특히 경두개 자기 전극은 두부 표피에 코일을 이용하여 뇌 심층으로 자기를 출력하여 언어능력, 인지능력, 기억력 등의 치매 증상에 의해 저하되는 능력을 향상시키기 위해 연구가 진행되고 있다. 본 연구에서는 경두개 자기 전극의 핵심인 코일의 설계를 위하여 Maxwell 3D 프로그램을 통한 시뮬레이션을 진행하였다. 선행 연구로 설계된 코일과 연구 개발을 통한 코일의 시뮬레이션 비교를 한 결과 출력의 경우 기존의 설계된 코일 보다 출력 면에서 뛰어난 것을 확인할 수 있었다. B-Field, H-Field 두 개의 코일 출력의 그래프는 대칭을 이루는 것을 확인하였으나, 각 코일간의 대칭은 유사 대칭으로 정확한 대칭을 이루지 않는 것으로 확인이 되었다. 이러한 결과를 바탕으로 양 코일을 통한 두부 표피의 출력이 가능한지에 관한 확인을 위해 실험을 진행하였다. 역순방향 2-코일의 분석의 자기장의 경우 최대 출력은 3.3920e+004 H[A_per_meter]로 나타났으며 벡터장의 경우 35도에서 165도 부근에서의 자기장이 가장강한 것으로 나타났지만, 양 방향의 자기 출력으로 인하여 자기 출력이 상쇄가 되는 것을 확인하였다. 순방향 2-코일의 경우 역방향 코일과 비슷한 최대 3.2348e+004H[A_per_meter] 나타났으나 vector field의 경우 순방향 출력 및 두부 표피 출력에 관한 자기 출력이 확인이 되었다. 다만, 출력 코일에서 높이의 변화를 하였을 때, 자기 출력이 줄어드는 것을 확인할 수 있었다.