• 제목/요약/키워드: Speech signals

검색결과 499건 처리시간 0.027초

자기피드백 마스킹 기법을 사용한 카오스 음성비화통신 (Chaotic Speech Secure Communication Using Self-feedback Masking Techniques)

  • 이익수;여지환
    • 한국지능시스템학회논문지
    • /
    • 제13권6호
    • /
    • pp.698-703
    • /
    • 2003
  • 본 논문에서는 카오스 신호를 이용하여 음성신호의 보안전송을 위한 아날로그 비화통신 시스템을 제안하고 통신성능을 분석하였다. 기존의 카오스 동기화 및 카오스 변조통신 알고리즘을 개선하여 통신환경에서 발생하는 다양한 조건들을 적용하여 음성신호의 복원능력을 모의실험 하였다. 일반적인 PC(Pecora & Carroll) 제어기법과 제안한 SFB(Self-FeedBack) 마스킹 기법을 사용하여 송신단에서 음성신호를 카오스 신호로 마스킹하여 변조하고, 통신채널에 잡음신호를 추가하여 전송하였다. 수신단에서는 카오스 응답시스템을 이용하여 음성신호를 복조하고, 복원성능을 계산하기 위하여 아날로그 복원 에러 신호의 평균전력을 제안하여 계산하였다. 실험결과 마스킹 정도, 파라미터들의 민감성, 채널잡음 등에 대하여 PC 제어기법보다 피드백 제어기법의 복원성능이 우수함을 정량적인 데이터로 확인할 수 있었다. 또한 로렌쯔 카오스 비화통신시스템에 사용할 경우 파라미터들의 조합으로 암호키를 구성해야 하므로 파라미터 변화율에 대응하는 복원에러율의 관계를 모의실험 값으로 구하였다.

A Novel Approach to COVID-19 Diagnosis Based on Mel Spectrogram Features and Artificial Intelligence Techniques

  • Alfaidi, Aseel;Alshahrani, Abdullah;Aljohani, Maha
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.195-207
    • /
    • 2022
  • COVID-19 has remained one of the most serious health crises in recent history, resulting in the tragic loss of lives and significant economic impacts on the entire world. The difficulty of controlling COVID-19 poses a threat to the global health sector. Considering that Artificial Intelligence (AI) has contributed to improving research methods and solving problems facing diverse fields of study, AI algorithms have also proven effective in disease detection and early diagnosis. Specifically, acoustic features offer a promising prospect for the early detection of respiratory diseases. Motivated by these observations, this study conceptualized a speech-based diagnostic model to aid in COVID-19 diagnosis. The proposed methodology uses speech signals from confirmed positive and negative cases of COVID-19 to extract features through the pre-trained Visual Geometry Group (VGG-16) model based on Mel spectrogram images. This is used in addition to the K-means algorithm that determines effective features, followed by a Genetic Algorithm-Support Vector Machine (GA-SVM) classifier to classify cases. The experimental findings indicate the proposed methodology's capability to classify COVID-19 and NOT COVID-19 of varying ages and speaking different languages, as demonstrated in the simulations. The proposed methodology depends on deep features, followed by the dimension reduction technique for features to detect COVID-19. As a result, it produces better and more consistent performance than handcrafted features used in previous studies.

감쇄(damping) 하모닉 크기 파라미터를 이용한 음성의 중첩합산 정현파 합성 방법 (Overlap and Add Sinusoidal Synthesis Method of Speech Signal Lising the Damping Harmonic Magnitude Parameter)

  • 박종배;김영준;이인성
    • 한국통신학회논문지
    • /
    • 제34권3C호
    • /
    • pp.251-256
    • /
    • 2009
  • 본 논문에서는 음성신호의 정현파 합성방법 중 하나인 선형위상을 사용한 중첩합산방법에 대하여 감쇄(Damping) 하모닉 크기 파라미터를 사용하여 합성음성의 연속성을 개선시킨 새로운 방법을 제안한다. 기존의 중첩합산 정현파 합성방법은 프레임의 중간 지점에 대한 정현파 파라미터를 얻기 위해서 가중치로 사용된 정현파 크기값을 과거 프레임과 현재 프레임의 평균값을 사용하였으나 제안하는 방법은 정현파 크기값을 단순히 과거와 현재 프레임에서 평균값이 아닌 원 신호와 합성신호 사이의 상관성을 이용하여 감쇄(Damping)요소를 정의하고 보다 정확한 정현파 크기의 파라미터 값을 추출한 후 합성한다. 이렇게 제안한 합성 방법의 성능을 관찰하기 위해 합성방법의 연속성 평가를 통해 기존의 방법과 비교 평가한다. 제안한 방법의 평균 MSE값이 N/2 중첩길이에서 0.251dB, N/4 중첩길이에서 0.298dB 낮아짐을 볼 수 있다.

점막하 구개열 환자 공명장애의 스펙트럼 특성 연구 (SPECTRAL CHARACTERISTICS OF RESONANCE DISORDERS IN SUBMUCOSAL TYPE CLEFT PALATE PATIENTS)

  • 김현철;임대호;백진아;신효근;김오환;김현기
    • Maxillofacial Plastic and Reconstructive Surgery
    • /
    • 제28권4호
    • /
    • pp.310-319
    • /
    • 2006
  • Submucosal type cleft palate is subdivision of the cleft palate. It is very difficult to find submucosal cleft, because when we exam submucosal type cleft palate patients, it seems to be normal. But in fact, there are abnormal union of palatal muscles of submucosal type cleft palate patients. Because of late detection, the treatment - for example, the operation or the speech therapy - for the submucosal type cleft palate patient usually becomes late. Some patients visited our hospital due to speech disorder nevertheless normal intraoral appearance. After precise intraoral examination, we found out submucosal cleft palate. We evaluated the speech before and after surgery of these patients. In this study, we want to find the objective characteristics of submucosal type cleft palate patients, comparing with the normal and the complete cleft palate patients. Experimental groups were 10 submucosal type cleft palate patients and 10 complete cleft palate patients who got the operation in our hospital. And, the controls were 10 normal person. The sentence patterns using in this study were simple 5 vowels. Using CSL program we evaluated the Formant, Bandwidth. We analized the spectral characteristics of speech signals of 3 groups, before and after the operation. In most cases, the formant scores were higher in experimental groups (complete cleft palate group and submucosal type cleft palate group) than controls. There were small differences when speeching /a/, /i/, /e/ between experimental groups and control groups, large differences when speeching /o/, /u/. After surgery the formant scores were decreased in experimental groups (complete cleft palate group and submucosal type cleft palate group). In bandwidth scores, there were no significant differences between experimental groups and controls.

16kbps 광대역 음성 압축기 개발 (16kbps Windeband Sideband Speech Codec)

  • 박호종;송재종
    • 한국음향학회지
    • /
    • 제21권1호
    • /
    • pp.5-10
    • /
    • 2002
  • 본 논문에서는 7 kHz 대역폭을 가지는 새로운 16 kbps 광대역 음성 압축기를 제안한다. 제안하는 압축기는 QMF (Quadrature Mirror Filter)를 사용하여 입력 신호를 하위 밴드와 상위 밴드로 분리하고, 하위 밴드는 AMR (Adaptive Multi Rate)음성 압축기를 이용하여 압축하고 상위밴드는 G.722.1 광대역 음성 압축기를 기반으로 새로운 압축기를 개발하여 압축한다. 특히 입력신호의 성질에 따라 상위 밴드와 하위 밴드에 할당되는 비트수를 다르게 함으로써 고정적으로 비트를 할당하는 음성 압축기보다 향상된 압축 성능을 제공하고, 웨이블릿 변환을 이용하여 상위 밴드 신호의 압축 성능을 향상시켰다. 주관적 방법으로 제안된 음성 압축기의 성능을 측정하였으며, 다양한 입력신호에 대하여 제안한 16 kbps음성 압축기가 G.722 48 kbps SB-ADPCH보다 우수한 성능을 가지는 것을 할인하였다.

FIR-STREAK 디지털 필터를 사용한 피치추출 방법에 관한 연구 (A Study on Pitch Extraction Method using FIR-STREAK Digital Filter)

  • 이시우
    • 한국정보처리학회논문지
    • /
    • 제6권1호
    • /
    • pp.247-252
    • /
    • 1999
  • 낮은 Bit Rate의 음성부호화 방식을 구현하기 위해 필요한 파라메터로서 피치정보가 있다. 연속음성에서 정규화 된 피치정보를 추출하는 방법에서는 음성의 시작이나 끝부분, 무성음 혹은 무성자음과 유성음이 같이 존재하는 프레임, 프레임 경계부에서 피치추출 오류가 발생한다. 이러한 오류를 억제하기 위하여 본 연구에서는 FIR-STREAK 필터의 출력 잔차신호에서 피치정보를 얻는 개별 피치추출법을 제안하였다. 이 방법은 피치정보를 정규화하지 않고 연속적으로 변위하는 피치간격을 적절하게 나타낼 수 있다. 실험결과, 개별 피치추출법은 음성의 시작이나 끝부분, 무성음 혹은 무성자음과 유성음이 같이 존재하는 프레임, 프레임 경계부에서도 유효한 피치정보를 얻을 수 있음을 알 수 있었다. 이 방법은 음성부호화방식, 음성분석, 음성합성, 음성인식등에 응용할 수 있을 것으로 기대된다.

  • PDF

반향 음성 신호의 하모닉 모델링을 이용한 음질 예측 알고리즘 (Speech Quality Estimation Algorithm using a Harmonic Modeling of Reverberant Signals)

  • 양재모;강홍구
    • 방송공학회논문지
    • /
    • 제18권6호
    • /
    • pp.919-926
    • /
    • 2013
  • 실내 환경에서 음성 신호는 음향 전달 함수에 의한 반향 신호를 포함한다. 이때 반향의 정도나 반향에 의한 음질 변화를 예측하는 것은 반향 제거 알고리즘 등에서 중요한 정보를 제공한다. 본 논문은 음성 신호의 하모닉 모델링 기법을 이용한 반향 환경에서의 자동 음질 예측 기법을 제안하다. 제안한 방법에서는 반향을 포함하는 음성 신호에 대한 하모닉 모델링 기법이 가능함을 보이고, 모델링된 하모닉 성분과 나머지 성분 사이의 통계적인 비율을 예측한다. 예측된 비율은 일반적인 방 환경에서의 음질 측정 표준 파라미터와 비 교하였다. 실험 결과 제안된 방법은 다양한 반향 환경 (반향 시간 0.2~1.0초)에서 표준 음질 파라미터를 정확하게 예측할 수 있음을 증명하였다.

우리말 100단음절의 명료도와 오청상에 관한 연구 (Articulation Scores and Confusion Patterns of the 100 Monosyllable Korean Speech Sounds)

  • 유방환;김홍기;노관택
    • 대한기관식도과학회:학술대회논문집
    • /
    • 대한기관식도과학회 1972년도 춘계종합 학술대회 초록집
    • /
    • pp.1.1-1
    • /
    • 1972
  • 청력검사의 검사자료로는 어음이 가장 적당하지만 검사어음의 선택에는 많은 어려운 문제점이 있어 우리말 어음에 대한 공인된 검사용어표가 아직도 없다. 때문에 저자는 이 표 작성에 필요한 기초자료를 얻기 위해 정상인, 각종향음하에서 정상인 및 난청자에 있어서 각각 그 명료도와 오청상에 관한 연구를 시행하였다. 사용어로는 일상생활에서 사용빈도가 많은 박의 498어음중 100개를 선택하여 정상인에서 60㏈의 어음강도로 검사하였을 경우와, 여러 강도의 white noise와 speech noise를 어음과 동시에 주었을 경우와, 난청자에서 여러 강도의 어언을 주었을 때 반응결과를 검토하여 보았다. 일반적으로 얻은 결과는 명료도가 불량한 감음성난청자를 제외하고는 정상인, 소음하에서 정상인 및 난청자에서의 오청상은 어두자음, 모음, 어미자음 각각 그들 음소의 판별적 자질에 따라 혼동하는 경향이 있었다. 명료도가 불량한 난청에서는 상기 변화규칙에 예외 되는 경우가 많았다. 명료도가 불량한 감음성 난청에서는 상기 변화규칙에 예외 되는 경우가 많았었다. 비교적 강한 소음하에서는 소음의 종류에 따라 같은 강도라도 오청률의 차를 현저히 볼 수 있었다.

  • PDF

전역 음성 부재 확률 기반의 향상된 최소값 제어 재귀평균기법을 이용한 음성 향상 기법 (Speech Enhancement Based on Improved Minima Controlled Recursive Averaging Incorporating GSAP)

  • 송지현;방동혁;이상민
    • 대한전자공학회논문지SP
    • /
    • 제49권1호
    • /
    • pp.104-111
    • /
    • 2012
  • 본 논문에서는 향상된 최소값 제어 재귀 평균 기법 (improved minima controlled recursive averaging, IMCRA) 알고리즘의 잡음 전력 추정성능을 향상 시키기 위한 알고리즘을 제안한다. 기존의 IMCRA은 주파수 특성이 빠르게 변화하는 비정상적인 환경과 낮은 SNR을 갖는 상황에서 잡음 전력 추정에 직접적으로 영향을 미치는 음성 검출기의 성능이 강인하지 못한 단점이 있다. 본 연구에서는 강인한 음성 검출 성능을 위해서 기존 IMCRA의 음성 검출기에 전역 음성 부재 확률을 적용한 음성 향상 기법을 제안한다. 제안된 알고리즘의 성능 평가는 음성의 perceptual evaluation of speech quality (PESQ)와 composite measure를 통한 음질을 평가하였다. 실험 결과 다양한 잡음 환경 (car, white, babble)에서 전역 음성 부재 확률을 적용한 IMCRA의 음성 향상 기법이 향상된 결과를 보여주었다. 특히, 비정상잡음 환경인 babble 5dB에서 PESQ 0.026, composite measure 0.029의 향상된 음질을 나타내었다.

한국어 반음절단위 규칙합성의 개선을 위한 포만트천이의 변경규칙 (An Alteration Rule of Formant Transition for Improvement of Korean Demisyllable Based Synthesis by Rule)

  • 이기영;최창석
    • 한국음향학회지
    • /
    • 제15권4호
    • /
    • pp.98-104
    • /
    • 1996
  • 본 연구에서는 반음절단위 규칙합성에서 연속음성을 합성할 때 조음결합에 의한 천이구간이 없는 반음절의 연결로 접속되어 부자연스러운 합성음이 되는 것을 개선하기 위하여 연쇄모음의 천이구간을 보상하는 방법으로 포만트천이의 변경규칙을 제안하였다. 반음절 단위만으로는 포만트천이가 발생하는 부분을 채울 수 없기 때문에 반음절단위의 음성데이타와 모음의 반음절 단위의 정상부위로부터 세그멘트한 정상모음 42개를 추가하여 데이터베이스를 구축하였으며 포만트를 변경하는 방법으로 포만트합성에서의 공진회로를 이용하였다. 제안한 방법의 타당성을 확인하기 위하여 음성합성시 연쇄모음 부분에 포만트천이의 변경규칙을 적용하여 원음성 및 변경규칙을 적용하지 않은 반음절단위 음성합성방식에 의한 합성음성의 스펙트로그램과 비교하고 MOS 테스트를 실시한 결과 보다 자연스러운 합성음성을 얻을 수 있음을 확인하였다.

  • PDF