• 제목/요약/키워드: Sound spectrogram

검색결과 69건 처리시간 0.028초

흉부음 데이터를 이용한 천식 질환 판별 (Classification of Asthma Disease Using Thoracic Data)

  • 문인섭;최형기;이철희;박기영;김종교
    • 대한음성학회지:말소리
    • /
    • 제49호
    • /
    • pp.135-144
    • /
    • 2004
  • In this paper, we make a study of classification normal from abnormal - normal, asthma through analysis of thoracic sound to take use thoracic sound detection system. Thoracic sound detection system has a function to store thoracic sound and analyze the data. The wave shape of thoracic sound is similar to noise and is systematically generated by inhalation and exhalation breathing, therefore, in this paper, to classify asthma sound in thoracic sound, we could discriminate between normal and abnormal case using level crossing rate(LCR) and spectrogram energy rate.

  • PDF

기침 소리의 다양한 변환을 통한 코로나19 진단 모델 (A COVID-19 Diagnosis Model based on Various Transformations of Cough Sounds)

  • 김민경;김건우;최근호
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.57-78
    • /
    • 2023
  • 2019년 11월 중국 우한시에서 발병한 코로나19는 2020년 중국을 넘어 세계로 퍼져나가 2020년 3월에는 전 세계적으로 확산되었다. 코로나19와 같이 전염성이 강한 바이러스는 예방과 확진시 적극적인 치료도 중요하지만 우선 전파 속도가 빠른 바이러스인 점을 감안할 때, 확진 사실을 재빠르게 파악하여 전파를 차단하는 것이 더욱 중요하다. 그러나 감염여부를 확인하기 위한 PCR검사는 비용과 시간이 많이 소요되고, 자가키트검사 또한 접근성은 쉽지만 매번 수시로 받기에는 키트의 가격이 부담이 될 수밖에 없는 실정이다. 이러한 상황에서 기침 소리를 기반으로 코로나19 양성 여부를 판단할 수 있게 된다면 누구나 쉽게 언제, 어디서든 확진 여부를 체크할 수 있어 신속성과 경제성 측면에서 큰 장점을 가질 수 있을 것이다. 따라서 본 연구는 기침 소리를 기반으로 코로나19 확진 여부를 식별할 수 있는 분류 모델을 개발하는 것을 목적으로 하였다. 이를 위해, 본 연구에서는 먼저 MFCC, Mel-Spectrogram, Spectral contrast, Spectrogram 등을 통해 기침 소리를 벡터화 하였다. 이 때, 기침 소리의 품질을 위해 SNR을 통해 잡음이 많은 데이터는 삭제하였고, chunk를 통해 음성 파일에서 기침 소리만 추출하였다. 이후, 추출된 기침 소리의 feature를 이용하여 코로나 양성과 음성을 분류하기 위한 모델을 구축하였으며, XGBoost, LightGBM, FCNN 알고리즘을 통해 모델 학습을 수행하고 각 알고리즘별 성능을 비교하였다. 또한, 기침 소리를 다차원 벡터로 변환한 경우와, 이미지로 변환한 경우에 대해 모델 성능에 대한 비교 실험을 수행하였다. 실험 결과, 건강상태에 대한 기본정보와 기침 소리를 MFCC, Mel-Spectogram, Spectral contrast, 그리고 Spectrogram을 통해 다차원 벡터로 변환한 feature를 모두 활용한 LightGBM 모델이 0.74의 가장 높은 정확도를 보였다.

말소리장애 아동의 말명료도와 음향학적 측정치 간 상관관계 (The Correlation between Speech Intelligibility and Acoustic Measurements in Children with Speech Sound Disorders)

  • 강은영
    • 대한통합의학회지
    • /
    • 제6권4호
    • /
    • pp.191-206
    • /
    • 2018
  • Purpose : This study investigated the correlation between speech intelligibility and acoustic measurements of speech sounds produced by the children with speech sound disorders and children without any diagnosed speech sound disorder. Methods : A total of 60 children with and without speech sound disorders were the subjects of this study. Speech samples were obtained by having the subjects? speak meaningful words. Acoustic measurements were analyzed on a spectrogram using the Multi-speech 3700 program. Speech intelligibility was determined according to a listener's perceptual judgment. Results : Children with speech sound disorders had significantly lower speech intelligibility than those without speech sound disorders. The intensity of the vowel /u/, the duration of the vowel /${\omega}$/, and the second formant of the vowel /${\omega}$/ were significantly different between both groups. There was no difference in voice onset time between the groups. There was a correlation between acoustic measurements and speech intelligibility. Conclusion : The results of this study showed that the speech intelligibility of children with speech sound disorders was affected by intensity, word duration, and formant frequency. It is necessary to complement clinical setting results using acoustic measurements in addition to evaluation of speech intelligibility.

주파수 해석기와 M-mode 영상을 갖는 펄스 도플러 장치의 개발에 관한 연구 (A Study on the Pulse Doppler System with M-mode Image and Spectrum Analyzer)

  • 정택섭;박세현;김영길
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1217-1220
    • /
    • 1987
  • We have developed a Ultra Sound Pulsed Doppler System with two-dimensional M-mode image and Spectrum analyzer. The image of the M-mode is composed of time and depth axes. The Spectrum analyzer shows the spectrum of Doppler signal which represents the velocity component of time dependent blood-flow behavior. The spectrogram using Spectrum analyzer is composed of frequency and amplitude axes. The outputs of the system are audio signals, velocity curves, velocity profiles, M-mode images and spectrogram.

  • PDF

한시의 평측법에 대한 음향음성학적 연구 (An Acoustic Study of Pitch Rules of Chinese Poetry)

  • 조성문
    • 음성과학
    • /
    • 제14권3호
    • /
    • pp.59-76
    • /
    • 2007
  • The purpose of this study is to investigate the pitch rules of Chinese poetry. Pitch rules are concerned with the high tone and the low tone. Because Chinese poetry is a fixed form of verse, it must keep pitch rules to compose Chinese poetry. But until now there has been no acoustic study of pitch rules of Chinese poetry. So, for the first time the present study investigates pitch rules of Chinese poetry acoustically. Pitch contours were analyzed from the sound spectrogram made by Praat. Results showed that actual pitch patterns did not coincide with theoretical pitch rules in reciting Chinese poetry. Therefore, in studying Chinese classics, the Chinese poetry, which has traditionally been considered to be recited according to original Chinese pitch rules, must now be considered in terms of how pitch rules may have changed over time in Korea since it was first introduce to Korean scholars.

  • PDF

Early Fusion을 적용한 위급상황 음향 분류 (Emergency Sound Classification with Early Fusion)

  • 양진환;김성식;최혁순;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1213-1214
    • /
    • 2023
  • 현재 국내외 CCTV 구축량 증가로 사생활 침해와 높은 설치 비용등이 문제점으로 제기되고 있다. 따라서 본 연구는 Early Fusion을 적용한 위급상황 음향 분류 모델을 제안한다. 음향 데이터에 STFT(Short Time Fourier Transform), Spectrogram, Mel-Spectrogram을 적용해 특징 벡터를 추출하고 3차원으로 Early Fusion하여 ResNet, DenseNet, EfficientNetV2으로 학습한다. 실험 결과 Early Fusion 방법이 가장 좋은 결과를 보였고 DenseNet, EfficientNetV2가 Accuracy, F1-Score 모두 0.972의 성능을 보였다.

주의집중 기반의 합성곱 양방향 게이트 순환 유닛을 이용한 코골이 소리 검출 방식 (Snoring sound detection method using attention-based convolutional bidirectional gated recurrent unit)

  • 김민수;이기용;김형국
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.155-160
    • /
    • 2021
  • 본 논문은 수면 무호흡 환자의 중요한 증상 중의 하나인 코골이 사운드 자동 검출 방식을 제안한다. 제안된 방식에서는 수면 중 발생하는 소리 신호를 입력받아 소리 발생 구간을 검출하고, 검출된 소리 구간으로부터 변환된 스펙트로그램을 주의집중 기반의 합성곱 양방향 게이트 순환 유닛 기반의 분류기에 적용하였다. 적용된 주의집중 메커니즘은 합성곱 양방향 게이트 순환 유닛 모델을 확장하여 코골이 소리에 대한 차별적 특징 표현을 학습함으로써 코골이 검출 성능을 향상시켰다. 실험 결과는 제안하는 코골이 검출 방식이 기존 방식보다 약 3.1 % ~ 5.5 %의 정확도 향상을 보여준다.

예방진단기술을 이용한 지능형 GIS 감시시스템에 관한 연구 (A Study on a Intelligent GIS Monitoring System using the Preventive Diagnostic Technology)

  • 박기영;이종하;조숙진;최형기;정의붕
    • 전자공학회논문지
    • /
    • 제51권6호
    • /
    • pp.244-251
    • /
    • 2014
  • 본 논문에서, 가스절연개폐장치(GIS)의 정상상태와 비정상상태에 대해 예방진단기술을 이용하여 자세하게 서술하였다. 이 기술은 지능형 GIS 감시시스템에 의해 저장된 GIS의 데이터의 분석과 진단에 근거한다. GIS음의 파형은 방전과 자체내의 코로나 방전음에 의해 발생되는 것으로 잡음과 비슷하다. 그러므로, 본 논문에서, GIS음의 정상 상태와 비정상 상태로 분류하는데, 정상과 비정상 상태를 레벨교차율(LCR)과 스펙트로그램 에너지비율로 이용하여 구분하였다.

Hierarchical Flow-Based Anomaly Detection Model for Motor Gearbox Defect Detection

  • Younghwa Lee;Il-Sik Chang;Suseong Oh;Youngjin Nam;Youngteuk Chae;Geonyoung Choi;Gooman Park
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권6호
    • /
    • pp.1516-1529
    • /
    • 2023
  • In this paper, a motor gearbox fault-detection system based on a hierarchical flow-based model is proposed. The proposed system is used for the anomaly detection of a motion sound-based actuator module. The proposed flow-based model, which is a generative model, learns by directly modeling a data distribution function. As the objective function is the maximum likelihood value of the input data, the training is stable and simple to use for anomaly detection. The operation sound of a car's side-view mirror motor is converted into a Mel-spectrogram image, consisting of a folding signal and an unfolding signal, and used as training data in this experiment. The proposed system is composed of an encoder and a decoder. The data extracted from the layer of the pretrained feature extractor are used as the decoder input data in the encoder. This information is used in the decoder by performing an interlayer cross-scale convolution operation. The experimental results indicate that the context information of various dimensions extracted from the interlayer hierarchical data improves the defect detection accuracy. This paper is notable because it uses acoustic data and a normalizing flow model to detect outliers based on the features of experimental data.

The Electropalatographic Evidence of the Korean Flap: An Intervocalic Korean Liquid Sound

  • Ahn, Soo-Woong
    • 음성과학
    • /
    • 제9권3호
    • /
    • pp.155-168
    • /
    • 2002
  • The intervocalic Korean liquid sound has been recognized as a flap in the studies of the Korean language. But there has been very little experimental data corroborating it. The electropalatographic (EPG) experiment was conducted to test this. The subjects were one Korean speaker and one native English speaker who had a pseudopalate and did the EPG experiment at the UCLA phonetics laboratory. The spectrographic evidence of the flaps in both the English t-flap and the Korean liquid flap was also sought. The English and Korean flaps were between mid/low back vowels so that the vowels themselves would not affect palatal contacts of the tongue. The results confirmed that the Korean liquid is realized as a flap in intervocallical position with many similar properties to English flap in both EPG and spectrographic data. The Korean initial liquid sound in borrowed words such as 'rotary' and 'radio' was also a flap. But the Korean liquid in the word-final and geminate positions was a lateral as in words 'dol ' (stone), 'dollo' (with stone), 'nal' (day) and 'nallara' (carry). The intuitive theory of the Korean liquid flap was proved by the EPG and spectrographic data.

  • PDF