• Title/Summary/Keyword: 소리 분류

Search Result 172, Processing Time 0.03 seconds

A Study on the Extraction of Specific Audio Feature In Basketball Video (농구 비디오에서 특정 음성 특징 추출에 관한 연구)

  • 공현장;김원필;김판구
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05d
    • /
    • pp.1075-1080
    • /
    • 2002
  • 최근 멀티미디어 정보 시스템에서의 음성 핀 시각적 내용의 분류에 관한 연구가 활발히 진행되고 있다. 이에 본 논문에서는 농구 경기의 비디오 데이터로부터 특정 음성 정보를 추출하는 방법과 이를 농구 게임의 중요 이벤트 검출에 이용하는 방법을 제안한다. MFCC 특징들과 LPC 엔트로피의 조합을 이용하여 검출된 관중들의 환호 소리로부터 중요한 이벤트의 위치를 예측할 수 있다. 농구 경기의 다양한 소리들 중에서 관중들의 환호 소리를 분류하여 이를 농구 비디오 데이터에서 중요한 이벤트들을 검출하는데 사용함으로써 매우 효과적 결과를 얻을 수 있었다.

  • PDF

Design of Intellignet Wearable Device for the Hearing-impaired (청각장애인용 지능형 웨어러블 디바이스 설계)

  • Lee, Se-Hoon;Lee, Jong-hyeon;Sim, Gun-woo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.15-16
    • /
    • 2019
  • 본 논문은 청각 장애인들이 듣지 못하는 위험한 상황에 대해 목걸이 형태의 웨어러블 기기를 통해 소리를 감지 및 분류하고 알림을 주는 시스템을 구현하였다. 구현한 시스템은 소리를 감지 및 녹음하고 녹음 된 소리의 종류를 분류하여 소리의 정보를 진동과 함께 시각적으로 사용자에게 보여주어 위험한 상황을 대비할 수 있는 웨어러블 시스템이다.

  • PDF

Convolutional neural network based traffic sound classification robust to environmental noise (합성곱 신경망 기반 환경잡음에 강인한 교통 소음 분류 모델)

  • Lee, Jaejun;Kim, Wansoo;Lee, Kyogu
    • The Journal of the Acoustical Society of Korea
    • /
    • v.37 no.6
    • /
    • pp.469-474
    • /
    • 2018
  • As urban population increases, research on urban environmental noise is getting more attention. In this study, we classify the abnormal noise occurring in traffic situation by using a deep learning algorithm which shows high performance in recent environmental noise classification studies. Specifically, we classify the four classes of tire skidding sounds, car crash sounds, car horn sounds, and normal sounds using convolutional neural networks. In addition, we add three environmental noises, including rain, wind and crowd noises, to our training data so that the classification model is more robust in real traffic situation with environmental noises. Experimental results show that the proposed traffic sound classification model achieves better performance than the existing algorithms, particularly under harsh conditions with environmental noises.

Anomaly Classification of Railway Point Machine Using Sound Information and DNN (소리정보와 DNN을 이용한 선로전환기의 비정상 상황 분류)

  • Noh, Byeongjoon;Lee, Jonguk;Park, Daihee;Chung, Yonghwa;Kim, Heeyoung;Yoon, SukHan
    • Annual Conference of KIPS
    • /
    • 2016.10a
    • /
    • pp.611-614
    • /
    • 2016
  • 최근 철도 산업의 비중이 증가함에 따라 열차의 안정적인 주행이 그 어느 때보다 중요한 이슈로 부각되고있다. 특히, 열차의 진로 변경을 위한 핵심 요소인 선로전환기의 결함은 열차의 사고와 직결되는 장비 중 하나로써, 그 이상 여부를 사전에 인지하여 선로전환기의 안정성을 확보하기 위한 유지보수의 지능화 시스템이 필요하다. 본 논문에서는 선로전환기의 작동 시 발생하는 소리정보를 활용하여 선로전환기의 비정상 상황을 분류하는 시스템을 제안한다. 제안하는 시스템은 먼저, 선로전환기의 상황별 소리를 수집하고, 다양한 소리정보를 추출하여 특징 벡터를 생성한다. 다음으로, 딥러닝 모델 중 하나인 DNN(Deep Neural Network)을 이용하여 선로전환기의 비정상 상황을 분류한다. 실제 선로전환기의 전환 시 발생하는 소리 데이터를 기반으로 DNN의 파라미터에 따른 다양한 실험을 수행한 결과, 약 93.10%의 정확도를 갖는 안정적인 DNN 모델을 설계하였다.

Noise Robust System for Pig Wasting Diseases Detection (잡음에 강인한 돼지 호흡기 질병 탐지 시스템)

  • Choi, Yongju;Choi, Yoona;Park, Daihee;Chung, Yongwha
    • Annual Conference of KIPS
    • /
    • 2017.11a
    • /
    • pp.720-723
    • /
    • 2017
  • 돼지 호흡기 질병은 돈사에 막대한 경제적 손실을 초래하는 질병들 중 하나이다. 본 논문에서는 저비용으로도 구축이 가능한 소리 센서 기반의 돼지 호흡기 질병 탐지 시스템을 제안하며, 특히 잡음 환경에서도 강인한 시스템의 구성에 초점을 두었다. 제안하는 시스템은 먼저, 돈사 내의 소리 센서로부터 취득한 돼지 소리를 2차원 회색조 이미지로 변환한다. 이후, 잡음에 강인한 성능을 보이는 Dominant Neighborhood Structure(DNS) 알고리즘을 이용하여 질감정보를 추출한다. 마지막으로, 이미지 분류에서 그 성능이 이미 입증된 딥러닝의 대표적 모델인 Convolutional Neural Network(CNN)에 사용하여 돼지 호흡기 질병을 탐지 및 분류한다. 실제 국내 돈사에서 취득한 돼지 소리를 이용하여 제안하는 시스템의 성능을 실험적으로 검증한 바 96%가 넘는 안정적인 시스템임을 확인하였다.

Classification of infant cries using 3D feature vectors (3D 특징 벡터를 이용한 영아 울음소리 분류)

  • Park, JeongHyeon;Kim, MinSeo;Choi, HyukSoon;Moon, Nammee
    • Annual Conference of KIPS
    • /
    • 2022.11a
    • /
    • pp.597-599
    • /
    • 2022
  • 영아는 울음이라는 비언어적 의사 소통 방식을 사용하여 모든 욕구를 표현한다. 하지만 영아의 울음소리를 파악하는 것에는 어려움이 따른다. 영아의 울음소리를 해석하기 위해 많은 연구가 진행되었다. 이에 본 논문에서는 3D 특징 벡터를 이용한 영아의 울음소리 분류를 제안한다. Donate-a-corpus-cry 데이터 세트는 복통, 트림, 불편, 배고픔, 피곤으로 총 5 개의 클래스로 분류된 데이터를 사용한다. 데이터들은 원래 속도의 90%와 110%로 수정하는 방법인 템포조절을 통해 증강한다. Spectrogram, Mel-Spectrogram, MFCC 로 특징 벡터화를 시켜준 후, 각각의 2 차원 특징벡터를 묶어 3차원 특징벡터로 구성한다. 이후 3 차원 특징 벡터를 ResNet 과 EfficientNet 모델로 학습을 진행한다. 그 결과 2 차원 특징 벡터는 0.89(F1) 3 차원 특징 벡터의 경우 0.98(F1)으로 0.09 의 성능 향상을 보여주었다.

Survey on the Mean Opinion Scores on the Sound Level of Mobile Phone Ring Tones (이동전화 벨소리 소음에 대한 호감도 조사)

  • 유성모;박승근
    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.6
    • /
    • pp.23-27
    • /
    • 2000
  • Noise can be defined as any undesired or loud sound. The sound level of mobile phone ring tones could be considered as noise if it is too loud on a specific situation. To classify a specific sound level of mobile phone ring tones as noise, it is useful to evaluate the mean opinion scores(MOS) on sound levels under some specific situations. The paper evaluates MOS on various sound levels (in dBA) of mobile phone ring tones, types of ring tone(bell/melody), and gender(male/female), location (street/office).

  • PDF

Automatic Tag Classification from Sound Data for Graph-Based Music Recommendation (그래프 기반 음악 추천을 위한 소리 데이터를 통한 태그 자동 분류)

  • Kim, Taejin;Kim, Heechan;Lee, Soowon
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.10 no.10
    • /
    • pp.399-406
    • /
    • 2021
  • With the steady growth of the content industry, the need for research that automatically recommending content suitable for individual tastes is increasing. In order to improve the accuracy of automatic content recommendation, it is needed to fuse existing recommendation techniques using users' preference history for contents along with recommendation techniques using content metadata or features extracted from the content itself. In this work, we propose a new graph-based music recommendation method which learns an LSTM-based classification model to automatically extract appropriate tagging words from sound data and apply the extracted tagging words together with the users' preferred music lists and music metadata to graph-based music recommendation. Experimental results show that the proposed method outperforms existing recommendation methods in terms of the recommendation accuracy.

Structure and Variability of the Isolation Calls of Juvenile Oriental Discoloured Bats (Vespenilio superans) from Korea (안주애기 박쥐 (Vespenilio superans) 새끼의 Isolation Call의 구조와 변화)

  • 서병희;박시룡
    • The Korean Journal of Zoology
    • /
    • v.35 no.2
    • /
    • pp.226-230
    • /
    • 1992
  • 5마리의 안주애기박쥐(Vespenilio superons) 새끼들의 Isolation call에 대해 연구를 하였다. 이들의 소리는 각각의 unit(2-9)로 구성되어 있으며 연결음을 내고 있다. 배음의 unit가운데 기본음의 주파수 범위는 5-23 kHz에 놓여 있다. 주파수 변조 패턴에 따라 대개의 unit들은 2타임으로 분류되나, 개체적 변이가 발견되었다. 새끼들의 소리는 개체마다 특징적으로 나타났다. (unit 수/call, 사용된 unit 유형, 주파수 범위 ); 이들의 전형적인 유형은 발달 과정을 통해 고유한 소리로 나타났다.

  • PDF

Stress Detection of Railway Point Machine using Sound Analysis (소리 정보를 이용한 선로전환기의 스트레스 탐지)

  • Choi, Yongju;Lee, Jonguk;Park, Daihee;Lee, Jonghyun;Chung, Yongwha;Kim, Heeyoung;Yoon, Sukhan
    • Annual Conference of KIPS
    • /
    • 2016.04a
    • /
    • pp.620-623
    • /
    • 2016
  • 열차의 진로를 제어하는 선로전환기는 열차의 안정적인 주행에 있어서 매우 중요한 시설이다. 본 논문에서는 선로전환기의 작동 시 발생하는 소리 정보를 이용하여 선로전환기의 스트레스를 탐지하는 시스템을 제안한다. 먼저 제안하는 시스템은 선로전환기에 스트레스가 쌓인 상태의 소리 정보와 스트레스가 제거된 소리 정보를 수집한 후, 다양한 소리특징들을 추출한다. 추출된 특징들로 부터 t-test를 이용하여 유의성이 확보된 소리 특징 파마미터만을 최종 특징벡터로 선택한다. 마지막으로, 소리 특징 벡터를 입력으로 하는 이진 분류기인 SVM(Support Vector Machine)을 이용하여, 선로전환기의 스트레스 상태 여부를 실시간으로 탐지한다. 실제 테스트용 선로전환기에서 취득한 소리 정보 데이터 셋을 이용하여 본 논문에서 제안하는 시스템의 성능을 실험적으로 검증한다.