• Title/Summary/Keyword: 소리 데이터

Search Result 184, Processing Time 0.033 seconds

Efficient Foam Sound Generation with Screened Clustering Based Sound Synthesis (스크린드 군집화 기반의 사운드 합성을 이용한 효율적인 거품 사운드 생성)

  • Shin, YoungChan;Kim, Jong-Hyun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.553-556
    • /
    • 2022
  • 본 논문에서는 거품 입자를 활용하여 시뮬레이션 장면에 맞는 소리를 효율적으로 합성할 수 있는 기법을 제안한다. 물리 기반 시뮬레이션 환경에서 소리를 표현하는 대표적인 방법은 생성과 합성이다. 사운드 생성의 경우 시뮬레이션 장면마다 물리 기반 접근법을 사용하여 소리를 생성할 수 있는데 계산 시간과 재질 표현의 어려움으로 다양한 시뮬레이션 장면에 대한 소리를 만들어 내기에는 쉽지 않다. 사운드 합성의 경우 소리 데이터를 미리 구축해야 하는 사전 준비가 필요하지만, 한 번 구축하면 비슷한 장면에서는 같은 소리 데이터를 활용할 수 있는 점이 있다. 따라서 본 논문에서는 거품 시뮬레이션의 소리 합성을 위해 소리 데이터를 구축하고 거품 입자의 효율적인 군집화를 통해 계산 시간을 줄이면서 소리의 사실감은 개선할 수 있는 사운드 합성 기법을 제안한다.

  • PDF

A study on data augmentation methods for sound data classification (소리 데이터 분류에 대한 데이터 증대 방법 연구)

  • Chang, Il-Sik;Park, Goo-man
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.1308-1310
    • /
    • 2022
  • 소리 데이터 분류는 단순 소리를 통한 분류, 감정 인식등 다양한 연구가 진행중이다. 심층 신경망에서 데이터의 부족과 과적합 문제를 개선하는 방법으로 데이터 증강은 중요하다. 본 논문에서는 3가지의 소리데이터(UrbanSound8K, RAVDESS, IRMAS)를 사용하였으며, 소리데이터는 멜 스펙트로그램을 통한 변환과정을 거쳐 네트워크 망에 입력된다. 입력된 신호는 다양한 네크워크 신경망(Bidirection LSTM, Bidirection LSTM Attention, Multi-Head Attention, CNN)을 통해 학습되어지며, 각각의 네트워크 신경망에서 데이터 증강 전후의 분류 정확도를 확인 하였다. 다양한 데이터셋과 다양한 네트워크 망에서의 데이터 증강 방법의 결과 비교를 통한 통찰을 얻을수 있을 것이다.

  • PDF

Multichannel surround audio format using 3D sound technology with sound objects (소리객체에 입체음향 기술을 적용시킨 멀티 채널 오디오 형식)

  • Kang, Myung-Soo;Kim, Kyoo-Nyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.213-216
    • /
    • 2002
  • 멀티 채널 오디오 시스템 및 입체음향 기술이 대중화 되면서 오디오 데이터의 저장 및 재생 방법에 있어서 실감 현장 음향을 고려하는 것이 일반화되었다. 이 논문에서는 구조화 오디오 데이터 형식 [1]을 이용해 불필요한 데이터 공간을 제거하고, 거기에 입체 음향 기술을 적용시켜 효과적인 오디오 데이터 처리 방법을 제시하고자 한다. 우리는 구조화 오디오 데이터 형식을 개념적으로 명백히 하기 위해 재사용 가능한 "소리 객체"를 사용하였다. 소리 객체는 오디오 데이터를 처리하기위한 녹음된 소리 샘플의 기본 단위로서 소리객체에 3D 위치 속성이나, 필터 속성을 지정해 소리를 변화 시킬 수 있다.

  • PDF

A Study on Elemental Technology Identification of Sound Data for Audio Forensics (오디오 포렌식을 위한 소리 데이터의 요소 기술 식별 연구)

  • Hyejin Ryu;Ah-hyun Park;Sungkyun Jung;Doowon Jeong
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.34 no.1
    • /
    • pp.115-127
    • /
    • 2024
  • The recent increase in digital audio media has greatly expanded the size and diversity of sound data, which has increased the importance of sound data analysis in the digital forensics process. However, the lack of standardized procedures and guidelines for sound data analysis has caused problems with the consistency and reliability of analysis results. The digital environment includes a wide variety of audio formats and recording conditions, but current audio forensic methodologies do not adequately reflect this diversity. Therefore, this study identifies Life-Cycle-based sound data elemental technologies and provides overall guidelines for sound data analysis so that effective analysis can be performed in all situations. Furthermore, the identified elemental technologies were analyzed for use in the development of digital forensic techniques for sound data. To demonstrate the effectiveness of the life-cycle-based sound data elemental technology identification system presented in this study, a case study on the process of developing an emergency retrieval technology based on sound data is presented. Through this case study, we confirmed that the elemental technologies identified based on the Life-Cycle in the process of developing digital forensic technology for sound data ensure the quality and consistency of data analysis and enable efficient sound data analysis.

Development of Open Platform for collecting and classifying animal sounds (동물 소리 수집 및 분류를 위한 오픈 플랫폼 개발)

  • Jung, Seungwon;Kim, Chung-Il;Moon, Jihoon;Hwang, Eenjun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.839-841
    • /
    • 2018
  • 인공지능 기술을 활용하여 동물 소리를 분석하고 그 종을 구별하는 기술은 지역의 야생동물 현황 파악이나 생태계 조사 등에 효과적으로 사용될 수 있다. 인공지능 기술을 활용하기 위해서는 많은 동물 소리 샘플이 필요하지만, 현재 그러한 데이터는 녹음 환경이 고도화되어 있는 상용 DB나 전문가 DB 형태로 존재한다. 이러한 데이터만을 학습한 인공지능의 경우 실제 환경에서 녹음된 동물 소리를 식별하는 데 많은 어려움이 예상된다. 따라서 본 논문에서는 다양한 동물 소리를 수집하기 위해 동물 관련 전문가나 일반 사용자 모두 자유롭게 사용할 수 있는 동물 울음소리 수집과 분류를 위한 오픈 플랫폼을 제안한다. 플랫폼에 업로드된 소리 파일은 인공지능의 학습 데이터로 사용하며, 이 인공지능은 사용자에게 소리 파일을 분석한 결과로 해당 동물종과 그에 대한 다양한 생태정보를 제공하고 부가적으로 지역별 동물 통계 및 소리 파일에서의 소리 구간 추출, 소리 파일 공유 등 다양한 기능을 제공한다.

Sound Enhancement with Generative Adversarial Network under Noise Conditions (잡음 환경에서 Generative Adversarial Network를 이용한 소리 음질 향상)

  • Choi, Yongju;Lee, Jonguk;Wang, Huasang;Park, Daihee;Chung, Yongwha
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.673-676
    • /
    • 2018
  • 4차 산업혁명이 도래하면서 정보 통신 기술 및 융합 기술의 발전에 힘입어 소리 데이터를 이용한 연구가 활발하게 진행되고 있다. 소리 데이터를 이용한 학술적 프로토타입 연구들을 실제 환경에서 운용하기 위해서는 소리 취득 시 발생하는 다양한 잡음 환경에서도 원시 데이터(raw data)에 근접한 정보를 취득할 수 있는 시스템의 강인함이 보장되어야 한다. 본 논문에서는 SEGAN(Speech Enhancement Generative Adversarial Network) 모델을 활용하여, 전처리 및 후처리 과정이 필요 없이 원시 데이터를 대상으로 하는 end-to-end 방식의 소리 음질 향상 시스템을 제안한다. 제안하는 시스템은, 축산업 분야의 돼지 호흡기 질병 소리 데이터를 이용하여 실험하였으며, 여러 가지 잡음 상황(인위적인 잡음, 실제 환경 잡음)에서 소리 음질이 개선됨을 실험적으로 검증하였다.

Cat Emotion Classification System using Cat Meowing (반려묘 울음소리를 이용한 감정 분류 시스템)

  • Chae, Heechan;Lee, Jonguk;Choi, Yoona;Park, Daihee;Chung, Yongwha
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.666-668
    • /
    • 2018
  • 최근 반려동물을 키우는 가구 수의 증가와 함께, 반려묘에 대한 관심도 상당히 증가하고 있다. 특히 반려인은 반려묘와의 원활한 의사소통과 교감을 바라지만 반려묘의 세세한 감정 상태를 24시간 내내 파악하는 것은 어려운 일이다. 본 논문에서는 반려묘의 울음소리에 많은 감정 및 상태 정보가 담겨있는 것에 착안하여, 반려묘의 울음소리를 기반으로 감정을 분류하는 시스템을 제안한다. 제안된 시스템은 먼저, 이미 수집된 소리 데이터를 데이터 증폭 방법론을 이용하여 데이터를 확장 한 후, 해당 소리들의 멜 스펙트로그램 정보를 추출한다. 이를 시계열 정보 처리에 효과적인 LSTM에 적용하여 반려묘의 감정 상황을 식별할 수 있도록 학습을 수행한다. 실험 결과, 반려묘의 감정 상태 분류의 가능성을 확인하였다.

Wild Bird Sound Classification Scheme using Focal Loss and Ensemble Learning (Focal Loss와 앙상블 학습을 이용한 야생조류 소리 분류 기법)

  • Jaeseung Lee;Jehyeok Rew
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.29 no.2
    • /
    • pp.15-25
    • /
    • 2024
  • For effective analysis of animal ecosystems, technology that can automatically identify the current status of animal habitats is crucial. Specifically, animal sound classification, which identifies species based on their sounds, is gaining great attention where video-based discrimination is impractical. Traditional studies have relied on a single deep learning model to classify animal sounds. However, sounds collected in outdoor settings often include substantial background noise, complicating the task for a single model. In addition, data imbalance among species may lead to biased model training. To address these challenges, in this paper, we propose an animal sound classification scheme that combines predictions from multiple models using Focal Loss, which adjusts penalties based on class data volume. Experiments on public datasets have demonstrated that our scheme can improve recall by up to 22.6% compared to an average of single models.

Abnormal Detection of Railway Point-Machine Under Noise Conditions (잡음 환경에서 선로 전환기 이상 상황 탐지)

  • Choi, Yongju;Lee, Jonguk;Park, Daihee;Chung, Yongwha
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.394-397
    • /
    • 2019
  • 센서 및 정보 통신 기술의 발전은 산업 현장에서 취득한 정보를 기반으로 다양한 연구를 수행할 수 있는 토대가 되었다. 본 연구에서는 철도의 진로 방향을 전환하는 선로 전환기 주변에 설치한 소리 센서에서 수집한 소리를 기반으로 선로 전환기의 이상 상황을 탐지하고자 한다. 이와 같은 소리 데이터 기반의 이상 상황 탐지 시스템을 실제 산업 현장에서 성공적으로 운용되기 위해서는 소리 취득 시 발생하는 다양한 잡음 환경에서도 이상 상황을 식별할 수 있는 강인함이 보장되어야 한다. 본 논문에서는 소리 음질을 향상시키기 위하여 SEGAN(Speech Enhancement Generative Adversarial Network)을 활용하며, CNN(Convolutional Neural Network)을 기반으로 선로 전환기의 이상 상황을 식별하는 시스템을 제안한다. 수집된 소리 데이터를 기반으로 제안한 시스템을 실험적으로 검증한 바 잡음에 강인한 성능을 확인하였다.

Novel Sound Energy and Reversal Mapping for Procedural Sound Synthesis in Cloth Simulation (옷감 시뮬레이션의 절차적 사운드 합성을 위한 새로운 사운드의 에너지와 반전 매핑)

  • Kim, Dong-Hui;Moon, Seong-Hyeok;Shin, Young-Chan;Kim, Jong-Hyun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.587-590
    • /
    • 2022
  • 본 논문에서는 물리기반 옷감 시뮬레이션에 적합한 소리를 효율적으로 생성하기 위한 데이터 기반 합성 기법을 제안한다. 시뮬레이션에서 소리를 표현하는 방법은 크게 생성과 합성이 있지만, 합성은 실시간 애플리케이션에서 활용이 가능하기 때문에 인터랙티브한 환경에서 자주 활용되고 있다. 하지만, 데이터에 의존하기 때문에 원하는 장면에 부합하는 사운드를 합성하기는 어려우며, 기존 방법은 한 방향으로만 사운드 데이터를 검색하기 때문에 불연속으로 인한 끊김 현상이 발생한다. 본 논문에서는 양방향 사운드 합성 기법을 제시하며, 이를 통해 불연속적으로 합성되는 사운드 결과를 효율적으로 개선될 수 있음을 보여준다.

  • PDF