• 제목/요약/키워드: sound information

검색결과 1,720건 처리시간 0.033초

선행음 효과를 이용한 최적의 음성피난유도음에 관한 연구 (A Study on the Optimized Announcement Based Evacuation Guidance Using Haas Effect)

  • 백은선;김선우;백건종;신훈;송민정;국찬
    • 한국화재소방학회논문지
    • /
    • 제25권2호
    • /
    • pp.101-106
    • /
    • 2011
  • 본 연구에서는 예기치 않는 화재 등의 재해가 돌발적으로 발생하였을 경우 소리 정보에 의해서 사람들을 적극적으로 올바른 방향으로 피난 유도시키려면 피난자가 유도 정보의 내용을 알아들을 뿐만 아니라 피난 방향도 지각할 수 있는 것이 필요하다. 이에 피난 유도음의 방향을 감지할 수 있는 선행음 효과를 이용하여 각 건물공간에서 선행음과 후속음에 대해서 음압레벨 변화와 지연시간 변화에 따른 청감실험 결과 즉, 최적의 음성 피난유도음을 도출하였다. 각 실내공간에서 최적의 음성 피난 유도음은 다음과 같다. 1) 강의실 공간에서 음성 피난 유도음의 최적의 조건은 선행음보다 후속음이 지연시간을 10ms~50ms 갖는 경우와 선행음과 후속음의 음압레벨 차이가 없거나 선행음이 높은 경우에 선행음 방향에 대하여 양호하게 인지하였다. 2) 복도 공간에서의 최적의 음성 피난 유도음은 선행음보다 후속음이 지연시간 20~60ms인 경우에 선행음에 대하여 양호하게 인지하였다. 3) 체육관에서는 최적의 음성 피난유도음은 선행음보다 후속음이 지연시간 10~40ms인 경우와 선행음이 후속음보다 음압레벨이 크거나 같은 경우에 선행음에 대하여 양호하게 인지하였다.

HSI 히스토그램에 기초한 이미지-사운드 변환 (Conversion of Image into Sound Based on HSI Histogram)

  • 김성일
    • 한국음향학회지
    • /
    • 제30권3호
    • /
    • pp.142-148
    • /
    • 2011
  • 본 연구는 컬러이미지에서 특정 사운드를 연상하는 인간의 공감각적 기능을 모방하는 지능로봇의 개발을 최종 목표로 하고 있으며, 이는 컬러이미지와 사운드의 상호변환에 기초하여 이루어질 수 있다. 최종 목표의 첫 번째 단계로서, 본 연구는 컬러 이미지에서 사운드로의 변환을 이용한 기본 시스템의 구축에 초점을 맞추었다. 본 연구에서는 빛과 소리사이의 물리적 주파수 정보로부터 그 유사성에 기초하여 컬러이미지에서 사운드로 변환하는 방법을 제시한다. 컬러이미지에서 사운드로 변환하는 방법은 RGB-to-HSI 컬러모델 변환을 통한 HSI 히스토그램을 사용하고 Microsoft Visual C++을 이용하여 코딩함으로써 구현되었다. 두 가지 컬러이미지를 사용하여 시뮬레이션 실험을 하였고, 그 결과, 각각의 입력 컬러이미지의 색상(Hue), 채도 (Saturation) 및 명도 (Intensity)를 사운드의 기본주파수 (F0: Fundamental Frequency), 하모닉 (Harmonics) 및 옥타브 (Octave)로 각각 변환한다. 제안된 시스템을 통하여 변환된 사운드 요소들을 Csound를 이용, 합성함으로써 웨이브(wav) 파일 포맷 음원을 최종 생성하였다.

주변 배경음에 강인한 구간 검출을 통한 음원 인식 및 위치 추적 시스템 설계 (Sound recognition and tracking system design using robust sound extraction section)

  • 김우준;김영섭;이광석
    • 한국전자통신학회논문지
    • /
    • 제11권8호
    • /
    • pp.759-766
    • /
    • 2016
  • 본 논문은 비정상 상황 시 발생하는 음원에 대해 주변 환경 음에 강인한 음원 구간을 검출하여, 구간내의 신호를 이용한 음원 인식 과 위치 추적 시스템 설계에 관한 연구이다. 강인한 음원 구간 검출은 수신되는 오디오 신호로부터 단 구간 가중 평균 델타 에너지를 계산하여, 저역 통과 필터에 입력 후, 출력되는 결과 값들의 비교를 통해 배경음에 강인한 구간을 정의 하며, 음원 인식은 검출된 구간 내 데이터로부터 종래의 인식 방법인 HMM(: Hidden Markov Model)을 이용해, 음원 인식 정보를 생성하여 학습 및 인식을 한다. 이는 주변 배경음이 포함된 음원 신호에 대해 기존 신호의 에너지를 이용해 구간을 검출 후, HMM을 통한 인식에 비해 3.94% 상향된 인식률을 보인다. 또한 인식 결과를 바탕으로 구간내의 신호간의 TDOA(: Time Delay of Arrival)를 이용한 위치 파악은 실제 발생 위치와의 각도와 97.44%일치함을 보인다.

지역교차로 교통사고 자동검지시스템 개선을 위한 교차로 제 음향특성의 해석

  • 조을수;고영권;김재이
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.789-792
    • /
    • 2008
  • 현재의 교통사고 검지시스템은 주로 대도시의 혼잡한 교차로의 교통사고를 감지하기 위한 시스템 개발에 초점이 맞추어져 있으며 주로 교차로에서의 영상정보와 디지털 영상처리기술에만 의존하고 있기 때문에 교차로에서의 혼잡한 상황에서는 정확한 판별의 제한이 잔존하고 있다. 이러한 문제점을 보완하기 위하여, 본 논문은 교차로에서의 교통사고 자동검지율의 향상을 위해 검토되어야 할 사고음의 음향특성을 분석함으로써 현재 기술수준과 실현가능성을 가늠해 보는 것을 목적으로 한다. 교차로에서 차량의 사고가 발생할 때, 충돌음의 주파수 대역은 500[Hz] 이하에서 사고가 발생하지 않은 시점보다 높은 30[dB] 이상의 음압차이를 보였다. 또한, 교차로 주변에 차량의 소통이 거의 없을 때 자동차사고 스키드음은 $1[kHz]{\sim}3[kHz}$ 대역에서 특정패턴을 보였다.

  • PDF

음원 데이터를 활용한 3D 애니메이션 카메라 아웃포커싱 표현 연구 (A Study on Sound Synchronized Out-Focusing Techniques for 3D Animation)

  • 이준상;이임건
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권2호
    • /
    • pp.57-65
    • /
    • 2014
  • 3D 애니메이션에서 사운드 효과는 몰입감을 증대시키는 주요한 요인이다. 특히 사운드와 영상 사이의 상호작용은 의미의 전달을 극명하게 만드는 하나의 표현방식으로 영상제작에서 여러 가지 방식으로 응용된다. 사운드와 영상의 상호 작용 중에 아웃포커싱 기법은 실사 영상과 3D 애니메이션에서 많이 사용하는 기법으로 정지된 물체에 역동성을 가미할 수 있는 표현 방법이다. 그러나 실사촬영과는 달리 3D 애니메이션의 경우 뮤직비디오나 폭파 장면등에 아웃포커싱을 구현하는 것은 까다로운 작업이다. 더욱이 음원의 리듬에 동기화된 영상효과를 표현하기 위해서는 키프레임 조작을 수동으로 해야 하므로 매우 번거롭다. 본 연구는 음원데이터를 활용하여 영상과 이상적인 결합을 살펴보고 카메라의 피사계 심도를 음원에 동기화시켜 장면을 아웃포커싱하는 새로운 제작 기법을 제안한다.

음원 내 보컬 주파수 대역 분석에 기반한 음향기기 추천시스템 (A system for recommending audio devices based on frequency band analysis of vocal component in sound source)

  • 김정현;석철민;김민주;김수연
    • 한국산업정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.1-12
    • /
    • 2022
  • 음원 스트리밍 서비스와 Hi-Fi 시장이 성장함에 따라 다양한 음향기기들이 출시되고 있다. 이로 인해 소비자들의 제품 선택에 대한 폭은 넓어졌지만 자신의 음악적 취향과 일치하는 제품을 찾기는 더욱 어려워졌다. 본 연구에서는 사용자가 선호하는 음원으로부터 보컬 성분을 추출하고 이를 토대로 사용자에게 가장 적합한 음향기기를 추천하는 시스템을 제안하였다. 이를 위해 먼저 원본 음원을 Python의 Spleeter Library를 통해 분리하여 보컬 음원을 추출하고 제조사의 음향기기의 주파수 대역 데이터를 수집한 결과를 각각 격자 그래프로 나타내었다. 추출한 보컬 음원의 주파수 대역과 음향기기의 주파수 대역 측정치 데이터를 비교하기 위한 지표로서 Matching Gap Index(MGI)를 제안하였다. 산출된 MGI 값을 토대로 사용자 선호와의 유사도가 가장 높은 음향기기를 추천한다. 추천 결과는 음향 전문업체에서 제공하는 장르별 Equalizer 데이터를 이용하여 검증하였다.

교차로 사고음 검지시스템의 방해음향 조사연구

  • 강희구;고영권;김재이
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.805-808
    • /
    • 2008
  • 본 논문에서는 교차로 사고음 자동검지시스템의 검지율 향상을 위하여 다양한 음향패턴을 분석하였는데, 자동검지의 방해요소인 차종별 경적음과 특수목적용 차량의 사이렌음의 음향패턴은 일반적으로 사고음과 비슷한 음압을 가지고 있으나, 각각 다른 주기적인 형태의 주파수 파형으로 구성되어 있음을 확인하였다. 이를 위해, 교차로사고 자동음향감지시스템의 각종 방해요소(자동차 경적, 사이렌음, 기타 잡음 등)들의 파형 및 주파수 특성 등을 분석하는 음향인식기법을 도입하였다. 연구결과, 일반적인 교통소음과 교통사고음의 음향패턴을 비교하면 많은 차이가 있으며, 차량소통의 유무에 따라 약 20[dB]의 오차범위가 존재하는 것으로 나타났다.

  • PDF

입체음향효과 향상을 위한 스테레오-10.2채널 블라인드 업믹스 기법 (Stereo-10.2Channel Blind Upmix Technique for the Enhanced 3D Sound)

  • 최선웅;현동일;이석필;박영철;윤대희
    • 한국음향학회지
    • /
    • 제31권5호
    • /
    • pp.340-351
    • /
    • 2012
  • 본 논문에서는 입체음향효과의 향상을 위한 스테레오-10.2채널의 블라인드 업믹스 알고리즘을 제안하였다. 최근에, 소비자들은 더 나은 입체음향효과나 3D 사운드를 즐기길 원하고 다양한 멀티채널 포맷의 등장으로 업믹스 알고리즘들이 연구 되어 왔다. 그러나 기존의 업믹스 알고리즘들은 공간정보를 왜곡하는 문제점을 가지고 있었다. 이러한 문제점을 해결하기위해 전 후방 채널에 대한 이득 조절 및 10.2 채널의 각 채널별 믹싱 알고리즘을 제안한다. 기존의 상용화된 멀티채널 업믹스 알고리즘들과의 주관적 평가 실험결과 제안한 알고리즘은 입력신호의 공간정보를 유지하면서 입체음향효과를 향상시킨 것으로 확인되었다.

한국어 CV단음절의 음소합성 (The Phoneme Synthesis of Korean CV Mono-Syllables)

  • 안점영;김명기
    • 한국통신학회논문지
    • /
    • 제11권2호
    • /
    • pp.93-100
    • /
    • 1986
  • 子音 音素/ㄱ, ㄷ, ㅂ, ㅈ/과 이에 대응한 硬音, 激音 그리고 母音 音素/ㅏ, ㅓ, ㅗ, ㅜ, ㅣ/로 구성된 韓國語 CV單音節을 偏自己相關方式으로 分析하고, 分析된 parameter를 적절히 제어하여 音素合成方法으로 이들 音節을 合成하였다. 분석결과 자음길이는 激音일 때 제일 길고, 硬音이 가장 짧았으며 이 音들의 gain도 비슷한 변화를 나타내었다. 그리고 平音뒤의 모음 pitch 주기가 가장 길고, 硬音, 激音으로 바뀌면 pitch주기가 짧아졌다. 子音 音素는 激音의 길이와 gain을 제어하여 합성하고 母音 音素는 平音뒤에 오는 母音의 pitch와 길이를 제어하여 합성하였다. 子音과 母音 音素를 結合시켜 CV單音節을 合成하였다. 實驗結果 合成音質은 대체로 양호하였고, 韓國語 音聲의 音素合成에 필요한 規則作成의 可能性을 확인하였다.

  • PDF

Investigating the Effects of Hearing Loss and Hearing Aid Digital Delay on Sound-Induced Flash Illusion

  • Moradi, Vahid;Kheirkhah, Kiana;Farahani, Saeid;Kavianpour, Iman
    • Journal of Audiology & Otology
    • /
    • 제24권4호
    • /
    • pp.174-179
    • /
    • 2020
  • Background and Objectives: The integration of auditory-visual speech information improves speech perception; however, if the auditory system input is disrupted due to hearing loss, auditory and visual inputs cannot be fully integrated. Additionally, temporal coincidence of auditory and visual input is a significantly important factor in integrating the input of these two senses. Time delayed acoustic pathway caused by the signal passing through digital signal processing. Therefore, this study aimed to investigate the effects of hearing loss and hearing aid digital delay circuit on sound-induced flash illusion. Subjects and Methods: A total of 13 adults with normal hearing, 13 with mild to moderate hearing loss, and 13 with moderate to severe hearing loss were enrolled in this study. Subsequently, the sound-induced flash illusion test was conducted, and the results were analyzed. Results: The results showed that hearing aid digital delay and hearing loss had no detrimental effect on sound-induced flash illusion. Conclusions: Transmission velocity and neural transduction rate of the auditory inputs decreased in patients with hearing loss. Hence, the integrating auditory and visual sensory cannot be combined completely. Although the transmission rate of the auditory sense input was approximately normal when the hearing aid was prescribed. Thus, it can be concluded that the processing delay in the hearing aid circuit is insufficient to disrupt the integration of auditory and visual information.