• Title/Summary/Keyword: 청각특성

Search Result 331, Processing Time 0.031 seconds

A Study on Enhancement of 3D Sound Using Improved HRTFS (개선된 머리전달함수를 이용한 3차원 입체음향 성능 개선 연구)

  • Koo, Kyo-Sik;Cha, Hyung-Tai
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.6
    • /
    • pp.557-565
    • /
    • 2009
  • To perceive the direction and the distance of a sound, we always use a couple of information. Head Related Transfer Function (HRTF) contains the information that sound arrives from a sound source to the ears of the listener, like differences of level, phase and frequency spectrum. For a reproduction system using 2 channels, we apply HRTF to many algorithms which make 3d sound. But it causes a problem to localize a sound source around a certain places which is called the cone-of-confusion. In this paper, we proposed the new algorithm to reduce the confusion of sound image localization. The difference of frequency spectrum and psychoacoustics theory are used to boost the spectral cue among each directions. To confirm the performance of the algorithm, informal listening tests are carried out. As a result, we can make the improved 3d sound in 2 channel system based on a headphone. Also sound quality of improved 3d sound is much better than conventional methods.

An Efficient Voice Activity Detection Method using Bi-Level HMM (Bi-Level HMM을 이용한 효율적인 음성구간 검출 방법)

  • Jang, Guang-Woo;Jeong, Mun-Ho
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.10 no.8
    • /
    • pp.901-906
    • /
    • 2015
  • We presented a method for Vad(Voice Activity Detection) using Bi-level HMM. Conventional methods need to do an additional post processing or set rule-based delayed frames. To cope with the problem, we applied to VAD a Bi-level HMM that has an inserted state layer into a typical HMM. And we used posterior ratio of voice states to detect voice period. Considering MFCCs(: Mel-Frequency Cepstral Coefficients) as observation vectors, we performed some experiments with voice data of different SNRs and achieved satisfactory results compared with well-known methods.

An Endpoint Detection Algorithm for Noise Speech using Band Energy (대역에너지를 이용한 잡음음성의 끝점검출 알고리즘)

  • Park Ki-Sang;Suk Su-Young;Jung Ho-Youl;Chung Hyun-Yeol
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.91-94
    • /
    • 2002
  • 음성인식 시스템의 실용화를 위해서 우선적으로 해결되어야 될 문제중 하나로 잡음환경하에서의 끝점검출을 들 수 있다. 잡음이 존재하지 않는 환경에서는 기존의 에너지 파라미터만으로도 어느정도 신뢰성있는 끝점 구간을 검출할 수 있으나 도심 소음과 같은 실제 잡음환경하에서는 대부분 좋지 않은 결과를 보인다. 본 논문에서는 도심환경의 배경잡음을 제거하는 방법으로 입력되는 음성에 대하여 주변소음에 의해 손상된 음성스펙트럼의 크기 성분만을 제거하는 전처리 기법인 Bark scale에 기반한 스펙트럼 차감법을 사용하고, 인간의 청각특성을 고려하여 음성의 주파수 대역을 3개의 대역으로 분리한 후, 대역별로 세밀한 에너지 문턱치값을 설정하여 음성의 끝점을 탐색하는 방법을 제안한다. 제안한 방법의 유효성을 확인하기 위해 실제 사무실 및 지하철역 등의 잡음환경하에서 녹음된 데이터베이스를 이용하여 끝점검출을 수행한 결과 기존의 에너지와 영교차율을 이용한 방법에 비해 평균 $46\%$의 오차율 감소와 대역에너지만을 사용한 경우에 비해 평균 $17\%$의 오차율 감소를 나타내어 제안한 방법의 유효성을 확인할 수 있었다.

  • PDF

Music classification system through emotion recognition based on regression model of music signal and electroencephalogram features (음악신호와 뇌파 특징의 회귀 모델 기반 감정 인식을 통한 음악 분류 시스템)

  • Lee, Ju-Hwan;Kim, Jin-Young;Jeong, Dong-Ki;Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • v.41 no.2
    • /
    • pp.115-121
    • /
    • 2022
  • In this paper, we propose a music classification system according to user emotions using Electroencephalogram (EEG) features that appear when listening to music. In the proposed system, the relationship between the emotional EEG features extracted from EEG signals and the auditory features extracted from music signals is learned through a deep regression neural network. The proposed system based on the regression model automatically generates EEG features mapped to the auditory characteristics of the input music, and automatically classifies music by applying these features to an attention-based deep neural network. The experimental results suggest the music classification accuracy of the proposed automatic music classification framework.

생리신호 측정에 의한 감성평가

  • 황민철;박재희;박수찬;김철중
    • Proceedings of the ESK Conference
    • /
    • 1995.04a
    • /
    • pp.35-39
    • /
    • 1995
  • 인간의 감성평가 기술은 제품설계에 필요한 중요한 기술로 인식되고있다. 정량적이고 객 관적인 감성평가를 위한 구체적인 연구가 요구된다. 본 연구는 생리신호가 인간감성에 따라 변화한 다는 가정아래 인간 오감(청각, 시각, 후각, 미각, 촉각)에 대한 생리신호 (EEG, ECG, GSR, FEMG)의 변화를 측정하였다. 감각종류로 긍정적 감성과 부정적 감성을 유발할 4개의 자극이 피실험자에게 제시되었고, 모든 생리신호를 동기화하여 측정하였다. 측정된 신호는 통계처리하여 주관적으로 평가한 감성과의 상관성을 분석하였고 긍정적인 감성과 부정적인 감성에 따른 신호변화의 특성을 파악하여 감 성평가를 위한 상관성을 관찰했다.

  • PDF

The Sensing Characteristics of SnO$_2$-WO$_3$ Seminconductor Gas Sensor (SnO$_2$-WO$_3$ 반도체 가스센서의 감응 특성 연구)

  • 김선태;최일환;김한수;민주식;이태영
    • Proceedings of the Korea Air Pollution Research Association Conference
    • /
    • 2003.11a
    • /
    • pp.231-232
    • /
    • 2003
  • 인간의 오감은 시각, 청각, 촉각, 미각 및 후각 둥으로 구성된다 최근 과학기술의 괄목할만한 진보에 동반하여 감각기관에 관한 연구와 이들을 대행하는 기기 등의 개발이 다방면에서 시도되어지고 있으며, 그 중 사람의 후각에 관한 것으로 인간에 코의 기능을 모방한 가스센서의 개발이 활발히 진행되고 있다. 이러한 가스센서가 환경유해가스를 손쉽게 감지할 수 있다는 장점을 부각시킴으로써 가스센서의 연구는 더욱 활발히 진행되고 있는 실정이다. (중략)

  • PDF

실리콘 박막을 이용한 가속도센서 제조기술

  • 이종현
    • Proceedings of the Korean Vacuum Society Conference
    • /
    • 1993.02a
    • /
    • pp.11-12
    • /
    • 1993
  • 센서를 인간의 오감에 비유한다면 가속도센서는 시각, 청각, 촉각, 미각, 후각 중에서 어떤 감각기관인가\ulcorner 먼저 시각을 쉽게 생각할 수 있다. 시각기능은 거리, 위치, 형상에 민감하다. 그러나 이들의 시간에 다른 변화 즉 1차 미분량인 속도에는 어느정도 정성적으로 감응하나 2차 미분량인 가속도는 시각으로 판단하기 어렵다. 활강하는 스키선수나 써커스의 공중곡예가 시각에만 의존한다고 볼 수 없으며 이러한 로봇(robot)을 만든다고 할 때 가속도 센서의 중요성은 상상 할 수 있을 것이다. 움직이는 모든 시스템의 동적특성을 제어하기 위해 정교한 가속도센서는 필수적이다.

  • PDF

The Sounds of Bird's Frequency Analyses for the Hearing Impaired Children (청각장애아를 위한 새 소리 주파수 특성 분석)

  • 김홍규
    • Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics
    • /
    • v.7 no.1
    • /
    • pp.20-26
    • /
    • 1996
  • The purposes of this study were to analyze the sound of bird's frequency region and pattern and to discuss hearing impaired children's auditory discrimination. The results were ie follows; 1) The sounds of bird's frequency region were divided into Low(below 1, 000Hz), Mid(between 1, 000 and 4, 000Hz) and High(between 2, 000 and 4, 000Hz). 2) The sounds of bird, which were same, long, high pattern, were in Mid & High. Short and high pattern were above High.

  • PDF

다층 퍼셉트론 네트워크에 의한 연속음성 화자분류

  • Choi, Jae-Seung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.05a
    • /
    • pp.682-683
    • /
    • 2017
  • 주변의 배경잡음으로부터 음성인식률을 향상시키기 위하여 적절한 음성의 특징 파라미터를 선택하는 것이 매우 중요하다. 본 논문에서는 위너필터 방법이 적용된 인간의 청각 특성을 이용한 멜 주파수 켑스트럼 계수를 사용한다. 제안한 멜 주파수 켑스트럼 계수의 특징 파라미터를 다층 퍼셉트론 네트워크에 입력하여 학습시킴으로써 화자인식을 구현한다.

  • PDF

The Study for Noisy Speech Improvement with Noise Perception Pattern Suppression (잡음 신호의 지각 패턴 제어를 통한 음질 개선 알고리즘 개발에 관한 연구)

  • Kim Hunjoong;Cha Hyungtai
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.199-202
    • /
    • 2002
  • 본 논문에서는 사람의 청각 모델을 기반으로 잡음에 의해 손상된 음성 신호로부터 잡음 신호의 마스킹 특성과 신호에너지의 지각(知覺)을 나타내는 임계대역(critical band)에서의 잡음 에너지에 대한 지각 패턴인 noise excitation pattern을 이용한 잡음 에너지 차감과 잡음 추정 오차에 의한 변형된 음성신호 내의 순음(tonal) 성분과 비순음(non-tonal)성분의 보정을 통해 효과적인 음성 품질의 개선을 위한 연구를 하였다.

  • PDF