• Title/Summary/Keyword: Voice signal

Search Result 431, Processing Time 0.028 seconds

노인음성신호처리: 젠더혁신 분석에 대한 체계적 문헌고찰 (Elderly Speech Signal Processing: A Systematic Review for Analysis of Gender Innovation)

  • 이지연
    • 융합정보논문지
    • /
    • 제9권8호
    • /
    • pp.148-154
    • /
    • 2019
  • 본 연구의 목적은 국내의 젠더혁신 기반 노인음성신호처리 연구에 대하여 체계적으로 문헌을 고찰하고, 젠더분석 방법의 효용성과 혁신성을 소개하는 것이다. 2000년부터 현재까지 국내 학회지에 게재된 37편의 연구 논문 중 중복되는 자료와 포함 및 배제 기준에 따라 적합한 25편의 논문이 선정되었다. 그리고 젠더분석 방법을 적용하여 남녀 연구대상과 젠더연구 설계로 구분하여 살펴보았다. 연구 결과 젠더혁신 측면 공학연구 개발에서 연구 분야의 다양성과 연구 개발팀의 높은 젠더 인식이 필요함을 보였다. 또한 노인음성신호처리 연구 및 논문에서 젠더혁신 연구과정 및 방법이 체계적으로 적용될 수 있도록 정부 차원의 규정 확립과 대학 차원의 다양한 젠더혁신 프로젝트 출범을 제언하는 바이다. 추후 노인음성 신호처리 연구에서의 젠더혁신은 남녀 모두의 요구를 반영한 음성인식 시스템과 서비스 개발로 우리 모두를 위한 새로운 시장을 창출할 것이다.

연속음성신호에서 피치와 TSIUVC 추출에 관한 연구 (A Study on Extraction of Pitch and TSIUVC in Continuous Speech)

  • 이시우
    • 인터넷정보학회논문지
    • /
    • 제6권4호
    • /
    • pp.85-92
    • /
    • 2005
  • 본 연구에서는 연속음성에서 개별 피치펄스와 TSIUVC를 추출하는 새로운 방법을 제안하고자 한다. TSIUVC 탐색과 추출은 FIR-STREAK 필터를 사용한 개별 피치펄스와 영교차율을 사용한다. 실험결과, 개별 피치펄스의 추출률은 남자음성에서 $96{\%}$, 여자음성에서 $85{\%}$를 얻을 수 있었다. 아울러, TSIUVC 추출률은 남자 음성의 경우 $88{\%}$에서 $94.9{\%}$, 여자 음성의 경우는 $84.8{\%}$에서 $94.9{\%}$의 결과를 얻었다. 제안한 방법은 음성분석, 음성합성, 새로운 Voiced/Silence/TSIUVC의 음성부호화 방식에 활용할 수 있을 것으로 기대된다.

  • PDF

고카페인 섭취 전·후 음성 특성 비교 (Comparison of Voice Characteristics Before and After High-Caffeine Intake)

  • 이아름;김은연;유현자;최예린
    • 말소리와 음성과학
    • /
    • 제7권4호
    • /
    • pp.59-65
    • /
    • 2015
  • This study was conducted to identify the differences in voice characteristic variables before and after taking a certain amount of high-caffeine. Linear PCM-M10 Recorder (SONY) was used for the recorder and basic frequency of the voice (Fo), frequency fluctuation rate (jitter), amplitude fluctuation rate (shimmer) and Signal-to-Noise Ratio (SNR) were measured using TF-32(University of Wisconsin-Madison, USA). First, prolonged phonation analysis results of /ah/ by male subjects showed the shimmer values after taking high-caffeine increased statistically significantly(p<.05) compared with before the intake and SNR values significantly decreased. (p<.05). On the other hand, female subjects didn't show any statistically significant differences in all variables. Second, male subjects showed statistically significant increased shimmer values after the intake compared with before the intake at /ah/ of syllable 'na' and /ah/ in 'ra' in 'autumn' paragraph (p<.05), and jitter values significantly increased at /ah/ in 'ah' (p<.05). However, female subjects didn't show any statistically significant differences in all variables. Results of this study showed that high-caffeine intake more affects male subjects than female subjects. In male subjects, shimmer and SNR changed at vowel prolonged phonation, /ah/, and study results showed that shimmer and SNR in 'Autumn' paragraph /na/, /ra/ and jitter in /ah/ could be identified as the variables to show the voice change.

UWB 전술망에서의 효과적인 음성 데이터 전송 (An Effective Transmission for Vice Traffic in UWB Mobile Ad Hoc Network)

  • 김종환;구명현;이현석;신정호
    • 한국통신학회논문지
    • /
    • 제38B권4호
    • /
    • pp.279-290
    • /
    • 2013
  • 본 논문에서는 UWB의 광대역 주파수와 낮은 신호세기의 특성을 이용해서 기밀한 음성 통신이 가능하고, 이동 ad hoc 네트워크로 동작하도록 하여 단말의 이동이 가능한 전술망용 MAC 프로토콜의 효과적인 음성 데이터 전송 기법을 제안하였다. 기존의 UWB MAC 프로토콜은 대부분 단말 간 동기화를 지원하여 전력 소모, 대역폭과 같은 자원 활용에 중점을 두었으나, 본 논문의 UWB MAC 프로토콜은 단말의 이동성에 중점을 두어 비동기 방식으로 구동된다. 또한 효과적인 음성 데이터 전송을 위해서 RTS/CTS 패킷을 사용하지 않고, 재전송 과정이 없다. 해당 음성 데이터 전송 방식의 시뮬레이션을 통하여 성능을 측정하였다.

한국 성인 음성의 음도인식에 관한 연구 (A Study on Pitch Perception of Normal Korean)

  • 정옥란;김형순;김영태;서장수
    • 음성과학
    • /
    • 제1권
    • /
    • pp.315-323
    • /
    • 1997
  • This study attempts to determine the fundamental frequency level of male and female voices that Koreans perceive as normal. Seventy-three college students majoring in Speech Pathology participated in the study on a voluntary basis. The subjects listened to a male voice with fundamental frequency of 60 Hz, 80 Hz, 100 Hz, 120 Hz, 140 Hz, 160 Hz, 180 Hz, and 200 Hz, and a female voice with fundamental frequency of 140 Hz, 160 Hz, 180 Hz, 200 Hz, 220 Hz, 240 Hz, 260 Hz, and 280 Hz. The PSOLA (Pitch Synchronous Overlap). method and harmonic modeling method of speech signal were used to change pitch in the 20 Hz interval. The voices were presented in a random order to prevent listener bias. The results were as follows; Firstly, $46.6\%$ judged male voice with 120 Hz as normal, and $19.2\%$ judged 140 Hz as normal, and another $19.2\%$ judged 160 Hz as normal. Secondly, $50.7\%$ perceived female voice with 220 Hz as normal, and $32.9\%\;and\;30.1\%$ responded to 200 Hz and 240 Hz, respectively. The problems and recommendations for a future investigation are discussed.

  • PDF

음성활동영역검색을 사용하는 유색잡음에 오염된 음성의 향상을 위한 일반화 부공간 접근 (A Generalized Subspace Approach for Enhancing Speech Corrupted by Colored Noise Using Voice Activity Detector(VAD))

  • 손경식;김현태
    • 한국정보통신학회논문지
    • /
    • 제17권8호
    • /
    • pp.1769-1776
    • /
    • 2013
  • 본 논문에서는 유색잡음에 의해 오염된 음성신호의 음성향상 알고리즘인 YL 접근법에 VAD(voice activity detector)를 구현하는 수정된 알고리즘을 제안한다. 제안한 알고리즘을 YL 접근법 및 LS 접근법과 컴퓨터 시뮬레이션으로 성능을 비교하였다. 사용한 유색잡음은 자동차 잡음과 다중화자 배블 잡음으로 AURORA 데이터베이스로 부터 각각 발췌하였고, 음성신호는 TIMIT 데이터 베이스로부터 발췌하였다. 제안한 알고리즘을 실험했을 때 제안하는 방법이 신호대잡음비 및 스펙트럼 왜곡 측면에서 기존의 두 알고리즘 보다 개선됨을 확인하였다.

An Ultrasonic Wave Encoder and Decoder for Indoor Positioning of Mobile Marketing System

  • Kim, Young-Mo;Jang, Se-Young;Park, Byeong-Chan;Bang, Kyung-Sik;Kim, Seok-Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권7호
    • /
    • pp.93-100
    • /
    • 2019
  • In this paper, we propose an intelligent marketing service system that can provide custom advertisements and events to both businesses and customers by identifying the location and contents using the ultrasonic signals and feature information in voice signals. We also develop the encoding and decoding algorithm of ultrasonic signals for this system and analyze the performance evaluation results. With the development of the hyper-connected society, the on-line marketing has been activated and is growing in size. Existing store marketing applications have disadvantages that customers have to find out events or promotional materials that the headquarters or stores throughusing the corresponding applications whenever they visit them. To solve these problems, there are attempts to create intelligent marketing tools using GPS technology and voice recognition technology. However, this approach has difficulties in technology development due to accuracy of location and speed of comparison and retrieval of voice recognition technology, and marketing services for customer relation are also much simplified.

대역 스크램블을 이용한 음성 보호방식 (Speech Encryption Scheme Using Frequency Band Scrambling)

  • 지형근;이동욱
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 추계학술대회 논문집 학회본부 B
    • /
    • pp.700-702
    • /
    • 1999
  • The protection of data which we want to keep secret from invalid users has become a main topic nowadays. This paper introduces a encryption scheme for protecting speech signals from eavesdropping. The proposed encryption scheme adopts a secure voice cryptographic algorithm based on the scrambling in frequency band. In order to improve the conventional speech signal encryption scheme, we have randomly permuted DCT coefficients of speech signal. Simulation results are included to show the performance of the proposed algorithm for secure transmission of speech signals.

  • PDF

VoIP 네트워크 내의 Fraud와 SIM Box Fraud 검출 방법에 대한 연구 (Study on Fraud and SIM Box Fraud Detection Method in VoIP Networks)

  • 이정원;엄종훈;박태흠;김승호
    • 한국통신학회논문지
    • /
    • 제40권10호
    • /
    • pp.1994-2005
    • /
    • 2015
  • 다양한 기술들이 하나로 융합된 VoIP(Voice over Internet Protocol) 서비스는 IP 망을 통해 음성뿐만 아니라 멀티미디어 서비스와 각종 부가서비스를 제공한다. 현재 대역폭 사용효율과 저비용성 등의 장점들 때문에 기존 PSTN 전화에서 VoIP 시스템으로 비즈니스가 전환되고 있다. 이러한 것이 가능한 이유는 기존의 회선교환 네트워크를 대신하여 디지털화된 정보가 IP 패킷 형태로 여러 계층의 컴퓨터로 구성된 패킷교환망을 통해 전달되기 때문이다. 반면에 이러한 형태의 시스템들이 기존 IP네트워크 환경에서의 취약점과 융합되어 발생되는 신규 취약점 등에 의해서 각종 Fraud가 발생하고 있다. 2012년 상반기 Fraud call의 46%가 VoIP 전화기에서 만들어지고 있다는 조사 결과도 있듯이 Fraud Call의 피해는 상당하다. 따라서 Fraud에 대한 손실예방을 위해 대책마련이 필요하다. 특히, Fraud Call의 피해는 주로 국제 통화를 이용할 때 과금 피해로 나타나고 있어, 이와 관련된 SIM Box에 의한 Toll Bypass Fraud에 대한 분석과 이를 검출할 수 있는 방안마련이 요구된다. 일반적으로는 DPI(Deep Packet Inspection)를 기반으로 주요 Signature 또는 통계정보를 이용한 다양한 검출 방안이 제안되었으나, Fraudster 역시 이를 회피하기 위해 다양한 방법을 사용하고 있다. 특히, VoIP에서 Call Setup과 Termination과정을 수행하는 SIP Signal을 암호화 하거나 여러 경로로 전송하는 방식을 사용함으로써 감지를 회피하고 있다. 본 논문은 Fraud call의 감지 회피를 효과적으로 방지할 수 있도록 VoIP 트래픽의 특성과 VoIP Fraud 중 SIM Box Fraud의 행위분석을 결합한 방법론을 제안한다. 또한 제안된 방법론을 적용하여 Toll Bypass Fraud와 관련된 VoIP 서비스 제공자의 장비를 검출하는 방법을 제시한다.

Active Noise Cancellation using a Teacher Forced BSS Learning Algorithm

  • 손준일;이민호;이왕하
    • 센서학회지
    • /
    • 제13권3호
    • /
    • pp.224-229
    • /
    • 2004
  • In this paper, we propose a new Active Noise Control (ANC) system using a teacher forced Blind Source Separation (BSS) algorithm. The Blind Source Separation based on the Independent Component Analysis (ICA) separates the desired sound signal from the unwanted noise signal. In the proposed system, the BSS algorithm is used as a preprocessor of ANC system. Also, we develop a teacher forced BSS learning algorithm to enhance the performance of BSS. The teacher signal is obtained from the output signal of the ANC system. Computer experimental results show that the proposed ANC system in conjunction with the BSS algorithm effectively cancels only the ship engine noise signal from the linear and convolved mixtures with human voice.