• 제목/요약/키워드: voice data

검색결과 1,264건 처리시간 0.024초

Kernel PCA를 이용한 GMM 기반의 음성변환 (GMM Based Voice Conversion Using Kernel PCA)

  • 한준희;배재현;오영환
    • 대한음성학회지:말소리
    • /
    • 제67호
    • /
    • pp.167-180
    • /
    • 2008
  • This paper describes a novel spectral envelope conversion method based on Gaussian mixture model (GMM). The core of this paper is rearranging source feature vectors in input space to the transformed feature vectors in feature space for the better modeling of GMM of source and target features. The quality of statistical modeling is dependent on the distribution and the dimension of data. The proposed method transforms both of the distribution and dimension of data and gives us the chance to model the same data with different configuration. Because the converted feature vectors should be on the input space, only source feature vectors are rearranged in the feature space and target feature vectors remain unchanged for the joint pdf of source and target features using KPCA. The experimental result shows that the proposed method outperforms the conventional GMM-based conversion method in various training environment.

  • PDF

인터넷전화 이용자 체감품질 측정을 위한 측정데이터 간의 시간동기화 (Time Synchronization of the Monitoring Data for the VoIP User Assessment of Voice Quality Measurement)

  • 권태훈;황혜정;이석기;송한춘;원승영
    • 한국콘텐츠학회논문지
    • /
    • 제5권4호
    • /
    • pp.227-236
    • /
    • 2005
  • 인터넷전화 이용자 체감품질을 측정함에 있어 측정시스템 간의 시간동기화가 중요하다. 현재 시스템의 시간동기를 하는 방법에는 NTP 또는 GPS를 이용하여 시간동기화를 하고 있으나 NTP 서버와 시스템간의 거리에 따른 시간적 오차, GPS로부터 수신된 데이터를 처리하는 과정에서의 지연시간, 시스템 클럭의 특성에 따라 발생하는 오차와 같은 문제로 인해 측정시스템 간의 시간동기가 어려운 실정이다. 본 논문에서는 측정데이터의 시간동기를 위해 측정시스템 간의 시간적 오차와 클럭 특성에 의해 발생되는 오차를 보정하여 신뢰성 있는 품질측정 결과를 생성하는 시간동기화 방식을 제안하고 구현하였다.

  • PDF

VoDSL 서비스에 최적화된 ATM SAR 프로세서 (The ATM SAR Processor Optimized for VoDSL Service)

  • 손윤식;정정화
    • 대한전자공학회논문지SD
    • /
    • 제40권10호
    • /
    • pp.9-16
    • /
    • 2003
  • 본 논문은 VoDSL(Voice over DSL) 가입자용 단말기에 적합한 ATM(Asynchronous Transfer Mode) 프로세서를 제안한다. 제안된 ATM 프로세서는 ATM 단, ATM 적응단의 프로토콜을 처리하는 블록. ATS 스케줄러 등으로 구성되며, ATM 네트워크상에 음성과 데이터 서비스를 위한 4개의 VCC (Virtual Channel Connection)을 지원한다. ATS(Adaptive Time Slot) 스케줄러는 음성 트래픽의 QoS (Quality of Service)를 보장하며 다중 AAL2 패킷을 지원하도록 설계하였다. 제안된 ATM 프로세서는 하이닉스 반도체의 0.35마이크론 공정에서 제작되었으며, 최대 52Mbps의 속도를 지원한다. 본 ATM 프로세서가 탑재된 VoDSL 가입자 장비인 LAD(Integrate Access Device)를 실제 제작하여 테스트용 네트워크 상에서 실험한 통하여 제안된 ATM 프로세서의 하드웨어 구조가 VoDSL 서비스의 대부분의 응용 분야에 성공적으로 적용 될 수 있음을 확인한다.

이동단말의 로밍에 따른 VoIP 서비스 품질 분석 (Evaluation of VoIP Service Quality under the Roaming of Mobile Terminals)

  • 최대우
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.747-752
    • /
    • 2012
  • 본 연구에서는 음성 및 데이터 단말의 로밍이 VoIP 호의 품질에 미치는 영향을 컴퓨터 시뮬레이션으로 분석하였다. MIPv4와 MIPv6에 상관없이 최대 용량의 VoIP 호가 진행중인 상태에서 한 단말의 로밍이 시작되면 무선구간 다운링크에서 재전송이 증가하게 되어 모든 VoIP 호의 품질이 급격히 최저수준으로 저하되었다. 또한 로밍해서 진입하게 된 셀에서도 최대용량의 호가 진행중인 경우에는 모든 호의 품질이 급격히 저하되므로 로밍서비스를 하는 경우에는 일종의 호수락 제어의 필요성이 제기된다. 데이터 트래픽의 경우에 로밍해서 들어가는 쪽의 품질이 더 많이 저하되었다.

CDMA 망에서의 음성 및 데이터 통합 서비스를 위한 우선권 기반의 패킷 예약 접속 프로토콜 (Prioritized Packet Reservation CDMA Protocolfor Integrated Voice and Data Services)

  • 김용진;강충구
    • 대한전자공학회논문지TC
    • /
    • 제37권1호
    • /
    • pp.32-43
    • /
    • 2000
  • 본 논문에서는 패킹 방식 CDMA 망에서 기존에 제시되었던 음성과 데이터 통합 서비스를 위한 매체 접근 제어(Medium Access Control: MAC) 프로토콜들이 갖는 문제점들을 고찰하고 이를 극복할 수 있는 새로운 접근 방법을 제시하였다. 본 논문에서는 동기식 다중코드 CDMA 시스템에서 중앙의 기지국이 모든 단말의 트래픽 상태를 우선권(priority)에 의해 파악하고 이에 따라 패킷 단위로 채널을 할당함으로써 음성과 데이터 서비스를 효율적으로 통합할 수 있는 Prioritized Packet Reservation CDMA ($P^2R$-CDMA) 프로토콜을 제안하고, 모의 실험을 통해 음성과 데이터 트래픽이 요구하는 서비스 품질을 보장하면서 다중화 이득을 극대화함으로써 전송 허가 확률의 제어를 기반으로 하는 기존의 방식보다 시스템 용량을 향상시킬 수 있음을 확인하였다.

  • PDF

UMTS망의 AAL2에서 Timer_CU에 따른 다중화 이득 성능분석 (Performance Analysis of Multiplexing Gain over Timer_CU in AAL2 on UMTS Network)

  • 이현진;김재현
    • 대한전자공학회논문지TC
    • /
    • 제41권8호
    • /
    • pp.35-43
    • /
    • 2004
  • AAL2 전송 방식은 3G WCDMA 망에서 Node-B와 RNC사이에서 음성 및 데이터 트래픽을 전송하는데 사용되고 있다. AAL2의 성능을 분석하기 위하여 이산 마코프 체인 모델을 이용하여 음성 트래픽의 압축밀도와 대역이득을 분석하였으며, 시뮬레이션을 통하여 이 결과를 검증하였다. 또한 집선기에서 AAL2 다중화기의 성능을 세부적으로 분석하였다. 분석에 의하여 Node-B에서의 최적의 Timer_CU를 결정하기 위한 근거를 제안하였으며, 대역이득의 측면에서 집선기에서의 부가적인 AAL2 다중화기의 이점이 매우 작다는 것을 확인하였다. 또한 Node-B와 Iub인터페이스의 집선기에서 AAL2를 사용했을 때 데이터 트래픽의 경우 음성 트래픽에 비하여 그 이점이 매우 작다는 것을 알 수 있었다.

임신돈의 분만 감시 및 예측 시스템 개발 (Development of a Monitoring and Forecasting System for the Delivery of Pregnant Sow)

  • 임영일
    • 한국축산시설환경학회지
    • /
    • 제6권1호
    • /
    • pp.15-22
    • /
    • 2000
  • A monitoring and the forecasting system for the swine delivery was developed using CCD camera multi-function board microphone and data-recorder equipped on a personal computer. For the swine delivery monitoring and forecasting factors four factors were selected such as genitalia swine body shape breast color and sound. Image of physical variation of body shape, shape and color of genitalia area and color of breast of pregnant sow were grabbed using the CCD color camera and multi-function board and variation of voice of pregnant sow was acquired using microphone and data recorder. Acquired information of image and voice were analyzed using a custom developed algorithm and program. The result of the forecasting efficiency of swine delivery was 89%, 71% and 100% using the variation of genitalia are the body shape and the voice of pregnant sow. respectively. The efficiency of image processing was 100% for the delivery detection when the piglet was delivered half of its body from genitalia of pregnant sow, The monitoring and forecasting system informed the estimated time of the delivery of swine to a farm manager immediately if an estimated and established time set by the farm manager was the same and/or the estimated time ws earlier than the established time and the system detected the delivery.

  • PDF

히어 캠 임베디드 플랫폼 설계 (HearCAM Embedded Platform Design)

  • 홍선학;조경순
    • 디지털산업정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.79-87
    • /
    • 2014
  • In this paper, we implemented the HearCAM platform with Raspberry PI B+ model which is an open source platform. Raspberry PI B+ model consists of dual step-down (buck) power supply with polarity protection circuit and hot-swap protection, Broadcom SoC BCM2835 running at 700MHz, 512MB RAM solered on top of the Broadcom chip, and PI camera serial connector. In this paper, we used the Google speech recognition engine for recognizing the voice characteristics, and implemented the pattern matching with OpenCV software, and extended the functionality of speech ability with SVOX TTS(Text-to-speech) as the matching result talking to the microphone of users. And therefore we implemented the functions of the HearCAM for identifying the voice and pattern characteristics of target image scanning with PI camera with gathering the temperature sensor data under IoT environment. we implemented the speech recognition, pattern matching, and temperature sensor data logging with Wi-Fi wireless communication. And then we directly designed and made the shape of HearCAM with 3D printing technology.

A Closer Look on Challenges and Security Risks of Voice Over Internet Protocol Infrastructures

  • Omari, Ahmed H. Al;Alsariera, Yazan A.;Alhadawi, Hussam S.;Albawaleez, Mahmoud A.;Alkhliwi, Sultan S.
    • International Journal of Computer Science & Network Security
    • /
    • 제22권2호
    • /
    • pp.175-184
    • /
    • 2022
  • Voice over Internet Protocol (VoIP) has grown in popularity as a low-cost, flexible alternative to the classic public switched telephone network (PSTN) that offers advanced digital features. However, additional security vulnerabilities are introduced by the VoIP system's flexibility and the convergence of voice and data networks. These additional challenges add to the normal security challenges that a VoIP system's underlying IP data network infrastructure confront. As a result, the VoIP network adds to the complexity of the security assurance task faced by businesses that use this technology. It's time to start documenting the many security risks that a VoIP infrastructure can face, as well as analyzing the difficulties and solutions that could help guide future efforts in research & development. We discuss and investigate the challenges and requirements of VoIP security in this research. Following a thorough examination of security challenges, we concentrate on VoIP system threats, which are critical for present and future VoIP deployments. Then, towards the end of this paper, some future study directions are suggested. This article intends to guide future scholars and provide them with useful guidance.

iVisher: Real-Time Detection of Caller ID Spoofing

  • Song, Jaeseung;Kim, Hyoungshick;Gkelias, Athanasios
    • ETRI Journal
    • /
    • 제36권5호
    • /
    • pp.865-875
    • /
    • 2014
  • Voice phishing (vishing) uses social engineering, based on people's trust in telephone services, to trick people into divulging financial data or transferring money to a scammer. In a vishing attack, a scammer often modifies the telephone number that appears on the victim's phone to mislead the victim into believing that the phone call is coming from a trusted source, since people typically judge a caller's legitimacy by the displayed phone number. We propose a system named iVisher for detecting a concealed incoming number (that is, caller ID) in Session Initiation Protocol-based Voice-over-Internet Protocol initiated phone calls. Our results demonstrate that iVisher is capable of detecting a concealed caller ID without significantly impacting upon the overall call setup time.