• 제목/요약/키워드: voice data

검색결과 1,250건 처리시간 0.026초

멀티 트래픽이 있는 계층 셀룰라 시스템의 성능 분석 (Analysis of Performance at Hierarchical Cellular System With Multi Traffic)

  • 성홍석;임승하;이종성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.1035-1036
    • /
    • 2006
  • We analyzed the performance of hierarchical cellular system with multi traffic(voice traffic, data traffic). We executed the computer simulation by the various ratio of traffic generation(voice traffic, data traffic). We generated data traffic at microcell. The more voice traffic generated, the higher the block probability of data traffic became at macrocell.

  • PDF

데이터 증강기법을 이용한 음성 위조 공격 탐지모형의 성능 향상에 대한 연구 (Data augmentation in voice spoofing problem)

  • 최효정;곽일엽
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.449-460
    • /
    • 2021
  • 본 논문에서는 음성위조공격탐지(Voice spoofing detection) 문제에 데이터 증강을 적용한다. ASVspoof 2017은 리플레이 공격 탐지에 대해 다루며 진짜 사람의 음성과 환경이나 녹음·재생 장치의 조건들을 다르게 하여 위조한 가짜 음성을 분류하는 것을 목적으로 한다. 지금까지 이미지 데이터에 대한 데이터 증강 연구가 활발히 이루어졌으며 음성에도 데이터 증강을 시도하는 여러 연구가 진행되어왔다. 하지만 음성 리플레이 공격에 대한 데이터 증강시도는 이루어지지 않아 본 논문에서는 데이터 증강기법을 통한 오디오 변형이 리플레이 공격 탐지에 어떠한 영향을 미치는지에 대해 탐구해본다. 총 7가지의 데이터 증강기법을 적용해보았으며 그 중 DVC, Pitch 음성 증강기법이 성능향상에 도움되었다. DVC와 Pitch는 기본 모델 EER의 약 8% 개선을 보여주었으며, 특히 DVC는 57개의 환경변수 중 일부 환경에서 눈에 띄는 정확도 향상이 있었다. 가장 큰 폭으로 증가한 RC53의 경우 DVC가 기본 모델 정확도의 약 45% 향상을 이끌어내며 기존에 탐지하기 어려웠던 고사양의 녹음·재생 장치를 잘 구분해냈다. 본 연구를 토대로 기존에 증강기법의 효과에 대한 연구가 이루어지지 않았던 음성 위조 탐지 문제에서 DVC, Pitch 데이터 증강기법이 성능 향상에 도움이 된다는 것을 알아내었다.

Voice Similarities between Brothers

  • Ko, Do-Heung;Kang, Sun-Mee
    • 음성과학
    • /
    • 제9권2호
    • /
    • pp.1-11
    • /
    • 2002
  • This paper aims to provide a guideline for modelling speaker identification and speaker verification by comparing voice similarities between brothers. Five pairs of brothers who are believed to have similar voices participated in this experiment. Before conducted in the experiment, perceptual tests were measured if the voices were similar between brothers. The words were measured in both isolation and context, and the subjects were asked to read five times with about three seconds of interval between readings. Recordings were made at natural speed in a quiet room. The data were analyzed in pitch and formant frequencies using CSL (Computerized Speech Lab), PCQuirer and MDVP (Multi -dimensional Voice Program). It was found that data of the initial vowels are much more similar and homogeneous than those of vowels in other position. The acoustic data showed that voice similarities are strikingly high in both pitch and formant frequencies. It was also found that the correlation coefficient was not significant between parameters above.

  • PDF

Discrimination of Pathological Speech Using Hidden Markov Models

  • Wang, Jianglin;Jo, Cheol-Woo
    • 음성과학
    • /
    • 제13권3호
    • /
    • pp.7-18
    • /
    • 2006
  • Diagnosis of pathological voice is one of the important issues in biomedical applications of speech technology. This study focuses on the discrimination of voice disorder using HMM (Hidden Markov Model) for automatic detection between normal voice and vocal fold disorder voice. This is a non-intrusive, non-expensive and fully automated method using only a speech sample of the subject. Speech data from normal people and patients were collected. Mel-frequency filter cepstral coefficients (MFCCs) were modeled by HMM classifier. Different states (3 states, 5 states and 7 states), 3 mixtures and left to right HMMs were formed. This method gives an accuracy of 93.8% for train data and 91.7% for test data in the discrimination of normal and vocal fold disorder voice for sustained /a/.

  • PDF

빅데이터와 FDS를 활용한 보이스피싱 피해 예측 방법 연구 (A Study on the Prediction Method of Voice Phishing Damage Using Big Data and FDS)

  • 이승용;이주락
    • 시큐리티연구
    • /
    • 제62호
    • /
    • pp.185-203
    • /
    • 2020
  • 2009년 이후 전체 범죄는 감소하고 있지만, 보이스피싱은 오히려 급증하고 있다. 정부와 학계에서는 이를 근절하기 위해 다양한 대책을 제시하고 연구를 진행해 왔으나 진화하는 보이스피싱을 따라잡기에는 역부족이다. 이 연구에서 연구자들은 범인 검거와 피해회복이 어려운 보이스피싱의 피해 예방에 초점을 두었다. 특히, 피해자가 금융거래행위(계좌이체 등)를 한다는 점이 금융사기(이상거래)와 유사하다는 점에 착안하여, 금융사기 탐지에 활용되고 있는 이상거래탐지시스템(FDS)을 활용한 보이스피싱 예측 방안을 연구하였다. 그 결과 머신러닝 기반의 이상거래탐지시스템(FDS)에 보이스피싱과 관련한 통화내역, 메신저내역, 대포통장, 보이스피싱 유형과 112신고 등 빅데이터를 결합한 방안을 개념적으로 도출하였다. 이 연구에서는 주로 정부 대책과 빅데이터 활용과 관련한 문헌연구를 중심으로 연구를 진행했다. 그러나 데이터 수집의 한계와 FDS의 보안 문제로 구체적인 모델까지를 제시하지는 못하였다. 다만, 관련된 선행연구가 없는 현실에서 머신러닝을 위해 필요한 데이터 종류와 FDS를 융합한 보이스피싱 대응방안의 개념을 최초로 제시했다는 점에 의미가 있다. 향후 이 연구를 바탕으로 '보이스피싱 피해 예측 시스템'이 개발되어 보이스피싱 피해가 근절되기를 기대한다.

리눅스 기반 실시간 처리 VoIP 단말기 시스템의 설계 및 구현 (A Design and Implementation of the Real-Time VoIP Terminal System Based on Linux)

  • 이명근;이상정;서정민;임재용
    • 정보처리학회논문지A
    • /
    • 제8A권4호
    • /
    • pp.345-352
    • /
    • 2001
  • 본 논문에서는 리눅스를 기반으로 실시간 음성 처리 VoIP 단말기를 설계 구현한다. 설계 구현하는 하드웨어 시스템은 i486 프로세서를 기반으로 설계되며, 음성 코덱칩을 사용하여 실시간으로 음성 데이터를 처리한다. 또한 실시간 음성 데이터를 관리하고 처리하기 위해 리눅스 기반 실시간 처리 운영 체제인 RTLinux를 포팅하여 실시간 음성처리 모듈을 구현한다. 음성처리에 사용한 음성처리 모듈은 ITU-T 표준 음성 코덱인 G.723.1 사용하여 30ms 내에 24바이트로 인코딩/디코딩된 음성 데이터를 전송하도록 하고, 음성 전달의 QoS를 보장해 주기 위해서 리눅스에 실시간 음성처리 디바이스 드라이버를 설계 구현한다. 설계 구현하는 시스템의 테스트 및 타당성 검증을 위해 음성채팅 응용 프로그램을 단말기에 구현하여 통화품질을 시험한다.

  • PDF

음성 및 데이터서비스를 위한 무선접속시스템에서 CDMA와 TDMA방식의 성능비교 (Performance Comparison of CDMA and TDMA protocols in radio access system for Integrated Voice/Data Services)

  • 고종하;양영님;이정규
    • 한국통신학회논문지
    • /
    • 제24권6A호
    • /
    • pp.820-831
    • /
    • 1999
  • 본 논문에서는 음성 및 데이터서비스를 위한 무선접속시스템에서 D-TDMA(Dynamic-Time Division Multiple Access)와 CDMA(Code Division Multiple Access) 프로토콜의 성능을 비교 분석하였다. D-TDMA 프로토콜에서 음성서비스는‘circuit mode’로 채널 사용 우선권을 부여하고 데이터서비스는 FCFS(First Come First Service) 형태의 동적 채널 할당 방식을 사용하였다. CDMA 프로토콜에서는 내부 셀과 외부 셀에 존재하는 다른 이동가입자들의 간섭잡음을 줄이기 위하여 음성검출 기법을 사용하고, 이 경우의 간선잡음전력을 분석하였다. 또한, 이 간섭잡음전력을 이용하여 실제 데이터의 BER(Bit Error Rate)를 구하고, 평균 데이터 길이와 평균 데이터 발생률의 변화에 따른 음성차단확률(음성패킷손실확률) 및 데이터전송 지연시간을 비교 분석하였다. 분석결과에 따르면 평균 데이터 길이가 짧을 경우, 데이터 발생률의 증감에 독립적으로 CDMA 프로토콜이 상대적으로 우수한 성능을 보였다. 그러나, 평균 데이터 길이가 길어질수록 데이터 전송 지연시간이 큰 폭으로 증가하는 CDMA 프로토콜보다 D-TDMA 프로토콜이 더 우수한 성능을 보였다.

  • PDF

Performance Analysis of Packet CDMA R-ALOHA for Multi-media Integration in Cellular Systems with Adaptive Access Permission Probability

  • Kyeong Hur;Eom, Doo-Seop;Tchah, Kyun-Hyon
    • 한국통신학회논문지
    • /
    • 제25권12B호
    • /
    • pp.2109-2119
    • /
    • 2000
  • In this paper, the Packet CDMA Reservation ALOHA protocol is proposed to support the multi-traffic services such as voice and videophone services with handoff calls, high-rate data and low-rate data services efficiently on the multi-rate transmission in uplink cellular systems. The frame structure, composed of the access slot and the transmission slot, and the proposed access permission probability based on the estimated number of contending users for each service are presented to reduce MAI. The assured priority to the voice and the videophone handoff calls is given through higher access permission probability. And through the proposed code assignment scheme, the voice service can be provided without the voice packet dropping probability in the CDMA/PRMA protocols. The code reservation is allowed to the voice and the videophone services. The low-rate data service uses the available codes during the silent periods of voice calls and the remaining codes in the codes assigned to the voice service to utilize codes efficiently. The high-rate data service uses the assigned codes to the high-rate data service and the remaining codes in the codes assigned to the videophone service. Using the Markov-chain subsystem model for each service including the handoff calls in uplink cellular systems, the steady-state performances are simulated and analyzed. After a round of tests for the examples, through the proposed code assignment scheme and the access permission probability, the Packet CDMA Reservation ALOHA protocol can guarantee the priority and the constant QoS for the handoff calls even at large number of contending users. Also, the data services are integrated efficiently on the multi-rate transmission.

  • PDF

시각 장애우를 위한 Wearable Computing System (Wearable Computing System for the bland persons)

  • 김형호;최선희;조태종;김순주;장재인
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.261-263
    • /
    • 2006
  • Nowadays, technologies such as RFID, sensor network makes our life comfortable more and more. In this paper we propose a wearable computing system for blind and deaf person who can be easily out of sight from our technology. We are making a wearable computing system that is consisted of embedded board to processing data, ultrasonic sensors to get distance data and motors that make vibration as a signal to see the screen for a deaf person. This system offers environmental informations by text and voice. For example, distance data from a obstacle to a person are calculated by data compounding module using sensed ultrasonic reflection time. This data is converted to text or voice by main processing module, and are serviced to a handicapped person. Furthermore we will extend this system using a voice recognition module and text to voice convertor module to help communication among the blind and deaf persons.

  • PDF

Hybrid Fiber Coaxial망에서 VoIP 서비스 구현 (Implementation of VoIP Service in Hybrid Fiber Coaxial Network)

  • 주재한
    • 한국항행학회논문지
    • /
    • 제21권1호
    • /
    • pp.113-118
    • /
    • 2017
  • 최근 모바일기기 및 네트워크에 대한 관심이 높아짐에 따라 기존의 IP (internet protocol) 망을 이용하여 음성데이터를 전송하는 기술인 VoIP (voice over internet protocol)서비스가 급속히 확산됨에 따라 무선 인터넷망을 활용하여 언제 어디서나 저렴한 음성 통화 서비스가 가능해졌다. 그리고 디지털방송서비스가 보급되면서 방송과 통신의 융합을 통해 광대역케이블망을 이용하는 HFC (hybrid fiber coaxial)망 기술은 기존의 통신시스템 및 망설비를 활용하여 양방향 방송서비스 및 인터넷, 전화 등 다양한 신규 서비스를 제공하고 있다. 따라서 실제 HFC 인터넷서비스망에서 음성데이터의 품질보장을 위해 VoCM에 UGS-AD를 MTA에는 RTPS를 적용하면 실제 상용 HFC 인터넷서비스망에서 문제가 되는 협소한 상향대역에서의 음성데이터 전송을 원활히 수행할 수 있음을 확인하였으며, HFC 인터넷서비스 망에서 음성데이터의 QoS개선을 통해 기존 대비 개선된 VoIP서비스를 구현하는 방안을 제시하였다.