• 제목/요약/키워드: voice data

검색결과 1,256건 처리시간 0.031초

UMTS망의 $I_{ub}$에서 AAL2 대역이득 성능평가 (Performance Evaluation of AAL2 Bandwidth Gain on $I_{ub}$ in UMTS Network)

  • 이현진;김재현
    • 한국통신학회논문지
    • /
    • 제29권8B호
    • /
    • pp.739-746
    • /
    • 2004
  • ATM/AAL2는 패킷의 길이가 작은 지연 민감성 응용 서비스의 효율적인 전송을 위하여 표준화된 전송 방식으로 UMTS망의 Node-B와 RNC사이의 $I_{ub}$ 인터페이스에서 음성 및 데이터 트래픽을 전송하기 위하여 사용되고 있다. AAL2의 성능을 분석하기 위하여 단대단으로 UMTS 망의 성능을 분석할 수 있는 시뮬레이터를 개발하였으며 UTRAN에서 음성 및 데이터 서비스에 따른 시뮬레이션을 실행하였다. 결과로 $I_{ub}$ 인터페이스에서 AAL2 다중화의 이득은 Node-B에서 최대 17%정도 높으며 데이터 트래픽의 경우 음성 트래픽에 비하여 대역이득이 적다는 것을 발견하였다. 또한 집선기에서 대역이득은 트래픽의 양이 증가할수록 감소하는 결과를 볼 수 있었다.

음성 경고의 도로 공사구간 적용 가능성 평가 (Evaluation of the Feasibility of a Voice Alarm in a Highway Work Zone)

  • 문재필;박현진;오철
    • 한국ITS학회 논문지
    • /
    • 제15권5호
    • /
    • pp.83-94
    • /
    • 2016
  • 도로공사구간의 안전성 증대를 위해 공사구간에 진입하는 운전자에게 전방상황에 대한 사전인지와 적절한 회피행동을 유도할 수 있는 경고정보를 제공하는 것은 효과적인 기술적 대안이 될 수 있다. 본 연구에서는 지향성 스피커를 이용하여 운전자에게 음성경고를 제공하여 안전운전을 유도하는 기술의 타당성을 평가하였다. 이를 위해 현장실험을 수행하였으며, 운전자의 경고정보 인지도 및 선호도, 공사구간 접근차량의 속도, 그리고 소음을 평가지표로 설정하여 수집된 자료를 분석하였다. 분석결과, 음성경고가 도로공사구간에 접근하는 운전자의 주위 환기를 위해서 긍정적으로 사용될 수 있음을 확인하였다. 반면 소음으로 인한 부정적인 효과도 발생할 수 있음을 관찰하였다. 따라서 음성 경고 제공 방식에 대한 개선을 통해 음성 정보 제공의 실효성을 증대시킬 필요가 있다. 또한 본 연구의 결과물은 향후 공사구간 안전성 증대를 위한 체계적인 음성경고정보시스템 개발을 위해 유용한 자료로 활용될 것으로 기대된다.

IEEE 802.15.4 표준에 적용을 위한 음성부호화 기술 (A Voice Coding Technique for Application to the IEEE 802.15.4 Standard)

  • 진진흥;강석근
    • 방송공학회논문지
    • /
    • 제13권5호
    • /
    • pp.612-621
    • /
    • 2008
  • 이용 가능한 데이터 영역과 전송전력 등 다양한 제한 요소들로 인하여 지그비 통신의 기술규격에는 음성통신에 대한 기준 사양이 포함되지 않았다. 본 논문에서는 지그비의 기반인 IEEE 802.15.4 표준에 적용하기 위한 음성부호화 기법이 제시된다. 여기서는 높은 압축율과 파형 복구능력이 우수한 파형부호기의 실현이 필수적이다. 이를 위하여 제시된 방법에서는 다단 이산 웨이블릿변환과 두 가지 펄스부호변조로 구성된 이진부호기가 사용된다. 이론적인 분석과 실내 무선 환경에서의 모의실험 결과 2단 웨이블릿변환을 적용한 경우가 압축율과 음성신호 복구능력 면에서 가장 적합한 것으로 판단된다. 직선전파경로 성분이 지배적인 경우 제시된 방법은 중간 정도의 신호 대 잡음비에서도 만족스러운 복구능력을 가진다. 따라서 제시된 음성부호화 방법은 향후 지그비를 이용한 음성통신의 표준 선정에 참고 가능한 기술이 될 수 있을 것으로 사료된다.

자가 음성평가와 체질량지수의 특성 비교 (A Comparison study on the relationship between the Self-reported Voice Problem and Body Mass Index)

  • 이인애;황영진
    • 한국산학기술학회논문지
    • /
    • 제14권3호
    • /
    • pp.1330-1334
    • /
    • 2013
  • 본 연구에서는 자가 음성평가에 따른 체질량지수를 비교하고자 하였다. 제5기(2010년) 1차년도 국민건강영양 조사 이비인후과 검진을 완료한 19세 이상의 성인을 5,811명을 대상으로 하며 자가음성평가와 체질량지수의 연관성을 분석하였다. 또한 체질량지수와 연관성이 깊은 키, 몸무게, 허리둘레 등도 함께 비교하여 자가음성평가와 어떠한 상관을 보이는지 살펴보았다. 비교를 위해 chi-square, t-test, 이변량 로지스틱 회귀분석을 이용하였으며 그 결과, 자가 음성평가에 따른 체질량지수는 유의한 차이를 나타내는 특성을 보이며, 체질량지수가 과체중-2단계 비만인 경우 정상체중보다 음성장애 위험률이 1.77배 높은 결과를 나타내었다. 또한 체질량지수가 음성장애 통제변수로서의 유의함을 확인하였으며, 음성장애 진단 시 키와 몸무게를 통한 체질량지수를 함께 비교하는 것은 필요하다는 것이 확인되었다.

Signal Enhancement of a Variable Rate Vocoder with a Hybrid domain SNR Estimator

  • Park, Hyung Woo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.962-977
    • /
    • 2019
  • The human voice is a convenient method of information transfer between different objects such as between men, men and machine, between machines. The development of information and communication technology, the voice has been able to transfer farther than before. The way to communicate, it is to convert the voice to another form, transmit it, and then reconvert it back to sound. In such a communication process, a vocoder is a method of converting and re-converting a voice and sound. The CELP (Code-Excited Linear Prediction) type vocoder, one of the voice codecs, is adapted as a standard codec since it provides high quality sound even though its transmission speed is relatively low. The EVRC (Enhanced Variable Rate CODEC) and QCELP (Qualcomm Code-Excited Linear Prediction), variable bit rate vocoders, are used for mobile phones in 3G environment. For the real-time implementation of a vocoder, the reduction of sound quality is a typical problem. To improve the sound quality, that is important to know the size and shape of noise. In the existing sound quality improvement method, the voice activated is detected or used, or statistical methods are used by the large mount of data. However, there is a disadvantage in that no noise can be detected, when there is a continuous signal or when a change in noise is large.This paper focused on finding a better way to decrease the reduction of sound quality in lower bit transmission environments. Based on simulation results, this study proposed a preprocessor application that estimates the SNR (Signal to Noise Ratio) using the spectral SNR estimation method. The SNR estimation method adopted the IMBE (Improved Multi-Band Excitation) instead of using the SNR, which is a continuous speech signal. Finally, this application improves the quality of the vocoder by enhancing sound quality adaptively.

대화 지속성 암묵적 단서를 고려한 차량 내 음성 인터랙션 구조 연구 (A Study on the In-Vehicle Voice Interaction Structure Considering Implicit context with Persistence of Conversation)

  • 남궁기찬
    • 한국융합학회논문지
    • /
    • 제12권2호
    • /
    • pp.179-184
    • /
    • 2021
  • 본 연구에서는 차량 내 음성 인터랙션을 사용하는 사용자의 대화 행태를 탐색적으로 살펴보았다. 본 연구의 목적은 시스템과의 음성 인터랙션에서 사용자들이 기대하는 대화 요소를 파악하여 사람 간의 대화와 유사한 음성 인터랙션을 가능하게 하기 위한 구조적 개선점을 제시하는 것이다. 사용자의 차량 내 음성 인터랙션 행태를 관찰하기 위해 맥락 질문법을 통해 자료를 수집하고 개방 코딩을 사용하여 인터뷰 내용을 분석하였다. 이를 통해 음성 인터랙션 기능의 유용성을 탐구할 수 있었으며, 이러한 유용성은 기능에 대한 사용자의 만족도와 사용 지속성을 증가시킨다는 점에서 매우 중요하다. 본 연구는 기술에 대한 사용자의 경험적 요구를 대인관계 모델인 대화의 관점에서 분석하였다는 점에서 의미가 있다고 할 수 있다.

멀티미디어 트랙픽의 QoS 지원을 위한 CDMA 무선데이터링크 프로토콜 설계 및 성능분석 (Design and Performance Analysis of CDMA Radio Link Protocols for QoS Control of Multimedia Traffic)

  • 조정호;이형옥;한승완
    • 한국통신학회논문지
    • /
    • 제25권4A호
    • /
    • pp.451-463
    • /
    • 2000
  • 본 논문에서는 CDMA ATM 이동망에서 음성, 비디오 고속 데이터 등의 멀티미디어 서비스를 제공하기 위한 QoS 보장형의 데이터링크 프로토콜을 설계하고 그 성능을 분석하였다. 이동 멀티미디어 트래픽을 지원하기 위해 요구되는 QoS 파라메터 및 특성을 분석하고, CDMA 무선망과 ATM망간의 접속을 위한 무선접속 프로토콜의 스택구조 및 계층별 기능을 제시한 후, QoS를 지원하기 위한 무선 데이터링크 프로토콜을 설계한다. 음성과 데이터 트래픽을 동시에 지원하는 시스템을 가정하여 데이터링크 프로토콜을 분석한다. 데이터 트랙픽의 경우 SREJ ARQ방식과 Type-1 Hybrid ARQ방식을 지연 및 처라량 관점에서 비교 분석하고, 음성 트래픽의 경우 BCH 코딩을 사용하여 데이터 트래픽 부하변화에 따른 음성 패킷으 에러율을 분석하다. 분석 결과로서 구현상의 복잡도는 높아질 수 있으나 QoS를 만족시키는 적응적 ARQ와 에러율 요구를 만족시키는 적응적 FEC 코딩을 이용하는 방식이 효율적임을 알 수 있다.

  • PDF

CNN을 이용한 음성 데이터 성별 및 연령 분류 기술 연구 (A Study on the Gender and Age Classification of Speech Data Using CNN)

  • 박대서;방준일;김화종;고영준
    • 한국정보기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.11-21
    • /
    • 2018
  • 본 논문에서는 사람을 대신하여 분류, 예측 하는 딥러닝 기술을 활용하여 목소리를 통해 남녀노소를 분류하는 연구를 수행한다. 연구과정은 기존 신경망 기반의 사운드 분류 연구를 살펴보고 목소리 분류를 위한 개선된 신경망을 제안한다. 기존 연구에서는 도시 데이터를 이용해 사운드를 분류하는 연구를 진행하였으나, 얕은 신경망으로 인한 성능 저하가 나타났으며 다른 소리 데이터에 대해서도 좋은 성능을 보이지 못했다. 이에 본 논문에서는 목소리 데이터를 전처리하여 특징값을 추출한 뒤 추출된 특징값을 기존 사운드 분류 신경망과 제안하는 신경망에 입력하여 목소리를 분류하고 두 신경망의 분류 성능을 비교 평가한다. 본 논문의 신경망은 망을 더 깊고 넓게 구성함으로써 보다 개선된 딥러닝 학습이 이루어지도록 하였다. 성능 결과로는 기존 연구와 본 연구의 신경망에서 각각 84.8%, 91.4%로 제안하는 신경망에서 약 6% 더 높은 정확도를 보였다.

생성형 AI 기술을 적용한 음성 및 모션 인식 기반 양방향 대화형 알고리즘 (Two-way Interactive Algorithms Based on Speech and Motion Recognition with Generative AI Technology)

  • 장대성;김종찬
    • 한국전자통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.397-402
    • /
    • 2024
  • 음성 인식과 모션 인식 기술은 다양한 스마트 디바이스에 적용되어 사용되고 있으나, 단순한 명령어 인식 형태로 구성되어 단순 기능으로 사용되고 있다. 인식 데이터에 대한 단순 기능에서 벗어나 다양한 분야에서 학습된 데이터를 기반으로 전문적인 명령어 수행 능력이 요구되고 있다. 현재 세계적으로 경쟁이 이루어지고 있는 생성형 AI를 활용하여 사용자에게 최적의 데이터를 제공하고, 음성 인식과 모션 인식을 통해 상호작용할 수 있는 시스템 플랫폼에 대한 연구가 진행되고 있다. 본 연구를 위해 설계한 주요 기술 프로세스는 음성 및 모션 인식 기능, AI 기술 적용, 양방향 커뮤니케이션 등 기술을 이용한 설계하였다. 본 논문에서는 AI 기술을 적용한 디바이스와 음성인식과 모션 인식 기술을 통해 디바이스와 사용자 간 양방향 커뮤니케이션을 다양한 입력방식에 의해 이루어질 수 있도록 하였다.

광대역 CDMA망에서 이동 멀티미디어 서비스 제공을 위한 액세스 제어 방법 (Access Control Scheme for supporting Mobile multimedia Service in CDMA Networks)

  • 최승식;조동호
    • 한국통신학회논문지
    • /
    • 제24권12A호
    • /
    • pp.1844-1851
    • /
    • 1999
  • 본 논문에서는 광대역 CDMA망에서 음성, 비디오, 데이터와 같은 멀티미디어 서비스를 제공하기 위해서 다양한 서비스 특성에 적합한 액세스 제어 방법을 제안한다. 즉 서비스별로 다른 Eb/No 값을 이용함으로써 서비스의 BER을 조절하고 음성과 비디오의 전송률이 시간에 따라 변하는 특성을 이용하여 데이터의 전송률을 제어하는 방법을 제안하였다. 또한 각 방법에 대한 시뮬레이션과 분석을 수행하였다. 성능 분석결과 제안된 액세스 방법을 사용할 경우 데이터에 대한 지연을 통해 전체적인 outage 발생확률을 감소시킴을 알 수 있었다.

  • PDF