• 제목/요약/키워드: voice communication

검색결과 1,030건 처리시간 0.022초

고령화 사회를 위한 음성 인식 챗봇 시스템 : 기술 개발과 맞춤형 UI/UX 설계 (Voice Recognition Chatbot System for an Aging Society: Technology Development and Customized UI/UX Design)

  • 정윤지;유민성;오주영;황현석;허원회
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권4호
    • /
    • pp.9-14
    • /
    • 2024
  • 본 연구는 고령화 사회의 노년층 우울증과 고독감 문제를 해결하기 위해 음성 인식 챗봇 시스템을 개발하였다. 이 시스템은 Whisper 모델, GPT 2.5, XTTS2를 활용하여 고성능 음성 인식과 자연어 처리, 텍스트-음성 변환 기능을 제공한다. 사용자는 이를 통해 감정과 상태를 표현하고 적절한 반응을 얻을 수 있으며, 지인의 목소리를 이용한 음성인식 기능으로 친숙함과 안정감을 느낄 수 있다. UX/UI는 스마트 시니어 세대의 인지 반응과 시력 저하, 운동 능력 제약 등을 고려하여 설계되었다. 명도와 선명도가 높은 색상, 가독성이 좋은 서체등을 활용하여 고령자의 사용 편의성을 높였다.이 연구는 음성 기반 인터페이스를 통해 노년층의 삶의 질 향상에 기여할 것으로 기대된다.

VoiceXML을 이용한 Web 연동 학습 시스템 설계 및 구현 (Design and Implementation of Web Interworking Learning System Using VoiceXML)

  • 김동현;조창수;신정훈;홍광석
    • 전자공학회논문지CI
    • /
    • 제42권2호
    • /
    • pp.21-30
    • /
    • 2005
  • 멀티미디어 및 통신망 기술의 발전은 학습 시스템 구현 측면에서의 많은 변화를 이룩하였다. 보다 창의적이며, 보다 효율적인 학습 시스템 구축을 위한 연구가 Web 및 전화망을 이용하여 시도되었다. 그러나 현재까지 구현된 학습 시스템의 경우 웹 또는 전화망을 이용한 단독 시스템으로 각각의 장 단점을 가지고 있다. 즉, Web을 이용한 학습 시스템의 활용을 통한 학습시 단점으로는 컴퓨터를 활용한 정적인 상태에서의 학습만 가능하며, 컴퓨터를 사용하지 못하는 사람들에겐 이용하기 위한 새로운 시스템 활용법을 익혀야 하는 문제점이 존재하였다. 또한, 전화망을 이용한 학습 시스템의 경우 언제 어디서나 전화를 활용학습이 가능하다는 장점을 가지고 있으나, 컴퓨터를 활용한 시스템과 같이 심도있게 효율적으로 정보의 전달이 이루어지지 않는다는 단점을 가지고 있다. 이에 본 논문에서는 VoiceXML을 활용하며 전화망을 경유한 학습 시스템과 Web 기반 학습 시스템의 연동을 통한, 효율적이며 편리한, 언제 어디서나 활용 가능한 학습 시스템을 제안 한다. 또한 전화망을 사용한 학습 시스템에서 사용자 ID, password, 이름 등록 기능의 새로운 알고리즘을 제안하고 전화망과 Web을 사용한 학습시스템에서는 개인학습 진도 저장 기능을 제안한다.

소규모 그룹에서의 음성 통신을 위한 TDMA 기반의 릴레이 프로토콜 (A TDMA-based Relay Protocol for Voice Communication on a Small Group)

  • 황상호;박창현;안병철
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.259-266
    • /
    • 2013
  • 근거리 무선 통신은 전송 거리에 제약이 있어 마스터 주변의 노드만이 통신이 가능하다. 기존의 블루투스와 지그비와 같은 통신은 ad hoc을 위한 기술을 제공함에도 불구하고 실시간 대화를 위한 멀티 홉 전송에는 적절하지 못하다. 본 논문은 TDMA을 이용하여 소규모의 여러 사용자들이 서로 대화할 수 있는 릴레이 프로토콜을 제안한다. 제안한 릴레이 프로토콜은 TDMA를 이용하여 실시간으로 데이터 또는 음성의 다중 홉 재전송이 가능하다. 제안하는 프로토콜은 라우팅 경로에 따라 주파수를 달리하여 패킷을 전송하는 방법으로 이동에 따른 채널 효율의 감소를 줄여 네트워크의 성능을 높이고 있다. NS-2 시뮬레이션을 통하여 제안한 프로토콜이 실시간 음성 전달에서 전송 지연과 패킷 손실률에 있어 우수한 성능을 가지고 있음을 보인다.

빅데이터 기반의 융합 보이스피싱을 이용한사회공학적 공격 기법과 대응방안 (A Scheme of Social Engineering Attacks and Countermeasures Using Big Data based Conversion Voice Phishing)

  • 김정훈;고준영;이근호
    • 한국융합학회논문지
    • /
    • 제6권1호
    • /
    • pp.85-91
    • /
    • 2015
  • 최근 전자금융사기가 급증하여 정부에서 스미싱, 파밍, 피싱, 메모리 해킹에 대한 예방법, 대처 요령을 배포하고 전자금융거래법을 강화하였다. 이에 따라 전자금융사기 방법 또한 진화하고 대처하기 어렵게 변하고 있다. 과거의 무작위 대상로 보이스피싱이 아닌 공격 대상의 개인 정보를 알아내서, 공격대상의 개인정보를 빅데이터로 만들어 치밀하게 분석한다. 분석한 정보를 토대로 보이스피싱을 하는 신종 전자금융사기로 진화하였다. 빅데이터화된 개인정보를 융합한 보이스피싱의 공격 방법을 분석하고 앞으로 점점 더 진화하고 있는 전자금융사기의 대응방안을 제안한다. 메모리에 의미 없는 데이터를 저장하는 방법으로 공격자는 빅데이터 기반으로 개인정보를 획득한다해도 정확한 정보를 도출 시킬 수 없으며 보이스피싱 또한 제대로 할 수 없게 된다. 본 논문에서 새로운 사회공학적 공격을 알아보고 그에 따른 대응방안을 제안한다.

기업형 사용자들을 위한 음성/영상 서비스 이동성 제공 방안 (Voice and Video Call Continuity for Enterprise Users)

  • 정창용;김현수;문정현;김희동
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2009년도 정보통신설비 학술대회
    • /
    • pp.99-103
    • /
    • 2009
  • Recently, as wired and wireless communication services have rapidly developed and multimodal mobile devices which have various characteristics have widely spread, the need for new convergence services increases. The growing population of VoIP technologies and the high communication expense yield that the market of IP based telephony such as WiFi phone and IP phone is substituted for one of the conventional PSTN telephony. With the help of this trend, the wireline network operators desire to find a market in mobile networks. Therefore, they focus on Fixed Mobile Convergence (FMC) service as one of the key factors to accomplish this goal. FMC services are able to provide the mobility of voice services between circuit switched and packet switched networks. IP Multimedia Subsystem (IMS) based Voice Call Continuity (VCC) is one of the schemes to embody FMC services. As Application Server (AS) which has this VCC function provides seamless handover of services between heterogeneous networks, FMC subscribers can communicate seamlessly with others m WiFi domain and COMA domain using WiFi-COMA dual phone. Most of enterprises have already introduced IP network infrastructure and IP-PBX (Private Branch eXchange) for telephony. However, the problems of high communication cost and work inefficiency due to frequent outside jobs or business trips have remained. In order to solve these problems, demands for enterprise FMC services increase. In this paper, we introduce a new IP-PBX based VCC model that can provide seamless handover of voice services between WiFi and COMA networks for enterprise users and we investigate some interworking and security issues between Soft Switch (SSW) and IMS, or between IMSs. In addition, we introduce a new service that can provide the continuity of voice sessions as well as video sessions using Multimedia Session Continuity (MMSC) technology which has evolved from VCC. This service is expected to be one of the next-generation personalized services based on user's context.

  • PDF

이동환경에서 치열영상과 음성을 이용한 멀티모달 화자인증 시스템 구현 (An Implementation of Multimodal Speaker Verification System using Teeth Image and Voice on Mobile Environment)

  • 김동주;하길람;홍광석
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.162-172
    • /
    • 2008
  • 본 논문에서는 이동환경에서 개인의 신원을 인증하는 수단으로 치열영상과 음성을 생체정보로 이용한 멀티모달 화자인증 방법에 대하여 제안한다. 제안한 방법은 이동환경의 단말장치중의 하나인 스마트폰의 영상 및 음성 입력장치를 이용하여 생체 정보를 획득하고, 이를 이용하여 사용자 인증을 수행한다. 더불어, 제안한 방법은 전체적인 사용자 인증 성능의 향상을 위하여 두 개의 단일 생체인식 결과를 결합하는 멀티모달 방식으로 구성하였고, 결합 방법으로는 시스템의 제한된 리소스를 고려하여 비교적 간단하면서도 우수한 성능을 보이는 가중치 합의 방법을 사용하였다. 제안한 멀티모달 화자인증 시스템의 성능평가는 스마트폰에서 획득한 40명의 사용자에 대한 데이터베이스를 이용하였고, 실험 결과, 치열영상과 음성을 이용한 단일 생체인증 결과는 각각 8.59%와 11.73%의 EER를 보였으며, 멀티모달 화자인증 결과는 4.05%의 EER를 나타냈다. 이로부터 본 논문에서는 인증 성능을 향상하기 위하여 두 개의 단일 생체인증 결과를 간단한 가중치 합으로 결합한 결과, 높은 인증 성능의 향상을 도모할 수 있었다.

An SS_RRA Protocol for Integrated Voice/Data Services in Packet Radio Networks

  • Lim, In-Taek
    • Journal of information and communication convergence engineering
    • /
    • 제5권2호
    • /
    • pp.88-92
    • /
    • 2007
  • In this paper, an SS-RRA protocol that is based on Code Division Multiple Access is proposed and analyzed under the integrated voice and data traffic load. The backward logical channels consist of slotted time division frames with multiple spreading codes per slot. The protocol uses a reservation mechanism for the voice traffic, and a random access scheme for the data traffic. A discrete-time, discrete-state Markov chain is used to evaluate the performance. The numerical results show that the performance can be significantly improved by a few distinct spreading codes.

Design of Intelligent Emotion Recognition Model

  • Kim, Yi-gon
    • 한국지능시스템학회논문지
    • /
    • 제11권7호
    • /
    • pp.611-614
    • /
    • 2001
  • Voice is one of the most efficient communication media and it includes several kinds of factors about speaker, context emotion and so on. Human emotion is expressed is expressed in the speech, the gesture, the physiological phenomena(the breath, the beating of the pulse, etc). In this paper, the emotion recognition method model using neuro-fuzzy in order to have cognizance of emotion from voice signal is presented and simulated.

  • PDF

멀티미디어 PCS에서 Image/Voice/Data 호에 대한 가변적 보호채널 할당의 분석 (Analysis of Variable Guard Channel Allocation For Image/Voice/Data Calls in Multimedia Personal Communication Services)

  • 나원식;이용주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.692-697
    • /
    • 2000
  • 멀티미디어 개인 휴대 통신(MPCS)에서 다중 클래스호에 대한 효율적인 채널할당은 매우 중요하다고 할 수 있다. 본 논문에서는 Image/Voice/Data 호에 대하여 가변적 보호 채널을 할당하는 새로운 방식을 제안하였다. 이러한 방식은 3차원 상태 천이도로 모델링 되며 보호 채널의 크기를 가변적으로 조절함으로써 보다 융통성있는 서비스를 제공하게 되며, 또한 수학적 분석과 시뮬레이션을 통해 비교분석을 수행하였다.

  • PDF

IEEE 802.15.4 LR-WPAN의 실시간 음성 데이터 응용에 대한 적용 가능성 연구 (Feasibility Study of IEEE 802.15.4 LR-WPAN to the Real-time Voice Application)

  • 허윤강;김유진;허재두
    • 대한임베디드공학회논문지
    • /
    • 제2권2호
    • /
    • pp.82-94
    • /
    • 2007
  • Wireless sensor networking technology is one of the basic infrastructures for ubiquitous environment. It enables us to gather various sensory data such as temperature, humidity, gas leakage, and speed from the remote sensor devices. To support these networking functions, IEEE WPAN working group makes standards for PHY and MAC, while ZigBee Alliance defines the standards for the network, security, and applications. The low-rate WPAN was emerged to have the characteristics of network resilience, low cost, and low power consumption. It has a broad range of applications including, but not limit to industrial control and monitoring, home automation, disaster forecast and monitoring, health care. In order to provide more intelligent and robust services, users want voice-based solutions to accommodate to low-rate WPAN. In this paper, we have evaluated voice quality of an IEEE 802.15.4 standard compliant voice node. Specifically, it includes the design of a voice node and experiments based on the prediction of voice quality using the E-model suggested by ITU-T G.107, and the network communication mechanisms considering beacon-enabled and nonbeacon-enabled networks for real-time voice communications.

  • PDF