• Title/Summary/Keyword: Voice function

검색결과 436건 처리시간 0.027초

스마트폰 기반의 실시간 모음 인식 마우스 구현 (Implementation of Real-time Vowel Recognition Mouse based on Smartphone)

  • 장태웅;김현용;김병만;정해
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권8호
    • /
    • pp.531-536
    • /
    • 2015
  • 음성인식은 HCI(Human Computer Interface)분야에서 가장 활발히 연구되고 있는 분야로 음성을 이용하여 디지털 디바이스를 제어하는 것을 목적으로 하고 있으며 마우스는 GUI 컴퓨터 환경에서 가장 널리 사용하는 장치로서 높은 보급률을 자랑하는 컴퓨터 주변기기 중의 하나이다. 본 논문은 스마트폰 환경에서 실시간 모음 음성 인식을 이용한 마우스 제어 방법에 관하여 제안한다. 구현 방법은 스마트폰에서 실시간으로 일정크기의 음성 신호를 입력 받아 핵심 음성 신호를 추출하고 MFCC(Mel Frequency Cepstral Coefficient)를 이용하여 특징을 추출하여 학습되어 있는 코드 북을 이용하여 양자화를 진행하고 HMM(Hidden Markov Model)을 이용하여 해당 모음 단어를 인식한다. 그리고 각 모음에 해당하는 마우스 명령어로 변환하여 화면상의 가상의 마우스를 제어한다. 최종적으로, 우리는 구현된 스마트폰의 앱을 가지고 데스크톱 PC의 화면상에서 다양한 마우스의 동작을 보여준다.

음성인식을 이용한 개인맞춤형 스마트 미러 (Personalized Smart Mirror using Voice Recognition)

  • 강대철;임종석;이길호;이범희;박형근
    • 한국전자통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.1121-1128
    • /
    • 2022
  • 본 논문에서는 일상생활 마이크에 원하는 정보를 입력했을 때 스피커를 통해 그에 대한 정보를 출력하는 스마트 미러를 제작하였다. 스마트 미러의 화면은 LCD 모니터를 사용하여 아크릴판이 결합하여 있는 액자에 하프미러를 붙여 디스플레이를 제외한 공간에는 빛이 투과되지 않도록 하여 거울 기능을 할 수 있게 만들었다. 소프트웨어 구성 중 Raspbian을 이용하여 시스템 환경을 구축하였다. 기본 메뉴는 실제 기능적인 부분에 있어서 사용되는 거울을 통해 다양한 정보를 제공할 수 있는 스마트 미러를 라즈베리 파이를 이용하여 개발하였다. 개발된 스마트 미러는 시간, 날씨, 구글 캘린더, 유튜브 음악, 웹브라우저 검색 기능 등의 다양한 정보를 제공하며, 핸드폰 무선 충전도 가능하게 하드웨어를 제작하였다. 기존의 스마트 미러는 미리 입력된 데이터 혹은 GUI 기능만 수행할 수 있었다면 본 논문의 스마트 미러는 'Google Assistant'를 연동하여 기존의 설정한 기능뿐만 아니라 알고리즘 검색을 활용하여 웹사이트 정보를 제공한다.

빅데이터를 이용한 독거노인 돌봄 AI 대화형 말동무 아가야(AGAYA) 로봇 시스템에 관한 연구 (A Study on Interactive Talking Companion Doll Robot System Using Big Data for the Elderly Living Alone)

  • 송문선
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.305-318
    • /
    • 2022
  • 본 연구는 4차 혁명기술의 핵심인 AI 기술을 활용한 대화형 AI 토이 로봇의 독거노인 돌봄에 대한 효과성에 주목하고, 보다 인간 중심적인 돌봄으로의 개인화, 맞춤화에 기여할 수 있도록 R&D를 통한 '아가야'라는 AI 토이 로봇을 개발하였다. R&D 작업은 활용 중인 AI 스피커와 AI 대화 인형의 기능을 고찰, 현재 AI 로봇을 사용 중인 총 6명의 독거노인과의 인터뷰, 독거노인의 AI 대화 로봇 사용 현황과 효과성, 한계성, 개선점 등을 파악한 후 진행되었다. 첫째, P-TTS 기술을 적용하여 듣고 싶은 사람의 음성을 자율적으로 선택하여 들음으로써 심리적 친밀감을 강화하고 둘째, 추억저장 및 소환기능으로 자신만의 심적 치유를 가능케 하며 셋째, 눈, 코, 입, 귀, 손의 5감의 다양한 역할을 추가하였고 넷째, 따뜻한 체온 유지, 아로마, 살균 및 미세먼지 제거부, 편리한 충전방식 등의 기술을 개발하였다. 이러한 기술들은 친밀감, 개인화 지향을 통한 독거노인의 대화형 로봇에 대한 사용을 확대하고, 돌봄의 수혜자라는 수동적인 프레임에서 벗어나 스스로 남은 노후를 생산적이고 독립적으로 기획할 수 있는 긍정적 이미지의 독거 노인상을 구축하는데 기여한다.

노인성 후두의 조직병리학적, 생리학적 특성 (Histopathologic and Physiologic Features of the Aging Larynx)

  • 박일석
    • 대한후두음성언어의학회지
    • /
    • 제25권1호
    • /
    • pp.20-23
    • /
    • 2014
  • Age-related changes in larynx can have a direct impact on voice quality and general comfort level. Observations of vocal aging have spanned perceptual, acoustic, aerodynamic, physical, electromyographic (EMG) and histological levels. Evidence of differential vocal aging in relation to gender and physical condition has been reported. Perceptual, acoustic, aerodynamic, kinematic, EMG and histological data document age-related changes in laryngeal structure and function with advancing age. These changes contribute to a functional age-related impact of vocal hypofunction or compensatory hyperfunction. This review will focus on the current understanding of the clinical and cellular changes in the larynx that lead to presbyphonia.

  • PDF

A Low Power Multi-Function Digital Audio SoC

  • Lim, Chae-Duck;Lee, Kyo-Sik
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 하계종합학술대회 논문집(2)
    • /
    • pp.399-402
    • /
    • 2004
  • This paper presents a system-on-chip prototype implementing a full integration for a portable digital audio system. The chip is composed of a audio processor block to implements audio decoding and voice compression or decompression software, a system control block including 8-bit MCU core and Memory Management Unit (MMU) a low power 16-bit ${\Sigma}{\Delta}$ CODEC, two DC-to-BC converter, and a flash memory controller. In order to support other audio algorithms except Mask ROM type's fixed codes, a novel 16-bit fixed-point DSP core with the program-download architecture is proposed. Funker, an efficient power management technique such as task-based clock management is implemented to reduce power consumption for portable application. The proposed chip has been fabricated with a 4 metal 0.25um CMOS technology and the chip area is about 7.1 mm ${\times}$ 7.1mm with 100mW power dissipation at 2.5V power supply.

  • PDF

IEEE 802.11 무선랜 시스템에서 PCF 프로토콜의 성능을 향상시키기 위한 최적의 폴링 방식 (Optimal Polling Method for Improving PCF MAC Performance in IEEE 802.11 Wireless LANs)

  • 최우용;이상완
    • 대한산업공학회지
    • /
    • 제32권1호
    • /
    • pp.1-8
    • /
    • 2006
  • A modified PCF(Point Coordination Function) protocol with the optimal polling sequence is defined in detail and shown to improve the efficiency of the conventional PCF protocol in IEEE 802.11 wireless LAN standard. The problem for the optimal polling sequence is formulated as TSP(Travelling Salesman Problem) with the distance values of 1's or 0's. Numerical examples show that the optimal polling sequence increases the capacity of the real-time service such as VoIP(Voice over Internet Protocol).

TDX-10A 온라인 녹음기능 구현방안 연구 (An Implementation of On-line Recording for TDX-10A Switching System)

  • 김태원;류영일이성근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.293-296
    • /
    • 1998
  • When the information of announcement facility is modified or added, they are recorded on a tape and then are updated manually using the cassette tape recorder at each office. But the degrade of the tone quality owing to repeated use of the tape and some recording mistakes by processing manually deteriorate the quality of service. And new services such as IN(Intelligent Network) and added functions make the announcement changed very often. Therefore the improved skill of the announcement handling is needed. This paper introduces the implementation of the TDX-10A on-line recording function of transferring voice in PCM data file and storing it in the memory of the recorded announcement facility, when message is recorded onthe fixed type of announcement facility.

  • PDF

모음환경에 따른 한국어 양순 파열음의 공기역학적인 특징 (Aerodynamic Characteristics of Korean Bilabial Stop Consonant in Vowel Environment)

  • 박상희;이옥분;정옥란;석동일
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2002년도 11월 학술대회지
    • /
    • pp.129-132
    • /
    • 2002
  • Aerodynamic analysis study was performed on 14 normal subjects(2 male, 12 female) by nonsense syllables composed of Korean bilabial stop(/p, p', $p^{h}$) and their preceding and/or following vowel /i, a, u/. That is [pi, p'i, phi, pa, p'a, pha, pu, p'u, $p^{h}u$]. All measures were analysed using Aerophone II voice function analyzer and included peak air pressure, mean air pressure, maximum flow rate, volume, mean SPL. As results, first, MSPL and MAP of /p, p', $p^{h}$/ themselves were significantly different. In addition, different vowel enviroment also produced significantliy different aerodynamic chracteristics those consonants.

  • PDF

THE DISCRETE-TIME ANALYSIS OF THE LEAKY BUCKET SCHEME WITH DYNAMIC LEAKY RATE CONTROL

  • Choi, Bong-Dae;Choi, Doo-Il
    • 대한수학회논문집
    • /
    • 제13권3호
    • /
    • pp.603-627
    • /
    • 1998
  • The leaky bucket scheme is a promising method that regulates input traffics for preventive congestion control. In the ATM network, the input traffics are bursty and transmitted at high-speed. In order to get the low loss probability for bursty input traffics, it is known that the leaky bucket scheme with static leaky rate requires larger data buffer and token pool size. This causes the increase of the mean waiting time for an input traffic to pass the policing function, which would be inappropriate for real time traffics such as voice and video. We present the leaky bucket scheme with dynamic leaky rate in which the token generation period changes according to buffer occupancy. In the leaky bucket scheme with dynamic leaky rate, the cell loss probability and the mean waiting time are reduced in comparison with the leaky bucket scheme with static leaky rate. We analyze the performance of the proposed leaky bucket scheme in discrete-time case by assuming arrival process to be Markov-modulated Bernoulli process (MMBP).

  • PDF

호흡곤란을 동반하는 과민성 후두 증후군 (Irritable Larynx Syndrome with Dyspnea)

  • 안철민
    • 대한후두음성언어의학회지
    • /
    • 제27권1호
    • /
    • pp.21-24
    • /
    • 2016
  • An irritable larynx syndrome is characterized by a sudden episodic dyspnea and dysphonia that is difficult to diagnose, and patients are often treated unnecessarily and/or too much. A correct diagnosis can be made by monitoring the larynx closing in the reversed direction during inhalation and posterior chink with videolaryngoscopy and by measuring a decrease in air flow volume during inhalation with a lung function test. Patients can be effectively treated with thorough differential diagnosis. Medications targeting precipitating factors, physical therapy sessions to improve abnormal larynx movement, counseling to reduce patients'anxiety rising from dyspnea, and etc. can effectively alleviate symptoms.

  • PDF