• Title/Summary/Keyword: 음성 동작

Search Result 317, Processing Time 0.033 seconds

음성Dialing 시스팀 개발을 위한 예비실험

  • Jeong, Yu-Hyeon;Lee, Ui-Taek
    • ETRI Journal
    • /
    • v.8 no.1
    • /
    • pp.25-33
    • /
    • 1986
  • 음성 다이얼링 구성방식, 구비기능, 시스팀동작 등에 관해서 일부 검토한 것을 기술하였으며, 이를 토대로 실험 시스팀을 구성하여 7자리의 전화번호를 대상으로 인식 결과가 터미널에 표시되도록 하고, 입력 전화번호의 확인 및 정정을 /예/, /아니오/의 음성으로 가능하도록 하는 음성 다이얼링 방식에 대해 컴퓨터 시뮬레이션을 통해 검토한 내용을 기술하였다 .

  • PDF

Implementation of Speaker Independent Speech Recognizer in Noise Environment based on DSP (DSP기반의 잡음환경에 강인한 화자 독립 음성 인식기 구현)

  • 박진영;권호민;박정원;김창근;허강인
    • Proceedings of the IEEK Conference
    • /
    • 2003.11a
    • /
    • pp.69-72
    • /
    • 2003
  • 본 논문에서는 범용 DSP를 이용한 잡음환경에 강인한 음성인식 시스템을 구현하였다. 구현된 시스템은 TI사의 범용 DSP인 TMS320C32를 이용하였고, 실시간 음성 입력을 위한 음성 Codec과 외부 인터페이스를 확장하여 인식결과를 출력하도록 구성하였다. 또한, 기존의 음성 인식 시스템에 사용한 파라메터에 대한 고찰과 ICA를 이용하여 잡음 환경에 강인한 음성 특징 파라메터를 제안하고 성능 비교 실험을 하였다. 제안된 ICA 파라메터를 적용하여 음성인식 시스템을 구현하였다. 그리고, 독립적으로 동작 가능한 음성인식 시스템의 응용 예로 무선자동차에 적용시켜 실험했다.

  • PDF

Real-time DSP implementation of IMT-2000 speech coding algorithm (IMT-2000 음성 부호화 알고리즘의 실시간 DSP 구현)

  • Seo, Jeong Uk;Gwon, Hong Seok;Park, Man Ho;Bae, Geon Seong
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.38 no.3
    • /
    • pp.68-68
    • /
    • 2001
  • 본 논문에서는 3GPP와 ETSI에서 IMT-2000의 음성부호화 방식 표준안으로 채택한 AMR 음성부호화 알고리즘을 분석하고 C 컴파일러와 어셈블리 언어를 이용한 최적화 과정을 거친 후, 고정 소수점 DSP 칩인 TMS320C6201을 이용하여 실시간 구현하였다. 구현된 codec의 프로그램 메모리는 약 31.06 kWords, 데이터 RAM 메모리는 약 9.75 kWords, 그리고 데이터 ROM 메모리는 약 19.89 kWords 정도를 가지며, 한 프레임(20 ms)을 처리하는데 약 4.38 ms가 소요되어 TMS320C6201 DSP 칩의 전체 가용한 clock의 21.94%만 사용하여도 충분히 실시간으로 동작 가능함을 확인하였다. 또한, DSP 보드상에서 구현한 결과가 ETSI에서 공개한 ANSI C 소스 프로그램의 수행 결과와 일치함을 검증하였고, 구현된 AMR 음성부호화기를 sound I/O 모듈과 결합하여 실험한 결과, 어떠한 음질의 왜곡이나 지연 없이 실시간으로 충분히 동작함을 확인하였다. 마지막으로, Host I/O와 LAN 케이블을 이용하여 AMR 음성부호화 알고리즘을 통한 쌍방간 실시간 통신을 full-duplex 모드로 확인하였다.

Speech-Recognition Drone Camera System using OpenPose (OpenPose를 활용한 음성인식기반 드론제어 촬영시스템)

  • Cho, Yu-Jin;Kim, Se-Hyun;Kwon, Ye-Rim;Jung, Soon-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.1056-1059
    • /
    • 2020
  • 최근 드론과 1인 미디어 시장의 성장으로, 영상 촬영 분야에서의 드론 산업이 활발하게 발전되고 있다. 본 논문에서는 딥러닝 기반 다중 객체 인식 기술인 Openpose를 활용하여 인물촬영을 위한 음성인식 드론 제어 시스템을 제안한다. 해당 시스템은 자연어 처리된 음성명령어를 통해 드론이 각 촬영 객체에 대한 회전, 초점변화 등 실제 영상촬영기법에 사용되는 다수의 동작을 수행할 수 있도록 한다. 최종적으로 96.2%의 정확도로 음성명령에 따라 동작을 수행하는 것을 확인할 수 있다. 이는 누구나 전문적 지식이나 경험 없이 음성만으로 쉽게 드론을 제어할 수 있을 것으로 기대된다.

A Study on ROS based Control of Serving Robot Using Speech Recognition (음성인식을 이용한 ROS 기반 서빙 로봇 원격 제어 연구)

  • Kim, Byeong-Jun;Lee, Seo-Hyeon;Cho, Eun-Young;Park, Hae-Jun;Kwon, Nam Kyu
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.01a
    • /
    • pp.211-212
    • /
    • 2021
  • 본 논문에서는 싱글보드 컴퓨터 Jetson nano 기반 음성 라이브러리 Snowboy를 활용하여 음성인식 시스템을 구현하여 Turtlebot의 동작을 제어하였다. Turtlebot은 ROS(Robot Operating System) 기반으로 동작하며 ROS core를 통해 Jetson nano와 데이터전송이 가능하다. 사용자에 의해 실시간으로 Snowboy에 저장된 특정 음성을 인식하고 지정된 좌표로 변환한다. 변환된 좌표에 따라 Turtlebot이 지정된 위치로 이동한다. Lidar센서를 활용하여 장애물을 감지하고 다른 경로를 생성해 지정된 위치로 이동한다.

  • PDF

Drone controller using motion imagery brainwave and voice recognition (동작 상상뇌파와 음성인식을 이용한 드론 컨트롤러)

  • Park, Myeong-Chul;Oh, Dae-Sung;Han, JI-Hun;Oh, Hyo-Jun;Kim, Yu-Sin;Jeong, Jin-Yong;Park, Sang-Uk;Son, Yeong-Woong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.257-258
    • /
    • 2020
  • 기존의 드론 조작은 초보자에게 어려웠다. 초보자의 경우 드론을 조종하다가 드론이 추락하거나 장애물에 걸려 프로펠러 등의 부품들이 손상되는 경우를 빈번하게 마주한다. 본 연구에서는 초보자 또한 드론 파손의 걱정 없이 드론의 조작을 더욱 쉽게 개선시키는 것을 전제로 뇌파와 보조입력인 음성인식을 이용한 드론 컨트롤러 기술을 적용하고자 한다. 현재 대중적으로 출시되어 있는 드론의 경우 호버링 기능을 포함시켜 드론의 추락 위험을 줄여주는 기능을 탑재하고 있다. 하지만 속도가 빠른 드론의 조작에 있어 미숙한 초보자들은 장애물과의 충돌 그리고 드론 착륙 시 기체손상 등의 위험에 대비하기 힘들다. 본 논문은 이러한 문제점들을 개선하기 위해 기존의 드론 컨트롤러 대신 특정한 동작을 상상할 때 발현되는 동작상상뇌파와 음성입력을 적용한 '동작상상뇌파와 음성인식을 이용한 드론 컨트롤러' 기술을 제안한다. 기존의 드론 컨트롤러와는 다르게 빅 데이터 처리기술인 머신러닝을 이용하여 뇌파 데이터를 처리하고 그 데이터들과 입력되는 뇌파 값을 비교하여 드론을 제어한다. 또한 뇌파의 발현이 안정적이지 못하는 상황을 대비한 보조입력인 음성인식을 이용하여 드론의 기체손상을 최소화 시킬 수 있다.

  • PDF

A Proposal of Collaborating Bluetooth Basestation in Hot Spot Area with Its Performance Analysis (핫스팟지역에서 협동방식 블루투스기지국의 제안과 성능분석)

  • Kim, Dong-Won;Cho, Dong-Uk;Lyu, Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05b
    • /
    • pp.1369-1372
    • /
    • 2003
  • 가까운 장래에 싼 가격의 블루투스가 여러 가지 이동, 휴대 장치에 내장되어 다양한 응용서비스를 제공할 것이다. 본 논문에서는 공항이나 쇼핑몰 등 사람들이 많이 몰리는 공공장소와 같은 핫스팟(hot spot) 지역에서 블루투스 기지국을 통한 음성서비스 제공을 위하여 다수의 기지국을 유서 LAN으로 협동시켜 각각 기지국별로 따로 제공되던 음성 채널들을 집합화(aggregation) 함으로써 보다 많은 음성 서비스 채널들을 동시에 수용할 수 있는 방법을 제시하고 성능을 분석하였다. 단독으로 동작하는 기지국은 ACL채널을 사용하는 경우 7개까지의 채널 수용이 가능하므로 이상적인 경우에서도 오버랩 영역의 기지국의 개수가 n이면 7n 만큼 채널의 증가가 가능한 반면 협동으로 동작하면 블록킹 율도 개선되면서 집합화된 채널들을 보간(interpolation) 기법을 통한 통계적 사용으로 음성 패킷의 허용 손실 범위 내에서 음성채널의 수를 약 14n 정도까지 확장할 수 있다. 또한 음성전송과 데이터 전송이 혼합 서비스 될 때 수용하는 음성 채널의 수에 따른 데이터 전송지연시간 특성을 분석하였다.

  • PDF

A Multi-Channel Speech Surveillance System (다채널 음성 감시 시스템 개발)

  • 김성수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.442-445
    • /
    • 1998
  • TMS320C31 DSP를 사용하여 다채널 음성신호를 실시간으로 압축/저장 및 재생 시스템을 구현하였다. 각각의 전화선으로부터 입력되는 DAM성신호는 실시간으로 VSELP 음성 부호화 알고리즘을 이용하여 8Kbps 의 전송률로 압축된다 압축 음성 데이터는 host computer 로 전송되어 각각의 채널별로 HDD 나 MOD 같은 저장 장치에 저장되어진다. PC microsoft windows95 환경에서 동작하는 호스트프로그램은 압축 음성 데이터를 하드 디스크나 광자기 디스크에 저장하고, 저장된 압축 음성 데이터는쉽게 검색하여 재생이 가능하다.

  • PDF

A Study on the Voice/Data Integrated PRMA Protocol With the Minimum Reservation Slot Assured (최소 예약슬롯 보증 음성/데이타 집적 PRMA 프로토콜에 관한 연구)

  • 김태규;조동호;윤용중
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.18 no.2
    • /
    • pp.250-260
    • /
    • 1993
  • Packet Reservation Multiple Access(PRMA) protocol provides a very efficient mechanism for many number of voice and data terminals with bursty traffic characteristics to share efficiently a common transmission channel. This protocol, however, cannot operate in high load conditions. That is, there occurs a instability problem, since the reservation channel is allowed to shrink to zero. In this paper, a more stable PRMA protocol which can avoid such problems and integrates voice and data traffic efficiently is proposed. Also, the performance of the proposed protocol is analyzed by a computer simulation. According to the simulation results, it can be shown that the proposed protocol provides a more efficient mechanism for voice/data integration and ensures a more stable operation than conventional PRMA protocol in high load conditions.

  • PDF