• Title/Summary/Keyword: 음성 발달

Search Result 299, Processing Time 0.024 seconds

Design & Implementation of Audio Minute System (음성기반 회의록 시스템 설계 및 구현)

  • Pyo, Sang-Ho;Lee, Sang-Hoon
    • Annual Conference of KIPS
    • /
    • 2001.10a
    • /
    • pp.205-208
    • /
    • 2001
  • 인터넷과 컴퓨터 하드웨어 및 통신망의 발달로 멀티미디어 분야는 고도 정보 사회의 핵심적인 영역으로 부상되고 있으며, 멀티미디어 데이터에 대한 사용자의 요구도 날로 증가하고 있다. 문서, 녹취록, 테이프 형태로 관리되는 멀티미디어 데이터의 경우는 파일의 속성(attribute)에 대한 검색만이 아니라 내용(content)에 대한 검색이 필요하고, 따라서 순차검색 위주인 기존방법은 데이터의 활용 측면에서 문제가 있다. 본 논문에서는 멀티미디어 자료 중 음성 데이터를 저장 관리하는 방안으로 음성 데이터를 화면으로 도시하고 음성의 시작점과 끝점구간을 키로 하여 자동으로 데이터베이스에 삽입한 후 여기에 주석을 입력하는 음성기반 회의록 시스템(Audio Minute System)을 구현하고 그에 따른 기대효과를 제시한다.

  • PDF

Designing Voice Interface for The Disabled (장애인을 위한 음성 인터페이스 설계)

  • Choi, Dong-Wook;Lee, Ji-Hoon;Moon, Nammee
    • Annual Conference of KIPS
    • /
    • 2019.05a
    • /
    • pp.697-699
    • /
    • 2019
  • IT 기술의 발달에 따라 전자기기의 이용량은 증가하였지만, 시각장애인들이나 지체 장애인들이 이용하는 데에 어려움이 있다. 따라서 본 논문에서는 Google Cloud API를 활용하여 음성으로 프로그램을 제어할 수 있는 음성 인터페이스를 제안한다. Google Cloud에서 제공하는 STT(Speech To Text)와 TTS(Text To Speech) API를 이용하여 사용자의 음성을 인식하면 텍스트로 변환된 음성이 시스템을 통해 응용 프로그램을 제어할 수 있도록 설계한다. 이 시스템은 장애인들이 전자기기를 사용하는데 많은 편리함을 줄 것으로 예상하며 나아가 장애인들뿐 아니라 비장애인들도 활용 가능할 것으로 기대한다.

Postnatal Development of Echolocation Vocalizations in the Serotine Bat, Eptesicus serotinus (Chiroptera: Vespertilionidae) (문둥이박쥐(Eptesicus serotinus)의 생후 반향정위 발성 발달에 관한 연구)

  • Chung, Chul-Un;Han, Sang-Hoon;Kim, Sung-Chul;Lim, Chun-Woo;Cha, Jin-Yeol
    • Korean Journal of Environment and Ecology
    • /
    • v.29 no.6
    • /
    • pp.858-864
    • /
    • 2015
  • Developmental changes in the vocal signals of serotine bats (Eptesicus serotinus) during their infancy were examined in this study. The analysis was conducted on 4 infant serotine bats from 1 to 40 days after their birth. Pulse duration (PD), pulse interval (PI), peak frequency (PF), maximum frequency ($F_{MAX}$), minimum frequency ($F_{MIN}$), and bandwidth (BW) were measured. As the bats grew, their vocalizations became increasingly consistent and similar to those of adults. For infant bats, PD and PI decreased as they grew older, whereas PF, $F_{MAX}$, $F_{MIN}$, and BW increased. The greatest change in vocalizations was observed between the $10^{th}$ and $20^{th}$ days after birth. Also, PF, $F_{MAX}$, $F_{MIN}$ and BW, which describe sound frequency, increased dramatically during the period between the $10^{th}$ and the $20^{th}$ days. In contrast, the greatest change in PD occurred between the $30^{th}$ and $40^{th}$ days after birth. The results collected in this study suggest that frequency increased as the contraction ability of the muscles developed by around 20 days of age. Muscle relaxation ability, which is related to PD, was found to develop significantly at 30 to 40 days of age. According to the results of this study, although 40 day-old infant bats are not yet able to fly, their vocal signals were similar to those of adults. This indicates that vocal development and flying activity develop separately in young bats.

An Implementation of Speech DB Gathering System Using VoiceXML (VoiceXML을 이용한 음성 DB 수집 시스템 구현)

  • Kim Dong-Hyun;Roh Yong-Wan;Hong Kwang-Seok
    • Journal of Internet Computing and Services
    • /
    • v.6 no.1
    • /
    • pp.39-50
    • /
    • 2005
  • Speech DB is basically required factor when we are study for phonetics, speech recognition and speech synthesis and so on. The quantity and quality of speech DB decide the efficiency of system that we develop. therefore. speech DB has an extremely important factor, Recently, development of the various telephone service technique such as voice portal. it is actual condition where the necessity of collection of telephone speech DB. The existing IVR application telephone speech DB collection system used C/C++ language or the exclusive development tool. Thus it is the actual condition where the recycle of each application service for resources is difficult and have a problem of many labors and time necessity. But. VoiceXML is a language having tag form ipredicated in XML. which has easy and simple grammar system. Therefore, if we make a few efforts we could draw up easily. it has a merit reducing labors and time, Also, VoiceXML has many advantages of various telephone speech DB gathering because of changing contents of DB. In this paper, we introduce telephone speech DB gathering system which is the mast important factor for development of speech information processing technique.

  • PDF

A Study on Voice User Interface for Domestic Appliance (가전제품의 VUI 가이드라인에 대한 연구)

  • Chae, Haeng-Suk;Hong, Ji-Young;Lee, Ju-Hwan;Jeon, Myoung-Hoon;Kim, Min-Sun;Heo, U-Beom;Ahn, Jeong-Hee;Han, Kwang-Hee
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02b
    • /
    • pp.185-192
    • /
    • 2007
  • 음성 사용자 인터페이스(Voice User Interface, 이하 VUI) 는 음성을 매개로 일어나는 인간과 기계 간 인터페이스를 뜻한다. 음성 인식율의 향상과 음성 재생 장치의 발달에 힘입어 최근 들어 휴대폰과 카 네비게이션 시스템에 주로 적용되고 있다. 최근 이러한 경향은 A/V 시스템 등 가전제품(Domestic Appliance) 에도 확대되고 있는데 본 연구에서는 사용자와 필수적이고 빈번한 상호작용이 일어나는 백색 가전을 대상으로 사용자를 만족시키는 음성 인터페이스의 주요 속성 중 음성 생성(Speech Generation)과 관련된 음성 표현을 중점 연구하였다. 연구방법으로 먼저 주부들이 느끼는 가전에서의 문제점과 VUI 로서 해결가능성에 대하여 F.G.I. 를 통하여 조사하여 주요 이슈를 도출하고, 대표적 백색 가전인 에어컨, 세탁기, 김치냉장고, 냉장고, 식기세척기, 오븐레인지 등 6개 제품에 대하여 음성의 물리적 특성, 내용적 특성, 기능에 따른 배치에 대하여 조건에 따라 다양한 프로토타입을 제작한 후 실제 환경과 유사한 실험실 상황에서 사용자의 선호도, 적합도 및 수행을 측정하였다. 연구 결과 각 이슈에 따라 가전제품에 적합한 VUI 가이드라인 특성을 찾아내었다.

  • PDF

A Study on the Effective Command Delivery of Commanders Using Speech Recognition Technology (국방 분야에서 전장 소음 환경 하에 음성 인식 기술 연구)

  • Yeong-hoon Kim;Hyun Kwon
    • Convergence Security Journal
    • /
    • v.24 no.2
    • /
    • pp.161-165
    • /
    • 2024
  • Recently, speech recognition models have been advancing, accompanied by the development of various speech processing technologies to obtain high-quality data. In the defense sector, efforts are being made to integrate technologies that effectively remove noise from speech data in noisy battlefield situations and enable efficient speech recognition. This paper proposes a method for effective speech recognition in the midst of diverse noise in a battlefield scenario, allowing commanders to convey orders. The proposed method involves noise removal from noisy speech followed by text conversion using OpenAI's Whisper model. Experimental results show that the proposed method reduces the Character Error Rate (CER) by 6.17% compared to the existing method that does not remove noise. Additionally, potential applications of the proposed method in the defense are discussed.

The Study for Correlation Among Auditory Development and Language Development of Children with Hearing Impairment (청각장애 아동의 청능발달과 언어발달간의 상관관계 연구)

  • Park, Sang-Hee;Kwon, Young-Ju
    • Speech Sciences
    • /
    • v.10 no.4
    • /
    • pp.255-261
    • /
    • 2003
  • The purpose of this study was to investigate correlation of auditory development and language development of children with hearing impairment Eighteen subjects with severe or profound hearing loss participated in this study. They were 22-to 55-month-olds who had hearing parents with no additional disabling conditions. The test material was the Meaningful Auditory Integration Scale (MAIS) and MacArthur Communicative Development Inventory-Korea (MCDI-K). A Pearson Correlation Coefficient was determined through a statistical analysis. The results followed as; firstly there was a strong correlation between auditory development and receptive language development. Secondly, there was a strong correlation between receptive language development and expressive language development. Finally, there was a strong correlation between auditory development and education onset time. Therefore, auditory training is important method for auditory rehabilitation and education onset time is important variation for auditory development.

  • PDF

SINABULO: pronunciation correction program to improve delayed speech development (시나브로: 언어발달지연 개선을 위한 발음 교정 프로그램)

  • Chaerin Kang;Yeonghyeon Lee;Min Gyo Chung
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.757-758
    • /
    • 2023
  • 시나브로는 언어발달지연 개선을 목적으로 발음을 교정하는 프로그램이다. TTS·STT API 를 사용하여 단어의 표준 발음을 음성 자료로 게시하고, 연습 후 사용자가 녹음한 음성에 대해 텍스트 및 시각 자료를 제공한다. 이를 통해 사용자는 자신의 발화 발음에 대해 객관적으로 피드백을 받아들일 수 있다. 시나브로는 전문기관 방문을 동반하는 일반적인 치료 방식과 달리, 온라인 기반 웹 서비스로 제작되어 공간, 시간, 비용 등의 제약을 극복하며 높은 접근성을 제공한다.

인터넷을 통한 멀티미디어 의료 정보 전달

  • 김경섭;윤태호;송철규
    • 전기의세계
    • /
    • v.53 no.4
    • /
    • pp.59-61
    • /
    • 2004
  • 컴퓨터 기술의 발전과 데이터 압축 및 전송 기술의 발달로 인하여, 인터넷을 통하여 실시간으로 전송된 음성, 비디오, 생체 신호, 문자, 처방, 의료 영상 등으로 이루어진 멀티미디어 의료 정보가 임상 진료, 의학 연구 및 교육에 활용되고 있다.(중략)

  • PDF

상후두운동과 경부외후두근의 근전도검사에 관한 연구

  • An, Chul-Min;Jang, Hoon
    • Proceedings of the KSLP Conference
    • /
    • 1997.11a
    • /
    • pp.265-265
    • /
    • 1997
  • 음성이란 성대내근과 성대외근의 운동에 의해 진성대에서 규칙적이고 조화로운 진동이 이루어져 나타나는 것으로, 이러한 운동 등에 이상이 생기거나 진성대에 기질적인 변화가 왔을 때 음성이 변하게 된다. 그러나 이런 환자들의 진단을 위하여 후두소견을 관찰해 보면 진성대 뿐만 아니라, 상후두에서도 여러 가지 양상의 다른 움직임을 확인할 수가 있는데, 상후두는 진성대와는 달리 특별한 자체를 움직일 만한 근육들이 발달되어 있지 않은 구조물임에도 불구하고 여러 다른 발성에 따라 다양한 움직임을 나타내게 된다. 이러한 것들은 진성대와 연결되어 있는 성대내근이나 후두의 외부에 붙어있는 성대외근의 영향에 의해 나타날 수가 있다고 생각이 되고, 이러한 것들은 일차적으로 또는 이차적으로 성대의 진동에 영향을 줄 수 있을 것으로 생각된다. 이에 저자들은 발성시 상후두의 움직임과 성대외근과의 관계를 확인하기 위하여 상후두의 움직임을 여러 가지 모양으로 만들도록 훈련한 후 스트로보스 3102;을 이용하여 상후두의 움직임을 확인하면서, 각각의 경우에 따라 근육의 수축정도를 비교할 수 있고 비침습적인 표면전극을 이용한 근전도 검사를 시행하여 이들에 관한 연구를 하였다.다.

  • PDF