• 제목/요약/키워드: Voice function

검색결과 434건 처리시간 0.034초

한국어 음성합성기의 실시간 구현에 관한 연구 (Real Time Implementation of a Korean Speech Synthesizer)

  • 임광일;이규태;조철우;이우선;신인철;이태원
    • 대한전자공학회논문지
    • /
    • 제25권2호
    • /
    • pp.176-181
    • /
    • 1988
  • In this paper, the LPC speech synthesizer with Multipulsse excitation is implemented using general-purpose DSP \ulcornerD7720. As the driving function for synthesis filter is used in the amplitude and position of pulse, the Voice/Unvoice decision and pitch period detectioncan be excluded. The synthesizer is implemented with DSP device which is operated on the interrupt mehtod with main computer and on the DMA mehtod with D/A converter. The comparision of synthetic and original waveform, alogn with the listening test, proves the validity of this system.

  • PDF

효율적인 탐색과 브라우징을 지원하는 하이퍼미디어 시스템의 사용자 인터페이스 설계 (User-interface design of a hypermedia system for effective searching and browsing)

  • 고영곤;최윤철
    • 대한인간공학회지
    • /
    • 제12권1호
    • /
    • pp.75-86
    • /
    • 1993
  • Hypermedia systems allow the retrieval and representation of multimedia in- formation such as text, graphics, image and voice/sound using navigation and browsing mechanisms. In this study we developed a hypermedia system which provides hierarchical group, local map and cluster view for effective navigation in hyperspace. The system also supports hot link, reference link, move-to link and multiple link to browse the multimedia information space effectively. This system has been designed to integrate the navigation, browsing and searching function of the hypermedia system in hyman factor perspective and provides the user-friendly user interface mechanism.

  • PDF

머리 전달 함수를 이용한 합성 스테레오 음향 반향 제거기 (Acoustic Echo Canceller for Synthetic Stereo Using HRTF)

  • 박장식;백주순;손경식
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.149-153
    • /
    • 2002
  • In this brief, Acoustic echo cancellation scheme is proposed to enhance the presence of multiple participants of hands-free voice and video conference. Synthetic stereo using head related transfer function and the stereo echo cancellation scheme are proposed. It is shown that the proposed synthetic stereo echo cancellation scheme is well performed by computer simulation.

  • PDF

안드로이드 기반의 블루투스 디바이스 응용 설계 및 구현 (The Android-based Bluetooth Device Application Design and Implementation)

  • 조효성;이혁준
    • 한국ITS학회 논문지
    • /
    • 제11권1호
    • /
    • pp.72-85
    • /
    • 2012
  • 현재, 차량 내에서 사용하는 대부분의 블루투스 핸즈프리 디바이스는 음성 통화, 발신자 식별번호 표시 및 SMS 메시지 표시 등의 전화 서비스 기능을 제공하고 있지만 인터넷 기반의 텍스트 데이터 디스플레이 기능은 지원하지 않고 있다. 최근 들어 차량에서도 SNS와 같은 인터넷 서비스 이용에 대한 요구가 증가하고 있어, 기존의 핸즈프리 기능 이외에도 인터넷 기반의 텍스트 데이터를 표시하는 기능의 개발이 필요하다. 제안하는 블루투스 디바이스 응용은 SNS 메시지 및 이메일 도착 알림 표시 등의 향상된 기능을 포함하며, 구현 플랫폼으로는 대부분의 SNS 응용 프로그램의 동작이 가능하고 소형 임베디드 디바이스에 탑재가 용이한 안드로이드 플랫폼을 사용한다. 제안하는 블루투스 디바이스와 연결되는 스마트폰 또는 태블릿 PC 역시 안드로이드 플랫폼 기반의 단말기이며, 단말 탑재 기능 모듈인 오디오-텍스트 게이트웨이는 안드로이드 앱 형태로 설계된다. 오디오-텍스트 게이트웨이 앱은 SNS 텍스트 데이터 수신시, 메시지 헤더 정보에서 제목, 발신자 정보 등을 추출하여 텍스트 데이터 형태로 ACL(Asynchronous Connection-Oriented) 링크를 통해 블루투스 디바이스로 전송하여 화면에 표시되도록 한다. 일반적으로 안드로이드 플랫폼에 탑재된 블루투스 핸즈프리 또는 헤드셋 프로파일은 오디오 게이트웨이의 기능만을 포함하고 있기 때문에 안드로이드 기반의 블루투스 디바이스에서는 음성 데이터의 스피커 출력이 불가능하다. 따라서 제안하는 블루투스 디바이스 응용은 블루투스 헤드셋 프로파일에서 일반적으로 사용되는 SCO(Synchronous Connection-Oriented) 링크를 통한 음성 데이터 전송 방식 대신에 ACL 링크를 통한 스트리밍 방식을 적용한다.

스마트폰 음성녹음 파일 구조 및 메타데이터의 위변조 기법에 관한 연구 (A Study on Forgery Techniques of Smartphone Voice Recording File Structure and Metadata)

  • 박재완;곽원준;이상현
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.807-812
    • /
    • 2022
  • 최근 음성녹음 파일도 법정 증거로 제출되는 수가 늘어남에 따라 위변조를 주장하는 사례도 증가하고 있다. 객관적 근거인 음성녹음 파일 구조 및 메타데이터를 완벽하게 위변조 할 경우에는 정교한 음성녹음 파일의 위변조 검출은 사실상 불가능하다. 위변조된 음성녹음 파일을 가지고 수행된 파일 구조 및 메타데이터 분석이 법정에서 거부되는 것은 쉽지 않다. 본 연구는 음성녹음 파일 구조 및 메타데이터의 위변조가 손쉽게 가능하다는 것을 증명하는 것을 목적으로 한다. 이를 위해 본 연구에서는 음성녹음 파일의 편집 방법의 유형화를 기반으로 정교한 편집이 가능한 '혼합붙여넣기' 기능을 적용할 경우 위변조 검출의 불가능함을 소개했다. 더욱이 실험을 통해 파일 구조 및 메타데이터의 위변조가 가능하다는 것을 증명했다. 따라서 음성녹음 파일이 디지털 증거로 채택됨에 있어서 더 엄격한 증거능력 판단 기준이 필요하다. 본 연구는 법관이 디지털 증거를 채택함에 무결성의 기준에 공헌할 뿐만 아니라 향후 개발될 것으로 예상되는 녹음파일 위변조 검출 인공지능을 위한 데이터셋 구축 방법에 공헌할 것이다.

성대 결절 및 폴립 병변 판별 예측모형에 대한 연구 (A Study of the Lesional Grade Discrimination Model for Vocal Fold Nodules and Polyps)

  • 박수정;심현섭;정성민;김한수;박애경
    • 대한후두음성언어의학회지
    • /
    • 제15권2호
    • /
    • pp.112-117
    • /
    • 2004
  • Background and Objectives : This study is purposed to investigate the statistically significant discrimination model for predicting vocal fold nodule and polyp's lesional grade, with patients' background data and objective voice evaluation parameters. Materials and Method : The retrospective research was carried out at the Ewha Womans University Hospital. 122 patients' voice examination data had been selected, and lesion screening (Grade I, II, and III) was conducted by 2 ENT specialists, with each patient's vocal fold pictures achieved during the laryngoscopy examination. Results : The Lesional Grade Discrimination Model with which the lesional grade of vocal fold nodules and polyps could be predicted was derived by the ordinal logistic regression analysis (using SPSS 10.0). With this model the lesional grades of 73 out of 122 patients(59.8%) were correctly predicted to their formerly screened ones. Conclusion : This model applied the multivariate approach, which statistically combined these currently used parameters, Jitter, Shimmer, MFR, MPT, and patient's background data such as gender and dysphonia period. It might explain the status of benign lesion of vocal folds, and furthermore expect the physiological function of vocal folds.

  • PDF

H.323과 SIP간의 상호 연동을 위한 호 설정과 메시지 매핑에 관한 연구 (A Study on the Call-Setup and Message Mapping for Interworking between H.323 and SIP)

  • 김정석;태원귀;김정호;반진양
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권9호
    • /
    • pp.1017-1024
    • /
    • 2004
  • 본 연구에서는 H.323과 SIP사이의 IWF(Inter-Working Function)을 위한 개선된 상호 연동방식을 제안하고, 개선된 특성을 해석한다. 인터넷을 통해 음성 서비스를 가능하게 해주는 VoIP(Voice over Internet Protocol)기술은 기존의 전화망에 비해 저렴한 가격에 장거리 전화를 이용할 수 있으며, 기존의 인터넷에서 사용 가능한 다양한 멀티미디어 서비스를 쉽게 수용할 수 있다. 이전의 VoIP 접속관리 방식은 H.323 프로토콜을 사용하였으나, 연결 설정의 복잡함으로 인해 최근에는 SIP-Working Group에서 제안한 SIP(Session Initiation Protocol) 프로토콜이 사용되고 있다. 따라서 H.323가 SIP의 서로 다른 프로토콜을 사용한 제품군 사이의 연동을 위한 방법론이 필요하게 되었다. 이에 본 연구에서는 H.323과 SIP 프로토콜간의 상호 연동의 불필요한 패킷 지연의 호 설정과 메시지 변환의 개선된 특성을 해석한다.

  • PDF

A Multi-Service MAC Protocol in a Multi-Channel CSMA/CA for IEEE 802.11 Networks

  • Ben-Othman, Jalel;Castel, Hind;Mokdad, Lynda
    • Journal of Communications and Networks
    • /
    • 제10권3호
    • /
    • pp.287-296
    • /
    • 2008
  • The IEEE 802.11 wireless standard uses the carrier sense multiple access with collision avoidance (CSMA/CA) as its MAC protocol (during the distributed coordination function period). This protocol is an adaptation of the CSMA/CD of the wired networks. CSMA/CA mechanism cannot guarantee quality of service (QoS) required by the application because orits random access method. In this study, we propose a new MAC protocol that considers different types of traffic (e.g., voice and data) and for each traffic type different priority levels are assigned. To improve the QoS of IEEE 802.11 MAC protocols over a multi-channel CSMA/CA, we have developed a new admission policy for both voice and data traffics. This protocol can be performed in direct sequence spread spectrum (DSSS) or frequency hopping spread spectrum (FHSS). For voice traffic we reserve a channel, while for data traffic the access is random using a CSMA/CA mechanism, and in this case a selective reject and push-out mechanism is added to meet the quality of service required by data traffic. To study the performance of the proposed protocol and to show the benefits of our design, a mathematical model is built based on Markov chains. The system could be represented by a Markov chain which is difficult to solve as the state-space is too large. This is due to the resource management and user mobility. Thus, we propose to build an aggregated Markov chain with a smaller state-space that allows performance measures to be computed easily. We have used stochastic comparisons of Markov chains to prove that the proposed access protocol (with selective reject and push-out mechanisms) gives less loss rates of high priority connections (data and voices) than the traditional one (without admission policy and selective reject and push-out mechanisms). We give numerical results to confirm mathematical proofs.

서버 기반 웹 리더 kWebAnywhere의 설계 및 구현 (Design and Implementation of Server-Based Web Reader kWebAnywhere)

  • 윤영선
    • 말소리와 음성과학
    • /
    • 제5권4호
    • /
    • pp.217-225
    • /
    • 2013
  • This paper describes the design and implementation of the kWebAnywhere system based on WebAnywhere, which assists people with severely diminished eye sight and the blind people to access Internet information through Web interfaces. The WebAnywhere is a server-based web reader which reads aloud the web contents using TTS(text-to-speech) technology on the Internet without installing any software on the client's system. The system can be used in general web browsers using a built-in audio function, for blind users who are unable to afford to use a screen reader and for web developers to design web accessibility. However, the WebAnywhere is limited to supporting only a single language and cannot be applied to Korean web contents directly. Thus, in this paper, we modified the WebAnywhere to serve multiple language contents written in both English and Korean texts. The modified WebAnywhere system is called kWebAnywhere to differentiate it with the original system. The kWebAnywhere system is modified to support the Korean TTS system, VoiceText$^{TM}$, and to include user interface to control the parameters of the TTS system. Because the VoiceText$^{TM}$ system does not support the Festival API used in the WebAnywhere, we developed the Festival Wrapper to transform the VoiceText$^{TM}$'s private APIs to the Festival APIs in order to communicate with the WebAnywhere engine. We expect that the developed system can help people with severely diminished eye sight and the blind people to access the internet contents easily.

성대마비와 성대구증의 강도 변화에 따른 최대발성지속시간 비교 (Comparison of Maximum Phonation Time Associated with the Changes in Vocal Intensity in Patients with Unilateral Vocal Fold Palsy and Sulcus Vocalis)

  • 최세진;최홍식;김재옥;최예린
    • 말소리와 음성과학
    • /
    • 제4권1호
    • /
    • pp.125-131
    • /
    • 2012
  • The patients with incomplete glottic closure have an important feature decreasing the maximum phonation time (MPT) because airflow rate or air leakage is greater than people without voice disorders. Also they can appear a problem in the intensity regulation. This study analyzed MPT difference based on the comfortable intensity and louder intensity and the correlation between MPT and respiration volume of unilateral vocal fold palsy (UVFP) and sulcus vocalis (SV) group. The twenty with UVFP, the 21 with SV, the 21 normal subjects measured MPT in /a/ vowel prolongation task with comfortable intensity and louder intensity and compared analysis by measuring FVC, $FEV_1$, $FEV_1/FVC$ to analyze the correlation between MPT and respiration volume. First, a comparison of MPT according to the intensity between groups is that MPT of the normal group was statistically significant long compared to the patient group in comfortable intensity, but MPT between groups was not statistically significant difference in the louder intensity. Second, an analysis of the correlation between MPT and respiration volume is that this was statistically significant correlation between MPT in comfortable intensity and MPT in louder intensity. But this did not show statistically significant correlation between intensity and respiration volume. This study can be supported the preceding study results deduced that shorting MPT of the patient group compared to the normal group was originated in the problem of laryngeal valving mechanism at the level of vocal folds rather than a problem of respiratory function. Also at the phonation by varying the intensity, the result can deduce that in the case of patient group, the length of MPT had been improved by increasing the glottal closure ratio in the louder intensity. These results can support the theoretical basis that should be applied to the clinicians by varying the intensity at the voice evaluation and voice therapy for the patients with the glottis incompetence.