• 제목/요약/키워드: voice quality features

검색결과 42건 처리시간 0.025초

Car Parking Lot 모니터링 시스템 (Monitoring System with PLC I/O for Car Parking Lot)

  • 이성재;김재양
    • 한국전기전자재료학회:학술대회논문집
    • /
    • 한국전기전자재료학회 2007년도 하계학술대회 논문집 Vol.8
    • /
    • pp.511-512
    • /
    • 2007
  • The monitoring system has won acceptance as a premium mark that identifies the highest standard of product quality in advanced industry. The TOP features with multi-I/O ports and VGA & RCA TV-out ports supporting mirroring & multiple dual-display modes by windows 0/5. With the choice of versatile stands, panel mount, or VESA wall-mount swing arm and connecting to modem. Wireless keyboard, Customer Display and Card Reader, is your idea Panel system for the application of TOP(Touch Operation Pannel), KIOSK, or Office / Factory Automation. TOP is the hardware and software product that transacts all kind of functions for advanced technology equipment to button, switch, voice and graph etc so that let consumer use easily Industrial HMI System Touch Panel. System characteristics: Easy of use and flexibility to the user, Present a high value solution and advanced function for many Application, Factory Automation, Office Automation, Building Automation System, Information Service System, etc. Analog Touch - 2MB Flash Memory for Saving Screen Data - RS-232C/422 Serial Port - Multi Language Support.

  • PDF

노인성 후두의 조직병리학적, 생리학적 특성 (Histopathologic and Physiologic Features of the Aging Larynx)

  • 박일석
    • 대한후두음성언어의학회지
    • /
    • 제25권1호
    • /
    • pp.20-23
    • /
    • 2014
  • Age-related changes in larynx can have a direct impact on voice quality and general comfort level. Observations of vocal aging have spanned perceptual, acoustic, aerodynamic, physical, electromyographic (EMG) and histological levels. Evidence of differential vocal aging in relation to gender and physical condition has been reported. Perceptual, acoustic, aerodynamic, kinematic, EMG and histological data document age-related changes in laryngeal structure and function with advancing age. These changes contribute to a functional age-related impact of vocal hypofunction or compensatory hyperfunction. This review will focus on the current understanding of the clinical and cellular changes in the larynx that lead to presbyphonia.

  • PDF

광역 스펙트로그램과 심층신경망에 기반한 중첩된 소리의 인식과 영향 분석 (Recognition of Overlapped Sound and Influence Analysis Based on Wideband Spectrogram and Deep Neural Networks)

  • 김영언;박구만
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.421-430
    • /
    • 2018
  • 많은 음성인식 시스템들은 MFCC와 HMM등의 분류 기법을 사용하여 사람의 음성을 인식한다. 그러나 이러한 음성인식 시스템은 단일 음성신호를 인식하는 것을 목적으로 설계되어, 인간과 기계사이의 일대일 음성 인식에는 적합하나, 애완동물 소리와 실내 소리같은 음성보다 다양하고 넓은 주파수의 소리 군으로 중첩된 음향 속에서 설정된 소리를 인식하기에는 제한이 있다. 중첩된 소리들의 주파수는 사람의 목소리보다 높은 최대 20 kHz까지 넓은 주파수 범위로 구성된다. 본 논문에서는 광역 사운드 스펙트로그램과 DNN에 기반한 케라스 시?셜 모델 기법을 활용하여 인지 주파수 범위를 넓게 확대하는 새로운 인식방법을 제안한다. 광역 사운드 스펙트로그램이 본 논문에서 설계된 특징 추출 및 분류 시스템과 같이 넓은 주파수 범위의 다양한 소리를 분석하고 실험하도록 채택되었다. 소리 인식률을 개선하기 위하여, 케라스 시?셜 모델이 사운드 스펙트로그램에 의하여 생성되어 추출된 특징을 사용하여 패턴인식을 수행하기 위한 방법으로 채용되었다. 제안된 특징 추출 및 분류 시스템이 광역 사운드 스펙트로그램과 케라스 시?셜 모델을 채용하여 애완동물 소리와 실내 소리같은 다양한 주파수들로 구성되어 중첩된 음향 속에서 설정된 소리를 우수하게 분류하는 것을 확인하였다. 그리고 중첩된 소리의 크기에 비례하여 인식에 미치는 특성과 영향을 단계별로 비교 분석하였다.

실용음악전공학생과 일반남학생의 흡연여부에 따른 호흡과 발성 특성 비교 (Characteristics of respiration and phonation depending on smoking or non smoking by practical musicology students and general male students)

  • 김은혜;최홍식;임성은;최예린
    • 말소리와 음성과학
    • /
    • 제6권3호
    • /
    • pp.49-56
    • /
    • 2014
  • This research compared the features of respiration and phonation between practical musicology students and general male students, according to their smoking status. Participants of this research are 15 practical musicology male students attending ${\bigcirc}{\bigcirc}$ university and 16 general ${\bigcirc}{\bigcirc}{\bigcirc}$ university students. The participants, both non-smokers and smokers with 5-years of smoking history have no history of voice disease in any case and have normal cognitive functions. The results indicated that, first, there is not a notable difference in the respiratory activity status(FVC, FEV1, FEV1/FVC), regardless of major and smoking status. In MPT, even though there is no significant difference in accordance with their majors, considering smoking status, the smoker group was shorter than non-smoker group significant difference statistically (p<.01). Second, the divisions of participants' major did not show significant difference in Fo, jitter, shimmer, and NHR in the vowel prolongation task. However, the smoker group showed a significantly higher degree of jitter and shimmer than the non-smoker group (p<.05) as Fo and NHR shows no difference. In the case of VRP, maximum frequency and frequency range of the practical group are significantly higher than normal group statistically (p<.001). Moreover, although the difference of the minimum frequency shown at the statistic is not significant, practical group showed a higher tendency of frequency than normal group (p=.051). In conclusion, even though there is no difference in respiratory activity between the smoker group and non-smoker group, the MPT of the smoker group is shorter than that of non-smoker group. In addition, the smoker group showed a higher degree of jitter and shimmer than the non-smoker group. MPT is related to the valve action of vocal fold that passes through the glottis. Thus, it is interpreted that the smoker group has a lower quality of voice and valve action of the vocal fold. Also, the practical group has a higher degree of maximum frequency and frequency range than the normal group. This research can function as basic data for vocal characteristics for the majors in relation to the voice-specializing.

A Study on the Syntagma & Paradigm by Repetition, Variation and Contrast in Ads

  • Choi, Seong-hoon
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권9호
    • /
    • pp.1-12
    • /
    • 2017
  • This study is the academic work to explore the potential meanings of print advertisements. Linguistic features such as repetition, variation, contrast and phonological structure in the verbal texts of ads can give rise to shades-of-meaning or slight variations in advertising. The language of advertising is not only language in words. It is also a language in images, colors, and pictures. Pictures and words combine to form the advertisement's visual text.. While the words are very important in delivering the sales message, the visual text cannot be ignored in advertisements. Forming part of the visual text is the paralanguage of the ad. Paralanguage is the meaningful behaviour accompanying language, such as voice quality, gestures, facial expressions and touch in speech, and choice of typeface and letter sizes in writing. Foregrounding is the throwing into relief of the linguistic sign against the background of the norms of ordinary language. This paper focuses its discussion on the advertisements within the framework of the paradigmatic and the syntagmatic relationship. The sources of ads have been confined to Malboro. The ads were reselected based on purposive sampling methods.

RawNet3를 통해 추출한 화자 특성 기반 원샷 다화자 음성합성 시스템 (One-shot multi-speaker text-to-speech using RawNet3 speaker representation)

  • 한소희;엄지섭;김회린
    • 말소리와 음성과학
    • /
    • 제16권1호
    • /
    • pp.67-76
    • /
    • 2024
  • 최근 음성합성(text-to-speech, TTS) 기술의 발전은 합성음의 음질을 크게 향상하였으며, 사람의 음성에 가까운 합성음을 생성할 수 있는 수준에 이르렀다. 특히, 다양한 음성 특성과 개인화된 음성을 제공하는 TTS 모델은 AI(artificial intelligence) 튜터, 광고, 비디오 더빙과 같은 분야에서 널리 활용되고 있다. 따라서 본 논문은 훈련 중 보지 않은 화자의 발화를 사용하여 음성을 합성함으로써 음향적 다양성을 보장하고 개인화된 음성을 제공하는 원샷 다화자 음성합성 시스템을 제안했다. 이 제안 모델은 FastSpeech2 음향 모델과 HiFi-GAN 보코더로 구성된 TTS 모델에 RawNet3 기반 화자 인코더를 결합한 구조이다. 화자 인코더는 목표 음성에서 화자의 음색이 담긴 임베딩을 추출하는 역할을 한다. 본 논문에서는 영어 원샷 다화자 음성합성 모델뿐만 아니라 한국어 원샷 다화자 음성합성 모델도 구현하였다. 제안한 모델로 합성한 음성의 자연성과 화자 유사도를 평가하기 위해 객관적인 평가 지표와 주관적인 평가 지표를 사용하였다. 주관적 평가에서, 제안한 한국어 원샷 다화자 음성합성 모델의 NMOS(naturalness mean opinion score)는 3.36점이고 SMOS(similarity MOS)는 3.16점이었다. 객관적 평가에서, 제안한 영어 원샷 다화자 음성합성 모델과 한국어 원샷 다화자 음성합성 모델의 P-MOS(prediction MOS)는 각각 2.54점과 3.74점이었다. 이러한 결과는 제안 모델이 화자 유사도와 자연성 두 측면 모두에서 비교 모델들보다 성능이 향상되었음을 의미한다.

Normative-Legal and Information Security of Socio-Political Processes in Ukraine: a Comparative Aspect

  • Goshovska, Valentyna;Danylenko, Lydiia;Chukhrai, Ihor;Chukhrai, Nataliia;Kononenko, Pavlo
    • International Journal of Computer Science & Network Security
    • /
    • 제22권10호
    • /
    • pp.57-66
    • /
    • 2022
  • The aim of the article is to investigate socio-political processes in Ukraine on the basis of institutional and behavioral approaches, in particular their regulatory and informational support. Methodology. To determine the nature and content of sociopolitical processes, the following approaches have been used: 1. Institutional approach in order to analyze the development of Ukraine's political institutions. 2. The behavioral approach has been used for the analysis of socio-political processes in Ukraine in the context of political behavior of citizens, their political activity which forms the political culture of the country. Results. The general features of the socio-political situation in Ukraine are as follows: the formed model of government, which can be conditionally described as "presidential"; public demand for new leaders remains at a high level; the society has no common vision of further development; significant tendency of reduction of real incomes of a significant part of the society and strengthening of fiscal pressure on businessmen will get a public response after some time. Increasing levels of voice, accountability, efficiency of governance and the quality of the regulatory environment indicate a slow change in the political system, which will have a positive impact on public sentiment in the future. At the same time, there has been little change in the quality of Ukraine's institutions to ensure political stability, the rule of law and control of corruption. There are no cardinal changes in the development of the institution of property rights, protection of intellectual rights, changes in the sphere of ethics and control of corruption. Thus, Ukraine's political institutions have not been able to bring about any change in the social-political processes. Accordingly, an average level of trust and confidence of citizens in political institutions and negative public sentiment regarding their perception and future change can be traced in Ukraine.

한국어 동시조음 모델에 기반한 스피치 애니메이션 생성 (Speech Animation Synthesis based on a Korean Co-articulation Model)

  • 장민정;정선진;노준용
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제26권3호
    • /
    • pp.49-59
    • /
    • 2020
  • 본 논문에서는 규칙 기반의 동시조음 모델을 통해 한국어에 특화된 스피치 애니메이션을 생성하는 모델을 제안한다. 음성에 대응되는 입 모양 애니메이션을 생성하는 기술은 영어를 중심으로 많은 연구가 진행되어 왔으며, 자연스럽고 사실적인 모션이 필요한 영화, 애니메이션, 게임 등의 문화산업 전반에 널리 활용된다. 그러나 많은 국내 콘텐츠의 경우, 스피치 애니메이션을 생략하거나 음성과 상관없이 단순 반복 재생한 뒤 성우가 더빙하는 형태로 시각적으로 매우 부자연스러운 결과를 보여준다. 또한, 한국어에 특화된 모델이 아닌 언어 비의존적 연구는 아직 국내 콘텐츠 제작에 활용될 정도의 퀄리티를 보장하지 못한다. 따라서 본 논문은 음성과 텍스트를 입력받아 한국어의 언어학적 특성을 반영한 자연스러운 스피치 애니메이션 생성 기술을 제안하고자 한다. 한국어에서 입 모양은 대부분 모음에 의해 결정된다는 특성을 반영하여 입술과 혀를 분리한 동시조음 모델을 정의해 기존의 입술 모양에 왜곡이 발생하거나 일부 음소의 특성이 누락되는 문제를 해결하였으며, 더 나아가 운율적 요소에 따른 차이를 반영하여 보다 역동적인 스피치 애니메이션 생성이 가능하다. 제안된 모델은 유저 스터디를 통해 자연스러운 스피치 애니메이션을 생성함을 검증하였으며, 향후 국내 문화산업 발전에 크게 기여할 것으로 기대된다.

스마트 디바이스 기반 수업분석 프로그램 설계 및 구현 -한국어 특성 반영과 교사활용도 증진을 위한 UI설계를 적용하여- (Design and Implementation of Smart Device Application for Instructional Analysis)

  • 강두봉;정주훈;김영환
    • 컴퓨터교육학회논문지
    • /
    • 제18권4호
    • /
    • pp.31-40
    • /
    • 2015
  • 본 연구의 목적은 수업 개선을 위한 수업분석 프로그램을 스마트 디바이스 기반의 어플리케이션으로 설계 및 구현한 데 있다. 이를 위해 사용자 인터페이스(UI)를 간소화하고, 서술어가 뒤에 나오는 한국어 특성을 감안하였으며, 입체적 분석을 위해 Flanders의 '언어상호작용 분석법', Tuckman의 '수업분위기 분석법', Mcgraw의 '과업집중 분석법'의 3가지 방법을 통한 분석이 가능하게 설계하였다. 본 연구는 선행 연구들과 달리 위 3가지 특징을 적용하여 교사들이 손쉽게 스스로 자신의 수업을 분석할 수 있는 앱을 개발했다는데 의의가 있으며, 일선 교사들은 다른 교사의 도움이나 전문적 지식 없이도 수업을 분석하고 피드백 할 수 있어 자발적 수업개선에 도움이 될 수 있을 것이다. 향후, 최근의 수업 환경에 맞는 수업분석 기법 및 음성인식 시스템 등의 연구와 연계하여 수업분석 원리의 정립과 관련 어플리케이션의 개발에 기초가 될 수 있을 것이다.

Rediscovering A Path to Aging in Place: Development of Housing Cooperatives for Rural Elderly

  • Lee, Hyun-Jeong
    • Architectural research
    • /
    • 제13권3호
    • /
    • pp.31-40
    • /
    • 2011
  • Profit-keeping behaviors naturally occur in the market to satisfy consumers, and the logic behind it lies in the economies of scale. On the flip side, some commodities transacted in the market are not available or can not be easily acquired unless the demand is high enough. Under this proposition, some consumers rise and find their own solution to meet the services at a reasonable cost or at an adequate level. The commonly adopted way is to establish a cooperative, and it stirs purchasing power by pooling resources and further bargains price and service quality. As a consumer cooperative, housing cooperatives notably found in rural towns enable the elderly to continue independent living. This study is to take a closer look at residential life of the rural elderly in housing cooperatives. Utilizing in-depth focus group interviews with 40 residents in four housing cooperatives, this qualitative research draws main factors affecting the decision to move in, residential assessment, and strengths and weakness of living in a housing cooperative. The primary factor influencing the moving decision is to continue to independent living in a familiar community, and the bottom line is planning ahead. Frailty and bereavement are found to be the leading occasions for them to move. The participants are satisfied with the independent living arrangement, and particularly, cited such features as safety and security, elderly-friendly design, common spaces, freedom, social activities and efficient living. Also, it is stated that some cooperative natures such as control over the property and giving a voice on management render positive impacts on the satisfaction with communal living. In spite of all the benefits and strengths, participants face with a public notion that an independent living arrangement like a housing cooperative has never done before in rural towns, so that most people recognize it as part of dependent living arrangements like nursing home.