• 제목/요약/키워드: Korean elderly speech data

검색결과 27건 처리시간 0.023초

제한된 학습 데이터를 사용하는 End-to-End 음성 인식 모델 (End-to-end speech recognition models using limited training data)

  • 김준우;정호영
    • 말소리와 음성과학
    • /
    • 제12권4호
    • /
    • pp.63-71
    • /
    • 2020
  • 음성 인식은 딥러닝 및 머신러닝 분야에서 활발히 상용화 되고 있는 분야 중 하나이다. 그러나, 현재 개발되고 있는 음성 인식 시스템은 대부분 성인 남녀를 대상으로 인식이 잘 되는 실정이다. 이것은 음성 인식 모델이 대부분 성인 남녀 음성 데이터베이스를 학습하여 구축된 모델이기 때문이다. 따라서, 노인, 어린이 및 사투리를 갖는 화자의 음성을 인식하는데 문제를 일으키는 경향이 있다. 노인과 어린이의 음성을 잘 인식하기 위해서는 빅데이터를 구축하는 방법과 성인 대상 음성 인식 엔진을 노인 및 어린이 데이터로 적응하는 방법 등이 있을 수 있지만, 본 논문에서는 음향적 데이터 증강에 기반한 재귀적 인코더와 언어적 예측이 가능한 transformer 디코더로 구성된 새로운 end-to-end 모델을 제안한다. 제한된 데이터셋으로 구성된 한국어 노인 및 어린이 음성 인식을 통해 제안된 방법의 성능을 평가한다.

자유대화의 음향적 특징 및 언어적 특징 기반의 성인과 노인 분류 성능 비교 (Comparison of Classification Performance Between Adult and Elderly Using Acoustic and Linguistic Features from Spontaneous Speech)

  • 한승훈;강병옥;동성희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.365-370
    • /
    • 2023
  • 사람은 노화과정에 따라 발화의 호흡, 조음, 높낮이, 주파수, 언어 표현 능력 등이 변화한다. 본 논문에서는 이러한 변화로부터 발생하는 음향적, 언어적 특징을 기반으로 발화 데이터를 성인과 노인 두 그룹으로 분류하는 성능을 비교하고자 한다. 음향적 특징으로는 발화 음성의 주파수 (frequency), 진폭(amplitude), 스펙트럼(spectrum)과 관련된 특징을 사용하였으며, 언어적 특징으로는 자연어처리 분야에서 우수한 성능을 보이고 있는 한국어 대용량 코퍼스 사전학습 모델인 KoBERT를 통해 발화 전사문의 맥락 정보를 담은 은닉상태 벡터 표현을 추출하여 사용하였다. 본 논문에서는 음향적 특징과 언어적 특징을 기반으로 학습된 각 모델의 분류 성능을 확인하였다. 또한, 다운샘플링을 통해 클래스 불균형 문제를 해소한 뒤 성인과 노인 두 클래스에 대한 각 모델의 F1 점수를 확인하였다. 실험 결과로, 음향적 특징을 사용하였을 때보다 언어적 특징을 사용하였을 때 성인과 노인 분류에서 더 높은 성능을 보이는 것으로 나타났으며, 클래스 비율이 동일하더라도 노인에 대한 분류 성능보다 성인에 대한 분류 성능이 높음을 확인하였다.

치매 환자를 포함한 한국 노인 음성 데이터 딥러닝 기반 음성인식 (Deep learning-based speech recognition for Korean elderly speech data including dementia patients)

  • 문정현;강준서;김기웅;배종빈;이현준;임창원
    • 응용통계연구
    • /
    • 제36권1호
    • /
    • pp.33-48
    • /
    • 2023
  • 본 연구에서는 발화자가 동물이나 채소와 같은 일련의 단어를 무작위로 일 분 동안 말하는 한국어 음성 데이터에 대한 자동 음성 인식(ASR) 문제를 고려하였다. 발화자의 대부분은 60세 이상의 노인이며 치매 환자를 포함하고 있다. 우리의 목표는 이러한 데이터에 대한 딥러닝 기반 자동 음성 인식 모델을 비교하고 성능이 좋은 모델을 찾는 것이다. 자동 음성 인식은 컴퓨터가 사람이 말하는 말을 자동으로 인식하여 음성을 텍스트로 변환할 수 있는 기술이다. 최근 들어 자동 음성 인식 분야에서 성능이 좋은 딥러닝 모델들이 많이 개발되어 왔다. 이러한 딥러닝 모델을 학습시키기 위한 데이터는 대부분 대화나 문장 형식으로 이루어져 있다. 게다가, 발화자들 대부분은 어휘를 정확하게 발음할 수 있어야 한다. 반면에, 우리 데이터의 발화자 대부분은 60세 이상의 노인으로 발음이 부정확한 경우가 많다. 또한, 우리 데이터는 발화자가 1분 동안 문장이 아닌 일련의 단어를 무작위로 말하는 한국어 음성 데이터이다. 따라서 이러한 일반적인 훈련 데이터를 기반으로 한 사전 훈련 모델은 본 논문에서 고려하는 우리 데이터에 적합하지 않을 수 있으므로, 우리는 우리의 데이터를 사용하여 딥러닝 기반 자동 음성 인식 모델을 처음부터 훈련한다. 또한 데이터 크기가 작기 때문에 일부 데이터 증강 방법도 적용한다.

Animal Naming Performance in Korean Elderly: Effects of age, education, and gender, and Typicality

  • Kim, Jung-Wan;Kim, Hyang-Hee
    • International Journal of Contents
    • /
    • 제8권3호
    • /
    • pp.26-33
    • /
    • 2012
  • The animal naming test (ANT) is known to be influenced not only by age, gender, and education but only by ethnicity, culture, and language. Thus, population-specific norm considering these variables needs to be developed for Korean-speaking elderly. We evaluated 185 healthy elderly people with five measures. Education was the single statistically independent correlate of the total number of words ($R^2$ = .312, p = .038). After adjusting for education, there was slightly significant negative correlation (r = -.215, p = .049) between age and total number of words. Mean number of words produced was $13.71{\pm}3.09$. The production frequency was negatively correlated with the typicality rating (r = -0.41, p < .05). The concrete and exact scoring rule could be set up in the comparison of naming performance between a normal and patient with neuro-linguistic disorder and its data could be utilized in a differential diagnosis for patients with neurological disorders.

독거노인과 가족동거노인의 건강 및 구강건강이 건강 관련 삶의 질에 미치는 영향 (Effects of general and oral health on quality of life in the elderly living alone and with family)

  • 정은주
    • 한국치위생학회지
    • /
    • 제19권4호
    • /
    • pp.577-589
    • /
    • 2019
  • Objectives: The purpose of this study was to investigate the effects of general and oral health on quality of life in the elderly living alone and with family. Methods: We analyzed data from the $6^{th}$ Korea National Health and Nutrition Examination Survey. Distribution of the elderly living alone and with family based on the general characteristics and general and oral health was analyzed using complex-sample chi-square tests. Multiple logistic regression was used to analyze the factors affecting quality of life by calculating the 95% confidence intervals. Results: In the elderly living alone, the quality of life significantly correlated with restriction of activity, perceived general and oral health status, perceived stress, and speech difficulties. Further, in the elderly living with family, lower quality of life significantly correlated with restriction of activity, perceived health status, walking days per week, life time smoking history, Community Periodontal Index, and chewing and speech difficulties. Conclusions: The elderly are concerned with self-maintenance of general and oral health. Therefore, systematic policies related to health services need to be developed and operated at the national level. It is especially necessary to take social interest in the elderly living alone and a more continuous and professional approach in their health care.

온라인상에서 공유되는 노인에 대한 사회적 인식과 태도: 소셜 빅데이터 분석을 중심으로 (Social Perceptions and Attitudes toward the Elderly Shared Online: Focusing on Social Big Data Analysis)

  • 안순태;이하나;정순둘
    • 한국노년학
    • /
    • 제41권4호
    • /
    • pp.505-525
    • /
    • 2021
  • 본 연구의 목적은 온라인상에서 '노인'이 어떠한 표현들로 지칭되고 있는지, 해당 단어의 쓰임새는 어떠한지 살펴보는 것이다. 구체적으로, 노인 낙인이라는 이론적 개념에 근거하여, 노인에 대한 이미지와 태도, 혐오표현의 특성 등을 분석하였다. 이를 위해 본 연구는 익명의 대화가 오가는 소셜 빅데이터를 기반으로 텍스트 마이닝을 실시하였다. 본 연구를 통해 확인한 결과는 다음과 같다. 첫째, 온라인상에서 공유되는 노인 이미지는 대체로 부정적인 것으로 확인됐다. 둘째, 노인에 대한 부정적 이미지로 인해 이들을 대하는 태도 역시 부정적인 경향이 높았다. 셋째, 본 연구를 통해 확인된 노인 관련 지칭어를 살펴보면, '노인네', '틀딱', '할머니', '꼰대', '늙은이', '할배' 등이 상위 빈도를 차지했다. 이 중, '틀딱', '꼰대'는 주로 노인을 부정적으로 평가하거나 비난하는 댓글에서 확인됐으며, 이러한 표현에는 청년들에게 짐만 되는 노인들을 향한 혐오와 차별의 의미가 담겨 있었다. 넷째, 온라인상에서의 노인 혐오표현은 노인을 주제로 한 콘텐츠가 아닌 정치/경제 관련 이슈에서 더 많이 발견되었다. 이상의 결과를 토대로 본 연구는 세대 간 이해를 높이는 방안에 대해 논의하였다.

노년층의 글쓰기 특성 -이야기문법과 구문구조 (Characteristics of Narrative Writing in Normal Aging: Story Grammar and Syntactic Structure)

  • 김현아;원새롬;이보은;윤지혜
    • 재활복지
    • /
    • 제21권1호
    • /
    • pp.193-212
    • /
    • 2017
  • 노년층은 이야기를 산출하면서 주제로부터 벗어나는 이야기를 하거나 문장구조를 단순화하기도 하며 문법 형태소의 오류를 보일 수 있다. 이야기를 말하는 능력과 글로 쓰는 능력은 서로 다를 수 있는데, 글을 쓰는 능력은 복잡한 인지과정을 필요로 하므로 노화에 더 취약할 수 있다. 이에 본 연구는 정상 노년층 32명과 청년층 32명을 대상으로 이야기 쓰기 능력을 살펴보았다. 과제는 전래동화('흥부놀부')에 대한 그림들을 보고 자유롭게 이야기를 구성하여 써보도록 하였다. 자료 분석 시에는 이야기 구성적 측면과 이야기 구문구조적 측면으로 나누어 그 특성을 확인하였다. 연구결과, 노년층은 청년층에 비하여 이야기 구성적으로는 이야기문법과 완전한 에피소드의 수가 유의하게 적었으며 주제에서 벗어난 문장을 더 많이 산출하였다. 구문구조적으로는 복문의 사용빈도는 청년층과 차이가 없었으나 관형절과 부사절 내포문의 사용이 저하되고 부적절한 결속표지를 많이 산출하였다. 이러한 결과는 노년층이 이야기 글쓰기를 할 때 주제의 유지가 저하되고 수식적으로 꾸며주는 표현의 사용이 부족하게 되면서 전체적인 글의 응집성이 저하되지만 쓰기 활동의 시각적 피드백에 도움을 받을 수 있게 되므로 긴 복문의 사용이 가능할 수 있었음을 시사한다.

지역사회 여성 노인 음성의 음향학적 특성: 거주지 및 우울감의 영향 (Acoustic Characteristics of Female Senior Citizens in Communities: The Effects of Residence and Depression)

  • 황재호;김정완
    • 말소리와 음성과학
    • /
    • 제4권4호
    • /
    • pp.155-162
    • /
    • 2012
  • The population of Korea is ageing as the number of elderly people increases due to improvements in health care and diet. Accordingly, it is expected that interest in how to live actively during the years after retirement and how to communicate effectively will increase the demand for voice improvement methods and technology. However, the criteria to evaluate the voice strength and characteristics of the elderly are lacking. In this study, we analyzed the acoustic characteristics of elderly women living in the community according to residential status and mental health status (e.g. depressive mood). Accordingly, we selected women (n=63) above the age of 65 age who were living in the Seoul metropolitan area and Daegu Gyeongbuk. The selected subjects were divided into two groups: a normal speaker group (n=40) and a speaker group comprised of those suffering from depressive mood (n=23). This study analyzed the voice characteristics of subjects based on collected data through the sustained phonation of the vowel /a/. It was shown that there were differences among MPT, F0, Jitter, Shimmer and NHR depending on location of residence but no difference with regard to depressive mood. Therefore, we must consider location of residence in elderly as the key factor in demonstrating the voice norms of seniors.

한국 정상 노인 음성의 기본주파수 (Fundamental Frequencies in Korean Elderly Speakers)

  • 김선해;고도흥
    • 음성과학
    • /
    • 제15권3호
    • /
    • pp.95-102
    • /
    • 2008
  • Multiple physical changes of the larynx and its components occur with age. Vocal pitch, commonly expressed through measures of fundamental frequency (Fo) relate to physical conditions of the larynx. Available data is lacking for the senescent voice, and should be applied to the of changes of elderly speakers' Fo characteristics. The purpose of this study was to investigate the Fo of normal elderly speaker's voice. A total of 406 normal elderly speakers (207 males and 199 females) participated in this experiment. Age ranged from 60 years to 89 years. The subjects were asked to produce sustained corner vowels (/a/ /i/ /u/) three times each and the data were analyzed using the MDVP of CSL. According to the results of this study, the mean Fo from the ages of 60's to 80's shows 143.95Hz(SD 13.94) for men and 185.42Hz (SD 15.29) for women. For men, a significant change is found as a function of age in the Fo (F=16.181, p<.05). A post-hoc Scheffe test revealed significant differences between the Fo data of subjects aged 60's and 70's, 60's and 80's. For women, a significant change is found as a function of age in the Fo (F=49.013, p<.05). A post-hoc $Scheff'{e}$ test revealed significant differences between the Fo data of subjects in their 60's and 70's, 70's and 80's, 60's and 80's. The Fo of men goes up from their 60's to 80's gradually, whereas the Fo of women goes down gradually until their 70's, and after their 70's it again increases. It has been known that diminishing estrogen levels in women in old age may be a factor in lowering Fo, whereas diminishing testosterone levels in men may contribute to a rising Fo. This result may be used as some meaningful guideline and lead the basic data to differentiate between normal aged voice and aged voice disorders.

  • PDF

노인의 우울 경험과 미충족 치과의료 경험의 관계 (Relationship between depressive experience and unmet dental needs in the elderly)

  • 김선미;정미희;안은숙
    • 대한치과의료관리학회지
    • /
    • 제8권1호
    • /
    • pp.30-36
    • /
    • 2020
  • This study is conducted on 1,725 elderly people over 65 years of age using 2018 data obtained from the 7th National Health and Nutrition Survey (KNHANES) data. In this study, an analysis is performed considering the general characteristics of the elderly and their oral health status (authoring discomfort, speech problems, etc.) to confirm the relationship between the elderly's unmet dental experience and depressive experience. The results of this study showed that depressive experiences by the elderly resulted in unmet dental medical experiences, and it was also found that the income level and the complaint of chewing discomfort had an effect. Based on these results, it is believed that oral health policies should be developed to improve the unmet dental medical experience by considering the socio-economic level of the elderly and depressive experiences. This policy development is expected to lead not only to the improvement of oral health for the elderly, but also to improve the quality of life for the elderly through health promotion.