• 제목/요약/키워드: 화자 연령 분류

검색결과 4건 처리시간 0.019초

발화 속도와 휴지 구간 길이를 사용한 방언 분류 (Dialect classification based on the speed and the pause of speech utterances)

  • 나종환;이보원
    • 말소리와 음성과학
    • /
    • 제15권2호
    • /
    • pp.43-51
    • /
    • 2023
  • 본 논문에서는 음성의 발화 속도와 휴지 구간의 길이 그리고 화자의 연령과 성별에 기반한 방언 분류 접근 방법을 제안한다. 방언 분류는 음성 분석을 위한 중요한 기술 중 하나이다. 예를 들어 정확한 방언 분류 모델은 화자 인식 또는 음성 인식의 성능을 향상시킬 수 있는 잠재력을 가질 수 있다. 선행 연구에 따르면, Mel-Frequency Cepstral Coefficients(MFCC) 특징을 사용한 딥러닝 기반의 연구가 주류를 이루었다. 우리는 지역 간의 음향적 차이에 주목하여 그 차이를 바탕으로 추출한 특징을 사용하여 방언 분류를 진행하였다. 본 논문에서는 음성의 발화 속도, 휴지 구간의 길이 특성을 추출하여 사용하며 이와 함께 화자의 연령과 성별과 같은 메타데이터를 추가로 사용하는 새로운 접근 방법을 제안한다. 실험 결과 제안된 접근 방법이 더 높은 정확도를 보이는 것을 확인하였으며 특히 음성의 발화 속도 특성을 사용하는 것이 기존 MFCC만을 사용하는 방법보다 향상된 성능을 보여준다는 것을 확인할 수 있었다. MFCC 특성만을 사용한 방법과 비교했을 때 본 논문에서 제안한 특성들을 모두 사용하였을 때의 정확도는 91.02%에서 97.02%로 향상되었다.

연령세대에 따른 말 산출의 시간적 특성: 말속도와 쉼을 중심으로 (The effects of speakers' age on temporal features of speech among healthy young, middle-aged, and older adults)

  • 김예지;이송민;최민경;정상민;성지은;이영미
    • 말소리와 음성과학
    • /
    • 제14권1호
    • /
    • pp.37-47
    • /
    • 2022
  • 본 연구의 목적은 정상 성인 화자의 연령세대에 따른 말 산출의 시간적 특성 간에 유의한 차이가 있는지를 분석하고, 말 산출 변수들 중에서 청년 화자와 노년 화자를 유의하게 분류할 수 있는 변수가 무엇인지 살펴보고자 하였다. 이를 위해 청년, 장년, 노년의 말속도(전체 말속도, 조음속도)와 발화당 쉼 빈도, 쉼 지속시간, 쉼의 실현 위치를 살펴보았다. 국립국어원에서 배포하는 오픈 코퍼스인 서울말 낭독 발화 말뭉치에서 청년층, 장년층, 노년층 각 10명씩 총 30명 화자의 발화를 선별해 말 산출의 시간적 특성을 분석하였다. 그 결과, 전체 말속도, 조음속도, 전체 쉼 빈도, 어절 간 쉼 빈도, 전체 쉼 지속시간, 어절 간 쉼 지속시간에 집단 간 유의한 차이가 발생했다. 사후 검정 결과, 장년층이 청년층보다, 노년층이 청년층보다 느린 말속도, 잦은 쉼 빈도, 긴 쉼 지속시간을 보였다. 반면 정상 성인에게서는 부적절한 쉼인 어절 내 쉼 빈도, 어절 내 쉼 지속시간에는 집단 간 유의한 차이가 없었다. 이중 청년층과 노년층을 유의하게 구별하는 변수는 전체 말속도로 나타났다. 노년층이 한 번 쉼을 가질 때 청·장년층과 비슷한 길이지만, 훨씬 더 빈번하게 가진다는 것을 보여주었다. 이러한 결과는 연령세대에 따라 말 산출의 시간적 특성에 변화가 나타난다는 것을 시사한다.

영남대학교 의과대학 부속병원 치과교정과에 내원한 부정교합 환자의 분포 및 변동추이 (The Distribution and Trend of Malocclusion Patients Visited at Department of Dentistry in Orthodontics)

  • 김종섭;박진호;윤홍식;임난희;진병로;이희경
    • Journal of Yeungnam Medical Science
    • /
    • 제11권2호
    • /
    • pp.323-331
    • /
    • 1994
  • 1983년부터 1994년 상반기까지 영남대학교 의과대학 부속병원 치과교정과에 내원한 1,050명의 진단기록 및 석고모형을 Angle씨 분류법으로 분류하고 성별, 연령별 분포 및 변동 추이에 대해 분석 해 본 결과 다음과 같은 결론을 얻었다. 거의 매년 환자의 내원율이 증가하였으며 남자에 비해 여자의 내원율이 높았다. 8세-15세 연령군이 전체 내원 환자수의 61.4%를 나타내었으며 20세 이상의 연령균은 18.5%, 7세 이하 연령군은 8.1%를 나타내었다. class I 은 42.2%, class II div 1은 22.5%, class II div 2는 3.9%, class III은 29.1%, 구순구개열 화자는 2.0%를 나타내었다. 외과적 교정 환자의 수가 증가하는 추세에 있었다.

  • PDF

자유대화의 음향적 특징 및 언어적 특징 기반의 성인과 노인 분류 성능 비교 (Comparison of Classification Performance Between Adult and Elderly Using Acoustic and Linguistic Features from Spontaneous Speech)

  • 한승훈;강병옥;동성희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.365-370
    • /
    • 2023
  • 사람은 노화과정에 따라 발화의 호흡, 조음, 높낮이, 주파수, 언어 표현 능력 등이 변화한다. 본 논문에서는 이러한 변화로부터 발생하는 음향적, 언어적 특징을 기반으로 발화 데이터를 성인과 노인 두 그룹으로 분류하는 성능을 비교하고자 한다. 음향적 특징으로는 발화 음성의 주파수 (frequency), 진폭(amplitude), 스펙트럼(spectrum)과 관련된 특징을 사용하였으며, 언어적 특징으로는 자연어처리 분야에서 우수한 성능을 보이고 있는 한국어 대용량 코퍼스 사전학습 모델인 KoBERT를 통해 발화 전사문의 맥락 정보를 담은 은닉상태 벡터 표현을 추출하여 사용하였다. 본 논문에서는 음향적 특징과 언어적 특징을 기반으로 학습된 각 모델의 분류 성능을 확인하였다. 또한, 다운샘플링을 통해 클래스 불균형 문제를 해소한 뒤 성인과 노인 두 클래스에 대한 각 모델의 F1 점수를 확인하였다. 실험 결과로, 음향적 특징을 사용하였을 때보다 언어적 특징을 사용하였을 때 성인과 노인 분류에서 더 높은 성능을 보이는 것으로 나타났으며, 클래스 비율이 동일하더라도 노인에 대한 분류 성능보다 성인에 대한 분류 성능이 높음을 확인하였다.