• 제목/요약/키워드: 학습 한국어

검색결과 1,335건 처리시간 0.019초

딥러닝 기반 한국어 실시간 TTS 기술 비교 (Comparison of Korean Real-time Text-to-Speech Technology Based on Deep Learning)

  • 권철홍
    • 문화기술의 융합
    • /
    • 제7권1호
    • /
    • pp.640-645
    • /
    • 2021
  • 딥러닝 기반 종단간 TTS 시스템은 텍스트에서 스펙트로그램을 생성하는 Text2Mel 과정과 스펙트로그램에서 음성신호를 합성하는 보코더 등 두 가지 과정으로 구성되어 있다. 최근 TTS 시스템에 딥러닝 기술을 적용함에 따라 합성음의 명료도와 자연성이 사람의 발성과 유사할 정도로 향상되고 있다. 그러나 기존의 방식과 비교하여 음성을 합성하는 추론 속도가 매우 느리다는 단점을 갖고 있다. 최근 제안되고 있는 비-자기회귀 방식은 이전에 생성된 샘플에 의존하지 않고 병렬로 음성 샘플을 생성할 수 있어 음성 합성 처리 속도를 개선할 수 있다. 본 논문에서는 비-자기회귀 방식을 적용한 Text2Mel 기술인 FastSpeech, FastSpeech 2, FastPitch와, 보코더 기술인 Parallel WaveGAN, Multi-band MelGAN, WaveGlow를 소개하고, 이를 구현하여 실시간 처리 여부를 검증한다. 실험 결과 구한 RTF로 부터 제시된 방식 모두 실시간 처리가 충분히 가능함을 알 수 있다. 그리고 WaveGlow를 제외하고 학습 모델 크기가 수십에서 수백 MB 정도로, 메모리가 제한되어 있는 임베디드 환경에 적용 가능함을 알 수 있다.

응급의료 영역 한국어 음성대화 데이터베이스 구축 (Building a Korean conversational speech database in the emergency medical domain)

  • 김선희;이주영;최서경;지승훈;강지민;김종인;김도희;김보령;조은기;김호정;장정민;김준형;구본혁;박형민;정민화
    • 말소리와 음성과학
    • /
    • 제12권4호
    • /
    • pp.81-90
    • /
    • 2020
  • 본 논문은 응급의료 환경에서 음성인식 성능을 향상시키기 위하여 실제 환경에서 데이터 수집 방법을 정의하고 정의된 환경에서 수집된 데이터를 전사하는 방법을 제안한다. 그리고 제안된 방법으로 수집되고 전사된 데이터를 이용하여 기본 음성인식 실험을 진행함으로써 제안한 수집 및 전사 방법을 평가하고 향후 연구 방향을 제시하고자 한다. 모든 음성은 기본적으로 16비트 해상도와 16 kHz 샘플링으로 저장되었다. 수집된 데이터는 총 166건의 대화로서 8시간 35분의 분량이다. 수집된 데이터는 Praat를 이용하여 철자 전사, 음소 전사, 방언 전사, 잡음 전사, 그리고 의료 코드 전사를 수행하여 다양한 정보를 포함한 텍스트 데이터를 구축하였다. 이와 같이 수집된 데이터를 이용하여 기본 베이스라인 실험을 통하여 응급의료 영역에서의 음성인식 문제를 실제로 확인할 수 있었다. 본 논문에서 제시한 데이터는 응급의료 영역의 1단계 데이터로서 향후 의료 영역에서의 음성인식 모델의 학습 데이터로 활용되고, 나아가 이 분야의 음성기반 시스템 개발에 기여할 수 있을 것으로 기대된다.

대학생들의 글쓰기 능력 인식 분석을 통한 교과 운영 개선 방안 : J대학의 학생 설문 분석을 중심으로 (Way to the Improvement of Curriculum Management by Analyzing the Perception of Writing Ability of University Students : Focusing on the Analysis of Student Surveys in J University)

  • 조보람;박종호
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권8호
    • /
    • pp.501-511
    • /
    • 2020
  • 이 연구는 대학생들의 글쓰기에 대한 인식을 분석하고 글쓰기 교육의 개선 방안을 찾고자 J대학 학생들을 대상으로 글쓰기 학습 내용, 글쓰기 자기 능력 평가, 글쓰기 능력에 대한 인식, 글쓰기 교육 방향에 대한 인식 등을 설문하여 조사·분석하였다. 이를 통해 글쓰기 교육의 운영 개선 방안에 대해 논의하였다. 대학생들의 인식을 조사·분석한 결과 대학생들은 글쓰기 능력을 중요하게 인식하고 있으며, 이론 수업보다는 실제 글을 써보고 피드백을 받는 실제적인 글쓰기 수업을 원하였다. 또한 글의 내용을 구성하고 전개해가는 부분에 대한 능력을 키우고 싶은 것으로 나타났다. 글쓰기 교육이 대학생들에게 실질적인 역량이 될 수 있도록 하기 위해서는 이론 강의도 중요하지만 실질적으로 글을 써볼 수 있는 충분한 시간과 기회를 부여해야 하며, 전공 맞춤형 실무글쓰기의 개발이 필요하다. 또한 다양한 수업 방식을 통해 학생들이 참여할 수 있는 글쓰기 수업이 되도록 해야하며, 대학 졸업 인증 요건 등의 방법을 통해 졸업 후 사회에 진출해서도 글쓰기 능력이 실무역량으로 이어질 수 있도록 해야 한다. 이 연구는 글쓰기와 관련한 대학생들의 인식을 통해 대학 글쓰기 교육의 방향을 모색해 볼 수 있다는데 의의가 있다고 하겠다.

한국인 영어학습자의 명사구 발화에서 영어 능숙도에 따른 관사와 단음절 명사 모음 길이 비교 (Comparison of vowel lengths of articles and monosyllabic nouns in Korean EFL learners' noun phrase production in relation to their English proficiency)

  • 박우지;모란;이석재
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.33-40
    • /
    • 2020
  • 본 연구는 기능어인 관사 및 1음절 내용어 명사로 구성된 명사구 내 두 단어의 모음 길이 비율과 영어 능숙도 사이의 상관관계를 밝히는 데 목적이 있다. 영어와 한국어 발음에 있어서 대표적 차이 중 하나는 발음상의 리듬이라는 특정적인 요소가 규칙적으로 나타나는지 여부이다. 특히 영어 발화시 내용어는 기능어 대비 상대적으로 더 두드러진(prominent) 소리를 가지게 되는데 이는 영어에서 내용어의 경우 강세를 갖게 되나 기능어의 경우 그 강세가 미비하거나 강세를 갖지 않기 때문이다. 따라서 영어의 내용어 단어 내 모음은 기능어 단어의 모음보다 길게 발음되며, 더 큰 소리로 발화되며, 더 높은 소리를 가지고 리듬을 만들어 내게 된다. 이를 근거로 본 연구에서는 내용어 내 강세를 갖는 모음과 기능어 내 강세를 갖지 않는 모음의 길이 차이에 초점을 두고 유창성이 평가된 L2 영어 음성 코퍼스(Rated K-SEC) 중 한국인 초등학생이 발화한 879(원어민 발화 20개 포함)개의 문장 내 명사구 음성 파일을 연구자료로 사용하였다. 이 879개의 문장은 영어 유창성 평가에 따라 4개의 등급으로 각각 재분류되었으며 이들 문장안에 들어 있는 명사구 내의 관사의 모음 길이와 명사의 모음 길이를 확인하고 그 비율을 측정하였다. 분석 결과 관사 모음 대비 명사 모음 길이 비율은 영어 능숙도와 양의 상관관계를 갖는 것을 확인하였다[Advanced(2.453)>Intermediate High(1.26)>Intermediate Low(1.034)>Novice(0.857)]. 또한 각 능숙도 그룹 간 내용어-기능어 간 모음 길이의 차이 및 그 비율의 차이가 통계적으로 유의미한 것으로 나타났다(p< .001). 이는 한국인 화자의 경우 영어 유창성이 높아질수록 영어 단어 발화 시 명사구 내의 기능어인 관사 모음보다 내용어인 명사 모음을 통계적으로 유의하게 더 길게 발화한다는 것을 의미한다.

2020 한국인 영양소 섭취기준 활용 자료 개발 (The development of resources for the application of 2020 Dietary Reference Intakes for Koreans)

  • 황지윤;김양하;이행신;박은주;김정선;신상아;김기남;배윤정;김기랑;우태정;윤미옥;이명숙
    • Journal of Nutrition and Health
    • /
    • 제55권1호
    • /
    • pp.21-35
    • /
    • 2022
  • 본 연구 결과, 식품군별 대표식품과 1인 1회 분량이 설정되었으며 생애주기별, 성별 1일 에너지필요추정량에 따른 식품군별 섭취횟수를 계산하여 제시한 권장식사패턴 및 이를 활용한 권장식사구성안 12종이 제시되었다. 지속적으로 증가하고 있는 유지·당류 섭취량의 감소를 위한 인지를 높이기 위해 1인 1회분량과 식품구성자전거에 유지·당류 식품군을 포함하였다. 자료 분석과 일반인 및 전문가 대상 설문조사를 실시하여 2020 KDRIs 기반 생애주기별 영양문제 범주화 및 대국민 메시지에 기반한 사용자 맞춤형 웹기반 영양 콘텐츠 개발 및 홍보를 위한 근거를 마련하였다. 이를 근거로 일반국민과 청소년 대상 카드뉴스 2종, 새로운 2020 식품구성자전거와 권장식사패턴을 홍보하기 위한 카드뉴스 2종과 5개 언어 (한국어, 영어, 일본어, 베트남어, 중국어) 포스터가 제작되었다. 또한 영양교육주제의 우선순위 선정 후 단계별 교육프로그램 설계 후 교육목표에 따른 교수학습안과 교수자료, 평가도구 등이 개발되었다. 이와 같은 자료는 모두 보건복지부와 한국영양학회 누리집을 통해 배포되었으니 다양한 분야에서 다각적인 측면에서 활용되기를 기대한다.