• 제목/요약/키워드: 한국어 학습

검색결과 1,344건 처리시간 0.028초

이집트 한국어 학습자들의 한국어 음소 학습용이성 (Egyptian learners' learnability of Korean phonemes)

  • ;이호영;황효성
    • 말소리와 음성과학
    • /
    • 제11권4호
    • /
    • pp.19-33
    • /
    • 2019
  • 이 연구는 한국어 자음과 모음 대해 단기간의 지각 훈련을 받은 이집트인 학습자들이 학습 수준별로 어떠한 지각 개선 양상을 보이는지 조사하고, 각 음소 쌍의 학습용이성 정도를 파악해 이집트인 학습자들을 대상으로 하는 한국어 발음교육에 실질적인 기여를 하는 것을 목적으로 한다. 이를 위해 50명의 한국어 학습자를 대상으로 이집트 현지에서 고변이 음성 훈련을 실시하였다. 한국어 수준에 따라 학습자를 초급 집단과 중고급 집단으로 나누었고, 2주간에 걸쳐 각 집단에 대해 30~40분의 지각 훈련을 10회 진행하였다. 고변이 음성 훈련용 자료는 다수의 한국어 원어민 화자가 발화한 자연음이었으며, 최소대립 쌍을 이루는 단어와 문장으로 최대한 다양하게 구성하였다. 사전과 사후 테스트 비교 결과, 이집트인 초급과 중고급 집단의 한국어 모음과 초성에 대한 지각 능력이 뚜렷하게 향상된 것을 확인할 수 있었다. 종성에 대한 지각 능력 역시 향상되었지만 훈련 전부터 정확도가 높아 향상폭은 다소 낮게 나타났다. 각 음소에 대한 지각 정확도와 향상도를 바탕으로 음소 쌍별 학습용이성을 측정하고, 이집트인 학습자를 위한 학습용이성 위계를 학습 단계별로 설정하였다.

홍콩의 한국어 학습자 특성 연구 - 홍콩의 대학 부설 평생교육기관 학습자를 대상으로 (Identifying Characteristics of Korean Language Learners Enrolled in University-attached Lifelong Learning Institutions in Hong Kong)

  • 이현주;이영민
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.368-379
    • /
    • 2022
  • 본 연구의 목적은 홍콩의 대학 부설 평생교육기관에서 한국어 수업을 듣는 학습자들을 가르친 경험이 있는 한국어 강사들을 대상으로 포커스 그룹 인터뷰를 실시하여 그들을 가르치면서 알게 된 홍콩 학습자의 특성을 파악하는 것이다. 이를 통해 홍콩의 한국어 학습자들에게 적합한 교수 방안을 모색하고자 한다. 이를 위해 최소 5년 이상 한국어를 가르친 경험이 있는 강사 10명을 대상으로 인터뷰를 하였다. 연령별 홍콩 한국어 학습자의 특성으로는 20대가 가장 많았지만, 50대 이상도 상당한 비율을 차지하는 등 연령층이 다양했다는 점이다. 한국어 학습의 동기 부여에 한류, 홍콩 정부의 평생 교육 보조금 지원의 영향이 컸다. 홍콩 학습자들의 특성은 적극적인 학습 욕구와 노력, 지속적인 학습 의도, 말하기에서 소극적인 참여와 절제, 개인 정보 공개에 민감함 등이었다. 이러한 결과를 바탕으로 한국어를 효과적으로 가르치기 위해서는 한 반에서 다양한 연령층을 고려한 교수 학습 방법이 필요하다는 점과 홍콩 한국어 학습자들의 특성이 반영된 말하기 교수 방법이 마련되어야 한다는 점을 제언하였다. 본 연구의 의의는, 홍콩에서 그동안 파악되지 않았던 현지의 홍콩 한국어 일반 학습자들의 특성 분석을 통해, 학습 동기, 학습 태도, 한국어 학습을 할 때 어려워하는 점을 확인한 현장 연구라는 것이다.

Cross-lingual Post-Training (XPT)을 통한 한국어 언어모델 구축 및 비교 실험 (Korean language model construction and comparative analysis with Cross-lingual Post-Training (XPT))

  • 손수현;박찬준;이정섭;심미단;이승현;이진우;소아람;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.295-299
    • /
    • 2022
  • 자원이 부족한 언어 환경에서 사전학습 언어모델 학습을 위한 대용량의 코퍼스를 구축하는데는 한계가 존재한다. 본 논문은 이러한 한계를 극복할 수 있는 Cross-lingual Post-Training (XPT) 방법론을 적용하여 비교적 자원이 부족한 한국어에서 해당 방법론의 효율성을 분석한다. 적은 양의 한국어 코퍼스인 400K와 4M만을 사용하여 다양한 한국어 사전학습 모델 (KLUE-BERT, KLUE-RoBERTa, Albert-kor)과 mBERT와 전반적인 성능 비교 및 분석 연구를 진행한다. 한국어의 대표적인 벤치마크 데이터셋인 KLUE 벤치마크를 사용하여 한국어 하위태스크에 대한 성능평가를 진행하며, 총 7가지의 태스크 중에서 5가지의 태스크에서 XPT-4M 모델이 기존 한국어 언어모델과의 비교에서 가장 우수한 혹은 두번째로 우수한 성능을 보인다. 이를 통해 XPT가 훨씬 더 많은 데이터로 훈련된 한국어 언어모델과 유사한 성능을 보일 뿐 아니라 학습과정이 매우 효율적임을 보인다.

  • PDF

한국어 튜터링 챗봇을 위한 말뭉치 구축 (Building a Corpus for Korean Tutoring Chatbot)

  • 김한샘;최경호;한지윤;정해영;곽용진
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.288-293
    • /
    • 2017
  • 교수-학습 발화는 발화 턴 간에 규칙화된 인과관계가 강하고 자연 발화에서의 출현율이 낮다. 일반적으로 어휘부, 표현 제시부, 대화부로 구성되며 커리큘럼과 화제에 따라 구축된 언어자원이 필요하다. 기존의 말뭉치는 이러한 교수-학습 발화의 특징을 반영하지 않았기 때문에 한국어 교육용 튜터링 챗봇을 개발하는 데에 활용도가 떨어진다. 이에 따라 이 논문에서는 자연스러운 언어 사용 수집, 도구 기반의 수집, 주제별 수집 및 분류, 점진적 구축 절차의 원칙에 따라 교수-학습의 실제 상황을 반영하는 준구어 말뭉치를 구축한다. 교실에서 발생하는 언어학습 상황을 시나리오로 구성하여 대화 흐름을 제어하고 채팅용 메신저와 유사한 형태의 도구를 통해 말뭉치를 구축한다. 이 연구는 한국어 튜터링 챗봇을 개발하기 위해 말뭉치 구축용 챗봇과 한국어 학습자, 한국어 교수자가 시나리오를 기반으로 발화문을 생성한 준구어 말뭉치를 최초로 구축한다는 데에 의의가 있다.

  • PDF

자연어 생성 모델을 이용한 준지도 학습 기반 한국어 사실 확인 자료 구축 (Semi-Supervised Data Augmentation Method for Korean Fact Verification Using Generative Language Models)

  • 정재환;전동현;김선훈;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.105-111
    • /
    • 2021
  • 한국어 사실 확인 과제는 학습 자료의 부재로 인해 연구에 어려움을 겪고 있다. 본 논문은 수작업으로 구성된 학습 자료를 토대로 자연어 생성 모델을 이용하여 한국어 사실 확인 자료를 구축하는 방법을 제안한다. 본 연구는 임의의 근거를 기반으로 하는 주장을 생성하는 방법 (E2C)과 임의의 주장을 기반으로 근거를 생성하는 방법 (C2E)을 모두 실험해보았다. 이때 기존 학습 자료에 위 두 학습 자료를 각각 추가하여 학습한 사실 확인 분류기가 기존의 학습 자료나 영문 사실 확인 자료 FEVER를 국문으로 기계 번역한 학습 자료를 토대로 구성된 분류기보다 평가 자료에 대해 높은 성능을 기록하였다. 또한, C2E 방법의 경우 수작업으로 구성된 자료 없이 기존의 자연어 추론 과제 자료와 HyperCLOVA Few Shot 예제만으로도 높은 성능을 기록하여, 비지도 학습 방식으로 사실 확인 자료를 구축할 수 있는 가능성 역시 확인하였다.

  • PDF

한국어 학습자 작문 자동 평가를 위한 평가 항목 선정 (Evaluation Category Selection For Automated Essay Evaluation of Korean Learner)

  • 곽용진
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.270-271
    • /
    • 2017
  • 본 연구는 한국어 학습자 작문의 자동 평가 시스템 개발의 일환으로, 자동 평가 결과에 대한 설명과 근거가 될 수 있는 평기 기준 범주를 선정하기 위한 데이터 구축과 선정 방법을 제시한다. 작문의 평가 기준의 영역과 항목은 평가체계에 대한 이론적 연구에 따라 다양하다. 이러한 평가 기준은 자동 평가에서는 식별되기 어려운 경우도 있고, 각각의 평가 기준이 적용되는 작문 오류의 범위도 다양하다. 그러므로 본 연구에서는 자동 평가 기준 선정의 문제는 다양한 평가 기준에 중 하나를 선정하는 분류의 문제로 보고, 학습데이터를 구축, 기계학습을 통해 자동 작문 평가에 효과적인 평가 기준을 선정 가능성을 제시한다.

  • PDF

외국인 학습자를 위한 문맥 기반 실시간 국어 문장 교정 (Context Based Real-time Korean Writing Correcting for Foriengers)

  • 박영근;최재성;김재민;이성동;이현아
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.273-275
    • /
    • 2016
  • 외국인 유학생과 국내 체류 외국인을 포함하여 한국어를 학습하고자 하는 외국인이 지속적으로 증가함에 따라, 외국인 한국어 학습자의 교육에 대한 관심도 높아지고 있다. 기존 맞춤법 검사기는 한국어를 충분히 이해할 수 있는 한국인의 사용에 중점을 두고 있어, 외국인 한국어 학습자가 사용하기에는 다소 부적절하다. 본 논문에서는 한국어의 문맥 특성과 외국인의 작문 특성을 반영한 한국어 교정 방식을 제안한다. 제안하는 시스템에서는 말뭉치에서 추출한 어절 바이그램에 대한 음절 역색인을 구성하여 추천 표현을 빠르게 제시할 수 있으며, 키보드 후킹에 기반한 사용자인터페이스를 제공하여 사용자 편의를 높인다.

  • PDF

한국어 ELECTRA 모델을 이용한 자연어처리 다운스트림 태스크 (Korean ELECTRA for Natural Language Processing Downstream Tasks)

  • 황태선;김정욱;이새벽
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.257-260
    • /
    • 2020
  • 사전 학습을 기반으로 하는 BERT계열의 모델들이 다양한 언어 및 자연어 처리 태스크들에서 뛰어난 성능을 보이고 있지만, masked language model의 경우 입력 문장의 15%만 마스킹을 함으로써 학습 효율이 떨어지고 미세 조정 시 마스킹 토큰이 등장하지 않는 불일치 문제도 존재한다. 이러한 문제를 효과적으로 해결한 ELECTRA는 영어 벤치마크에서 기존의 언어모델들 보다 뛰어난 성능을 보여주었지만 한국어에 대한 관련 연구는 부족한 실정이다. 본 연구에서는 ELECTRA를 한국어 코퍼스에 대해 학습시키고, 다양한 한국어 자연어 이해 태스크들에 대해 실험을 진행한다. 실험을 통해 ELECTRA의 모델 크기별 성능 평가를 진행하였고, 여러 한국어 태스크들에 대해서 평가함으로써 ELECTRA 모델이 기존의 언어 모델들보다 좋은 성능을 보인다는 것을 입증하였다.

  • PDF

한국어 사전학습 모델을 활용한 자연어 처리 모델 자동 산출 시스템 설계 (An Automated Production System Design for Natural Language Processing Models Using Korean Pre-trained Model)

  • 장지형;최호윤;이건우;최명석;홍참길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.613-618
    • /
    • 2022
  • 효과적인 자연어 처리를 위해 제안된 Transformer 구조의 등장 이후, 이를 활용한 대규모 언어 모델이자 사전학습 모델인 BERT, GPT, OPT 등이 공개되었고, 이들을 한국어에 보다 특화한 KoBERT, KoGPT 등의 사전학습 모델이 공개되었다. 자연어 처리 모델의 확보를 위한 학습 자원이 늘어나고 있지만, 사전학습 모델을 각종 응용작업에 적용하기 위해서는 데이터 준비, 코드 작성, 파인 튜닝 및 저장과 같은 복잡한 절차를 수행해야 하며, 이는 다수의 응용 사용자에게 여전히 도전적인 과정으로, 올바른 결과를 도출하는 것은 쉽지 않다. 이러한 어려움을 완화시키고, 다양한 기계 학습 모델을 사용자 데이터에 보다 쉽게 적용할 수 있도록 AutoML으로 통칭되는 자동 하이퍼파라미터 탐색, 모델 구조 탐색 등의 기법이 고안되고 있다. 본 연구에서는 한국어 사전학습 모델과 한국어 텍스트 데이터를 사용한 자연어 처리 모델 산출 과정을 정형화 및 절차화하여, 궁극적으로 목표로 하는 예측 모델을 자동으로 산출하는 시스템의 설계를 소개한다.

  • PDF

중국인 초급 학습자의 한국어 발음 교육 연구 - 자음과 모음을 중심으로 - (A Study on the Teaching Method of Korean Pronunciation for the Chinese Learners)

  • 강비
    • 한국교육논총
    • /
    • 제40권2호
    • /
    • pp.35-56
    • /
    • 2019
  • 본 연구의 목적은 중국인 한국어 초급 학습자들이 한국어를 정확하게 발음하도록 교육하는 방법을 탐구하여 제시하는 데 있다. 발음은 언어를 구사하는 데 있어 가장 기본적인 요소로, 의사소통 과정에서 학습자가 목표 언어에 대한 유창성과 정확성을 판단하는 기본 적인 요소이다. 그러나 제2외국어를 학습하는 과정에서 오류를 범하는 원인 중 하나가 모국어의 간섭으로 인한 오류 요인이 많이 작용되는 것이다. 따라서 본 연구에서는 한국어와 중국어의 음운 체계를 분류하여, 한국어와 중국어 음운 체계의 그 차이점과 유사점을 알아보고 이를 바탕으로 중국에서 태어나고 중국에서 거주하는 중국인 초급 한국어 학습자들을 위해 한국어를 정확히 발음할 수 있도록 한국어 발음 교육 방법을 모색하는 것이 본 논문의 목적이다.

  • PDF