• Title/Summary/Keyword: 학습 한국어

Search Result 1,338, Processing Time 0.025 seconds

Korean Depenency Parsing using a Maximum Spanning Tree (최대신장트리를 이용한 한국어 의존구문분석)

  • Park, Young-Min;Seo, ung-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.68-72
    • /
    • 2010
  • 본 논문에서는 그래프 기반의 최대신장트리(Maximum Spanning Tree)를 이용한 한국어 의존구문분석 방법을 제안한다. 우리는 최대신장트리 알고리즘을 한국어의 특성인 지배성분 후위의 원칙과 투사성의 원칙을 적용하여 한국어 의존구문분석에 적합한 알고리즘을 만들었다. 제안한 알고리즘은 기존의 한국어 의존구문분석의 방법들보다 낮은 시간복잡도를 가지며 대용량 말뭉치를 학습하기 위해 증분학습이 가능하고 비교적 학습속도가 빠른 Averaged Perceptron 알고리즘을 사용하였다. 실험결과 제안한 방법은 비교적 열악한 환경인 복문이 포함된 장문의 문장에서도 뛰어난 성능을 보여주었다,

  • PDF

Construction of bilingually pre-trained language model from large-scaled Korean and English corpus (KE-T5: 한국어-영어 대용량 텍스트를 활용한 이중언어 사전학습기반 대형 언어모델 구축)

  • Shin, Saim;Kim, San;Seo, Hyeon-Tae
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.419-422
    • /
    • 2021
  • 본 논문은 한국어와 영어 코퍼스 93GB를 활용하여 구축한 대형 사전학습기반 언어모델인 KE-T5를 소개한다. KE-T5는 한국어와 영어 어휘 64,000개를 포함하는 대규모의 언어모델로 다양한 한국어처리와 한국어와 영어를 모두 포함하는 번역 등의 복합언어 태스크에서도 높은 성능을 기대할 수 있다. KE-T5의 활용은 대규모의 언어모델을 기반으로 영어 수준의 복잡한 언어처리 태스크에 대한 연구들을 본격적으로 시작할 수 있는 기반을 마련하였다.

  • PDF

Korean Named Entity Recognition using ManiFL (ManiFL을 이용한 한국어 개체명 인식)

  • Kim, Wansu;Shin, Joon-choul;Park, Seoyeon;Ock, CheolYoung
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.633-636
    • /
    • 2021
  • 개체명 인식은 주어진 문장 안의 고유한 의미가 있는 단어들을 인명, 지명, 단체명 등의 미리 정의된 개체의 범주로 분류하는 문제이다. 최근 연구에서는 딥 러닝, 대용량 언어 모델을 사용한 연구들이 활발하게 연구되어 높은 성능을 보이고 있다. 하지만 이러한 방법은 대용량 학습 말뭉치와 이를 처리할 수 있는 높은 연산 능력을 필요로 하며 모델의 실행 속도가 느려서 실용적으로 사용하기 어려운 문제가 있다. 본 논문에서는 얕은 기계 학습 기법을 적용한 ManiFL을 사용한 개체명 인식 시스템을 제안한다. 형태소의 음절, 품사 정보, 직전 형태소의 라벨만을 자질로 사용하여 실험하였다. 실험 결과 F1 score 기준 90.6%의 성능과 초당 974 문장을 처리하는 속도를 보였다.

  • PDF

Constructing Korean Dialogue Natural Inference Dataset through Pseudo Labeling (Pseudo Labeling을 통한 한국어 대화 추론 데이터셋 구축)

  • Young-Jun Lee;Chae-Gyun Lim;Yunsu Choi;Ji-Hui Lm;Ho-Jin Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.205-209
    • /
    • 2022
  • 페르소나 대화 시스템이 상대방의 개인화된 정보에 일관된 응답을 생성하는 것은 상당히 중요하며, 이를 해결하기 위해 최근에 많은 연구들이 활발히 이루어지고 있다. 그 중, PersonaChat 데이터셋에 대해 수반/중립/모순 관계를 라벨링한 DialoguNLI 데이터셋이 제안되었으며, 일관성 측정, 페르소나 속성 추론 태스크 등 여러 분야에 활용되고 있다. 그러나, 공개적으로 이용가능한 한국어로 된 대화 추론 데이터셋은 없다. 본 연구에서는 한국어로 번역된 페르소나 대화 데이터셋과 한국어 자연어 추론 데이터셋에 학습된 모델을 이용하여 한국어 대화 추론 데이터셋(KorDialogueNLI)를 구축한다. 또한, 사전학습된 언어모델을 학습하여 한국어 대화 추론 모델 베이스라인도 구축한다. 실험을 통해 정확도 및 F1 점수 평가 지표에서 KLUE-RoBERTa 모델을 미세조정(fine-tuning)시킨 모델이 가장 높은 성능을 달성하였다. 코드 및 데이터셋은 https://github.com/passing2961/KorDialogueNLI에 공개한다.

  • PDF

A grammar definition and the GLR parsing for Korean sub-language (한국어 부분언어에 대한 문법 정의 및 GLR 파싱)

  • Kim, Ji Hyun;Jung, Byung Chae;Lee, Jae Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.142-145
    • /
    • 2013
  • 최근 한국어를 배우는 외국인의 증가로 '외국어로서의 한국어 학습(KFL)'에 대한 관심이 늘고 있다. 본 논문에서는 외국인을 위한 한국어 교재에서 사용된 회화 문장으로부터 문장 패턴을 분석하고 이를 기반으로 한국어 부분 언어 문법을 정의한다. 대개 부분 언어 문법은 간단하고 배우기 쉬우므로 외국어로서의 한국어 학습자들이 쉽게 한국어로 의사소통을 할 수 있을 것이다. 특히, 본 논문에서는 이 부분 문법이 컴퓨터로 해석될 수 있도록 문법을 정의하였고, 이를 자동 어휘분석기 생성기(flex)와 자동 파서 생성기(bison)을 이용해 기본적인 검증을 하였다.

  • PDF

Effect of Learning Korean Vocabulary with the Use of Mobile Applications -focused on Korean beginner learners- (애플리케이션을 활용한 한국어 어휘 학습의 효과 -초급 한국어 학습자들을 중심으로-)

  • Lee, Ba-Reun
    • The Journal of the Korea Contents Association
    • /
    • v.22 no.5
    • /
    • pp.37-47
    • /
    • 2022
  • The purpose of this study was to research the effects of Korean beginner learners' perception of vocabulary learning and comparison of vocabulary learning methods between the use of vocabulary application Classcard and rote learning with writing. This experiment was conducted by 24 beginner Korean learners who were at the 1st and 2nd level in Institute of Korean Language of D University. These students were dividing into 2 groups for the test - 12 in the control group and 12 in the experimental group. They took the vocabulary tests which were designed for examining the differences between before and after learning. Study results showed that vocabulary learning using the application Classcard significantly improved learners' vocabulary scores which were statistically significant. These results demonstrated that the method using Classcard has a greater learning effect than the method of rote learning with writing. Furthermore, the survey showed that learners did not feel uncomfortable in learning vocabulary using the application Classcard, and they thought it was one of the ways to learn vocabulary easily, which means that vocabulary learning using this application has a positive effect on learners' learning achievement. This study is significant in that it suggested a vocabulary learning method that can increase learners' interest and vocabulary by proving the effect of vocabulary learning using applications.

Analysis of Korean Language Parsing System and Speed Improvement of Machine Learning using Feature Module (한국어 의존 관계 분석과 자질 집합 분할을 이용한 기계학습의 성능 개선)

  • Kim, Seong-Jin;Ock, Cheol-Young
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.51 no.8
    • /
    • pp.66-74
    • /
    • 2014
  • Recently a variety of study of Korean parsing system is carried out by many software engineers and linguists. The parsing system mainly uses the method of machine learning or symbol processing paradigm. But the parsing system using machine learning has long training time because the data of Korean sentence is very big. And the system shows the limited recognition rate because the data has self error. In this thesis we design system using feature module which can reduce training time and analyze the recognized rate each the number of training sentences and repetition times. The designed system uses the separated modules and sorted table for binary search. We use the refined 36,090 sentences which is extracted by Sejong Corpus. The training time is decreased about three hours and the comparison of recognized rate is the highest as 84.54% when 10,000 sentences is trained 50 times. When all training sentence(32,481) is trained 10 times, the recognition rate is 82.99%. As a result it is more efficient that the system is used the refined data and is repeated the training until it became the steady state.

An Analysis of Korean Language Learners' Understanding According to the Types of Terms in School Mathematics (수학과 용어 유형에 따른 한국어학습자의 이해 분석)

  • Do, Joowon;Chang, Hyewon
    • Communications of Mathematical Education
    • /
    • v.36 no.3
    • /
    • pp.335-353
    • /
    • 2022
  • The purpose of this study is to identify the characteristics and types of errors in the conceptual image of Korean language learners according to the types of terms in mathematics that are the basis for solving mathematical word problems, and to prepare basic data for effective teaching and learning methods in solving the word problems of Korean language learners. To do this, a case study was conducted targeting four Korean language learners to analyze the specific conceptual images of terms registered in curriculum and terms that were not registered in curriculum but used in textbooks. As a result of this study, first, it is necessary to guide Korean language learners by using sufficient visualization material so that they can form appropriate conceptual definitions for terms in school mathematics. Second, it is necessary to understand the specific relationship between the language used in the home of Korean language learners and the conceptual image of terms in school mathematics. Third, it is necessary to pay attention to the passive term, which has difficulty in understanding the meaning rather than the active term. Fourth, even for Korean language learners who do not have difficulties in daily communication, it is necessary to instruct them on everyday language that are not registered in the curriculum but used in math textbooks. Fifth, terms in school mathematics should be taught in consideration of the types of errors that reflect the linguistic characteristics of Korean language learners shown in the explanation of terms. This recognition is expected to be helpful in teaching word problem solving for Korean language learners with different linguistic backgrounds.

The Transfer Effects of Perceptual Learning by Japanese of Korean Alveolar Stop Consonants (일본인의 한국어 치경폐쇄음 지각 학습의 전이효과)

  • Kim, Yoon-Hyun;Kim, Jung-Oh
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2005.05a
    • /
    • pp.154-157
    • /
    • 2005
  • 본 연구는 한국어를 학습한 경험이 없는 일본인의 한국어 치경폐쇄음 세 음소 범주(/ㄷ/, /ㄸ/, /ㅌ/)에 대한 지각 학습이 양순폐쇄음 세 음소(/ㅂ/. /ㅃ/, /ㅍ/) 지각에 미치는 효과를 검토하였다. 김윤현과 김정오 (2005)는 일본인들이 지각 학습과제에서 한국어 치경폐쇄음 세 범주를 구분할 때 기식성. 긴장성과 같은 변별 자질에 선택주의 하게 됨을 시사하는 결과를 얻었다. 치경음에 대한 지각 학습으로 적절한 단서에 선택주의 하게 되었다면, 같은 지각 차원에 따라 세 범주로 구분되는 양순음의 경우에도 치경폐쇄음 학습 후 음성자극들을 옳게 범주화를 할 것이다. 실험 결과, 치경폐쇄음 자극(/다/, /따/, /타/)만으로 이루어진 동일-상이판단 학습 과제에서 치경폐쇄음 파악의 정확율은 29.1%(표준오차=3.02) 증가하였고, 조음 위치의 변화에 따른 음향적 차이에도 불구하고 양순폐쇄음의 정반응율도 15.8%(표준오차=3.27)의 향상을 보였다. 이 전이효과는 치경음 지각 학습 때문에 일본인들이 폐쇄음의 세 음소 범주를 구분하는 적절한 지각 차원에 선택주의하게 되었음을 시사한다.

  • PDF

The Effect of Robot-Based STEAM Class on the Korean Learning of Multiculturul School Children -Focusing on After School Learning of Elementary School- (로봇 활용 STEAM 수업이 다문화 아동의 한국어 학습에 미치는 영향 -초등학교 방과 후 수업을 중심으로-)

  • Kim, Se-Min;You, Kang-Soo
    • Journal of Digital Convergence
    • /
    • v.13 no.8
    • /
    • pp.1-8
    • /
    • 2015
  • This paper focuses on analyzing Korean language learning effect through the STEAM class using a robot which is targeted on multicultural elementary school students. For the purpose of it, the degree of difficulty and interest of how students feel has been measured. By using the programing tool of Korean language entering base, they learn the programming commands like as variable, data type, branching statement, loop statement, etc in Korean, the effect of Korean learning has been measured. It has been examined two interviews at the beginning and the end of the second semester to measure the effect of Korean language learning. As a result of this research, It can be realized that multicultural children who have similar linguistic characteristics and cultural sphere understood Korean language easily when they take the Korean language class by utilizing a robot, and the class had an effect on the acquisition of Korean language for multicultural children.