• Title/Summary/Keyword: 학습 한국어

Search Result 1,338, Processing Time 0.024 seconds

Korean Outline Font Editing System based on UFO Using METAFONT (메타폰트를 이용한 UFO 기반의 한글 외곽선 폰트 시스템)

  • Gwon, Gyeong-Jae;Son, Min-Ju;Jeong, Geun-Ho;Choi, Jae-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.44-48
    • /
    • 2016
  • 오늘날 폰트를 디자인하는데 주로 사용되는 외곽선 방식은 글자의 크기를 손쉽게 변경할 수 있으나 글자의 굵기나 스타일을 변화시키려면 다시 수작업을 통해서 디자인을 변경해야 한다. 이를 보완하기 위한 프로그래머블 폰트인 메타폰트는 매개변수를 사용하여 글자의 변화가 매우 용이하다. 하지만 메타폰트는 프로그래밍 언어이므로 메타폰트에 대한 선행학습이 필요하여 폰트 디자이너에게 사용되지 않았다. 따라서 본 논문에서는 폰트 디자이너에게 익숙한 외곽선 방식에 편집기를 제공하면서 글자의 스타일에 대한 변화를 메타폰트에서 처리하여 다양한 폰트를 파생할 수 있는 한글 외곽선 폰트 시스템을 제안한다. 이를 위하여 본 시스템에서는 외곽선 방식의 폰트를 제작할 수 있도록 하는 웹 외곽선 폰트 편집기를 구현하였으며 외곽선 방식의 폰트를 메타폰트로 변환하는 UFO2mf를 구현하였다. 본 논문에서 제안하는 폰트 시스템은 기존 외곽선 방식의 스타일 변화에 대한 수고를 덜어줄 수 있을 것으로 기대한다.

  • PDF

Isolated-Word Recognition Using Neural Network and Hidden Markov Model (Neural-HMM을 이용한 고립단어 인식)

  • 김연수;김창석
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.17 no.11
    • /
    • pp.1199-1205
    • /
    • 1992
  • In this paper, a Korean word recognition method which usese Neural Network and Hidden Markov Models(HMM) is proposed to improve a recognition rate with a small amount of learning data. The method reduces the fluctuation due to personal differences which is a problem to a HMM recognition system. In this method, effective recognizer is designed by the complement of each recognition result of the Hidden Markov Models(HMM) and Neural Network. In order to evaluate this model, word recognition experiment is carried out for 28 cities which is DDD area names uttered by two male and a female in twenties. As a result of testing HMM with 8 state, codeword is 64, the recognition rate 91[%], as a result of testing Neural network(NN) with 64 codeword the recognition rate is 89[%]. Finally, as a result of testing NN-HMM with 64 codeword which the best condition in former tests, the recognition rate is 95[%].

  • PDF

Bootstrapping for Semantic Role Assignment of Korean Case Marker (부트스트래핑 알고리즘을 이용한 한국어 격조사의 의미역 결정)

  • Kim Byoung-Soo;Lee Yong-Hun;Na Seung-Hoon;Kim Jun-Gi;Lee Jong-Hyeok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.4-6
    • /
    • 2006
  • 본 논문은 자연언어처리에서 문장의 서술어와 그 서술어가 가지는 명사 논항들 사이의 문법관계를 의미 관계로 사상하는 즉 논항이 서술어에 대해 가지는 역할을 정하는 문제를 다루고 있다. 의미역 결정은 단어의 의미 중의성 해소와 함께 자연언어의 의미 분석의 핵심 문제 중 하나이며 반드시 해결해야 하는 매우 중요한 문제 중 하나이다. 본 연구에서는 언어학적으로 유용한 자원인 세종전자사전을 이용하여 용언격틀사전을 구축하고 격틀 선택 방법으로 의미역을 결정한 후. 결정된 의미역들에 대한 확률 정보를 확률 모델에 적용하여 반복적으로 학습하는 부트스트래핑(Bootstrapping) 알고리즘을 사용하였다. 실험 결과, 기본 모델에 대해 10% 정도의 성능 향상을 보였다.

  • PDF

A Study of Relative Clauses in Korean Used by Korean Learners (한국어 학습자들의 관계절 사용 양상 연구)

  • Jo, Su Hyun
    • Cross-Cultural Studies
    • /
    • v.19
    • /
    • pp.359-388
    • /
    • 2010
  • This study is aimed to investigate the aspect of using relative clauses in Korean. The data used for this study were extracted from the Korean text books for the foreign students and from the Chinese students' Korean compositions. They are the learners of Korean language at the early intermediated stage. As the result of analyzing them, the followings were found I)the majority of relative clauses in Korean consists of left-branching sentences. ii)The number of the subject relative clauses was higher than object ones in both of them. Especially in the aspect of using relative clauses, subject ones were used even more frequently than objective ones. This result is corresponded to the previous thesis, "the subject relative clauses was acquired earlier than object ones". iii)The relative clauses that those with a head noun function as subject in the main sentence showed in higher proportion in comparison of those as object. That is, this study showed that subjects were used more frequently than objects in the relative clauses used in their compositions. Finally, this study analyzed the errors of adnominal ending usage occurring in their compositions. More errors occurred when adjective form ended with '-hada' are changed into adnominal ending one.

Native language Interference in producing the Korean rhythmic structure: Focusing on Japanese (한국어 리듬구조에 미치는 L1의 영향: 일본인 학습자를 중심으로)

  • Yune, Youngsook
    • Phonetics and Speech Sciences
    • /
    • v.10 no.4
    • /
    • pp.45-52
    • /
    • 2018
  • This study investigates the effect of Japanese (L1) on the production of the Korean rhythmic structure. Korean and Japanese have typologically different rhythmic structure as a syllable-timed language and mora-timed language, respectively. This rhythmic difference comes from the different phonological properties of the two languages. Due to this difference, Japanese speakers that are learning Korean may produce a different rhythm than native Korean speakers' rhythm. To investigate the influence of the native language's rhythm on the target language, we conducted an acoustic analysis using acoustic metrics such as %V, VarcoV, and VarcoS. Four Korean native speakers and ten advanced Japanese Korean learners participated in a production test. The analyzed material consisted of six Korean sentences that contained various syllable structures. The results showed that KS and JS's rhythms are different in %V as well as in VarcoV. In the case of VarcoS, significant rhythmic difference was observed in the VC and CVC syllable, in which the coda segment is nasal sound. This study allowed us to observe the influence of L1 on production of L2 rhythm.

Template Constrained Sequence to Sequence based Conversational Utterance Error Correction Method (문장틀 기반 Sequence to Sequence 구어체 문장 문법 교정기)

  • Jeesu Jung;Seyoun Won;Hyein Seo;Sangkeun Jung;Du-Seong Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.553-558
    • /
    • 2022
  • 최근, 구어체 데이터에 대한 자연어처리 응용 기술이 늘어나고 있다. 구어체 문장은 소통 방식 등의 형태로 인해 정제되지 않은 형태로써, 필연적으로 띄어쓰기, 문장 왜곡 등의 다양한 문법적 오류를 포함한다. 자동 문법 교정기는 이러한 구어체 데이터의 전처리 및 일차적 정제 도구로써 활용된다. 사전학습된 트랜스포머 기반 문장 생성 연구가 활발해지며, 이를 활용한 자동 문법 교정기 역시 연구되고 있다. 트랜스포머 기반 문장 교정 시, 교정의 필요 유무를 잘못 판단하여, 오류가 생기게 된다. 이러한 오류는 대체로 문맥에 혼동을 주는 단어의 등장으로 인해 발생한다. 본 논문은 트랜스포머 기반 문법 교정기의 오류를 보강하기 위한 방식으로써, 필요하지 않은 형태소인 고유명사를 마스킹한 입력 및 출력 문장틀 형태를 제안하며, 이러한 문장틀에 대해 고유명사를 복원한 경우 성능이 증강됨을 보인다.

  • PDF

Noised Guide-based Generative Model for Open-domain Conversation (오픈 도메인 대화를 위한 노이징된 가이드 기반 생성 모델)

  • Bit-Na Keum;Hong-Jin Kim;Sang-Min Park;Jai-Eun Kim;Jin-Xia Huang;Oh-Woog Kwon;Hark-Soo Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.82-87
    • /
    • 2022
  • 대화 모델은 대표적으로 검색 모델 또는 생성 모델을 기반으로 구현된다. 최근에는 두 모델의 장점은 융합하고 단점은 보완하기 위해 검색 기법과 생성 기법을 결합하는 연구가 활발히 이루어지고 있다. 그러나 생성 모델이 검색된 응답을 전혀 반영하지 않고 응답을 생성하여 검색 모델을 간과하는 문제 또는 검색된 응답을 그대로 복사해 생성하여 검색 모델에 과의존하는 문제가 발생한다. 본 논문에서는 이러한 문제들을 완화하며 검색 모델과 생성 모델을 모두 조화롭게 활용할 수 있는 대화 모델을 제안한다. 생성 모델이 검색 모델을 간과하는 문제를 완화하기 위해 학습 시 골드 응답을 검색된 응답과 함께 사용한다. 또한, 검색 모델에 과의존하는 문제를 완화하기 위해 검색된 응답들의 내용어 일부를 마스킹하고 순서를 무작위로 섞어 노이징한다. 검색된 응답은 대화 컨텍스트와의 관련성이 높은 것만을 선별하여 생성에 활용한다. 정량 평가 및 정성 평가를 통해 제안한 방법의 성능 향상 효과를 확인하였다.

  • PDF

SaJuTeller: Conditional Generation Deep-Learning based Fortune Telling Model (SaJuTeller: 조건부 생성 모델을 기반으로 한 인공지능 사주 풀이 모델)

  • Hyeonseok Moon;Jungseob Lee;Jaehyung Seo;Sugyeong Eo;Chanjun Park;Woohyeon Kim;Jeongbae Park;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.277-283
    • /
    • 2022
  • 사주 풀이란 주어진 사주에 대해서 그에 맞는 해석 글을 생성해주는 작업을 의미한다. 전통적으로 사주 풀이는 온전한 사람의 영역으로 인식되어왔으나, 우리는 본 연구를 통해 사주 풀이 영역도 인공지능으로 대체할 수 있을 것이라는 가능성을 탐구한다. 본 연구에서 우리는 최근 연구되고 있는 자연어 생성분야의 연구들에서 영감을 받아, 사주 유형과 사주 풀이 내에 포함할 명사 키워드를 기반으로 풀이글을 생성하는 인공지능 모델 SaJuTeller를 설계한다. 특히 이전 문맥을 고려하여 풀이글을 생성하는 모델과 단순 사주 유형 및 명사 키워드를 기반으로 풀이글을 생성하는 두가지 모델을 제안하며, 이들 각각의 성능을 분석함으로써 각 모델의 구체적인 활용 방안을 제안한다. 본 연구는 우리가 아는 한 최초의 인공지능 기반 사주풀이 연구이며, 우리는 이를 통해 사주풀이에 요구되는 전문인력의 노력을 경감시킴과 동시에, 다양한 표현을 가진 사주 풀이 글을 생성할 수 있음을 제안한다.

  • PDF

Data Augmentation for Generating Counter Narratives against Hate Speech (혐오 표현에 대한 대응 발화 생성을 위한 데이터 증강 기법)

  • Seungyoon Lee;Suhyune Son;Dahyun Jung;Chanjun Park;Aram So;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.10-15
    • /
    • 2022
  • 온라인상에서 발생하는 혐오 표현은 사회가 직면한 주요 문제 중 하나이다. 이러한 필요성에 입각해, 최근 인공지능을 활용하여 발화에 대한 교화 목적을 가진 대응 발화 쌍을 통해 혐오 표현에 대한 실질적인 완화를 진행하는 연구들이 생겨나고 있다. 그러나 각 혐오 표현에 적합한 대응 발화의 구축은 다수의 전문 인력이 요구되므로 데이터를 구축함에 있어 시간과 비용이 많이 소요되며 대응 발화 생성 또한 어려운 문제로 여겨진다. 해당 문제를 완화하기위해, 본 논문은 사전에 기 구축되어 있는 혐오 표현 데이터를 기반으로 의미 기반 검색을 적용하여 자동으로 데이터를 증강할 수 있는 쉽고 빠른 데이터 증강 방법론을 제안한다. 제안하는 프로세스의 타당성과 증강된 문장의 효과를 검증하기 위해 사전학습 모델을 기반으로 비교 실험을 진행하였다. 실험 결과, 제안하는 프로세스를 적용하였을 시, 그렇지 않은 모델 대비 높은 폭의 성능 향상을 보였다.

  • PDF

MICA: Mind Care Dataset on Korean Anonymous Mental Health Platform (MICA: 한국 익명 심리건강 플랫폼 기반 심리상담 데이터셋)

  • Seungmoo Yang;Seonghyun Kim;Chanhee Jeong;Jeehye Koo;Seunghyeok Hong
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.210-215
    • /
    • 2022
  • 최근 전 세계적으로 불안감, 우울증 등을 비롯한 정신 건강 관리에 어려움을 겪고 있다. 특히 COVID-19 팬데믹 사태로 인해 경제적, 사회적으로 고립되는 시간이 길어지면서 정신 건강이 악화되고 있다. 한국의 경우도 심리상담을 받는 비율이 증가하는 등 정신 건강 관리의 수요가 높아지고 있다. 정신 건강 관리를 위한 여러 진입 장벽들을 극복하기 위해 개발된 비대면 심리상담들이 인기를 얻고 있다. 특히, 인공지능 기술과 정신 건강 관리를 결합하려는 시도가 많아지고 있으며, 미국, 중국 등 해외에서는 이미 워봇(Woebot), 유퍼(Youper) 같은 심리상담 챗봇이 상용화되어 서비스 중이다. 그러나 한국에서의 심리상담 챗봇은 아직까지 해외만큼 상용화 단계에 이르지 못했다. 또한, 이러한 챗봇을 구축하기 위한 데이터셋 연구가 부족한 실정이다. 본 논문에서는 익명 심리 플랫폼을 통하여, 심리전문가가 비식별화한 고민과 해당 고민에 대한 전문가 답변을 활용하여 구축한 MICA를 소개한다. 또한, 본 데이터셋을 활용해 딥러닝 기반의 언어 모델을 학습하고 정량적, 정성적 성능 평가를 통해 챗봇의 가능성을 확인하였다.

  • PDF