• Title/Summary/Keyword: language transfer

Search Result 285, Processing Time 0.023 seconds

Korean Text Style Transfer Using Attention-based Sequence-to-Sequence Model (Attention-based Sequence-to-Sequence 모델을 이용한 한국어 어체 변환)

  • Hong, Taesuk;Xu, Guanghao;Ahn, Hwijeen;Kang, Sangwoo;Seo, Jungyun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.567-569
    • /
    • 2018
  • 한국어의 경어체는 종결어미에 따라 구분하고, 서로 다른 경어체는 각각 고유한 경어 강도가 있다. 경어체 간의 어체 변환은 규칙기반으로 진행되어 왔다. 본 논문은 어체 변환을 위한 규칙 정의의 번거로움을 줄이고 어체 변환 데이터만을 사용한 심층 학습 기반의 어체 변환 방법을 제안한다. 본 연구는 '해요체-합쇼체' 쌍의 병렬 데이터를 이용하여 Attention-based Sequence-to-Sequence 모델을 바탕으로 한 어체 변환 모델을 학습하였다. 해당 모델을 학습하고 실험하였을 때, 정확도 91%의 우수한 성과를 얻을 수 있었다.

  • PDF

Style Transfer in Korean Text using Auto-encoder and Adversarial Networks (오토인코더와 적대 네트워크를 활용한 한국어 문체 변환)

  • Yang, Kisu;Lee, Dongyub;Lee, Chanhee;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.658-660
    • /
    • 2018
  • 인공지능 산업이 발달함에 따라 사용자의 특성에 맞게 상호작용하는 기술에 대한 수요도 증가하고 있다. 하지만 텍스트 스타일 변환의 경우 사용자 경험을 크게 향상시킬 수 있는 기술임에도 불구하고, 학습에 필요한 병렬 데이터가 부족하여 모델링과 성능 개선에 어려움을 겪고 있다. 이에 따라 본 논문에서는 비 병렬 데이터만으로 텍스트 스타일 변환이 가능한 선행 모델[1]을 기반으로, 한국어에 적합한 문장 표현 방식 및 성능 개선을 위한 임의 도메인 예측 기법이 적용된 모델을 제안한다.

  • PDF

Absolute and Proportional Undershoot Values as Indices of Coarticulation

  • Oh, Eun-Jin
    • Speech Sciences
    • /
    • v.12 no.1
    • /
    • pp.65-74
    • /
    • 2005
  • The aim of this paper is to suggest an index of coarticulation, proportional undershoot values, given the observation that absolute undershoot within a language tends to be proportional to target-locus difference. The target-locus proportionality predicts that a large difference between the consonant locus and the vowel target will result in a large amount of vowel undershoot, while a small difference a small amount of vowel undershoot. It turns out that the proportional undershoot is a potentially more appropriate way of comparing degree of undershoot across languages. However, even though the proportional undershoot measurement may provide a useful index comparing the overall coarticulation degree in a CV token for cross-linguistic data, it is concluded that it may potentially wrongly predict the cases of transfer or error as a progress in learning.

  • PDF

Head-based Pharse Structure Transfer Dictionary for Korean_English Machine Translation (한.영 기계번역을 위한 중심어 기반 구 구조 변환 사전)

  • Lee, San-Jo;Park, Sang-Kyu;Kim, Yung-Taek
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.157-162
    • /
    • 1994
  • 한국어로부터 자연스러운 영어 역어문장을 생성하기 위한 정보를 사전에 일관성있게 수록하는 방법을 제시하였다. 기계번역의 각 과정에서 필요한 정보는 가장 적당한 형태로 사전으로부터 제공되어야 하는 것이 일반적인 방법이다. 그러나 한국어는 어순의 부분적 자유성, 어미의 복잡한 활용규칙, 조사의 다양한 쓰임새로 인해 이러한 규칙들의 정보를 일관되게 사전에 수록하기가 어려운 실정이다. 본 논문에서는 한국어 문장과 역어 문장을 단어나 구 혹은 절등의 구성요소들의 다대다 매핑규칙을 찾고 이들 규칙을 적당한 형태로 사전에 수록하여야하는 어려움에서 벗어나 문장대 문장구조를 직접대응시켜 구구조단위로 분석된 형태의 부분 파서트리 형태의 트리구조를 역어와 함께 사전에 수록하므로써 사전정보를 손쉽게 구축, 유지하고자 하였다. 또 이들 정보를 추출해내는 알고리즘을 사용함으로써 주어진 한국어 문장에 대해 사전에 수록된 가장 자연스러운 형태의 역어문장을 생성할 수 있도록 하였다.

  • PDF

Non-native Locus Equations and the Unit of Phonetic Acquisition

  • Oh, Eunjin
    • Korean Journal of English Language and Linguistics
    • /
    • v.1 no.3
    • /
    • pp.497-508
    • /
    • 2001
  • This study tested whether non-native speakers approximated native-like locus equation slopes. Russian learners of English acquired native-like values of the locus equation slope for the English bilabial, and English learners of Russian made slight modifications to the locus equation slope of the Russian bilabial. The acquisition of the locus equations occurred gradually with experience. While English speakers, with limited experience with Russian, failed to approximate Russian-typical value of the locus equations slope, Russian speakers, with more extensive experience with English, succeeded in approximating the locus equation for English bilabial. The observation of locus equation transfer effect supports for the locus equation hypothesis as the unit of acquisition over CV-by-CV learning.

  • PDF

A Suggestion of Designing Program for Learning Transfer from Block-Based Programming Language to Text-Based Programming Language (블록 기반 프로그래밍 언어에서 텍스트 기반 프로그래밍 언어로의 학습 전이를 위한 프로그램 설계 방안)

  • Yi, Soyul;Lee, Youngjun
    • Proceedings of The KACE
    • /
    • 2018.01a
    • /
    • pp.29-31
    • /
    • 2018
  • 프로그래밍 언어 교육에서 일반적으로 학습자들은 블록 기반 프로그래밍 언어에서 텍스트 기반 프로그래밍 언어 순서로 학습한다. 블록 기반 프로그래밍 언어나 텍스트 기반 프로그래밍 언어는 여타의 프로그래밍 언어들과 마찬가지로 프로그래밍의 기본 논리는 동일하나, 형태, 언어적 특성 및 사용 등에 대하여 다소 차이가 있다. 따라서 본 연구에서는 학습자들의 블록 기반 프로그래밍 언어에서 텍스트 기반 프로그래밍 언어로의 유연한 학습 전이를 돕기 위한 프로그램의 설계 방안을 선행 조직자의 제시, 학습 콘텐츠의 체계화, 단순하고 직관적인 화면 구성으로 제시하였다.

  • PDF

A Study on Integrated User Interface transfer model base on UIML (UIML에 기반한 통합 사용자 인터페이스 변환 모델에 관한 연구)

  • Park, Byung-Chul;Son, Min-Woo;Kim, Kang;Shin, Dong-Il;Shin, Dong-Kyoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.865-868
    • /
    • 2004
  • 오늘날 스마트 홈, 홈오토메이션, 홈 네트워크 등의 연구 개발로 여러 기기들과 컴퓨터가 연동한다. 이에 따라 다양한 기기에 맞춰 사용자 인터페이스를 여러 번 개발해야하는 비효율적인 일이 빈번하다. 또한, 개발자에게 있어서 여러 기기에 사용되는 서로 다른 언어를 모두 익히고 개발하는 것 역시 많은 부담을 준다. 이러한 불합리함을 위해 새로운 markup language가 제시되었는데 바로 UIML(User Interface Markup Language)이다. UIML은 XML-compliant 언어로 여러 기기를 위한 사용자 인터페이스를 하나의 문서로서 구현이 가능하다. 따라서 개발자는 UIML 문서 하나만을 개발하면 HTML, WML, VoiceXML 등 다른 언어로 변환이 용이하다. 그러나 UIML도 여러 언어로의 변환을 위해 각각의 문서를 생성해야하는 번거로움이 있다. 본 연구에서는 이러한 UIML을 보완하여 통합된 사용자 인터페이스 변환의 모델을 제시한다.

  • PDF

Improving Performance of Sentiment Classification using Korean Style Transfer based Data Augmentation (한국어 스타일 변환 기반 데이터 증강을 이용한 감성 분류 성능 향상)

  • Eunwoo Go;Eunchan Lee;Sangtae Ahn
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.480-484
    • /
    • 2022
  • 텍스트 분류는 입력받은 텍스트가 어느 종류의 범주에 속하는지 구분하는 것이다. 분류 모델에 있어서 좋은 성능을 나타내기 위해서는 충분한 양의 데이터 셋이 필요함을 많은 연구에서 보이고 있다. 이에 따라 데이터 증강기법을 소개하는 많은 연구가 진행되었지만, 실제로 사용하기 위한 모델에 곧바로 적용하기에는 여러 가지 문제점들이 존재한다. 본 논문에서는 데이터 증강을 위해 스타일 변환 기법을 이용하였고, 그 결과 기존 방법 대비 한국어 감성 분류의 성능을 높였다.

  • PDF

Text Style Transfer of Non-parallel Data using Transformer and Discriminator (트랜스포머와 판별기를 이용한 비병렬 데이터의 텍스트 스타일 변환)

  • Park, Da-Sol;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.64-68
    • /
    • 2020
  • 텍스트 스타일 변환은 문장 내 컨텐츠는 유지하면서 문장의 스타일을 변경하는 것이다. 스타일의 정의가 모호하기 때문에 텍스트 스타일 변환에 대한 연구는 대부분 지도 학습으로 진행되어왔다. 본 논문에서는 병렬 데이터 구축이 되지 않은 데이터를 학습하기 위해 비병렬 데이터를 이용하여 스타일 변환을 시도한다. 트랜스포머 기반의 문장 생성기를 이용하여 문장을 생성하고, 해당 스타일을 분류하는 판별기로 이루어진 모델을 제안한다. 제안 모델을 통해, 감정 변환의 성능은 정확도(Accuracy) 56.9%, self-BLEU 0.393(긍정→부정), 0.366(부정→긍정), 유창성(fluency) 798.23(긍정→부정), 1381.05(부정→긍정)을 보였다. 본 연구는 비병렬 데이터에 대해 스타일 변환을 적용함으로써, 병렬 데이터가 없는 다양한 도메인에도 적용가능 할 것이다.

  • PDF

Emotion Transfer with Strength Control for End-to-End TTS (감정 제어 가능한 종단 간 음성합성 시스템)

  • Jeon, Yejin;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.423-426
    • /
    • 2021
  • 본 논문은 전역 스타일 토큰(Global Style Token)을 기준으로 하여 감정의 세기를 조절할 수 있는 방법을 소개한다. 기존의 전역 스타일 토큰 연구에서는 원하는 스타일이 포함된 참조 오디오(reference audio)을 사용하여 음성을 합성하였다. 그러나, 참조 오디오의 스타일대로만 음성합성이 가능하기 때문에 세밀한 감정 조절에 어려움이 있었다. 이 문제를 해결하기 위해 본 논문에서는 전역 스타일 토큰의 레퍼런스 인코더 부분을 잔여 블록(residual block)과 컴퓨터 비전 분야에서 사용되는 AlexNet으로 대체하였다. AlexNet은 5개의 함성곱 신경망(convolutional neural networks) 으로 구성되어 있지만, 본 논문에서는 1개의 신경망을 제외한 4개의 레이어만 사용했다. 청취 평가(Mean Opinion Score)를 통해 제시된 방법으로 감정 세기의 조절 가능성을 보여준다.

  • PDF