• 제목/요약/키워드: 문법적 형태소

검색결과 60건 처리시간 0.027초

노년층의 글쓰기 특성 -이야기문법과 구문구조 (Characteristics of Narrative Writing in Normal Aging: Story Grammar and Syntactic Structure)

  • 김현아;원새롬;이보은;윤지혜
    • 재활복지
    • /
    • 제21권1호
    • /
    • pp.193-212
    • /
    • 2017
  • 노년층은 이야기를 산출하면서 주제로부터 벗어나는 이야기를 하거나 문장구조를 단순화하기도 하며 문법 형태소의 오류를 보일 수 있다. 이야기를 말하는 능력과 글로 쓰는 능력은 서로 다를 수 있는데, 글을 쓰는 능력은 복잡한 인지과정을 필요로 하므로 노화에 더 취약할 수 있다. 이에 본 연구는 정상 노년층 32명과 청년층 32명을 대상으로 이야기 쓰기 능력을 살펴보았다. 과제는 전래동화('흥부놀부')에 대한 그림들을 보고 자유롭게 이야기를 구성하여 써보도록 하였다. 자료 분석 시에는 이야기 구성적 측면과 이야기 구문구조적 측면으로 나누어 그 특성을 확인하였다. 연구결과, 노년층은 청년층에 비하여 이야기 구성적으로는 이야기문법과 완전한 에피소드의 수가 유의하게 적었으며 주제에서 벗어난 문장을 더 많이 산출하였다. 구문구조적으로는 복문의 사용빈도는 청년층과 차이가 없었으나 관형절과 부사절 내포문의 사용이 저하되고 부적절한 결속표지를 많이 산출하였다. 이러한 결과는 노년층이 이야기 글쓰기를 할 때 주제의 유지가 저하되고 수식적으로 꾸며주는 표현의 사용이 부족하게 되면서 전체적인 글의 응집성이 저하되지만 쓰기 활동의 시각적 피드백에 도움을 받을 수 있게 되므로 긴 복문의 사용이 가능할 수 있었음을 시사한다.

Out-of-Vocabulary 단어에 강건한 병렬 Tri-LSTM 문장 임베딩을 이용한 감정분석 (Sentiment Analysis using Robust Parallel Tri-LSTM Sentence Embedding in Out-of-Vocabulary Word)

  • 이현영;강승식
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.16-24
    • /
    • 2021
  • word2vec 등 기존의 단어 임베딩 기법은 원시 말뭉치에 출현한 단어들만을 대상으로 각 단어를 다차원 실수 벡터 공간에 고정된 길이의 벡터로 표현하기 때문에 형태론적으로 풍부한 표현체계를 가진 언어에 대한 단어 임베딩 기법에서는 말뭉치에 출현하지 않은 단어들에 대한 단어 벡터를 표현할 때 OOV(out-of-vocabulary) 문제가 빈번하게 발생한다. 문장을 구성하는 단어 벡터들로부터 문장 벡터를 구성하는 문장 임베딩의 경우에도 OOV 단어가 포함되었을 때 문장 벡터를 정교하게 구성하지 못하는 문제점이 있다. 특히, 교착어인 한국어는 어휘형태소와 문법형태소가 결합되는 형태론적 특성 때문에 미등록어의 임베딩 기법은 성능 향상의 중요한 요인이다. 본 연구에서는 단어의 형태학적인 정보를 이용하는 방식을 문장 수준으로 확장하고 OOV 단어 문제에 강건한 병렬 Tri-LSTM 문장 임베딩을 제안한다. 한국어 감정 분석 말뭉치에 대해 성능 평가를 수행한 결과 한국어 문장 임베딩을 위한 임베딩 단위는 형태소 단위보다 문자 단위가 우수한 성능을 보였으며, 병렬 양방향 Tri-LSTM 문장 인코더는 86.17%의 감정 분석 정확도를 달성하였다.

형태소 분석기의 어휘적 중의성 해결에 관한 연구 (A Study on Lexical Ambiguity Resolution of Korean Morphological Analyzer)

  • 박용욱
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.783-787
    • /
    • 2012
  • 한 어절을 중심으로 검사가 이루어지는 맞춤법 검사는 문맥상 어울리지 않는 단어로 인하여 생기는 오류는 찾기 어렵다. 맞춤법 검사기는 현재 어절 단위로 오류 여부를 판단하는 것이기 때문에 어휘적 중의성을 고려하지 않아도 된다. 그러나 문법 검사기는 문장 분석을 해야 하므로 어휘적 중의성을 제거하지 않고는 정확한 검사가 어렵다. 본 논문에서는 어휘적 중의성을 해결하기 위하여 몇 가지 규칙을 만들고 이를 활용하여 문장에 존재하는 어휘적 중의성을 해결할 수 있는 방법을 보인다. 또한 실험을 통하여 그 결과를 분석하였다.

대화체 연속음성 인식을 위한 한국어 대화음성 특성 분석 (Analysis of Korean Spontaneous Speech Characteristics for Spoken Dialogue Recognition)

  • 박영희;정민화
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.330-338
    • /
    • 2002
  • 대화체 연속음성은 자연스러운 발화로 낭독체 문장에 비해 잡음, 간투어와 같은 비문법적인 요소가 많고, 발음의 변이가 심하다. 이런 이유로 대화체 연속음성을 인식하기 위해서는 대화 현상을 분석하고 그 특징을 반영하여야 한다. 본 논문에서는 실제 대화음성에 빈번히 나타나는 대화 현상들을 분류하고 각 현상들을 모델링하여 대화체 연속음성 인식을 위한 기본 베이스라인을 구축하였다. 대화 현상을 묵음 구간과 잡음, 간투어, 반복/수정 발화의 디스풀루언시 (disfluencies), 표준전사와 다른 발음을 갖는 발음변이 현상으로 나누었다. 발음변이 현상은 다시 양성음의 음성음화, 음운축약/탈락현상, 패턴화된 발음변이, 발화오류로 세분화하였다. 대화체 음성인식을 위해서 빈번히 나타나는 묵음구간을 고려한 학습과 잡음, 간투어 처리를 위한 음향모델을 각각 추가하였다. 발음변이 현상에 대해서는 출현빈도수가 높은 것들만을 대상으로 발음사전에 다중 발음열을 추가하였다. 대화현상을 고려하지 않고 낭독체 스타일로 음성인식을 수행하였을 때 형태소 에러율 (MER: Morpheme Error Rate)은 31.65%였다. 이에 대한 형태소 에러율의 절대값 감소는 묵음 모델과 잡음 모델을 적용했을 때 2.08%, 간투어 모델을 적용했을 때 0.73%, 발음변이 현상을 반영했을때 0.92%였으며, 최종적으로 27.92%의 형태소 에러율을 얻었다. 본 연구는 대화체 연속음성 인식을 위한 기초 연구로 음향모델과 어휘모델, 언어모델 각각에 대한 베이스라인으로 삼고자 한다.

한국어 대화체 음성언어 번역시스템에서의 개념기반 번역시스템 (Concept-based Translation System in the Korean Spoken Language Translation System)

  • 최운천;한남용;김재훈
    • 한국정보처리학회논문지
    • /
    • 제4권8호
    • /
    • pp.2025-2037
    • /
    • 1997
  • 대화체 음성언어번역시스템의 일부인 개념기반 번역시스템은 음성인식의 결과를 이용하여 다른 언어로 번역해 주는 시스템이다. 본 논문은 여행계획 영역에 대해 한국어를 해석하여 영어, 일본어, 한국어로 번역해 주는 시스템에 대해 기술한 것이다. 개념기반 번역은 비정형 문장이 많은 대화체 문장을 처리하기 위해 형태소 분석 등의 구문정보를 이용하지 않고, 의미단위의 번역을 시도한 것으로 화자의 의도를 정확히 번역해 주는 것을 목표로 한다. 개념기반 번역은 280여개의 개념과 개념간의 계층구조에 의해, 인식결과를 개념구조로 변환한 후 다른 언어로 생성해 준다. 효율적인 한국어 처리를 위해 기준단어를 이용한 토큰분리기와 문법자동 수정기를 개발하였다. 그리고 자연스러운 생성문을 위해 각 언어에 대한 후처리기를 개발하였다.

  • PDF

레스토랑 영역에서의 자질기반 대화시스템 구현 (Implementation of Feature-based Dialog System in Restaurant domain)

  • 양현석;김동주;설용수;정성훈;김한우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.425-428
    • /
    • 2011
  • 서비스 로봇과 펫 로봇 등 사람과 직접 상호작용하는 로봇기술의 필요성이 증가하고 있다. 대화시스템은 자연언어처리 기술을 활용하여 음성인식 기술과의 결합을 통해 현재 로봇에서 주로 사용되고 있는 버튼과 터치스크린 위주의 HRI(Human-Robot Interface)보다 자연스러운 HRI를 제공한다. 이러한 자연스러운 HRI를 수행할 수 있는 로봇을 구성하기 위해서는 로봇이 서비스를 제공할 실제 영역에 맞는 대화시스템의 연구가 필요하다. 본 논문에서는 자질사전, 단일화 문법(unification grammar), 대화 흐름도(dialogue flow diagram)를 사용한 레스토랑 영역의 자질기반(feature-based) 대화시스템을 제시한다. 자질 정보는 형태소, 시제, 어휘의 의미구조 등을 나타내며 화행(speech act) 결정에 사용하고 문장 자질과 구문 자질을 파서에서 활용한다. 자질기반 대화시스템을 통하여 레스토랑 영역에서 사용자 화행 이해 및 주문, 안내 등의 서비스를 성공적으로 수행할 수 있음을 보인다.

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.

적용구문과 참여자관계 (Applikative Konstruktion und Partizipantenrelationen)

  • 신용민
    • 한국독어학회지:독어학
    • /
    • 제6집
    • /
    • pp.57-78
    • /
    • 2002
  • 적용구문(Applikative Konstruktion)은 타동사 구문의 일종이며 적용동사(Applikatives Verb)는 두 가지 유형으로 나눌 수 있다 적용동사가 자동사에서 타동사화 된 경우면 자동사에서는 없던 직접 목적어를 위한 슬롯이 적용형태소(Applikativmarker)를 통해 생긴다. 타동사에서 적용형태소의 삽입을 통해 변화된 적용동사는 두 개의 직접목적어를 취할 수 있는 동사의 특징을 나타내거나, 동사의 논항구조를 재배열하는 기능을 가진다. '논항구조 재배열'(rearrangement of argument structure)의 가장 전형적인 예는 타동사의 주변적인 참여자(peripherer Partizipant)를 적용동사를 통해 격상(Promotion) 시키는 반면 핵심참여자(zentraler Partizipant)는 격하(Demotion) 되는 구문이다. 즉 비 적용구문의 주변적인 참여자가 적용구문에서는 핵심참여자로서 직접목적어(direktes Objekt)의 통사적 기능을 가지는 것이다. 이러한 현상은 세계 여러 나라 언어에서 찾아 볼 수 있는데 본 논문에서는 독일어, 유카텍마야어, 인도네시아어, 캄베라어를 연구대상으로 삼았으며 이들 각 언어에서 어떤 참여자관계(Partizipantenrelation)가 적용구문의 직접목적어로 표현될 수 있는가를 살펴보았다. 이들 언어에서는 장소(Lokation)>수혜자($Benfizi\"{a}r$) & 수취인(Rezipient) > 동반자(Komitativ) > 기구(Instrument) 등의 순서로 가능하다. 이 것을 페터슨(1999)의 연구결과와 종합하여 살펴보면 적용구문의 직접목적어로 나타날 수 있는 참여자들의 순서는 루라기(2000)에 소개된 참여자의 원인연쇄(Kausale Kette)의 역순과 거의 일치하는 것을 볼 수 있는데 제일 자주 나타나는 참여자를 그 순서대로 보면 다음과 같다: 수혜자($Benefizi\"{a}r$) & 수취인(Rezipient)<장소(Lokation)>동반자(Komitativ) & 기구(Instrument)> 원인(Ursache). 이러한 순서를 우리는 '적용성의 위계'($Applikativit\"{a}tshierarchie$)라 부를 수 있으며 이것을 가능한 많은 언어에 유효한 언어의 보편성 중의 하나가 될 수 있다는 가설을 제기해 본다.

  • PDF

언어 장애인의 언어보조 시스템을 위한 아이콘 언어의 구현 (Implementation of Iconic Language for the Language Support System of the Language Disorders)

  • 추교남;우요섭;민홍기
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.479-488
    • /
    • 2006
  • 언어 장애인에게 기존의 키보드에 의한 문자입력 방법보다 원활하고 편리한 의사전달 환경을 제공하기 위한 아이콘 언어 인터페이스를 설계한다. 이를 위하여 활용성이 높은 대화 영역으로부터 구축한 원시 말뭉치를 대상으로 어휘 구사 경향과 특성을 분석하고 형태소, 구문, 의미 분석을 적용하여 아이콘에 부여되는 한국어의 어휘와 의미를 추출한다. 사용자가 직관적으로 인지하고 전달할 수 있는 아이콘 영역을 선별하고 추출한 한국어의 어휘와 의미를 정합시킨다. 이웃하는 아이콘간의 연결로부터 전달하고자 하는 의미적 상황을 만들어내기 위하여, 아이콘 언어의 어휘와 품사, 문법 규칙, 의미체계를 정의하여 아이콘 언어를 설계한다. 아이콘 언어에서 나타날 수 있는 언어적 애매성을 해결하기 위한 방법으로 범용의 한국어 의미사전과 술어 중심의 하위범주화사전으로부터 아이콘 언어에 대한 상황중심의 의미 데이터를 구축한다. 이를 바탕으로 아이콘 언어 인터페이스로부터 한국어를 의미적인 범주에서 생성한다.

쌍형어에 대하여 (On Doublets)

  • 이은경
    • 비교문화연구
    • /
    • 제50권
    • /
    • pp.425-451
    • /
    • 2018
  • 본고에서는 기존의 쌍형어 논의들의 쟁점들을 살펴보았다. 일반적으로 쌍형어는 공통의 어원에서 갈라져 나온 단어들의 쌍을 가리키지만 공시적으로 의미가 같고 형식의 유사성을 보이는 단어들의 쌍이나 문법 형태소들의 쌍을 가리키기도 한다. 본고는 전형적인 쌍형어는 공통의 어원을 가지는 단어들의 쌍이라고 보았다. 쌍형어는 의미와 형식의 유사성이나 차이에 따라 하위 유형화가 가능하다. 전형적인 쌍형어에서 가장 멀어진 것은 공통의 어원을 가지지는 않지만 의미가 같고 형식이 유사한 단어들의 쌍이라고 할 수 있다. 두 번째 쟁점은 쌍형어가 단어들의 쌍을 가리키는가 하는 점이다. 공통의 어원을 가지는 단어들의 쌍이 전형적인 쌍형어이나 조사나 어미의 경우에도 쌍형어를 인정한다면 조사 쌍형어나 어미 쌍형어의 존재가 가능할 것이다. 접미사의 경우에는 접미사 쌍형어의 인정이 가능할 수 있으나 접미사가 결합한 파생어가 쌍형어를 형성하므로 굳이 접미사 쌍형어를 인정할 필요는 없다고 보았다. 어미의 경우도 해당 어미가 결합한 활용형의 쌍형어를 인정할 수도 있으나 한국어의 어미가 통사단위로서의 성격이 강하다는 점을 고려하면 엄청나게 많은 활용형의 쌍형어를 인정하기보다는 해당 어미를 쌍형어라고 하는 쪽이 적절할 것이다. 마지막으로 어간 쌍형어나 어미 쌍형어 일부가 기저형 층위에서 일종의 이형태 관계를 이루는지에 관한 쟁점이 있을 수 있으나 본고에서는 하나의 어휘 항목 내에 속하는 경우에는 쌍형어에 속하지 않는 것으로 보았다. 이들은 일종의 복수 기저형에 해당한다고 할 수 있다.