• 제목/요약/키워드: same form-morpheme

검색결과 3건 처리시간 0.015초

현대 중국어의 삼음사(三音詞)와 현용 한국 삼음절(三音節) 한자어(漢字語)의 동형(同形) 동소어(同素語) 비교 연구 (A Comparative Study of the Trisyllabic Words with same form-morpheme and same meaning in Modern Chinese and the Trisyllabic Korean Words Written in Chinese Characters with same form-morpheme and same meaning)

  • 최금단
    • 비교문화연구
    • /
    • 제25권
    • /
    • pp.743-773
    • /
    • 2011
  • In this research, the writer has done a comparative analysis of 4,791 trisyllabic modern Chinese vocabularies from "a dictionary for trisyllabic modern Chinese word" and the corresponding Korean words written in Chinese characters out of 170,000 vocabularies hereupon that are collected in "new age new Korean dictionar y". Aa a result, we have the total 407 pairs of corresponding group with the following 3 types: 1) Chinese : Korean 3(2) : 3 syllable Chinese characters with completely same form-morpheme and same meaning, use, class (376pairs, 92.38% of 407), 2) Chinese : Korean 3 : 3 syllable Chinese characters with completely same form-morpheme and partly same meaning, use, class (18pairs, 4.42% of 407), 3)Chinese : Korean 3 : 3 syllable Chinese characters with completely same form-morpheme and different meaning, use, class (13pairs, 3.19% of 407).

신(新)HSK와 초급용(初級用) TOPIK 어휘 중의 중한(中韓) 동형(同形) 동소(同素) 한자(漢字) 어휘의 비교 연구 (A Comparative Study of New HSK and Entry-Level of TOPIK Written in Sino-Korean in the same form and morpheme of vocabularies)

  • 최금단
    • 비교문화연구
    • /
    • 제30권
    • /
    • pp.187-222
    • /
    • 2013
  • In this study, From 1,560 entry-level of TOPIK standard vocabularies are 702 Sino-Korean words selected which account for 45% of the whole vocabularies in TOPIK. In addition, the same form and morpheme words in Sino-Korean are sorted out by comparing them with 5,000 words of the NEW HSK vocabularies in Sino-Korean morpheme, array position of morpheme, meaning, and usage. Those are categorized into three parts : type of completely the same form-morpheme and same meaning, use, class(189 pairs), type of completely the same form-morpheme and partly same meaning, use, class(28 pairs), and type of completely the same form-morpheme and different meaning, use, class(10 pairs). The first type of words that account for 83.26% of them are used in exactly the same way in both Chinese and Korean. Through an accurate understanding of these vocabularies could either Chinese-speaking Korean learners or Korean-speaking Chinese learners apply those words in their mother tongue to the acquisition of the target language and get more effective means of learning methods for language proficiency test.

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.