• Title/Summary/Keyword: 기초 어휘

Search Result 105, Processing Time 0.027 seconds

Korean Lexical Disambiguation Based on Statistical Information (통계정보에 기반을 둔 한국어 어휘중의성해소)

  • 박하규;김영택
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.19 no.2
    • /
    • pp.265-275
    • /
    • 1994
  • Lexical disambiguation is one of the most basic areas in natural language processing such as speech recognition/synthesis, information retrieval, corpus tagging/ etc. This paper describes a Korean lexical disambiguation mechanism where the disambigution is perfoemed on the basis of the statistical information collected from corpora. In this mechanism, the token tags corresponding to the results of the morphological analysis are used instead of part of speech tags for the purpose of detail disambiguation. The lexical selection function proposed shows considerably high accuracy, since the lexical characteristics of Korean such as concordance of endings or postpositions are well reflected in it. Two disambiguation methods, a unique selection method and a multiple selection method, are provided so that they can be properly according to the application areas.

  • PDF

Discriminative Training Algorithms for Speech Recognizers (음성인식기의 변별력있는 학습 알고리즘들)

  • 나경민
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.166-171
    • /
    • 1994
  • 기존의 음성인식기들은 일반적으로 간단하면서도 성능이 우수한 계층별 학습에 의해서 설계된다. 계층별 학습은 통계적 패턴인식에서의 ML 추정기법처럼 모델간의 독립성이 보장되고 무한한 양의 학습데이타가 주어진다는 가정에 기초하고 있다. 그러나, 대상어휘집합에 음운학적으로 유사한 어휘가 많이 포함되어 있는 인식문제에 있어서는 모델간의 독립성이 보장되지 못하고, 실제 주어지는 grktmqepdlk의 양도 제한되므로 기존의 합습알고리즘에는 한계가 있다. 따라서 본 논문에서는 그러한 가정상의 문제점으로 생기는 인식기의 성능저하를 개선할 수 있는 변별력 있는 학습알고리즘들을 검토하고 그의 일반적인 접근방법들에 대해서 논의한다.

  • PDF

기초 통계량을 이용한 저작자 진위 추론

  • 이근무;이근우
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2001.11a
    • /
    • pp.69-73
    • /
    • 2001
  • 이 논문에서 문장특성을 파악하는 방법으로 주로 이용한 것은 특정문자의 출현율이다. 어떤 사람이나 그 글 속에는 자신의 개성이 들어있다. 문장의 길이를 비롯하여 문장의 구조나 어휘량, 유의어 중에서 선호하는 글자, 평서문이나 의문문의 사용, 품사의 사용, 문두나 문말에 오는 글자 등에서 각각의 개성이 드러난다. 그 중에서도 접속사나 조사, 접두어, 접미어 등 상대적으로 의미적인 요소보다는 형식적인 요소에 가까운 영역에서 문장의 특성이 두드러지는 것으로 보고되어 있다, 이런 특징을 이용하여 화랑세기의 저작자의 진위를 추론하고자 한다.

  • PDF

The Composition of Korean-English Transfer Dictionary for Proper Selection of Verb Translation (적절한 동사 대역어 선택을 위한 한영 변환 사전 구성)

  • Song, Jung-Keun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.294-301
    • /
    • 2001
  • 기계번역이 인간의 언어 능력을 기계로 구현한다는 점에서 전산학적 성격이 강하다면, 변환 사전은 인간의 어휘부(lexicon) 정보를 그대로 기계에 표상한다는 점에서 언어학적 성격이 강하다. 여기서는 다양한 어휘부 정보 중에서 한영 기계번역에서 필요한 언어학적 정보를 추출하고 이러한 정보를 바탕으로 적절한 동사 대역어 선택을 위한 변환 사전의 모형을 만들어 보고자 하였다. 한영 기계번역에서 적절한 동사 대역어 선택의 어려움은 한국어 동형어 처리 문제와 한국어에서는 포착되지 않지만 영어로 번역하는 과정에서 발생하는 영어 표현의 특수성 때문에 기인한 것으로 볼 수 있다. 이 논문에서는 이러한 문제를 논항과 문법 형태소, 선택제약, 개별 어휘 등의 기초적인 언어학적 개념을 이용한 변환사전을 통해 해결한다. 또한 동사 대역어 선택에 영향을 미치는 이러한 개별적인 요인들은 실제 변환사전의 기술에 있어서는 복합적으로 적용됨을 동사 '먹다'의 기술을 통해 확인할 수 있다.

  • PDF

Measuring meaning of korean adjectives and colors (감성 측정을 위한 우리말 형용사의 의미구조)

  • 박미자;신수길;한광희;황상민
    • Science of Emotion and Sensibility
    • /
    • v.1 no.2
    • /
    • pp.1-11
    • /
    • 1998
  • 최근 감성연구의 한 측정 방법으로 의미변별 기법을 이용해 형용사를 제시하는 연구가 증가하고 있다. 본 연구는 의미변별 기법을 사용하는 감성 연구의 기초적인 연구로서 우리말 형용사의 전체적인 의미구조를 분석해 보았다. 우리말 형용사의 의미구조는 기존의 다른 언어권에서 얻은 연구결과와 거의 일치하는 것으로 나타났다. 전체 형용사의 의미구조는 다섯 요인으로 나타났으나, 기존 연구들과 마찬가지로 세 요인이 주요 요인으로 작용했다. 한편, 이러한 의미구조가 색채라는 특정 자극과 관련해서 나타나는 의미구조를 파악하기 위해 NCS단색과 형용사 쌍을 사용하여 측정하였다. 색채 이미지와 관련된 형용사의 의미구조도 세부적인 차이는 있으나, 첫 연구에서 발견된 결과와 크게 다르지 않았다. 감성의 표현수단으로서 어휘를 고려할 때, 이 결과는 사용하는 어휘가 다를지라도 기저에 있는 의미구조는 문화에 상관없이 보편적이라는 것을 제시한다. 다시 말해 어휘로 표현되는 감성의 기본구조가 공통적일 수 있음을 제시한다.

  • PDF

The Effect of Power Card Strategy on Improvement of Vocabulary in Children With Autism Spectrum Disorder (파워카드 전략이 자폐범주성장애아동 어휘 향상에 미치는 효과)

  • Ahn, Ah-Hyeon;Park, Sun-Hee
    • Therapeutic Science for Rehabilitation
    • /
    • v.8 no.3
    • /
    • pp.83-95
    • /
    • 2019
  • Objective: The purpose of this study was to investigate the effects of the Power Card strategy on the receptive vocabulary and expressive vocabulary in children with autism spectrum disorders. Method: Three children with autism spectrum disorder were selected for this study and the power card strategy language intervention was applied, using a multiple baseline design across individuals. The target vocabulary was selected by examining the individual preferred characters. Power cards were constructed, and intervention was applied to improve the receptive vocabulary and expressive vocabulary through the baseline stage, intervention, and maintenance. Result: The application of the power card strategy showed that the acquisition rate of receptive vocabulary in children with autism spectrum disorder was increased, and expressive vocabulary acquisition rate was also improved. Conclusion: During the intervention period using the power card strategy, the children's target receptive vocabulary and expressive vocabulary acquisition rates improved, and the acquisition rate was maintained, even after the intervention. This suggests that the power card strategy is effective in improving the vocabulary of autistic children with disabilities, of school age.

Vocabulary in Korean-Speaking Toddlers : A Preliminary Analysis of Word Class, Composition, Gender, and Individual Variation (걸음마기 한국아동의 어휘발달 : 단어유목, 어휘구성, 성 차 및 개인차에 관한 기초분석)

  • Bornstein, Marc H.;Park, Sung-Yun;Cote, Linda R.
    • Korean Journal of Child Studies
    • /
    • v.25 no.2
    • /
    • pp.19-39
    • /
    • 2004
  • Mothers of 58 20-month-olds in Seoul, the Republic of Korea, completed vocabulary checklists for their children. When vocabulary level was taken into account, children's vocabularies contained relatively greater proportions of nouns than other word classes, and more verbs than adjectives or closed-class words. Correlations among word classes showed that each word class was consistently positively correlated with every other class. Girls' vocabularies showed evidence of being larger than boys. Large individual differences in the sizes of children's vocabularies were found. Factors that influence vocabulary size and can account for gender and individual differences are discussed. Noun prevalence in the vocabularies of children learning to speak Korean, and the merits of several theories that may account for this word-class prevalence pattern, are evaluated.

  • PDF

A Study on the Automatic Descriptor Assignment for Scientific Journal Articles Using Rocchio Algorithm (로치오 알고리즘을 이용한 학술지 논문의 디스크 립터 자동부여에 관한 연구)

  • Kim, Pan-Jun
    • Journal of the Korean Society for information Management
    • /
    • v.23 no.3 s.61
    • /
    • pp.69-89
    • /
    • 2006
  • Several performance factors which have applied to the automatic indexing with controlled vocabulary and text categorization based on Rocchio algorithm were examined, and the simple method for performance improvement of them were tried. Also, results of the methods using Rocchio algorithm were compared with those of other learning based methods on the same conditions. As a result, keeping with the strong points which are implementational easiness and computational efficiency, the methods based Rocchio algorithms showed equivalent or better results than other learning based methods(SVM, VPT, NB). Especially, for the semi-automatic indexing(computer-aided indexing), the methods using Rocchio algorithm with a high recall level could be used preferentially.

A Measurement of Lexical Relationship for Concept Network Based on Semantic Features (의미속성 기반의 개념망을 위한 어휘 연관도 측정)

  • Ock, Eun-Joo;Lee, Wang-Woo;Lee, Soo-Dong;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.146-154
    • /
    • 2001
  • 본 논문에서는 개념망 구축을 위해 사전 뜻풀이말에서 추출 가능한 의미속성의 분포 정보를 기반으로 어휘 연관도를 측정하고자 한다. 먼저 112,000여 개의 사전 뜻풀이말을 대상으로 품사 태그와 의미 태그가 부여된 코퍼스에서 의미속성을 추출한다. 추출 가능한 의미속성은 체언류, 부사류, 용언류 등이 있는데 본 논문에서는 일차적으로 명사류와 수식 관계에 있는 용언류 중 관형형 전성어미('ㄴ/은/는')가 부착된 것을 대상으로 한다. 추출된 공기쌍 45,000여 개를 대상으로 정제 작업을 거쳐 정보이론의 상호 정보량(MI)을 이용하여 명사류와 용언류의 연관도를 측정한다. 한편, 자료의 희귀성을 완화하기 위해 수식 관계의 명사류와 용언류는 기초어휘를 중심으로 유사어 집합으로 묶어서 작업을 하였다. 이러한 의미속성의 분포 정보를 통해 측정된 어휘 연관도는 의미속성의 공유 정도를 계산하여 개념들간에 계층구조를 구축하는 데 이용할 수 있다.

  • PDF

Extraction of Representative Emotions to Measure Emotions Expressed by Traditional Korean Clothes (Hanbok) (한복에서 표출되는 감성을 측정하기 위한 대표감성 추출)

  • Park, Eunjung;Seo, Jonghwan;Jeong, Sanghoon
    • Science of Emotion and Sensibility
    • /
    • v.21 no.2
    • /
    • pp.61-72
    • /
    • 2018
  • Different types of traditional Korean clothes (Hanbok) are appearing in the market with the increasing interest of culture consumers. In order to turn traditional Korean clothes into everyday clothes that adequately reflect various demands of culture consumers, it is important to satisfy both functional and emotional aspects of clothing. However, there is lack of existing studies on emotions of culture consumers while wearing traditional Korean clothes. In this study, 28 emotional words regarding traditional Korean clothes were extracted by applying the Delphi method and conformity rating survey to 182 emotional words reported in existing studies and references from areas such as psychology, linguistics, and sensibility engineering. The 28 selected emotional words can be used to express emotions felt by culture consumers about traditional Korean clothes. Also, words were grouped based on the correlation according to factor analysis. Based on common characteristics, the emotional words were classified into 6 categories of 'pleasure,' 'aesthetic sense,' 'harmony,' 'novelty,' 'likability,' and 'stability.' These 6 emotional categories were concluded to represent emotions of consumers about traditional Korean clothes. The 28 emotional words and 6 representative emotions noted in this study can be used as basic data for measuring emotions of culture consumers of traditional Korean clothes. A future study task is to design a detailed assessment scale to measure emotions of culture consumers about traditional Korean clothes using representative emotions.