• Title/Summary/Keyword: 연관 어휘

Search Result 81, Processing Time 0.036 seconds

Generation and Recognition Language Model for Spoken Language Parser (구어파서를 위한 생성 인식 언어모델)

  • Jeong, Hong;Hwang, Kwang-Il
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.167-172
    • /
    • 1999
  • 구어는 프로그래밍 언어와는 달리 주어진 문장 내에서의 해당 어휘의 뜻(semantic information)을 알고 다른 어휘들과의 연관성 (grammatical information)을 알아야만 적절한 형태소분석이 가능하다. 또한 구어는 방대한 양의 어휘들로 구성되어 있으며 사용하는 사람마다의 다양한 응용과 공식화되기 어려운 수많은 예외들로 운용되기 때문에 단순히 찾아보기표와 오토마타만으로는 형태소분석에 한계가 있다. 이에 본 논문에서는 주어진 어휘집과 그 어휘들로 만들어진 다양한 문장들로부터 구어운용의 근본기제를 스스로 학습해나가는 강화학습중심의 언어모델을 제안하고 실제로 한국어 형태소분석에 적용하여 그 성능과 특성을 파악해보았다. 구어파서의 입력은 음절단위의 발음이며 인간이 문장을 듣거나 보는 것과 동일하게 시간에 따라 순차적으로 입력된다. 파서의 출력 또한 시간에 따라 변화되면서 나타나며 입력된 연속음절을 형태소단위로 분리(segmentation)하고 분류(labeling)한 결과를 나타낸다. 생성인식 언어모델이 기존의 언어모델과 다른 점은 구어 파싱에 있어서 필수적인 미등륵어에 대한 유연성과 앞단의 음성인식기 오류에 적절한 반응(fault tolerance)을 나타내는 것이다.

  • PDF

Comparison of Performance on Superordinate Word Tasks in Elderly and Young Adults (노년층과 청년층의 상위범주어 과제 수행력 비교)

  • Kim, Hyung Moo;Yoon, Ji Hye
    • 재활복지
    • /
    • v.20 no.4
    • /
    • pp.229-246
    • /
    • 2016
  • The aim of this study is to conduct superordinate word selection task to compare their performance and reaction time, and superordinate word writing task to compare the differences in their performance and error pattern in 40 elderly adults and 43 young adults. As a result, first, in both tasks, elderly adults had a smaller number of correct responses. Second, elderly adults showed slower reaction time than young adults. Third, in superordinate word writing task, elderly adults showed more relevant errors than irrelevant errors. The reason elderly adults had a smaller number of correct responses in both tasks was that the links among the pieces of information in the semantic lexicon weakened or deteriorated due to normal aging. Slower reaction time was based on neurophysiological changes of the brain and cognitive processing speed. In addition, the relevant errors showed that they could access the lexicon for target words and produce explanation the relevant characteristics, even though they could not retrieve the target words.

Word Sense Disambiguation Considering Words Relations and Its Application to Sign Language Generation System (어휘 간의 관계를 고려한 중의성 해소 방법 및 수화 생성 시스템에의 응용)

  • Kim, Sangchul;Park, Kwang-Hyun;Bien, Zeungnam
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.124-128
    • /
    • 2008
  • 어휘 중의성 해소는 다양한 분야에서 중요한 위치를 차지하고 있는 자연어처리 관련 문제이다. 본 논문에서는 어휘 중의성 해소의 실제 응용과 관련하여 문헌 내에 여러 개의 중의어가 존재할 때의 중의성 해소 문제를 다룬다. 기존의 연구에서는 다루지 않았던 다수의 중의어가 존재할 때의 중의성 해소 문제에 대하여 고찰한 후, 중의어 간의 연관성을 이용한 중의성 해소 개념을 제시한다. 또한 이를 이용한 구체적인 해소 방안 제안 및 본 연구의 한국어-한국수화 번역 시스템에의 응용 예를 소개한다. 결론 및 향후 과제에서는 본 논문에서 언급된 방법의 향후 개선 방안에 관하여 언급한다.

  • PDF

A study on vocabularies related to four fundamental rules of arithmetic used in elementary school mathematics (초등학교 수학에서 사용하는 사칙계산 관련 어휘에 관한 연구)

  • Park, Kyo Sik
    • Journal of Elementary Mathematics Education in Korea
    • /
    • v.17 no.2
    • /
    • pp.185-205
    • /
    • 2013
  • In this study, to begin with, it was discussed to gather vocabularies which are expected to be vocabularies related to four fundamental rules of arithmetic and classify them according to kinds and groups, to demarcate vocabularies related to four fundamental rules of arithmetic for using in elementary school mathematics which are associated with addition, subtraction, multiplication, and division directly. Next, the basic vocabularies related to four fundamental rules of arithmetic were discussed. At this time, regarding vocabularies related addition, subtraction, multiplication, and division as coming from the verb add, subtract, multiply, divide respectively, vocabularies that contains the stem of each verb were considered as the basic vocabularies related to four fundamental rules of arithmetics. Following it, vocabularies which assist the operation and indicate the result of the operation were included, then, vocabularies related to four fundamental rules of arithmetic for using in elementary school mathematics were demarcated and presented according to the following criteria. First, a newly coined verb or derivative using the noun form of a certain verb as a root should not be used. Second, such vocabularies of which examples do not exist or rarely exist in textbooks/workbooks should not be used, even though they are registered in mathematics glossary book published by ministry of education or Korean dictionary published by the national institute of Korean language. Third, vocabularies which are not replaceable and vocabularies which have some didactical reasons for using them should be used.

  • PDF

A Study on the Automatic Lexical Acquisition for Multi-lingustic Speech Recognition (다국어 음성 인식을 위한 자동 어휘모델의 생성에 대한 연구)

  • 지원우;윤춘덕;김우성;김석동
    • The Journal of the Acoustical Society of Korea
    • /
    • v.22 no.6
    • /
    • pp.434-442
    • /
    • 2003
  • Software internationalization, the process of making software easier to localize for specific languages, has deep implications when applied to speech technology, where the goal of the task lies in the very essence of the particular language. A greatdeal of work and fine-tuning has gone into language processing software based on ASCII or a single language, say English, thus making a port to different languages difficult. The inherent identity of a language manifests itself in its lexicon, where its character set, phoneme set, pronunciation rules are revealed. We propose a decomposition of the lexicon building process, into four discrete and sequential steps. For preprocessing to build a lexical model, we translate from specific language code to unicode. (step 1) Transliterating code points from Unicode. (step 2) Phonetically standardizing rules. (step 3) Implementing grapheme to phoneme rules. (step 4) Implementing phonological processes.

Migrant Representation in the English-language Media during the Brexit Campaign (브렉시트 캠페인 기간 동안 영어 미디어에 나타난 이민자들)

  • Lee, Jae-Seung
    • Cross-Cultural Studies
    • /
    • v.45
    • /
    • pp.325-348
    • /
    • 2016
  • This study aims to identify the representation of migrants in the English-language media during the Brexit campaign period. For the purpose of this study, the methodological tool of corpus-assisted discourse studies(CADS) was employed and a collection was compiled of articles mentioning Brexit in British, American, Canadian, and Australian media from April 15 to June 22, 2016 in order to compare their portrayals of migrants. To examine how IMMIGRANT, MIGRANT, and REFUGEE are represented in the media, their collocates were analyzed by MI score and categorized by social actor categorization(Van Leeuwan, 1996). The results show that IMMIGRANT is related to collocates that refer to legal status and provenance, MIGRANT associated with economic terms, and REFUGEE relates to terms expressing quantities. The results also reveal that migrants are frequently depicted by functionalization, classification, and appraisement categorization and are more negatively portrayed in British and American media. This paper claims that corpus-assisted linguistic analysis of words enables one to identify salient linguistic patterns or lexical choices in the discourses about a particular phenomenon or group of people.

Automatic Error Detection of Morpho-syntactic Errors of English Writing Using Association Rule Analysis Algorithm (연관 규칙 분석 알고리즘을 활용한 영작문 형태.통사 오류 자동 발견)

  • Kim, Dong-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.3-8
    • /
    • 2010
  • 본 연구에서는 일련의 연구에서 수집된 영작문 오류 유형의 정제된 자료를 토대로 연관 규칙을 생성하고, 학습을 통해서 효용성이 검증된 연관 규칙을 활용해서 영작문 데이터의 형태 통사 오류를 자동으로 탐지한다. 영작문 데이터에서 형태 통사 오류를 찾아내는 작업은 많은 시간과 자원이 소요되는 작업이므로 자동화가 필수적이다. 기존의 연구들이 통계적 모델을 활용한 어휘적 오류에 치중하거나 언어 이론적 틀에 근거한 통사 처리에 집중하는 반면에, 본 연구는 데이터 마이닝을 통해서 정제된 데이터에서 연관 규칙을 생성하고 이를 검증한 후 형태 통사 오류를 감지한다. 이전 연구들에서는 이론적 틀에 맞추어진 규칙 생성이나 언어 모델 생성을 위한 대량의 코퍼스 데이터와 같은 다량의 지식 베이스 생성이 필수적인데, 본 연구는 적은 양의 정제된 데이터를 활용한다. 영작문 오류 유형의 형태 통사 연관 규칙을 생성하기 위해서 Apriori 알고리즘을 활용하였다. 알고리즘을 통해서 생성된 연관 규칙 중 잘못된 규칙이 생성될 가능성이 있으므로, 상관성 검정, 코사인 유사도와 같은 규칙 효용성의 통계적 검증을 활용해서 타당한 규칙만을 학습하였다. 이를 통해서 축적된 연관 규칙들을 영작문 오류를 자동으로 탐지하는 실험에 활용하였다.

  • PDF

Automatic Text Summarization using Noun-Verb Cooccurrence Pattern (명사-동사 공기패턴을 이용한 문서 자동 요약)

  • Nam, Ki-Jong;Lee, Chang-Beom;Kang, Dae-Wook;Park, Hyuk-Ro
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.611-614
    • /
    • 2002
  • 문서 자동 요약은 입력된 문서에 대해 컴퓨터가 자동으로 요약을 생성하는 과정을 의미한다. 즉, 컴퓨터가 문서의 기본적인 내용을 유지하면서 문서의 복잡도 즉 문서의 길이를 줄이는 작업이다. 효율적인 정보 접근을 제공함과 동시에 정보 과적재를 해결하기 위한 하나의 방법으로 문서 자동요약에 관한 연구가 활발히 진행되고 있다. 본 논문의 목적은 어휘 연관성 정보를 이용하여 한국어 문서를 자동으로 요약하는 효율적이며 효과적인 모형을 개발하는 것이다. 제안한 방법에서는 신문기사와 같은 특정 부류에 국한되는 단어간의 어휘연관성을 이용하여 명사-명사 공기패턴과 명사-동사 공기패턴을 구축하여 문서요약에 이용한다. 크게 불용어 처리 단계, 공기패턴 구축 단계, 문장 중요도 계산 단계, 요약 생성단계의 네 단계로 나누어 요약을 생성한다. 30% 중요문장 추출된 신문기사를 대상으로 평가한 결과 명사-명사 공기패턴과 빈도만을 이용한 방법보다 명사-동사 공기패턴을 이용한 방법이 좋은 결과를 가져 왔다.

  • PDF

Topic modeling and topic change trend analysis for advanced construction technologies (건설신기술에 대한 토픽 모델링 및 토픽 변화추이 분석)

  • Jeong, Seong Yun;Kim, Nam Gon
    • Smart Media Journal
    • /
    • v.10 no.4
    • /
    • pp.102-110
    • /
    • 2021
  • Currently, the advanced construction technology endorsement system is being operated to promote the development of domestic construction technology. We tried to examine the implicit meanings inherent in advanced construction technologies by analyzing the relationship between emerging vocabularies with high importance in relation to the advanced construction technologies endorsed through this system. For this purpose, 918 cases of advanced construction technology information were collected. Based on the endorsed year and summary of the advanced construction technologies, the importance of the emerging vocabularies was measured for each advanced construction technology. And, based on the LDA model, the degree of influence between related vocabularies was evaluated for each of the four topic areas. Topics according to the technical application fields were analyzed. From 1990 to 2021, the trend of changes in highly influential vocabularies by each topic was inferred. In the future, changes in the degree of influence of the topics of environment, machinery, facilities, and maintenance and reinforcement of structures and related technology fields were predicted.

User's Emotional Preference on PC OS GUI - Though Semantic Differential Method (PC OS GUI 의 사용자 감성에 관한 연구 - 의미분별 척도법을 활용한 사용자 감성 선호도 분석)

  • Moon, Hyun-Jung;Lee, Jung-Yeun
    • 한국HCI학회:학술대회논문집
    • /
    • 2008.02b
    • /
    • pp.30-35
    • /
    • 2008
  • The purpose of this study is to analyze and define user's emotional satisfaction factors to the PC OS GUI image. The study is to investigate the relationship between PC OS GUI Image and Sensitive Vocabula교 based on user's emotional preference. 47 user preferred sensitive words are collected by the initial survey. Through the similarity test, 47 words are narrowed down to 20 comprehend words. The semantic differential methods is used in the final survey with 5 step questionnaire. From this process, user preferred the GUI design that is vocabularized as Clear, Easy, Safety, Stability. Additionally, the result shows that the image of Clear is related to Safety and the image of Easy is related to Stability. The result of the study could be used in design PC OS GUI as base data.

  • PDF