• 제목/요약/키워드: word list

검색결과 131건 처리시간 0.023초

한국어 어휘 의미망(alias. KorLex)의 지식 그래프 임베딩을 이용한 문맥의존 철자오류 교정 기법의 성능 향상 (Performance Improvement of Context-Sensitive Spelling Error Correction Techniques using Knowledge Graph Embedding of Korean WordNet (alias. KorLex))

  • 이정훈;조상현;권혁철
    • 한국멀티미디어학회논문지
    • /
    • 제25권3호
    • /
    • pp.493-501
    • /
    • 2022
  • This paper is a study on context-sensitive spelling error correction and uses the Korean WordNet (KorLex)[1] that defines the relationship between words as a graph to improve the performance of the correction[2] based on the vector information of the word embedded in the correction technique. The Korean WordNet replaced WordNet[3] developed at Princeton University in the United States and was additionally constructed for Korean. In order to learn a semantic network in graph form or to use it for learned vector information, it is necessary to transform it into a vector form by embedding learning. For transformation, we list the nodes (limited number) in a line format like a sentence in a graph in the form of a network before the training input. One of the learning techniques that use this strategy is Deepwalk[4]. DeepWalk is used to learn graphs between words in the Korean WordNet. The graph embedding information is used in concatenation with the word vector information of the learned language model for correction, and the final correction word is determined by the cosine distance value between the vectors. In this paper, In order to test whether the information of graph embedding affects the improvement of the performance of context- sensitive spelling error correction, a confused word pair was constructed and tested from the perspective of Word Sense Disambiguation(WSD). In the experimental results, the average correction performance of all confused word pairs was improved by 2.24% compared to the baseline correction performance.

병렬말뭉치를 이용한 대체어 자동 추출 방법 (Automatic Extraction of Alternative Words using Parallel Corpus)

  • 백종범;이수원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권12호
    • /
    • pp.1254-1258
    • /
    • 2010
  • 정보 검색에 있어서 통일 객체를 다양한 표기로 기술하는 문제는 시스템의 성능을 저하시키는 요인이 된다. 본 연구에서는 이러한 문제를 해결하기 위하여 특허 정보의 국/영문 제목을 병렬말뭉치로 이용하여 대역어 뭉치를 추출하고, 이를 각 단어의 특징(Feature)으로 이용하여 대체어 목록을 자동 추출하는 방법을 제안한다. 또한 대체어 목록 내에 대체어가 아닌 다수의 연관단어들이 포함되는 문제점을 해결하기 위하여 국문 제목에서 추출한 연관단어 뭉치를 이용하여 대체어 목록 내 연관단어들을 필터링하는 방법을 제안한다. 평가결과에 따르면 본 연구에서 제안한 방법이 기존의 대체어 추출 방법들보다 더 우수한 것으로 나타났다.

The Effects of Vocabulary Exercises on EFL Vocabulary Learning and Retention

  • Son, Jung-Mi
    • 영어어문교육
    • /
    • 제13권4호
    • /
    • pp.167-192
    • /
    • 2007
  • This study investigates the effects of written vocabulary exercises on lexical knowledge. Korean university students learning English as a foreign language were randomly assigned to one of four conditions-Condition 1 (having students match word form with word meaning), Condition 2 (having students fill in the blank provided with a list of words), Condition 3 (having students write sentences with the target words), Condition 4 (having students do three practices with the same vocabulary exercise as the condition 1). Each type of exercises in Condition 1, 2, and 3 was designed to classify a different level of mental processing except Condition 4 with multiple encounters of the target words. Learners' vocabulary knowledge of this study was obtained using a format adopted from the Vocabulary Knowledge Scale (VKS) immediately and two weeks later. The findings indicated that: (1) Condition 4 having students do three matching vocabulary exercises was as effective as the condition 3 (one writing exercise) on the immediate learning of word; (2) although there was no significant difference of the effect of vocabulary exercises between Condition 3 and 4, Condition 4 asking students to do three matching vocabulary exercises was the most effective way of vocabulary retention after two weeks.

  • PDF

Q&A 문서의 검색 결과 요약을 활용한 질의응답 시스템 (Question and Answering System through Search Result Summarization of Q&A Documents)

  • 유동현;이현아
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권4호
    • /
    • pp.149-154
    • /
    • 2014
  • 지식iN과 같은 사용자 참여 질의응답 커뮤니티에서 원하는 질문에 대한 답을 찾기 위해서는 검색 결과로 제공되는 다양한 문서를 일일이 확인하여 판단하는 과정이 필요하다. 만일 사용자가 원하는 답변을 자동으로 정제하여 제시할 수 있다면, 질의응답의 사용성이 크게 향상될 수 있다. 본 논문에서는 질의응답 데이터 분석을 통해 사용자의 질문의 유형을 단어, 목록, 도표, 글의 4가지 유형으로 분류하고, 문서 내 통계적 특성을 활용하여 각 분류별 답변을 자동으로 제시하기 위한 방식을 제안한다. 단어, 목록, 글 유형은 질의어에 대해 검색된 질문을 군집화하고, 군집 내 빈도와 질의어에 대한 근접도, 답변 신뢰도 등으로 계산된 답변 내 어휘의 적합도를 활용하여 요약한 답변을 사용자에게 제시한다. 도표형은 답변들에서 사용자의 의견 정보를 추출하여 의견 통계를 도표로 제시한다.

천마를 이용한 기억력 향상 효과 연구 (The Verify of Memory Improvement by Gastrodia Elata Blume)

  • 김우철;정종길;김정상;김경옥
    • 동의신경정신과학회지
    • /
    • 제24권1호
    • /
    • pp.27-44
    • /
    • 2013
  • Objectives : This study was designed to investigate the effects of Gastrodia elata Blume on the improvement of memory. Methods : This study was a 12 week, double blind, comparative clinical study. There were eligible who worked with a group of healthy seniors, all 60 years of age or older. 50 subjects were randomized either to Gastrodia elata Blume in powder form and steep in hot water or placebo. We measured the faculty of memory by using K-DRS, MMSE-K, Digit Span, Letter Fluency Test, Word List Memory Test, and the Trail Making Test, and after 12 weeks we measured the faculty of memory again using the same methods. Results : Gastrodia elata Blume steeps in the hot water group significantly increased. Initiation, perseveration level, and Memory level of K-DRS and MMSE-K score. There were no considerable differences between three groups in Digit Span and Trail Making Test score. Gastrodia elata Blume group showed significant advances in Letter Fluency Test and recognition of Word List Memory Test. Conclusions : The results suggest that Gastrodia elata Blume may have positive effects on memory improvement and function of the frontal lobe activation.

일 지역 알츠하이머병 노인에서 Apolipoprotein E ${\varepsilon}4$와 인지변화의 연관에 대한 전향적 연구 (A Prospective Study on an Association between Apolipoprotein E ${\varepsilon}4$ and Cognitive Change in Community-Dwelling Elders with Alzheimer's Disease)

  • 강민성;문석우
    • 생물정신의학
    • /
    • 제20권3호
    • /
    • pp.104-110
    • /
    • 2013
  • Objectives : The aim of this study was to examine the prospective impact of the apolipoprotein E (APOE) ${\varepsilon}4$ on cognitive performance in the community-dwelling elderly individuals with Alzheimer's disease (AD). Methods : The total number of subjects was 30 (12 men and 18 women) who were diagnosed with AD from a Korean project of "Early Detection of Dementia". People aged 65-85 years were included in the analysis. The eight neuropsychological domains from the Korean version of Consortium to Establish a Registry of Alzheimer's Disease (CERAD-K) were conducted to test subjects. They have been followed at 24-month intervals with the same assessments at each interval. Their cognitive performance at 2 year intervals was compared by the occurrence of the APOE ${\varepsilon}4$. Results : The impact of ${\varepsilon}4$ allele was significant in the Word List Memory Test (WLMT, F = 4.345, df = 1, p = 0.021) and Word List Recall Test (WLRT, F = 5.569, df = 1, p = 0.033). Conclusions : The APOE ${\varepsilon}4$ allele was significantly correlated especially with verbal episodic memory domain in community-dwelling elders diagnosed with AD.

일 지역 치매의심 노인군에서 갑상선관련 호르몬, 인지기능, 우울증, 주관적 기억저하의 연관성 (Thyroid Hormones, Cognitive Impairment, Depression and Subjective Memory Complaint in Community-Dwelling Elders with Questionable Dementia in Korea)

  • 이성남;진하영;문석우
    • 생물정신의학
    • /
    • 제21권4호
    • /
    • pp.175-181
    • /
    • 2014
  • Objectives It was the aim to examine the association of the thyroid-related hormones with cognitive function, depression, and subjective memory impairment in community-dwelling elders with questionable dementia. Methods The sample consisted of 399 community residents with 'questionable dementia' aged 60 or over in whom serum thyroid-related hormones [thyroid stimulating hormone (TSH) and thyroxine] had been assayed. Cognitive impairment was defined using the Korean version of the Consortium Establish a Registry for Alzheimer's Disease. Depression was diagnosed using the Korean version of Geriatric Depression Scale and subjective memory complaint (SMC) was checked using the subjective memory complaints questionnaire (SMCQ). Age, gender, education, and the presence of apolipoprotein E {\varepsilon}4 were included as covariates. Results There was a significant positive association between verbal fluency test (VFT) score and serum TSH levels (p = 0.01). There was a significant negative association between SMCQ total score and word list memory test (WLMT)(p = 0.002) or word list recall test (WLRT) score (p = 0.013). Conclusions Lower serum TSH levels were associated with semantic memory (VFT), and we found that SMC was associated with episodic memory (WLMT and WLRT) in this sample.

한국어 감정표현단어의 추출과 범주화 (Korean Emotion Vocabulary: Extraction and Categorization of Feeling Words)

  • 손선주;박미숙;박지은;손진훈
    • 감성과학
    • /
    • 제15권1호
    • /
    • pp.105-120
    • /
    • 2012
  • 본 연구 1에서는 한국어 감정표현단어의 목록을 제작하고, 연구 2에서는 제작된 감정표현단어가 어떤 범주의 감정에 속하는지를 조사하였다. 연구 1의 한국어 감정표현단어 목록 제작을 위하여 연세대학교에서 제작한 '현대 한국어의 어휘빈도' 자료집으로부터 감정단어들을 추출하는 작업을 여러 단계에 걸쳐 시행하였다. 일상생활에서 빈도 높게 사용하는 감정표현단어를 선정하기 위하여 국문학 전공자와 감정연구자 12명이 참가하였으며, 총 504개의 감정표현단어들로 구성된 목록을 완성하였다. 연구 2에서는 80명의 대학생을 대상으로 각 단어가 '기쁨', '공포', '분노' 등 10개 범주(중성포함)의 감정 중 어느 감정과 관련 있는지 복수 선택하도록 하여 각 단어에 대한 감정 범주를 조사하였다. 단어들의 감정 범주 분석 결과, 504개 단어 중 426개 단어는 한 범주의 감정을 의미하였는데, '슬픔'을 나타내는 단어가 가장 많았으며, 다음으로 '분노', '기쁨' 순으로 나타났다. 다음 72개 단어는 두 감정 범주를 나타내었는데, '분노'와 '혐오', '슬픔'과 '공포' 그리고 '기쁨'과 '흥미'로 묶이는 단어가 많았다. 세 감정 범주를 보인 6개의 단어는 '놀람', '흥미', '기쁨'의 조합이 가장 높은 빈도로 나타났다. 본 연구는 일상생활에서 실제로 사용하는 감정표현단어 목록을 제작하고, 이에 기반을 두어 각 단어와 관련된 감정 범주를 복수의 감정 범주를 포함하여 규명하였다는데 의의가 있다. 본 연구에서 개발된 감정표현단어들과 각 단어에 대한 감정 범주 정보는 심리학 분야뿐만 아니라 이후 HCI 분야에서 언어적 내용에 기반을 둔 감정인식 연구에 활용될 수 있을 것으로 기대한다.

  • PDF

특허 정보 검색을 위한 대체어 후보 추출 방법 (Extracting Alternative Word Candidates for Patent Information Search)

  • 백종범;김성민;이수원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권4호
    • /
    • pp.299-303
    • /
    • 2009
  • 특허 정보 검색은 연구 및 기술 개발에 앞서 선행연구의 존재 여부를 확인하기 위한 사전 조사 목적으로 주로 사용된다. 이러한 특히 정보 검색에서 원하는 정보를 얻지 못하는 원인은 다양하다. 그 중에서 본 연구는 키워드 불일치에 의한 정보 누락을 최소화하기 위한 대체어 후보 추출 방법을 제안한다. 본 연구에서 제안하는 대체어 후보 추출 방법은 문장 내에서 함께 쓰이는 단어들이 비슷한 두 단어는 서로 비슷한 의미를 지닐 것이다라는 직관적 가설을 전제로 한다. 이와 같은 가설을 만족하는 대체어를 추출하기 위해서 본 연구에서는 분류별 집중도, 신뢰도를 이용한 연관단어뭉치, 연관단어 뭉치간 코사인 유사도 및 순위 보정 기법을 제안한다. 본 연구에서 제안한 대체어 후보 추출 방법의 성능은 대체어 유형별로 작성된 평가지표를 이용하여 재현율을 측정함으로써 평가하였으며, 제안 방법이 문서 벡터공간 모델의 성능보다 더 우수한 것으로 나타났다.

반 전역 정렬을 이용한 온라인 게임 변형 욕설 필터링 시스템 (The Online Game Coined Profanity Filtering System by using Semi-Global Alignment)

  • 윤태진;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.113-120
    • /
    • 2009
  • 온라인 게임에서의 언어폭력 문제는 매우 심각하지만 그에 대한 효과적인 정책이나 기술적인 방법은 부족한 상황이다. 온라인 게임 서비스 업체에서는 금칙어 리스트를 작성하여 Swear Filter를 이용한 고정된 형식의 문자열 검색 방식을 통해 문제를 해결하려고 하고 있으나 사용자들은 다양한 방법으로 욕설을 조합 또는 변형시켜 기존의 필터링을 회피하고 있다. 특히 한글은 욕설의 변형이 매우 쉬운 특성을 가지고 있다. 본 논문에는 한글에 기초한 변형 욕설을 효율적으로 탐색하여 걸러내는 알고리즘을 제시한다. 이 알고리즘의 주된 특징은 변형 욕설의 표준형 변환과 자소단위의 반 전체 정렬(semi-global alignment), 이다. 실험 결과 저자들이 다양한 인터넷 게임 환경에서 직접 수집한 다종의 욕설 단어들에 대하여 약 90%의 우수한 필터링 성능을 보였다.