• 제목/요약/키워드: 어휘지식

검색결과 143건 처리시간 0.023초

어절 내 형태소 출현 정보와 클러스터링 기법을 이용한 어휘지식 자동 획득 (The automatic Lexical Knowledge acquisition using morpheme information and Clustering techniques)

  • 유원희;서태원;임희석
    • 컴퓨터교육학회논문지
    • /
    • 제13권1호
    • /
    • pp.65-73
    • /
    • 2010
  • 본 논문은 자연어처리 연구를 위하여 지도학습(supervised learning)방식의 어휘지식(lexical knowledge) 수동 구축 방법의 한계점을 극복하기 위하여 비지도학습(unsupervised learning)방식의 자동 어휘지식 획득 모델을 제안한다. 제안하는 모델은 벡터화, 클러스터링, 어휘지식 획득 과정을 통하여 입력으로 주어지는 어휘목록에서 어휘지식을 자동으로 획득한다. 모델의 어휘지식 획득 과정에서 파라미터 변화에 따른 어휘지식 개수의 변화와 어휘지식의 특징이 나타나는 어휘 지식 사전의 일부 모습을 보인다. 실험결과 어휘지식 중 하나로 획득되는 어휘범주 지식의 클러스터가 일정한 개수에서 수렴하는 것이 관찰되어 어휘지식을 필요로 하는 전자사전 자동구축의 가능성을 확인하였다. 또한 한국어 특성이 반영되어 좌 우 통사정보가 포함된 어휘사전을 구축하였다.

  • PDF

한국어 어휘 지식 베이스 구축 시스템 (Korean Lexical Knowledge Base Construction System)

  • 이해중;조정미;문준혁;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.397-403
    • /
    • 1999
  • 어휘 지식은 자연어 처리에서 매우 중요한 요소이다. 그러나 대규모의 어휘 지식 베이스를 구축하는 것은 많은 시간과 비용을 필요로하는 일이다. 본 논문에서는 온라인 국어 사전을 이용하여 범용의 대규모 한국어 어휘 지식 베이스를 자동으로 구축하는 방법을 제안하고 실제로 시스템을 구현한다. 제안하는 방법론은 비교적 적은 비용으로 단시일내에 대규모의 어휘 지식 베이스를 구축하는 것을 가능하게 한다. 또한 지식 구축 과정이 자동화되어 만들어진 지식 베이스의 유지, 보수 및 확장이 용이하다. 구현된 시스템으로 구축한 어휘 지식 베이스는 기계번역에서의 대역어 선정이나 한국어 조사의 의미 분별 등 자연어 처리 과정에서 발생하는 각종 어휘 의미 모호성 해소에 응용될 수 있다.

  • PDF

중간언어 기계번역방식을 위한 어휘지식 표현체계에 관한 연구 (A Study on Lexical Knowledge Representation for Interlingua Machine Translation)

  • 이휘봉;송성대;이종혁;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.105-111
    • /
    • 1995
  • 본 논문에서는 중간언어 설계의 일부분으로, 중간의미 표현을 위한 어휘지식 표현 방안에 관하여 논한다. 기존 중간언어들은 단어의 의미 구별법이 단순한 선택적 제한을 기반으로 하고 있으며, 시소러스체계도 단일하게 유지하고 있다. 따라서, 단어의 의미간 중첩성이 반영되지 못하고 단어의 창조적 사용(creative use)에 대한 대처능력도 떨어진다. 또한 단일 시소러스체계를 통해서는 단어들의 명확한 분류기준을 파악할 수가 없다. 이러한 어휘지식 표현체계의 문제점들을 극복하기 위한 해결책으로서 생성사전(Generative Lexicon)을 도입하고, 중간표현의 관계기호를 효과적으로 파악하기 위한 관점에서의 시소러스 분류체계를 제안한다. 또한 이 같은 어휘지식 표현체계를 이용하여 문장의 구문구조로부터 중간표현을 나타내는 과정을 제시한다.

  • PDF

외국인 학습자의 한국어 어휘 지식 평가를 통한 어휘 교육 방안 연구 -질적 지식의 평가를 중심으로- (Vocabulary Education Plan Research through Foreign Learners' Korean Vocabulary Knowledge Assessment;Focusing on Assessment of Qualitative Knowledge)

  • 이유경
    • 한국어교육
    • /
    • 제23권1호
    • /
    • pp.161-182
    • /
    • 2012
  • The purpose of this study is to examine level of individual foreign learners' quantitative knowledge of korean vocabulary through the Foreign Learners' Korean Vocabulary Knowledge Assessment and to propose a vocabulary education plan reflecting the result. This assessment was written in focus of semantic relation to identify category, integrated and analytical knowledge of Korean verbs acquired by foreign learners and as a result, the following educational implications were made. First, the learners' knowledge about the vocabulary combinational relationship was very limited. Second, learners are not interested in vocabulary's synonymous relation and antonymous relations. Lastly, there needs to be a concern about postpositional particle-use education. The results of these kinds of research, observes the learners vocabulary acquisition process to determine Korean textbook and present vocabulary level in appropriate in terms of learners' perspective, and provide an opportunity to check if current professors' method is adequate and valid.

위키를 활용한 상호작용이 산출적 어휘 지식에 미치는 영향 (Effects of Interaction using Wiki on Productive Vocabulary Knowledge)

  • 장용선
    • 한국콘텐츠학회논문지
    • /
    • 제14권5호
    • /
    • pp.487-497
    • /
    • 2014
  • 본 연구의 목적은 의사소통 중심의 수업에서 동료 및 교사와 위키를 활용하여 상호작용하는 것이 우연적으로 산출적 어휘 지식을 향상시키는데 효과가 있는지를 알아보는 것이다. 대학 1학년 학생 82명이 두 집단으로 구분되어 본 연구에 참여했다. 4-5명이 한 조가 되어 7-10분 길이의 영화를 만드는 프로젝트에서 조원들과 교사는 위키로 상호작용하면서 협동하여 영어 대본을 만들었다. 38명(과정 집단)은 위키로 상호작용하면서 영어 대본을 만드는 과정 중에 수시로 교사의 피드백을 받고 수정하면서 최종본을 만들었다. 반면에 44명(결과 집단)은 조원들이 위키로 협력하여 1차 대본을 작성하고 그 결과물에 대해 교사의 피드백을 1회 받은 후 수정하여 최종본을 만들었다. 참여자들의 사전 어휘 지식을 측정하기 위해 어휘 지식 시험을 시행했고, 실험 처치 후에 산출적 어휘 지식의 습득과 유지를 측정하는 사후 시험을 두 번 보았다. 본 연구에서 나타난 결과는 위키를 활용하여 동료 및 교사와 상호작용할 때 어휘를 계속 사용할 기회가 많았던 것이 산출적 어휘 지식을 향상시키는데 도움이 되었으며, 과정 집단이 결과 집단보다 조금 더 큰 폭으로 점수가 상승되었다는 점이다. 이러한 결과들을 종합하여 교육적인 시사점도 논의되었다.

짝/모둠 활동이 영어 어휘 습득에 미치는 영향 (Effects of Pair/Group Work on English Vocabulary Acquisition)

  • 장용선
    • 한국콘텐츠학회논문지
    • /
    • 제15권7호
    • /
    • pp.629-642
    • /
    • 2015
  • 본 연구의 목적은 동료들과 상호작용하면서 짝 또는 모둠 활동에 의해 어휘 과제를 하는 것이 어휘 습득에 효과가 있는지를 탐색하는 것이다. 대학생 112명이 세 집단으로 나뉘어 본 연구에 참여했다. 짝 집단(n=42)은 두 명씩 짝을 이루어 수업 시간 외에 3회의 어휘 과제를 한 후 공동의 결과물을 제출했고, 모둠 집단(n=32)은 4-5명이 한 조를 이루어 수업 시간에 과제를 해서 공동의 결과물을 제출했다. 대조군으로서 개별 집단(n=38)은 수업 시간 외에 혼자 어휘 과제를 하는 전통적인 방식이었다. 연구 참여자들의 사전 어휘 지식을 측정하기 위해 어휘 지식 시험을 시행했고, 실험 처치 후에 수용적 및 산출적 어휘 지식의 습득을 측정하는 사후 시험을 보았으며, 2주 후에 효과의 지속 여부를 평가하는 지연된 사후 시험을 실시했다. 본 연구에서 나타난 결과는 수업 시간에 동료들과 상호작용하면서 어휘 과제를 한 모둠 집단의 성취도가 가장 높았으며, 수업 시간 외에 과제를 한 짝 집단은 개별 집단보다 결과가 좋지 않았다. 어휘 지식 상 하위 군으로 구분하여 분석한 결과 어휘 숙달도가 높은 참여자들이 협력적인 모둠 활동을 통해 더 많은 어휘를 습득한 것으로 나타났다. 이런 결과들을 종합하여 교육적인 시사점도 논의되었다.

사전에 나타난 인지정보를 이용한 단어 개념의 지식표현 (Knowledge Representation of Concept Word Using Cognitive Information in Dictionary)

  • 윤덕한;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.118-125
    • /
    • 2004
  • 인간의 언어지식은 다양한 개념 관계를 가지며 서로 망(network)의 모습으로 연결되어 있다. 인간의 언어지식의 산물 중에서 가장 체계적이며 구조적으로 언어의 모습을 드러내고 있는 결과물이 사전이라고 할 수 있다. 본 논문에서는 이러한 사전 뜻풀이 말에서 개념 어휘와 자동적인 지식획득을 통하여 의미 정보를 구조적으로 추출한다. 이러한 의미 정보가 추출되면서 동시에 자동적으로 개념 어휘의 의미 참조 모형이 구축된다. 이러한 것은 사전이 표제어 리스트와 표제어를 기술하는 뜻풀이말로 이루어진 구조의 특성상 가능하다. 먼저 172,000여 개의 사전 뜻풀이말을 대상으로 품사 태그와 의미 태그가 부여된 코퍼스에서 의미 정보를 추출하는데, 의미분별이 처리 된 결과물을 대상으로 하기 때문에 의미 중의성은 고려하지 않아도 된다. 추출된 의미 정보를 대상으로 정제 작업을 거쳐 정보이론의 상호 정보량(Ml)을 이용하여 개념 어휘와 의미 정보간에 연관도를 측정한 후, 개념 어휘간의 유사도(SMC)를 구하여 지식표현의 하나로 연관망을 구축한다.

  • PDF

어휘 빈도를 활용한 지식 검색에서의 답변 추천 시스템 (Answer Recommendation for Knowledge Search using Term Frequency)

  • 이호창;탁현기;이현아
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.315-317
    • /
    • 2012
  • 지식iN 등의 지식검색 서비스는 잘못된 답변으로 인한 낮은 신뢰성과 다수의 중복 답변 등의 문제점을 가진다. 질의문 '세상에서 가장 큰 나라'에 대해서 관련된 모든 질문과 답변을 제시하지 않고 질의문과 관련된 다수의 답변을 분석하여 답변 '러시아'를 추천하여 제시할 수 있다면 지식검색의 효용성과 신뢰성이 크게 향상될 수 있다. 본 논문에서는 질문-답변의 유형을 단어, 글, 도표, 목록의 네가지로 분류하고, 그 중 단어 유형에 대한 답변 추천 방법을 제시한다. 질의문에 대해 검색된 질문을 군집화하고, 질문에 대한 답변들에 대해서 TF, IDF, 어휘간 거리 정보를 다양하게 결합하여 어휘의 점수를 계산한다. 각 군집에서 가장 높은 점수를 가지는 어휘를 해당 군집에서 가장 중요한 어휘로 보고 추천 정답으로 제시한다. 단어 유형인 질문 100개에 대한 네이버 지식iN에 대한 시스템 평가에서 추천된 상위 1위에 대해서는 68%의 정답률을, 상위 5위까지에 대해서는 89%의 정답률을 보였다.

Semantic parsing 기반 지식 베이스 질의응답 시스템의 어휘-의미 패턴 질의 템플릿을 통한 보완 (Assisting semantic parsing-based QA system with lexico-semantic pattern query template)

  • 심효섭;박선영;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.255-258
    • /
    • 2014
  • 본 논문에서는 semantic parsing과 사전 정의된 어휘-의미 패턴 질의 템플릿 방법론을 결합하여 자연어 질의로부터 RDF 지식베이스에 질의하기 위한 SPARQL 쿼리를 생성하는 방법을 제안한다. semantic parsing 접근법은 문장의 표현과 분리된 형식적 의미표현만을 포착해내므로, paraphrase 혹은 의미 변화와 무관한 어순의 변화에 강인하지만, 일부 자연어 질의문장에는 단순한 의미 및 구조를 갖는 문장도 적합한 형식적 의미표현을 생성하지 못하는 단점이 있다. 따라서 이 연구에서는 이러한 단순한 문장에 있어서는 사전 정의된 질의 템플릿을 사용하여 적합한 쿼리를 생성하되, 적합한 템플릿을 선택하는데 있어 해당 질의문장의 어휘-의미적 유형을 포착하고 해당 정보를 이용하는 방법을 이용하였으며 이를 통해 주 방법론의 약점을 보완하는 제한적인 효과를 얻을 수 있었다.

  • PDF

통신보조기기용 어휘 예측 시스템의 구조 (Design of word prediction system for Assistive Communication System)

  • 황인정;김효진;이은주;민홍기
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.169-172
    • /
    • 2000
  • 본 연구에서는 청각장애인용 통신보조기기에 적용하기 위한 어휘예측 시스템의 기본구조를 제안한다. 통신보조기기의 어휘는 사용자의 환경을 고려한 어휘이므로, 어휘 예측 시스템도 사용자의 환경과 실생활에서 쉽게 이용할 수 있는 방향으로 고안되어야 한다. 따라서 어휘예측 시스템은 사용자의 환경을 정의하고, 중심어휘와 장소별 도메인에서의 어휘를 발췌한다. 발췌된 어휘는 말뭉치와 의미함축의 원리를 이용하여 분류한다. 분류된 어휘는 문법적 지식을 바탕으로 가상 네트워크를 구성한다. 가상네트워크에서의 어휘는 명사, 조사, 동사의 3부분으로 나눈 후 의미함축과 말뭉치로부터 파생된 어휘를 근접한 거리에 위치시킨다. 동일한 네트워크상에서 어휘의 위치는 문법적 연관성, 빈도수 등을 이용하여 정한다. 따라서 본 연구에서는 어휘예측은 명사, 조사, 동사에서 가장 근접한 어휘를 연결하여 간단한 문장을 작성할 수 있는 어휘 예측 시스템의 기본구조를 제안한다.

  • PDF