• Title/Summary/Keyword: 어휘 처리

Search Result 684, Processing Time 0.03 seconds

Design of Emotional Vocabulary Analysis Model for Interview Environment Enhancement Based on Mobile Web (모바일 웹 기반의 면접 환경 개선을 위한 감성어휘 분석 모형 설계)

  • Kim, Yong-Woo;Park, Seok-Cheon;Hong, Suk-Woo;Kim, Tae-Youb
    • Annual Conference of KIPS
    • /
    • 2013.11a
    • /
    • pp.1038-1041
    • /
    • 2013
  • 모바일의 발전과 확산으로 인해 모바일 웹의 필요성이 높아지고 있으며 사용성과 접근성이 용이한 웹 기반에서 인적자원 시스템이 구축되고 있는 사례가 많아지고 있다. 인적자원과 관련된 모바일 애플리케이션 개발과 활용성에 대한 연구가 여러 기업에서 진행 중이며 국내외 인적 자원 시스템을 개발하고 있는 기업들은 모바일을 활용하여 인적자원 시스템에 다양한 각도에서 접근하기 위해 노력하고 있다. 본 논문은 모바일 웹 기반의 인사 시스템에서 감성 어휘를 구축하여 면접자가 면접을 통해 받은 감성이나 인상에 대한 정보를 면접자의 모바일을 통해 설문지 형태로 모바일 웹 기반으로 한 채용 시스템에 입력하게 한다. 입력된 정보는 감성 어휘의 특정 형용사를 기준으로 구축된 감성 사전을 통해 면접 환경 개선에 필요한 정보들을 시각적으로 제공하는 모바일 웹 기반의 감성 어휘 분석 모형을 설계하여 면접 환경 개선을 할 수 있는 시각화 모델을 제안한다.

Reranking Clusters based on Query Term Position and Context (질의의 위치와 문맥을 반영한 클러스터 기반 재순위화)

  • Jo, Seung-Hyeon;Jang, Gye-Hun;Lee, Kyung-Soon
    • Annual Conference of KIPS
    • /
    • 2010.04a
    • /
    • pp.471-474
    • /
    • 2010
  • 질의와 질의 주변에 나오는 어휘는 의미적으로 연관되어있다는 가정하에 질의뿐만 아니라 질의 주변에 나오는 문맥 어휘들도 가중치를 높여준다면 검색에 효율을 높일 수 있을 것이다. 본 논문에서는 질의와 질의 주변에 나오는 문맥 어휘들에게 가중치를 주어 질의 어휘의 위치 가중치를 반영한 문서를 표현하고, 위치 가중치가 반영된 문서 벡터들 사이의 유사도를 계산하여 클러스터 기반 재순위화를 하여 성능을 향상시키는 방법을 제안한다. 뉴스 집합인 TREC AP 문서를 이용하여 언어모델, 위치 가중치를 이용한 언어모델, 클러스터 기반 재순위화 모델의 비교실험을 통해 유효성을 검증한다.

Creation and View of Ontology Vocabulary by Agent Communication using JADE (JADE를 이용한 에이전트 통신에 의한 온톨로지 어휘의 생성과 보기)

  • Baek, Sung-Jin;Lee, Myung-Jin;Lee, Tae-Kyung
    • Annual Conference of KIPS
    • /
    • 2009.04a
    • /
    • pp.19-22
    • /
    • 2009
  • 온톨로지는 특정 영역에서 정보 공유를 필요로 하는 개발자를 위한 공통의 어휘를 정의하고, 그 영역에서의 기본 개념의 정의와 개념들 사이의 관계를 포함한다. 따라서 이런 온톨로지를 사용함으로써 소프트웨어 에이전트들 사이의 정보 구조의 이해를 공유할 수 있고 영역 지식의 재사용이 가능하다. 본 연구에서는 $Prot{\acute{e}}g{\acute{e}}$를 사용하여 유사한 에이전트 온톨로지들을 생성하고 이들을 이용하는 JADE 에이전트들을 구현한 다음에, 특정 어휘가 주어지면 다른 온톨로지들을 가진 에이전트들과 통신하여 어떤 온톨로지에 포함된 어휘를 결정하는가를 보이고, 온톨로지 저장소에 관한 연구를 서술하였다.

The automatic Lexical Knowledge acquisition using morpheme information and Clustering techniques (어절 내 형태소 출현 정보와 클러스터링 기법을 이용한 어휘지식 자동 획득)

  • Yu, Won-Hee;Suh, Tae-Won;Lim, Heui-Seok
    • The Journal of Korean Association of Computer Education
    • /
    • v.13 no.1
    • /
    • pp.65-73
    • /
    • 2010
  • This study offered lexical knowledge acquisition model of unsupervised learning method in order to overcome limitation of lexical knowledge hand building manual of supervised learning method for research of natural language processing. The offered model obtains the lexical knowledge from the lexical entry which was given by inputting through the process of vectorization, clustering, lexical knowledge acquisition automatically. In the process of obtaining the lexical knowledge acquisition of model, some parts of lexical knowledge dictionary which changes in the number of lexical knowledge and characteristics of lexical knowledge appeared by parameter changes were shown. The experimental results show that is possibility of automatic building of Machine-readable dictionary, because observed to the number of lexical class information cluster collected constant. also building of lexical ditionary including left-morphosyntactic information and right-morphosyntactic information is reflected korean characteristic.

  • PDF

Query Expansion Based on Word Graphs Using Pseudo Non-Relevant Documents and Term Proximity (잠정적 부적합 문서와 어휘 근접도를 반영한 어휘 그래프 기반 질의 확장)

  • Jo, Seung-Hyeon;Lee, Kyung-Soon
    • The KIPS Transactions:PartB
    • /
    • v.19B no.3
    • /
    • pp.189-194
    • /
    • 2012
  • In this paper, we propose a query expansion method based on word graphs using pseudo-relevant and pseudo non-relevant documents to achieve performance improvement in information retrieval. The initially retrieved documents are classified into a core cluster when a document includes core query terms extracted by query term combinations and the degree of query term proximity. Otherwise, documents are classified into a non-core cluster. The documents that belong to a core query cluster can be seen as pseudo-relevant documents, and the documents that belong to a non-core cluster can be seen as pseudo non-relevant documents. Each cluster is represented as a graph which has nodes and edges. Each node represents a term and each edge represents proximity between the term and a query term. The term weight is calculated by subtracting the term weight in the non-core cluster graph from the term weight in the core cluster graph. It means that a term with a high weight in a non-core cluster graph should not be considered as an expanded term. Expansion terms are selected according to the term weights. Experimental results on TREC WT10g test collection show that the proposed method achieves 9.4% improvement over the language model in mean average precision.

Korean Word Learning System Using User-Word Intelligent Network and Automatic Question Generation Technique (사용자 어휘지능망과 자동문제생성기술을 이용한 한국어 어휘학습시스템)

  • Choe, Su-Il;Im, Ji-Hui;Choe, Ho-Seop;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.15-21
    • /
    • 2006
  • 본 논문에서는 올바른 한국어 생활과 한국어 실력 향상을 위하여, 한국어 어휘에 대한 풍부한 정보를 담고 있는 한국어사전, 사용자 어휘지능망(User-Word Intelligent Network : U-WIN)등의 언어자원을 이용한 자동문제생성기술을 소개하고, 이를 이용한 한국어 어휘학습시스템을 제시한다. 대부분의 학습시스템에서 사용하는 문제 은행식 출제 방식의 문제점을 해소할 수 있는 하나의 방법으로서, 기존의 한국어 어휘문제의 문항을 분석하여 8가지 문제 유형으로 재편성하고, 각 유형별 자동 문제 생성패턴에 따라 언어자원이 가지고 있는 한국어 어휘의 형태적 정보, 의미적 정보를 이용하여 한국어 어휘 문제를 자동 출제하는 한국어 어휘학습시스템을 구현하였다.

  • PDF

Attention and Naïve Bayes Models based Lexicon Corpus and Applications for Korean (한국어에서 Attention 모델과 Naïve Bayes 모델 기반의 어휘 말뭉치 구축 및 응용에 관한 연구)

  • Yoon, Joosung;Kim, Hyeoncheol
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.13-16
    • /
    • 2017
  • 감성 분석에서 어휘 말뭉치는 기존의 전통적인 기계학습 방법에서 중요한 특징으로 사용되었다. 최근 딥러닝의 발달로 hand-craft feature를 사용하지 않아도 되는 End-to-End 방식의 학습이 등장했다. 하지만 모델의 성능을 높이기 위해서는 여전히 어휘말뭉치와 같은 특징이 모델의 성능을 개선하는데 중요한 역할을 하고 있다. 본 논문에서는 이러한 어휘 말뭉치를 Attention 모델과 Naïve bayes 모델을 기반으로 구축하는 방법에 대해 소개하며 구축된 어휘 말뭉치가 성능에 끼치는 영향에 대해서 Hierarchical Attention Network 모델을 통해 분석하였다.

  • PDF

Effects of Word Recall on English Vocabulary Learning (단어회상이 영어어휘 학습에 미치는 영향)

  • Baik, Yeonji;Choi, Jiyoun;Chung, Taewon;Nam, Kichun
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.247-250
    • /
    • 2009
  • 본 실험에서는 단어회상이 영어어휘 학습에 미치는 영향을 살펴보기 위해 160개 단어 쌍에 대해 어휘학습을 실시하였다. 세 종류의 어휘 학습 방법(교대학습, 반복검사, 반복학습)을 채택하여 학습을 실시하였으며 학습 1주일 후 160개 단어 쌍에 대해 지연회상검사를 실행하였다. 그 결과 세 종류의 어휘 학습 방법 중 단어회상을 강조한 두 개의 어휘 학습 방법에서 그렇지 않은 조건에 비해 유의미하게 좋은 지연회상률을 보였다. 또한 실험 참가자를 대상으로 선호하는 학습 방법에 대해 설문조사를 실시한 결과 63.5%의 설문 응답자가 한 번 학습한 것에 대해 스스로 시행하는 회상 검사를 선호하였다. 그러나 자가검증을 통한 회상 검사 자체가 효과적인 학습 방법이라고는 생각하지 않는 것으로 나타났다.

  • PDF

Word Sense Disambiguation of Polysemy Predicates using UWordMap (어휘지도(UWordMap)를 이용한 용언의 다의어 중의성 해소)

  • Bae, Young-Jun;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.167-170
    • /
    • 2013
  • 한국어 어휘의 의미를 파악하기 위하여 어휘의 의미 중의성을 해결하는 것은 중요한 일이다. 본 논문에서는 한국어 다의어 기반의 어휘 의미망과 용언의 논항정보 등의 관계가 포함된 어휘지도(UWordMap)를 사용하여 용언의 의미 중의성 해소에 대한 연구를 진행한다. 기존의 의미 중의성 해소 연구와 같은 동형이의어 단위가 아닌 다의어 단위의 용언 의미 중의성 해소 시스템을 개발하였다. 실험결과 실험말뭉치로 품사 태그 부착 말뭉치를 사용했을 때 동형이의어 단위 정확률은 96.44%였고, 다의어 단위 정확률은 67.65%였다. 실험말뭉치로 동형이의어 태그 부착 말뭉치를 사용했을 때 다의어 단위 정확률은 77.22%로 전자의 실험보다 약 10%의 높은 정확률을 보였다.

  • PDF

Noun and Verb Polysemy Word Sense Disambiguation Using UWordMap (어휘지도(UWordMap)를 활용한 명사와 용언의 다의어 중의성 해소)

  • Shin, Joon-Choul;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.216-219
    • /
    • 2015
  • 컴퓨터를 이용하여 명사와 용언의 의미를 자동으로 분별하는 것은 기계번역이나 검색 등의 기술에서 아주 중요한 기반 기술이다. 최근에 동형이의어 분별에 대한 연구 결과로 약 96%의 정확률을 보이는 시스템이 개발되었으나, 다의어 분별에 대한 연구는 아직 초기 단계로 일부 어휘만을 한정하여 연구되고 있다. 본 논문에서는 어휘지도를 이용하여 다의어를 분별하는 방법을 연구하였고, 어휘지도에 등록된 모든 일반 명사와 용언을 대상으로 실험하였다. 제안된 알고리즘은 문장에서 나타나는 명사와 용언의 관계를 어휘지도에서 찾고, 그 정보를 기반으로 다의어를 분별하였다. 아직은 그 정확률이 실용적인 수준이라고 볼 수는 없지만, 전체 다의어를 대상으로 실험하였고, 그 실험 결과를 분석함으로써 앞으로의 다의어 분별 연구 방향에 도움될 것으로 판단된다.

  • PDF