• Title/Summary/Keyword: 문맥정보

Search Result 661, Processing Time 0.021 seconds

Discovery of Coordinate Terms and Context using the Title and Snippet in Web Search (Web 검색 엔진의 제목과 문서요약을 이용한 동위어와 문맥의 발견)

  • Han, Sang-Yong;Lee, Sang-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.210-215
    • /
    • 2007
  • 웹상에서의 정보량이 증가함에 따라, 사용자가 알고 싶어 하는 단어에 대해서 연관된 단어를 통해서 이해하게 된다. 동위어란 공통의 상위어를 가지는 단어이다. 이를 위한 기존의 연구로서 동위어와 상위어, 하위어 등을 찾는 연구는 많이 있었지만, 웹상의 문서를 이용하여 거대한 코퍼스를 해석해서 결과를 구하는 데 많은 시간이 소요되었다. 이에 본 논문에서는 사용자의 질의어에 대해서 웹 검색엔진이 가지는 제목과 문서요악으로부터 동위어와 문맥을 빠른 시간 안에 발견하는 방법에 대해 제안한다. 어떤 단어에 대한 동위어가 병렬조사 #와#로 접속되는 것을 이용하여 웹 검색 엔진에 대한 질의어를 작성하고, 그 검색 결과로부터 동위어를 얻는다. 이와 동시에 발견된 동위어와 질의어의 배후에 있는 문맥도 얻는다. 이를 통해, 웹 검색에 있어서 질의어의 확장과 비교 대상의 발견 등 폭넓은 분야에서도 적용가능하다고 할 수 있다.

  • PDF

Contextualized Embedding-based Korean Movie Review Sentiment Analysis (문맥 표현 기반 한국어 영화평 감성 분석)

  • Park, Cheoneum;Kim, Geonyeong;Kim, Hyunsun;Lee, Changki
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.75-78
    • /
    • 2018
  • 감성 분석은 특정 대상에 대한 의견을 수집하고 분류하는 과정이다. 그러나 자연어에 담김 사람의 주관을 파악하는 일은 어려운 일로써, 기존의 감성 단어 사전이나 확률 모델은 이러한 문제를 해결하기 어려웠으나 딥 러닝의 발전으로 문제 해결을 시도할 수 있게 됐다. 본 논문에서는 사전 학습된 문맥 표현을 한국어 감성 분석에 활용하여 더 높은 성능을 낼 수 있음을 보인다.

  • PDF

Song-lyrics Generation system by Deep Learning (딥러닝 기법을 이용한 노래 가사 생성 시스템)

  • Son, Sung-Hwan;Lee, Hyun-Young;Nam, Gyu-Hyeon;Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.570-573
    • /
    • 2018
  • 본 논문에서는 한국 가요 학습 데이터를 노래 가사 마디 단위로 문자열을 역전시키는 형태로 변형하고 LSTM으로 학습하여, 마디 간의 문맥을 고려해 문자열을 생성하는 방법에 대해 제안한다. 그리고 이를 통해 특정 가요 가사와 유사하면서도 다른 가사를 생성하는 것도 가능하다. 문자열의 우측 끝에 위치하면서 마디 간의 문맥을 연결해 주는 서술어, 접속사와 같은 요소를 활용하기 위해 데이터를 변형하여 적용한다. 제안하는 방식으로 생성한 문자열이 단순히 문자열 데이터를 그대로 학습하여 생성하는 것보다 상대적으로 더 자연스러운 문맥으로 생성되는 것을 확인하였다.

  • PDF

KoELMo: Deep Contextualized word representations for Korean (KoELMo: 한국어를 위한 문맥화된 단어 표상)

  • Hong, Seung-Yean;Na, Seung-Hoon;Shin, Jong-Hoon;Kim, Young-Kil
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.296-298
    • /
    • 2018
  • 기존의 Word2Vec이나 Glove 등의 단어 임베딩 모델은 문맥에 상관없이 단어의 Vector들이 고정된 Vector를 가지는 문제가 있다. ELMo는 훈련된 Bi-LSTM 모델을 통해서 문장마다 Word Embedding을 수행하기 때문에 문맥에 상관없이 고정된 Vector를 가지는 문제를 해결하였다. 본 논문에서는 한국어와 같이 형태적으로 복잡한 언어의 경우 수 많은 단어가 파생될 수 있어 단어 임베딩 벡터를 직접적으로 얻는 방식에는 한계가 있기 때문에 형태소의 표상들을 결합하여 단어 표상을 사용한 ELMo를 제안한다. ELMo 단어 임베딩을 Biaffine attention 파싱 모델에 적용 결과 UAS에서 91.39%, LAS에서 90.79%으로 기존의 성능보다 향상된 성능을 얻었다.

  • PDF

Context-aware caching Strategy in Digital Television Environment (디지털 텔레비전 환경에서의 문맥인지 캐슁 정책)

  • 최지혁;이해원;김수연;최양희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.510-512
    • /
    • 1999
  • 컴퓨터통신 분야 및 개인이동통신 분야 등에서 먼저 도입된 멀티미디어 데이터의 사용이 큰 호응을 얻으면서, 최근 디지털 텔레비전 환경에서 멀티미디어 데이터 방송서비스를 시행하려는 노력들이 이루어지고 있다. 이는 다수의 사용자를 겨냥한 방송서비스로 데이터가 개별 사용자의 요구에 의해서가 아닌 정해진 방송 순서에 의해 제공된다. 따라서 사용자들은 원하는 정보를 수신할때까지 대기하게 된다. 이러한 응답시간 (response time)을 감소시키기 위해서, 문맥인지 캐슁(context-aware caching) 정책과 캐쉬 점유 우선순위 결정에 핵심이 되는 두 노드사이의 거리 산출을 위한 방법을 제안한다. 또한 선입산출(first-in-first-out) 정책과의 비교 모의실험(simulation)을 통해, 제안한 문맥인지 캐슁 정책이 응답시간 감소효과가 좋음을 확인하고, 이를 분석한다.

  • PDF

Content Recommendation Using High-Speed Association Rule Generation for Contextual Advertisement (고속연관규칙을 이용한 문맥광고에서의 콘텐츠 추천)

  • Kim, Sung-Ming;Lee, Seong-Jin;Lee, Soo-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.362-365
    • /
    • 2006
  • 인터넷 사용자가 급증함에 따라 온톨로지를 이용한 지능형 웹이나 인터넷 사용자에게 개인 맞춤형 서비스를 제공하기 위한 다양한 연구가 진행되고 있다. 대표적인 예로 문맥광고는 인터넷 사용자들이 뉴스나 커뮤니티 사이트에서 콘텐츠를 조회하고, 해당 콘텐츠와 일치하거나 관련성이 높은 제품 또는 서비스 정보를 제공하는 광고기법이다. 그러나 문맥 광고는 사용자에게 다양한 콘텐츠 및 사이트 추천 서비스를 제공하지 못하고 있다. 따라서 다양한 콘텐츠 및 사이트 추천 서비스를 제공하기 위해 본 논문에서는 사용자가 조회한 콘텐츠의 내용을 대표할 수 있는 중요 키워드를 선정하고, 콘텐츠 내에서 추출된 키워드간의 연관성을 분석하여 관련 콘텐츠 및 사이트를 추천하는 방법에 대해 제안한다. 또한 연관키워드리스트 생성방법을 고속연관규칙을 이용하여 처리속도를 줄이고, 사용자가 선호할 만한 다양한 콘텐츠와 관련된 사이트를 제공하는 방법에 대해 제안한다.

  • PDF

Target Word Selection for English-Korean Machine Translation System using Multiple Knowledge (다양한 지식을 사용한 영한 기계번역에서의 대역어 선택)

  • Lee, Ki-Young;Kim, Han-Woo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.5 s.43
    • /
    • pp.75-86
    • /
    • 2006
  • Target word selection is one of the most important and difficult tasks in English-Korean Machine Translation. It effects on the translation accuracy of machine translation systems. In this paper, we present a new approach to select Korean target word for an English noun with translation ambiguities using multiple knowledge such as verb frame patterns, sense vectors based on collocations, statistical Korean local context information and co-occurring POS information. Verb frame patterns constructed with dictionary and corpus play an important role in resolving the sparseness problem of collocation data. Sense vectors are a set of collocation data when an English word having target selection ambiguities is to be translated to specific Korean target word. Statistical Korean local context Information is an N-gram information generated using Korean corpus. The co-occurring POS information is a statistically significant POS clue which appears with ambiguous word. The experiment showed promising results for diverse sentences from web documents.

  • PDF

Design of Q/A System By Natural Language Processing (자연언어에 의한 질의응답 시스템의 설계)

  • Kim, Y.K.;Kang, S.H.;Woo, Y.S.;Kim, H.W.;Choi, B.U.
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.469-477
    • /
    • 1992
  • 본 논문에서는 자연언어 처리를 기반으로 한 질의응답 시스템을 설계하며 그 대상을 호텔 예약 시스템으로 한다. 시스템은 크게 언어 해석부, 문맥 처리부, 화제 처리부 및 한국어 생성부로 구성한다. 언어 처리부에서는 단일화 문법을 적용하여 사용자가 입력한 질의문을 해석하며 그 해석결과로부터 이 후 질의응답에 사용되는 정보들인 술어, 각 명사구들의 의존 관계치 및 의미 제약치를 얻어 낸다. 문맥처리를 수행하여 생략문 등에 의해 결핍된 정보들을 추출함으로서 정보의 손실을 보완한다. 이 정보들을 이용하여 사용자와 시스템간의 자연스러운 대화를 진행하기 위한 화제처리를 수행하며, 최종적으로 화제 처리부에서 파악한 화자의 의도를 기초로 사용자가 요구한 정보를 제공하고 계속된 대화진행을 위해 적절한 한국어를 생성해 주는 한국어 생성부를 거치게 된다. 본 논문에서는 호텔 예약이라는 정해진 영역하에서 자연언어처리에 의해 추출한 술어, 각 명사구들의 의존관계치 및 의미제약치 정보들을 이용하여 문맥처리와 화제처리를 수행함으로서 더욱 효율적인 질의응답 시스템을 구현할 수 있음을 보인다.

  • PDF

A New Method for Estimating Rule Probabilities of Stochastic Context-Free Grammars (확률문맥자유문법의 규칙확률 추정을 위한 새로운 기법)

  • Byun, Seong-Chan;Ra, Dong-Yul
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.247-252
    • /
    • 1998
  • 본 논문에서는 확률문맥자유문법의 규칙확률을 추정하여 주는 새로운 알고리즘을 제시한다. 이 알고리즘은 이미 잘 알려진 인사이드-아웃사이드 알고리즘에 비하여 개념적으로 이해하기 쉽다는 장점을 가지고 있으며 속도면에서 훨씬 빠르다는 것이 실험으로 입증되었다.

  • PDF

Domain Architecture Design for Component-Based Software Development(CBD) (컴포넌트 기반 소프트웨어 개발을 위한 도메인 아키텍쳐 설계)

  • 하현주;염근혁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.495-497
    • /
    • 2000
  • CBD(Component-Based Development)는 이미 존재하는 소프트웨어 컴포넌트를 조립함으로써 시스템을 개발하는 방법이다. 컴포넌트를 이용하여 시스템을 개발하는 것은 개발시간과 비용을 줄이고, 생산성을 향상시키는 등 여러 가지 장점을 가진다. 그러나 여러 벤더에 의해 개발된 컴포넌트를 조립하는 것은 쉬운 일이 아니다. 이를 위해 컴포넌트가 어떤 문맥에서 사용되는지 이해하는 것이 필요하며 이 문맥은 아키텍쳐에 의해 결정된다. 따라서 본 논문에서는 컴포넌트 기반 개발을 위한 도메인 아키텍쳐를 제안한다. 도메인 아키텍쳐는 도메인을 구성하는 컴포넌트와 그들간의 관계에 대한 정보를 제공함으로써, 어플리케이션 개발을 쉽게 한다. 또한 도메인 아키텍쳐는 관련된 여러 시스템을 위한 아키텍쳐이므로, 도메인 아키텍쳐 상의 컴포넌트는 재사용이 높다.

  • PDF