• 제목/요약/키워드: 속담인지

검색결과 62건 처리시간 0.015초

사전과 말뭉치를 이용한 한국어 단어 중의성 해소 (Korean Word Sense Disambiguation using Dictionary and Corpus)

  • 정한조;박병화
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.1-13
    • /
    • 2015
  • 빅데이터 및 오피니언 마이닝 분야가 대두됨에 따라 정보 검색/추출, 특히 비정형 데이터에서의 정보 검색/추출 기술의 중요성이 나날이 부각되어지고 있다. 또한 정보 검색 분야에서는 이용자의 의도에 맞는 결과를 제공할 수 있는 검색엔진의 성능향상을 위한 다양한 연구들이 진행되고 있다. 이러한 정보 검색/추출 분야에서 자연어처리 기술은 비정형 데이터 분석/처리 분야에서 중요한 기술이고, 자연어처리에 있어서 하나의 단어가 여러개의 모호한 의미를 가질 수 있는 단어 중의성 문제는 자연어처리의 성능을 향상시키기 위해 우선적으로 해결해야하는 문제점들의 하나이다. 본 연구는 단어 중의성 해소 방법에 사용될 수 있는 말뭉치를 많은 시간과 노력이 요구되는 수동적인 방법이 아닌, 사전들의 예제를 활용하여 자동적으로 생성할 수 있는 방법을 소개한다. 즉, 기존의 수동적인 방법으로 의미 태깅된 세종말뭉치에 표준국어대사전의 예제를 자동적으로 태깅하여 결합한 말뭉치를 사용한 단어 중의성 해소 방법을 소개한다. 표준국어대사전에서 단어 중의성 해소의 주요 대상인 전체 명사 (265,655개) 중에 중의성 해소의 대상이 되는 중의어 (29,868개)의 각 센스 (93,522개)와 연관된 속담, 용례 문장 (56,914개)들을 결합 말뭉치에 추가하였다. 품사 및 센스가 같이 태깅된 세종말뭉치의 약 79만개의 문장과 표준국어대사전의 약 5.7만개의 문장을 각각 또는 병합하여 교차검증을 사용하여 실험을 진행하였다. 실험 결과는 결합 말뭉치를 사용하였을 때 정확도와 재현율에 있어서 향상된 결과가 발견되었다. 본 연구의 결과는 인터넷 검색엔진 등의 검색결과의 성능향상과 오피니언 마이닝, 텍스트 마이닝과 관련한 자연어 분석/처리에 있어서 문장의 내용을 보다 명확히 파악하는데 도움을 줄 수 있을 것으로 기대되어진다.

한문 희곡 <동상기(東廂記)>의 구성과 야담 <동상기찬(東廂記纂)>과의 연계성 (A Study on the Configuration of Chinese Drama and the Connection between Yadam )

  • 김준형
    • 공연문화연구
    • /
    • 제39호
    • /
    • pp.325-355
    • /
    • 2019
  • 1791년 6월 12일, 노총각 김희집과 노처녀 신덕빈의 딸의 혼인이 이루어 졌다. 이 혼인식은 국가가 주도해 시행한 일종의 노처녀노총각 혼인 프로젝트라 부를 만한 것이었다. 혼인은 인륜의 시작으로, 때를 놓치면 천지의 조화로운 기운[和氣]이 상한다던 당대 통념을 염두에 둔 정조가 진두지휘한 국가 정책이었다. 정조는 이 사건을 이덕무에게 기록하게 했는데, 그것이 <김신부부전>이다. 민간에서도 이 혼인에 주목했는데, 이옥(李鈺)은 희곡의 틀을 빌어 <동상기>를 창작했다. <동상기>는 가난한 백성에게 덕화를 베푼 임금을 찬양한다는 주지 아래, 오락적 요소를 가미한 텍스트다. 희곡을 모방했지만, 공연은 염두에 두지 않았다. <동상기>를 두고 수준 낮은 작품이란 평가는 이를 고려하지 않고 완정한 극적 구성물로 이해했던 결과다. <동상기>는 극 형식만 차용했을 뿐, 주된 목적은 임금의 덕화를 찬양하되 다양한 오락적 요소를 틈입시킴으로써 축제의 장을 담아내려 했다. <동상기> 4개의 절(折)마다 각각 다른 문체가 사용된 것도 그러하다. 1절과 2절에는 설화와 속담, 3절에는 판소리, 4절에는 연극을 배치시켰다. <동상기>를 통해 공연하겠다는 의도 대신 무료함을 달래기 위해 여러 문체를 적용한 것이다. 이후 1918년 한남서림 주인 백두용은 이옥의 <동상기>에 기존 야담 <동상기찬>을 더한 동상기찬을 출판한다. 기존 연구에서는 <동상기>와 <찬>을 별개의 텍스트로 인지했지만, 기실 둘은 긴밀하게 연계되어 있다. 애초 김신 부부가 임금이 살펴줌으로써 인륜의 도리를 할 수 있었던 것처럼, 백두용은 근대로 전환하는 도정에서 누군가가 자신을 알아봐 줄 것을 고대했다. 나를 알아주는 누군가를 만나는 것. 백두용은 그 단서를 임금이 가난한 백성에게까지 눈길을 미쳤던 <동상기>에서 찾았던 것이다. 그에 따라 백두용은 이옥이 쓴 정일(正目)을 각각 '재현(才賢)', '덕혜(德慧)', '권택(眷澤)', '복연(福緣)', '보유(補遺)'로 분류하고, 기존 야담에서 해당 범주에 맞는 작품을 선취하여 <찬>을 만들었다. 그러니 <동상기>와 <찬>은 '지기(知己)'라는 연결 고리로 이어진다. 실제 백두용은 1절에서 4절까지를 '누군가가 나를 알아줌 → 내가 누군가를 알아줌 → 적선→ 여경(餘慶)'으로 각각 구성함으로써 자신의 욕망을 구체화했다. 우리가<동상기>와 <찬>을 분리시켜 다룰 수 없는 까닭이다.