• 제목/요약/키워드: 인용문 인식

검색결과 4건 처리시간 0.019초

한국어 학술 문헌의 본문 인용문 인식을 위한 규칙 기반 방법 (A Rule-based Approach to Identifying Citation Text from Korean Academic Literature)

  • 강인수
    • 정보관리학회지
    • /
    • 제29권4호
    • /
    • pp.43-60
    • /
    • 2012
  • 학술 문헌 원문에서 발견되는 인용문은 인용에 기초한 학술문헌 자동 요약, 리뷰 논문 자동 생성, 인용문 감성 분석, 인용문 기반 문헌 검색 등 다양한 학술 정보 서비스의 창출을 가능케 한다. 이러한 서비스가 가능하기 위해서는 원문 텍스트로부터 인용문의 자동 인식이 선행되어야 한다. 그러나 인용문의 인식은 인용 표지가 부착되지 않은 암묵 인용문의 존재로 인해 그 처리가 용이하지 않다. 영어의 경우 최근 이에 대한 연구가 집중되고 있으나 한국어 학술 문헌 내 인용문의 자동 인식 연구는 찾기 힘들다. 이 논문은 한국어 인용문을 자동 인식하는 규칙 기반의 방법을 제시하고 다양한 베이스라인 기법들과 인용문 인식 성능을 비교하였다. 제안된 방법은 테스트 셋 내 전체 암묵 인용문의 30%를 약 70%의 정확률로 인식할 수 있었다.

어휘 자질 기반 기계 학습을 사용한 한국어 암묵 인용문 인식 (Recognition of Korean Implicit Citation Sentences Using Machine Learning with Lexical Features)

  • 강인수
    • 한국산학기술학회논문지
    • /
    • 제16권8호
    • /
    • pp.5565-5570
    • /
    • 2015
  • 암묵인용문 인식은 학술문헌의 본문 텍스트 내에서 명시적 인용표지가 누락된 인용문장을 자동 인식하는 것으로 인용 기반 논문 검색 및 요약의 핵심 기술이다. 기존 암묵인용문 인식의 최신 연구들은 단어 ngram, 단서어구, 명시인용문과의 거리, 기존 연구자의 성, 기존 방법의 명칭 등 다양한 자질을 활용하여 50% 이상 인식 수준을 보고하고 있다. 그러나 대부분의 기존 연구들은 영어에 대해 수행되었으며 한국어의 경우 최근 긍정/부정 단서어구 패턴을 활용한 규칙 기반 시도에서 42% 성능 수준이 보고되어 있어 추가 성능 향상이 요구되는 상황이다. 이 연구에서는 한국어 어휘 자질을 사용하여 한국어 암묵인용문의 기계학습 기반 인식을 시도하였다. 이를 위해 어절, 형태소, 음절 단위에 기반한 다양한 크기의 어휘 ngram 자질들의 인식 성능을 비교 평가하고 한국어 암묵인용문 인식에 적합한 어휘 자질로 형태소 1gram 및 음절 2gram 단위를 결정하였다. 또한 이들 어휘 자질들을 전후 명시인용문들과의 인접성을 표현한 위치 자질들과 결합하여 한국어 암묵인용문 인식 성능을 50% 이상 수준으로 대폭 향상시켰다.

대물(de re) 문맥과 '-라고'의 몇 가지 의미론적 특성 (De re context and some semantic traits of 'rago')

  • 민찬홍
    • 논리연구
    • /
    • 제16권1호
    • /
    • pp.61-85
    • /
    • 2013
  • 대언 믿음과 대물 믿음의 구별을 소개하고, 믿음 문맥과 양상 문맥에서 대언(de dicto)/대물(de re) 애매성이 동일하게 나타나는데, 양상 구문의 경우 한국어는 영어와 차별화되는 특징을 갖지 않는다는 것을 지적한다. 부정문에서도 대언/대물 구문의 애매성이 나타나는 바, 이와 관련하여 한국어는 대물 부정문에 해당하는 통사 구조를 허용한다. 대물 구문은 지시적으로 투명한 구문이요 따라서 동일자 대입률을 허용하는 구문이며, 대언 구문은 지시적으로 불투명한 구문이요 동일자 대입률을 허용하지 않는 구문이다. 그런데, 인용 동사, 언어행위동사, 인지태도 동사들과 함께 사용되는 한국어의 인용 어미 '라고'는 특이하게도 영어와 평행하게 대언/대물 애매성을 갖는 문장 뿐 아니라 애매성 없는 대물 구문을 구성하는 문장도 제공한다. 또한, '라고' 구문은 내포절의 내용에 대한 화자의 공약에 있어서도 중립적이다. 한국어에서는 내포절의 내용에 대한 화자의 긍정적인 공약을 표시하고자 하는 경우 '음/임' 또는 '라는 것'이라는 어미를 사용한다. 이런 점 때문에 '앎이 진리를 전제한다'는 서구 인식론의 원칙은 인식 문장을 한국어 어미 '라고'를 사용하는 문장으로 표현하려고 할 때에는 어려움을 겪게 된다.

  • PDF

태음인(太陰人) 이열병(裡熱病)의 병증(病證) 약리(藥理)에 대한 연구(硏究) (A Study on the medical and pharmacological theory of Interior-Overheated-Disease of Taeumin)

  • 김종열;김경요
    • 사상체질의학회지
    • /
    • 제10권2호
    • /
    • pp.111-150
    • /
    • 1998
  • 1. 연구배경 및 목적 이제마가 태음인(太陰人) 이열병(裡熱病)을 인식하고 태음인(太陰人) 처방(處方)을 계발한 과정을 파악함으로써 태음인의 병증(病證) 약리(藥理)에 대한 이해를 높이고자 한다. 2. 방 법 동의수세보원(東醫壽世保元) 병증론(病證論)에 나타난 인용문과 처방의 출전을 시대별로 고찰함으로써 병증(病證)과 약리(藥理)에 대한 인식의 변화를 관찰하고 분석하였다. 3. 결 과 이제마(李濟馬) 이전에는 태음인(太陰人) 간열증(肝熱證)이 소양인(少陽人) 위열증(胃熱證)과 다르다는 것은 알았으나, 병리에 있어서는 둘을 구분하지 못하고 똑같이 열결(熱結)로만 이해하였고, 그러면서도 처방은 어느 정도 서로 다르게 쓰여지는 경향이 있었다. 문헌 고찰 결과 위열이 상하로 치성(熾盛)하여 번조(煩燥), 두통(頭痛) 소편불이(小便不利), 편비(便秘)를 거의 대부분 동반하는 소양인 위열증과 '호산지기(呼散之氣) 부족흡취지기(不足吸聚之氣) 태과(太過)로 인해 내부에 조와 열(熱)이 발생함으로써 목동(目疼), 비건(鼻乾), 인통(咽痛), 음일수이 등의 특징적 증상을 보이는 태음인 간열증을 구분할 수 있었다. 한편 약재에 있어서도 갈근, 승마(升麻), 고본(藁本), 백지(白芷), 대황(大黃)은 태음인 간열증의 치방에 군약으로 쓰이는 점에서, 황금(黃芩)과 길경(桔梗)은 폐에 작용하는 약임이 분명하므로, 그리고 라복자(蘿卜子)와 급각은 각각 치담약(治痰藥)과 개열락(開悅樂)이면서 천식(喘息), 해수(咳嗽) 등 폐병증을 함께 치료하는 점에서 각각 태음인 약으로 알 수 있었다.

  • PDF