• 제목/요약/키워드: 표제어

검색결과 102건 처리시간 0.032초

문장 클러스터링에 기반한 자동요약 모형 (A Text Summarization Model Based on Sentence Clustering)

  • 정영미;최상희
    • 정보관리학회지
    • /
    • 제18권3호
    • /
    • pp.159-178
    • /
    • 2001
  • 본 연구에서는 문장 클러스터로부터 대표문장을 선정하여 요약문을 생성하는 자동요약 모형을 제시하고. 학습문서 집단을 미용하여 최적의 요약 환경을 구축한 후 요약 실험을 수행하였다. 학습 과정에서 문장의 클러스터링 기법으로는 7개의 계층적 기법들을 비교한 결과 클러스터를 구성하는 문장 수의 편차가 가장 적고 단일 문장 클러스터를 가장 적게 생성하는 센트로이드 기법이 선택되었다. 또한 각 클러스터를 대표하는 문장의 선정을 위해 용어 및 문장 가중치를 합산한 문장값과 클러스터-문장 벡터간 유사도의 두 기준을 비교한 결과 문장값 기준이 선택되었다. 용어 가중치로는 역문장빈도와 표제어 가중치, 그리고 문장의 위치 가중치가 자동요약 성능을 개선시키는 것으로 나타났으며, 적절한 요약문의 길이는 전체 문서의 1/3인 것으로 나타났다. 실험문서 집단으로는 문서의 길이와 특성이 다른 신문기사와 잡지기사의 두 집단을 이용하였다. 요약 모형의 검증 실험 결과 요약 정확률은 신문기사 집단에서는 53%, 잡지기사 집단에서는 47%인 것으로 나타났다. 두 실험 모두 랜덤하게 생성한 베이스라인 요악문보다 성능이 우수하였으나, 리드문장들로 구성된 베이스라인 요약문과의 비교에서는 짧은 길이의 신문기사의 경우 요약 모형의 성능이 오히려 떨어지는 것으로 나타났다.

  • PDF

인용 이미지 구축자 프로파일링을 이용한 국내 여성학 분야 연구 전선 분석 (Analyzing the Research Fronts of Women's Studies in Korea Using Citation Image Makers Profiling)

  • 김조아;이재윤
    • 정보관리학회지
    • /
    • 제33권2호
    • /
    • pp.201-225
    • /
    • 2016
  • 학제적 분야의 연구 전선을 분석하는 새로운 기법으로 인용 이미지 구축자 프로파일링 기법을 제안하였다. 인용 이미지 구축자 프로파일링은 해당 문헌을 인용한 문헌의 표제어를 단서로 사용하여 문헌 간의 주제관계를 파악하는 방법이다. 이 연구에서는 시험적으로 국내 여성학 연구를 대상으로 인용 이미지 구축자 프로파일링 기법을 적용하여 연구 전선과 주요 연구 주제를 파악해보았다. 분석 대상은 KCI의 2015년 기준 여성학분야 인용빈도 10회 이상에 해당하는 핵심문헌 집합이다. 여성학 분야에 문헌동시인용 기법을 적용한 결과 인용 데이터 부족 때문에 어려움이 있었던 반면에, 인용 이미지 구축자 프로파일링 기법을 적용한 결과 성공적으로 2개 대분야 및 6개 소분야를 파악할 수 있었다. 이 연구에서 제안한 인용 이미지 구축자 프로파일링 기법은 학제적 연구분야의 동향을 파악하는데 기여할 수 있을 것으로 기대된다.

고군산 선유팔경(仙遊八景)의 설정과정과 집경(集景) 특성 (A Study on the Setting Process and Formational Characteristics of the Seonyu Eight Scenic in Gogunsan Islands)

  • 정우진;황국웅
    • 한국전통조경학회지
    • /
    • 제37권4호
    • /
    • pp.32-50
    • /
    • 2019
  • 본 연구는 고군산 선유팔경이 설정된 경위와 각 경점의 경관특성을 고찰한 것으로 요약된 결론은 다음과 같다. 첫째, 1969년 이래 설정된 경점은 수차례 그 내용과 순서가 바뀌었고 표제어 또한 일정한 변천과정이 확인된다. 70년대까지 알려진 팔경은 공식적인 팔경명이 없거나 고군산팔경으로 명명된 경우가 많았으며, 무산십이봉이 제외된 구성을 보인다. 또한 팔경의 경점이 시기별로 제각각인 유형도 나타나는데, 따라서 선유팔경의 초기 형태는 인근 지역의 팔경을 참조하되, 고군산군도 특히 선유도의 경승이 취사선택된 것이었음을 알 수 있다. 둘째, 현재와 같은 팔경 요소가 모두 충족되어 나타나는 2000년대 초의 선유팔경은 순번이 명시되어 있고 표제어가 네 글자로 정제되어 있어 전통적인 팔경의 명명법을 따르고 있다. 이때 제1경이 망주폭포로 설정되고 선유낙조가 제8경으로 구분되기도 하였는데, 현재는 제1경이 선유낙조, 제2경이 망주폭포의 순서로 확정되었다. 이러한 경처 순서의 변화는 시기별 대표 경관자원이 달랐다는 점을 잘 보여준다. 셋째, 정체성과 완결성이 약한 점은 선유팔경에 내재된 문제점으로 지적된다. 무엇보다 설정주체와 설정시기가 모호하며, 선행되는 옥구팔경, 임피팔경 등 인근 지역의 팔경사례를 답습한 흔적이 역력하다. 또한 경관대상에 대한 지식정보, 조망하는 시점의 명시, 역사·문화적 배경 등이 모호하여 정제되지 않은 불완전한 체계를 갖는 것으로 평가된다. 넷째, 제1경 선유낙조는 전체 경점을 대표하는 것을 넘어 팔경 전체를 지배하는 주도적인 이미지를 갖는다. 일시적 경관인 낙조가 제일의 경관이 될 수 있었던 것은 그것이 선유도의 아름다운 자연적 요소들이 융합하여 만들어진 경관의 총체로 인식되었기 때문이었다. 따라서 선유낙조를 기점으로 선유도 및 고군산군도 전체 경관을 탐색해 보고자 하는 기왕의 인식을 활용하여, 다른 고군산군도 경관자원의 가치 고양시킬 여지는 충분하다고 판단되며, 이를 위해서 각 경점의 정체성과 완결성을 강화하는 작업이 추가되어야 할 것으로 사료된다.

전주팔경의 시원(始原)과 변용(變容)에 관한 연구 (A Study on the Origin and Transformation of Jeonju-Palkyung)

  • 노재현;손희경;신상섭;최종희
    • 한국전통조경학회지
    • /
    • 제33권3호
    • /
    • pp.1-15
    • /
    • 2015
  • 전주를 대상으로 한 11개 집경(集景)의 표제어 및 시어(詩語) 분석과 해석을 토대로 전주 팔경의 형식과 내용상의 시원 및 변용과정을 시계열분석으로 살핀 연구의 결과는 다음과 같다. 추재(秋齋) 조수삼(趙秀三, 1762~1849)의 팔경시 이전에는 전주팔경의 골격과 유사한 형식의 집경 사례가 발견되지 않는 것으로 보아, "추재집"에 실린 여덟 편의 시를 전주팔경의 시원(始原)으로 보기에는 큰 무리가 없으며 그 시기는 1829년경으로 추정된다. 이후 19세기 말 작품인 '완산승경'과 '열녀춘향수절가에 기재된 팔경' 그리고 일제강점기의 '시인 신석정이 전하고 있는 팔경' 중 '동포귀범'만이 행정구역의 변화에 따라 동지포에서 봉동의 동촌으로 대상장이 변용되었지만 모두 조수삼의 팔경과 크게 다르지 않다는 점 또한 이를 뒷받침한다. 표제어 일치율 분석 결과, 전주팔경은 최소한 19C 후반에 정착(定着)된 이후 일제강점기에도 줄곧 전주를 대표하는 경관으로 지속된 것으로 확인되며 이후 '남천표모'와 '곤지망월'이 추가되어 전주십경으로써 외연(外延)이 확산되었다. 이러한 팔경 제영의 형식성에도 불구하고 "패향십영(沛鄕十詠)"이나 "견도십영(甄都十詠)" 그리고 "빈일헌십영(賓日軒十詠)" 등 조선 전기의 집경뿐만 아니라 일제강점기 일본인 나루시마 슈쿠시(成島淑士)의 집경 속에도 경기전 건지산 조경단 오목대 그리고 기린봉 덕진연 만경대 등 조선왕조의 발생지이자 전라감영의 수부(首府)로서의 상징성이 높고 전주십경의 연원(淵源)이 되는 명소들이 자리하고 있음을 볼 때 전주팔경의 의미론적 태동기는 조선 전기까지로 그 전범이 소급(遡及)되어야 할 것이다. 이 시기에는 견훤도(甄萱都)와 같이 후백제 도읍지로서의 회고(懷古) 관성(慣性)이 큰 승경 뿐 아니라 만경대와 같이 고려말 정몽주와 이성계를 상기시키는 내용의 경물 또한 전주 팔경에 등장함으로써 후백제 도읍지로서의 전주의 위상을 높이고, 조선 왕조의 발흥지로의 역사적 간극을 좁히고 있음이 확인된다. 전주팔경은 후백제 이후 조선시대 역사문화를 담는 유기체적 존재로 다소 부침(浮沈)을 거듭하였지만 지역의 대표적인 승경으로 꾸준히 변용되어 왔다. 전주 팔경은 '전주 한풍경(韓風景)'을 이해할 수 있는 문화족보로, 이를 보존하고 계승하기 위한 노력은 오늘을 사는 전주인의 몫이라 판단된다.

문맥가중치가 반영된 문장 유사 척도 (Context-Weighted Metrics for Example Matching)

  • 김동주;김한우
    • 전자공학회논문지CI
    • /
    • 제43권6호
    • /
    • pp.43-51
    • /
    • 2006
  • 본 논문은 영한 기계번역을 위한 예제기반 기계번역에서 예제 문장의 비교를 위한 척도에 관한 것으로 주어진 질의 문장과 가장 유사한 예제 문장을 찾아내는데 사용되는 유사성 척도를 제안한다. 제안하는 척도는 편집거리 알고리즘에 기반을 둔 것으로 표면어가 일치하지 않는 단어에 대해 기본적으로 단어의 표제어 정보와 품사 정보를 이용하여 유사도를 계산한다. 편집거리 척도는 비교 단위의 순서에 의존적이기는 하지만 순서만 일치하면 동일한 유사성 기여도를 갖는 것으로 판단하기 때문에 완전 문맥을 반영하지는 못한다. 따라서 본 논문에서는 완전 문맥 반영을 위해 추가적으로 이들 정보 외에 일치하는 단위 정보를 갖는 연속된 단어들에 대해 연속 정보를 반영한 문맥 가중치를 제안한다. 또한 비유사성 정도를 의미하는 척도인 편집거리 척도를 유사성 척도로 변경하고, 문맥 가중치가 적용된 척도를 문장 비교에 적용하기 위하여 정규화를 수행하며, 이를 통하여 유사도에 따른 순위를 결정한다. 또한 언어적 정보를 이용한 기존 방법류들에 대한 일반화를 시도하였으며, 문맥 가중치가 적용된 척도의 우수성을 증명하기 위해 일반화된 기존 방법류들과의 비교 실험을 수행하였다.

「규장총목」의 목록기술방식에 대한 연구 (A Study on the Bibliographical Description of the Gyujang-chongmok, or the Annotated Classified Bibliography of Books in Gyujanggak)

  • 리상용
    • 한국문헌정보학회지
    • /
    • 제47권2호
    • /
    • pp.377-388
    • /
    • 2013
  • 본 논문은 조선시대에 서호수(徐浩修)가 정조의 왕명으로 편찬한 분류순 해제목록인 "규장총목(奎章總目)"의 목록기술방식에 대해 연구한 것이다. 목록기술은 표제, 책수, 저작시대 및 생존연대, 저자명, 저작역할어, 기타 특기할만한 목록기술 사례 등으로 구분하여 각각의 특성을 살펴보았다. 이 "규장총목"은 상당히 통일성을 갖춘 목록기술방식을 설정하여 저록을 작성하였다는 점에서 한국목록기술사상 큰 의미를 부여할 수 있겠다.

A Multi-task Self-attention Model Using Pre-trained Language Models on Universal Dependency Annotations

  • Kim, Euhee
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권11호
    • /
    • pp.39-46
    • /
    • 2022
  • 본 논문에서는 UD Korean Kaist v2.3 코퍼스를 이용하여 범용 품사 태깅, 표제어추출 그리고 의존 구문분석을 동시에 예측할 수 있는 보편적 다중 작업 모델을 제안하였다. 제안 모델은 사전학습 언어모델인 다국어 BERT (Multilingual BERT)와 한국어 BERT (KR-BERT와 KoBERT)을 대상으로 추가학습 (fine-tuning)을 수행하여 BERT 모델의 자가-집중 (self-attention) 기법과 그래프 기반 Biaffine attention 기법을 적용하여 제안 모델의 성능을 비교 분석하였다.

강희제(康熙帝)의 「승덕 피서산장(避暑山莊) 36경」에 담긴 황가원림의 경관 특성과 함의 (A Study on the Landscape Characteristics and Implications of the Royal Garden through 「The 36 Scenery of Seongdeok Summer Mountain Resort」 by Kangxi Emperor)

  • 노재현;맹자군
    • 헤리티지:역사와 과학
    • /
    • 제55권4호
    • /
    • pp.212-240
    • /
    • 2022
  • 문헌연구와 고서화 도해 그리고 현장연구를 통해 중국 강희제가 읊은 「승덕 피서산장 삼십육경(承德 避暑山莊 三十六景)」(이하 「강희36경」) 제영시(題詠詩)의 분석과 해석(解釋)을 통해 「강희36경」에 담긴 경관 특성과 함의를 추적한 결론은 다음과 같다. 「강희36경」은 팔경시의 외연(外緣)을 연장한 것으로, 기존의 「팔경시」나 <팔경도>와 비교해 볼 때 '대상 중심'이 아닌 '시점(시점장) 중심'의 경관 형상화가 두드러진다. 그 결과 전(殿)과 정(亭) 등 9개 유형의 건축물을 시점으로 구조화된 경관 틀짜임을 지향하였다. 특히 호박구에 입지한 여의주는 중국의 저명한 원림과 산수시 및 산수화의 정수(精髓)만을 모은 집금식(集錦式) 배치와 구성을 통해 원중원(園中園)의 성격을 부여하였다. 표제어 분석 결과, 제영시에 등장하는 경관요소는 수체류(水體類) 14개 경(38.9%), 지형지모(地形地貌)와 관련된 산체류(山體類) 13개 경(36.1%)으로 이들 요소의 비중이 월등히 높았으며, 건축·토목류는 3개 경(8.3%), 천공류(天空類)는 2개 경(5.6%)으로 분류되었다. 제영시에서는 기후풍토요소에 대한 경관어휘(景觀語彙)의 언급이 압도적으로 두드러졌는데 특히 표제어에서는 구름(雲)과 바람(風)이 대표적 경관어휘로 드러났다. 뿐만 아니라 운(雲)·수(水)·천(泉)·청(清)·파(波)·류(流)·풍(風) 그리고 무서(無暑) 등과 같은 '청량(淸涼)'을 상징하는 시어가 높은 빈도로 출현하고 있음은 우연이 아니며, 이는 열하(熱河)의 지역성 및 피서산장의 장소성과 강하게 밀착되어 있음을 보여준다. 계절 배경이 확인된 23개 경중에서 하경(夏景)이 과반수로 비중 있게 묘사되는 점이나 피서산장 일원의 청랭성(淸冷性)으로 집약되는 기후풍토요소가 입체적이고 다의적으로 묘사되고 있음은 경관 주체인 강희제의 원림 향유 시기와 관련 깊은 것으로 보인다. 더불어 제영시에 등장하는 다수의 동식물 경관은 휴양은 물론 관상과 수렵의 공간 속성과도 동일한 맥락으로 보인다. 한편 제영시에는 고시(古詩), 전고(典故), 고화(古畫) 등을 통해 명인(名人)과 명저(名著)를 인용한 경이 33개(91.7%) 경에 이를 정도로 상고성(尙古性)의 경향이 두드러진다. 이는 경관 주체인 강희제의 중국 전통문화에 대한 이해와 자부심을 바탕으로 한 것으로 추론된다. 「강희36경」에는 가경(佳景)에 의탁(依託)된 심정에 대한 서경적 묘사뿐만 아니라 근정애민(勤政愛民) 정신, 자강불식(自强不息)과 권학(勸學) 정신 그리고 모친에 대한 공경(恭敬)과 효(孝)의 정서가 깊이 내포되고 있다. 궁극적으로 「강희36경」은 피서산장의 실경(實景)은 물론 의경적(意境的) 차원을 다층적이고 입체적으로 보여줌으로써, 황가원림의 품격과 문인의 정서를 바탕으로 한 황제로서의 기개(氣槪)를 드러내고자 한 제황적(帝皇的) 집경(集景)이라 할 만하다.

민생 없는 민생 담론 -한국 종합일간지 사설에 대한 비판적 담론 분석 (Critical Approach to the Discourse of Livelihood in Korean Newspaper's Editorial)

  • 이정민;이상기
    • 한국언론정보학보
    • /
    • 제67권
    • /
    • pp.88-118
    • /
    • 2014
  • 이 연구는 첫째, 현대 한국사회의 신문사에 의해 발화되는 '민생'이 어떤 의미를 가지며, 그것을 지칭하는 구체적인 대상이 무엇인가를 밝히고자 했다. 둘째, 신문사에 의해서 형성되는 거대담론과 시간의 흐름에 따라 변하는 것 그리고 변하지 않는 것이 무엇인지를 고찰하고자 했다. 이를 위해 한국의 주요 종합일간지의 표제어에 '민생'이란 키워드를 담고 있는 사설들을 분석했다. 이를 통해 민생담론은 누적적으로 형성된 담론 관행이 시간의 흐름과 사회변화에 따라 변하는 것을 알 수 있었다. 정치적 관점에서는 정부별로 담론이 형성되고 전환되는 양상이 뚜렷하게 나타났다. 민생을 대변한다는 암묵적인 전제하에, 정부 정치권과 저항세력에 대해 적대적이나 공격적인 진술을 정당화했다. 또한 민생담론은 한국의 민주화 세계화 과정이라는 거대한 사회적 흐름과 관계했고, 민주화의 발전과정과 함께 비판의 주된 대상이 정부중심에서 정당중심으로 변해온 것을 확인할 수 있었다. 경제적인 관점에서 민생담론이 노동쟁의, 물가, 통화증가율, 주택문제, 외환위기 등을 해결하기 위한 노력이었다면, 환란이후인 2000년대 들어서는 경제성장과 분배문제부터 양극화 문제, 일자리 창출, 비정규직 철폐 등의 문제들로 전환되는 양상을 보였다. 우리사회에 위기가 닥칠 때마다 민생경제 담론은 경제정책을 주도하는 주체에 대해 비판을 가했지만, 위기를 벗어나려는 대안의 모색이나 구체적인 분석을 제시한 것은 아니었다. 결론적으로 한국의 주요종합일간지 신문사설에 의해서 생산되는 '민생'이란 단어의 의미는, 사전적 정의로서의 '국민생활' 그 자체와 거리가 있었다.

  • PDF

온톨로지를 이용한 단어 군집화 성능 개선 (Performance Improvement of Word Clustering Using Ontology)

  • 박은진;김재훈;옥철영
    • 정보처리학회논문지B
    • /
    • 제13B권3호
    • /
    • pp.337-344
    • /
    • 2006
  • 이 논문은 사전의 뜻 풀이말을 이용하여 단어 군집화 시스템을 설계하고 구현한다. 군집화를 위해서는 다양한 형태의 자질이 요구되며 어떤 자질을 사용하느냐에 따라 군집화의 성능이 좌우된다. 뜻 풀이말은 표제어를 자세히 설명하고 있기는 하지만, 뜻 풀이말에 사용된 단어가 너무 함축적이거나 추상적이어서 뜻 풀이말이 그다지 길지 않다. 뜻 풀이말로부터 추출된 자질을 그대로 군집화에 이용할 경우에는 다수의 작은 군집이 형성된다. 뜻 풀이말을 이용하여 보다 더 좋은 군집화 결과를 얻기 위해서는 뜻 풀이말의 의미를 크게 손상하지 않는 범위에서 보다 더 일반적인 단어로 바꾸어 군집화에 필요한 자질을 확장할 필요가 있다. 이 논문에서 추상적인 말을 온톨로지 상에서 한 단계 위의 단어로 확장하거나 온톨로지 상에서 고정 높이에 해당하는 단어로 확장함으로써 단어 군집화 성능을 향상시키는 방법을 제안한다. 실험을 통해서 온톨로지를 이용해서 자질을 확장할 경우 단어 군집화 성능이 크게 개선되었으며, 전체적으로 보면 온톨로지 상에서 고정 높이에 해당하는 단어로 확장할 경우가 더 좋은 성능을 보였다. 또한 단어 군집화를 위한 자질로 동사가 매우 유용함을 관찰할 수 있었다.