초록
본 연구는 컴퓨터 문헌 분석 기법을 활용하여 <토끼전> '어족회의' 대목의 계열과 계통을 밝히는 데에 목적을 둔다. 우선 각 단락의 이본 유형을 인코딩하여 코퍼스를 구축하고, 이를 바탕으로 해밍 거리를 이용하여 각 이본 간의 거리 행렬을 산출하였다. 그다음 산출된 거리 행렬을 다차원 척도법, 계층적 군집 분석을 적용하여 이본의 군집 양상을 시각화하여, 기존에 토끼전 전체 단락을 대상으로 한 군집 분석 연구와 비교하여 '어족회의' 대목의 계열과 계통 특징을 살펴보았다. 그 결과 토끼전 전체 단락을 대상으로 한 군집 분석이 6개의 계열을 이루고 있는 것과는 달리, '어족회의' 대목은 5개의 계열을 이루고 있다는 점과 몇몇 이본의 계열 출입이 있다는 점을 확인할 수 있었다. 본 연구의 성과는 계산에 의한 객관적이고 실증적인 방법으로 이본 간의 상대적 거리 측정하고 계통 분류를 했다는 점과 토끼전 전체를 내용을 대상으로 한 계열 분석과 대비하여 어족회의 대목 계열의 특징을 밝혔다는 데에 있다.
This study aims to identify the family and lineage of a part of a "Fish Tribe Conference" in the section Tokkijeon by utilizing computer literature analysis techniques. First of all, we encode the classification for a pairwise comparison's type of each paragraph to build a corpus, and based on this, we use the Hamming distance to calculate the distance matrix between each classification for a pairwise comparison's. We visualized classification for a pairwise comparison's clustering pattern by applying multidimensional scale method, and hierarchical clustering to explore the characteristics of the 'fish family' line and lineage compared to the existing cluster analysis study on entire paragraphs of "Tokkijeon". As a result, unlike the cluster analysis of the entire paragraph of "Tokkijeon", which consists of six categories, the "Fish Tribe Conference" section has five categories and some classification for a pairwise comparison's accesses. The results of this study are that the relative distance between Yibon was measured and systematic classification was performed in an objective and empirical way by calculation, and the characteristics of the line of the fish family were revealed compared to the analysis of the entire rabbit exhibition.