Abstract
A method for poll analysis using information theory and data visualization is proposed in this paper. Questions of opinion poll consist of a target variable and many explanation variables. The type of explanation variables is either numerical or categorical. In this study, explanation variables of mixed types have been ranked according to the magnitude of their effect on target variable by using mutual information. Likewise, the order of explanation variables has been evaluated using data visualization. This is the first study to quantify the impact of specific explanation variable on the related target variable.
본 논문에서는 상호정보와 데이터 시각화를 사용하여 여론조사 결과를 분석하는 방법을 제안하였다. 여론조사의 경우, 목적 변수와 이를 위한 설명 변수가 있으며 설명 변수는 수치형과 명목형이 혼재된 형태이다. 상호정보를 사용하면 목적변수에 대한 혼합형 설명변수의 영향을 크기순으로 순위를 매길 수 있고, 데이터 시각화 방법을 사용하여 이들 순위 매김에 대한 평가를 수행할 수 있다. 여론조사에서 목적변수에 미치는 설명변수의 영향력의 크기가 어느 정도인가를 정량화한 것은 이연구에 의해서만 이루어진 것이다.