Abstract
The purpose of this study is to determine factors affecting text difficulty and to model objective formulas which measure readability scores. Some readability-related factors such as total number of letters, total number of syllables, total number of unique syllables, total number of sentences and total number of paragraphs were found through correlation analysis. Some regression equations with these factors as their variables were produced through regression analysis. A model estimating readability score from total number of unique syllables was a good formula, while a model with two factors, total number of unique syllables and new syllable occurrence ratio, was a better enhanced one. The readability score represents detailed level so we can recommend students read texts corresponding to their reading levels.
본 고의 목적은 초등학생용 독서자료의 텍스트수준에 영향을 미치는 요인들을 규명하여 텍스트수준 측정 공식을 구성함으로써 텍스트의 수준 평가를 자동화하는 데에 있다. 컴퓨터로 계량화할 수 있는 언어적 요인들을 대상으로 표본집단에 부여된 텍스트수준 점수와의 상관관계를 검토한 결과 글자수, 어절수, 이형어절수, 문장수, 단락수 요인이 텍스트수준을 결정하는 요인으로 드러났다. 단순회귀분석을 통해 도출된 회귀방정식들 중에서 이형어절수 모형이 최적의 공식으로 드러났으나, 중회귀분석을 한 결과 이형어절수요인과 새 어절출현비율요인을 결합한 모형은 설명력이 더욱 향상된 공식으로 밝혀졌다. 공식에 따라 측정된 텍스트수준 점수는 학년 내에서 매우 세분된 단계까지 나타내고 있으므로 각 학생별로 그들의 독서능력에 적합한 자료를 추천할 수 있다.