Quantitative Assessment of Text Difficulty in Croatian Language

Abstract

U radu su prikazana dosadašnja istraživanja u području statističke analize teksta, s posebnim naglaskom na razvoj formula čitkosti. Pored teorijskog objašnjenja čitanja, razumijevanja i čitkosti, prikazani su rezultati analize korpusa tekstova na engleskom i hrvatskom jeziku. Na kraju, preporučuje se formula čitkosti za hrvatski jezik, modificirana prema Fleschovoj formuli za engleski jezik, koja se može koristiti kao objektivni pokazatelj za grubu procjenu težine teksta na hrvatskom jeziku.This paper presents past research in the field of statistical text analysis, with special emphasis on development of readability formulas. Apart from the theoretical part on reading, comprehension, and readability, the paper also presents results of analysis of a corpus of English and Croatian texts. Finally, a readability formula for Croatian language is suggested, as modified from Flesch Reading Ease for English language, which could be used as an objective indicator for a rough assessment of text difficulty in Croatian language

    Similar works