Dale-Chall formulė yra vienas iš būdų nuspėti, kaip sunku skaityti tekstą. Tai yra skaitomumo testas. Dale-Chall formulė yra vieno kintamojo testas: juo matuojamas vartojamų žodžių sunkumas. Jis nematuoja sakinio struktūros (sintaksės) sudėtingumo.

Viename pirmųjų skaitomumo testų, Dale-Chall formulėje, buvo naudojamas žodžių sąrašas. Pagal jį buvo skaičiuojamas ištraukoje esančių žodžių skaičius ir taikoma formulė, pagal kurią nustatomas lygis. Ji buvo naudojama JAV mokyklų apygardų vadovėliams vertinti pagal klasių lygius. 1995 m. autoriai paskelbė atnaujintą žodžių sąrašą.

Iš principo žodyno sąrašą lengva naudoti kaip kompiuterinio skaitomumo vertinimo dalį. Sąrašas sudaromas kaip paieškos lentelė. Išvardytų žodžių procentinė dalis ištraukoje suteikia duomenis formulei, o naudotojui pateikiamas vertinimo lygis.

Apibrėžimas ir esmė

Dale–Chall skaitomumo formulė remiasi idėja, kad teksto sunkumas priklauso pirmiausia nuo vartojamų žodžių pažįstamumo. Autoriai sudarė ilgą „pažįstamų“ (lengvų) žodžių sąrašą; bet kurie žodžiai, kurie neįeina į šį sąrašą, laikomi „sunkesniais“. Formulė apjungia dviejų rodiklių įtaką: sunkesnių žodžių dalį ir vidutinį sakinio ilgį.

Kaip skaičiuojama (žingsniai)

  1. Suskaidyti tekstą į sakinius (suskaičiuoti sakinių skaičių).
  2. Suskaidyti tekstą į žodžius ir suskaičiuoti visų žodžių skaičių.
  3. Suskaičiuoti „sunkesnių“ žodžių skaičių — t. y. tokių žodžių, kurie nėra įtraukti į Dale–Chall lengvųjų žodžių sąrašą.
  4. Apskaičiuoti sunkesnių žodžių procentą: (sunkesnių žodžių skaičius / bendras žodžių skaičius) × 100.
  5. Apskaičiuoti vidutinį sakinio ilgį: bendras žodžių skaičius / sakinių skaičius.
  6. Pritaikyti formulę (žr. žemiau) ir, jei reikia, atlikti pataisą pagal sunkesnių žodžių procentą.
  7. Gautą „žaliąjį“ (raw) balą konvertuoti į mokyklinį (grade) lygį pagal standartinę lentelę.

Formulė ir korekcija

Standartinė Dale–Chall formulė rašoma taip:

Raw score = 0.1579 × (sunkesnių žodžių procentas) + 0.0496 × (vidutinis sakinio ilgis)

Jei sunkesnių žodžių procentas yra didesnis nei 5 %, prie gauto balo pridedama 3.6365. Gautas „raw score“ vėliau verčiamas į JAV klasių (grade) lygius pagal oficialią lentelę.

Pavyzdys

Tarkime, tekste yra 120 žodžių, 6 sakiniai ir 8 sunkesni žodžiai.

  • Sunkesnių žodžių procentas = (8 / 120) × 100 = 6,67 %
  • Vidutinis sakinio ilgis = 120 / 6 = 20 žodžių
  • Raw score = 0.1579 × 6.67 + 0.0496 × 20 ≈ 1.05 + 0.99 = 2.04
  • Kadangi sunkesnių žodžių > 5 %, pridedame 3.6365 → galutinis raw score ≈ 5.68

Gautas balas konvertuojamas pagal lentelę; pagal įprastą interpretaciją tai atitinka maždaug 5–6 klasės skaitymo lygį.

Taikymas ir istorija

Originaliai formulė buvo sukurta anglų kalbai ir buvo plačiai taikoma JAV švietimo sistemoje vadovėliams, informaciniams tekstams ir pedagoginėms medžiagoms vertinti. 1995 m. autorių atnaujintas žodžių sąrašas siekė tikslinti „pažįstamų“ žodžių rinkinį, tačiau esminė formulės logika liko ta pati.

Privalumai

  • Aiški, paprasta implementuoti: reikia tik žodžių sąrašo ir kelių skaičiavimų.
  • Konkrečiai akcentuoja žodyno pažįstamumą — svarbu tekstams, kuriuose vartojama daug specialios leksikos.
  • Lengvai automatizuojama kaip kompiuterinio skaitomumo dalis.

Apribojimai ir trūkumai

  • Formulė nematuoja sintaksės sudėtingumo, teksto nuoseklumo, semantikos ar konteksto aiškumo.
  • Originalus žodžių sąrašas yra anglų kalbai; taikant kitoms kalboms (pvz., lietuvių) būtina sudaryti atitinkamą pažįstamų žodžių sąrašą ir, pageidautina, perskaičiuoti formulės koeficientus remiantis empirine medžiaga.
  • Negali atskirti homonimų, sudurtinių žodžių ar žodžių formų — reikalinga normalizacija (lematizacija) prieš skaičiavimą.
  • Tekstas su trumpais, bet sudėtingais žodžiais gali gauti geresnį balą nei iš tikrųjų yra suprantamas (ir atvirkščiai).

Praktiniai patarimai implementuojant

  • Prieš skaičiuojant, normalizuokite tekstą: pašalinkite perteklinę interpunkciją, suskaidykite sutrumpinimus, tvarkykite skaičius ir datų formatą.
  • Apsvarstykite lematizaciją (žodžių formų suvienodinimą) arba bent mažųjų/ didžiųjų raidžių vienodumą.
  • Hyphenizuotus ir sudurtinius žodžius apdorokite pagal naudojamą taisyklę (vienas ar keli žodžiai) — tai gali daryti įtaką sunkesnių žodžių skaičiui.
  • Vertinant kitomis kalbomis, sukurkite ir patikrinkite vietinį „pažįstamų žodžių“ sąrašą, taip pat, jei įmanoma, kalibruokite koeficientus su anotuotais tekstais ir skaitytojų supratimo duomenimis.

Santrauka

Dale–Chall formulė yra naudingas įrankis greitam teksto žodyno sudėtingumo įvertinimui, ypač kai reikia objektyviai palyginti skirtingų tekstų žodyninį sunkumą. Tačiau ji nėra vienintelė priemonė: geriausi vertinimo rezultatai gaunami derinant leksikos analizę su kitais rodikliais (sintaksės, semantikos ir konteksto vertinimu) arba naudojant specialiai konkrečiai kalbai pritaikytas versijas.