Statistikoje dažnių pasiskirstymas yra kintamojo reikšmių, kurias jis įgyja imtyje, sąrašas. Paprastai tai yra sąrašas, išdėstytas pagal kiekį: nurodoma, kiek kartų (absoliučių dažnių) kiekviena reikšmė pasitaiko. Dažnių pasiskirstymas padeda suprasti imties struktūrą, rasti dažniausiai pasitaikančias reikšmes (modą), įvertinti pasiskirstymo asimetriją ir kt.
Negrupuotas ir sugrupuotas dažnių pasiskirstymas
Yra du pagrindiniai dažnių pasiskirstymo tipai:
- Negrupuotas (diskretus) – kai kintamasis turi nedaug skirtingų, aiškiai atskiriamų reikšmių (pvz., Likerto skalė ar skaičius lankytųsi). Kiekvienai reikšmei pateikiamas absoliutus dažnis.
- Sugrupuotas (intervalinis) – kai kintamasis įgyja daug arba tolydžių reikšmių (pvz., ūgis, pajamos). Tuomet reikšmės suskirstomos į klases (intervalus) ir skaičiuojamas kiekvienos klasės dažnis.
Pavyzdys: Likerto skalė
Pavyzdžiui, jei 100 žmonių penkiabalėje Likerto skalėje vertina savo sutikimą su teiginiu (1 – stiprus sutikimas, 5 – stiprus nesutikimas), jų atsakymų dažnių pasiskirstymas gali atrodyti taip:
- 1: 30 respondentų
- 2: 25 respondentų
- 3: 20 respondentų
- 4: 15 respondentų
- 5: 10 respondentų
Iš šių absoliučių dažnių lengva apskaičiuoti santykinius dažnius (proporcijas) ir procentus: pvz., reikšmės 1 santykinis dažnis = 30/100 = 0,30 (30 %). Taip pat galima sudaryti kaupiamąjį dažnių pasiskirstymą (cumulative frequency), kuris parodo, kiek stebėjimų yra mažiau arba lygu tam tikrai reikšmei (pvz., iki 3 taškų – 30+25+20 = 75 respondentų).
Pavyzdys: ūgio duomenys ir intervalai
Kai kintamasis gali įgyti tolydžių reikšmių, sudaroma intervalinė dažnių lentele. Pavyzdžiui, klasės mokinių ūgiui dažnių lentelė gali būti:
- 150–159 cm: 5 mokiniai
- 160–169 cm: 12 mokinių
- 170–179 cm: 20 mokinių
- 180–189 cm: 8 mokiniai
Kiekvienai klasei kartais priskiriami dar tokie stulpeliai kaip klasės vidurkis (klasės vidurio taškas), klasės plotis (intervalo ilgis), santykinis dažnis ir kaupiamasis dažnis. Pvz., santykinis dažnis 170–179 cm klasei (jei bendras mokinių skaičius 45) = 20/45 ≈ 0,444 (44,4 %).
Kaip sudaryti gerą intervalinę lentelę
- Pasirinkite klasių skaičių ir plotį taip, kad klasės būtų ne per daug siauros (triukšmas) ir ne per daug plačios (informacijos praradimas). Dažnai naudojamos taisyklės: Sturgeso taisyklė arba vizualus pasirinkimas.
- Laikykitės neperlapančių intervalų ir aiškios ribos (pvz., [150–159], [160–169]).
- Apsvarstykite, ar naudoti lygią taškų įtraukimą (pvz., 159,9) ar sveikųjų skaičių ribas pagal matavimo tikslumą.
- Pateikite papildomus stulpelius: absoliutūs dažniai, santykiniai dažniai (proporcijos), procentai ir kaupiamieji dažniai.
Vizualizacijos
- Histogramas – tinka intervaliniams duomenims; stačiakampių aukštis atitinka klasės dažnį arba santykinį dažnį.
- Stulpelinė diagrama (bar chart) – tinka diskretiniams duomenims (pvz., Likerto skalė), kai aukštis rodo dažnį.
- Dažnių poligonas – linija, sujungusi intervalų vidurio taškų reikšmes pagal dažnius; naudinga lyginant kelis pasiskirstymus.
Dažnių tipai ir pagrindinės sąvokos
- Absoliutūs dažniai – kiek kartų pasitaiko konkreti reikšmė arba klasė.
- Santykiniai dažniai – absoliutus dažnis padalintas iš bendro stebėjimų skaičiaus (dažnai pateikiami procentais).
- Kaupiamieji dažniai – sukaupti dažniai iki tam tikros reikšmės ar klasės.
- Moda – reikšmė arba klasė su didžiausiu dažniu.
Naudojimo paskirtis ir apribojimai
Dažnių pasiskirstymai yra pagrindinis aprašomosios statistikos įrankis: jie padeda greitai apibendrinti duomenis, rasti tipines reikšmes, aptikti išskirtinas reikšmes (anomalijas) ir paruošti duomenis tolimesnei analizei. Tačiau reikia atkreipti dėmesį:
- Intervalų pasirinkimas gali pakeisti vizualinį pasiskirstymo įspūdį (binning efektas).
- Sugrupuoti duomenys praranda informaciją apie atskiras reikšmes.
- Mažos imtys gali duoti netikėtus dažnių rezultatus dėl atsitiktinumo.
Kai kurias praktinės patarimai
- Visada nurodykite bendrą stebėjimų skaičių (imties dydį), kai pateikiate dažnių lentelę.
- Jei įmanoma, pateikite tiek absoliučius, tiek santykinius dažnius — tai padeda skirtingų dydžių imčių palyginimui.
- Naudokite histogramos papildomam pasirinktų intervalų įvertinimui ir patikrinkite, ar intervalų pasirinkimas neiškraipo pagrindinio modelio.
Apibendrinant, dažnių pasiskirstymas — tai paprastas, bet galingas būdas suprasti duomenis. Tinkamai sudarytas ir iliustruotas jis leidžia greitai pamatyti duomenų centrinę tendenciją, sklaidą ir formas, o tai yra pirmas žingsnis daugelyje statistinių analizės procesų.


