Dažnių pasiskirstymas: apibrėžimas ir pavyzdžiai statistikoje

Sužinokite, kas yra dažnių pasiskirstymas statistikoje: aiškus apibrėžimas, dažnių lentelės, intervalų pavyzdžiai ir praktiniai paaiškinimai pradedantiesiems.

Autorius: Leandro Alegsa

Statistikoje dažnių pasiskirstymas yra kintamojo reikšmių, kurias jis įgyja imtyje, sąrašas. Paprastai tai yra sąrašas, išdėstytas pagal kiekį: nurodoma, kiek kartų (absoliučių dažnių) kiekviena reikšmė pasitaiko. Dažnių pasiskirstymas padeda suprasti imties struktūrą, rasti dažniausiai pasitaikančias reikšmes (modą), įvertinti pasiskirstymo asimetriją ir kt.

Negrupuotas ir sugrupuotas dažnių pasiskirstymas

Yra du pagrindiniai dažnių pasiskirstymo tipai:

  • Negrupuotas (diskretus) – kai kintamasis turi nedaug skirtingų, aiškiai atskiriamų reikšmių (pvz., Likerto skalė ar skaičius lankytųsi). Kiekvienai reikšmei pateikiamas absoliutus dažnis.
  • Sugrupuotas (intervalinis) – kai kintamasis įgyja daug arba tolydžių reikšmių (pvz., ūgis, pajamos). Tuomet reikšmės suskirstomos į klases (intervalus) ir skaičiuojamas kiekvienos klasės dažnis.

Pavyzdys: Likerto skalė

Pavyzdžiui, jei 100 žmonių penkiabalėje Likerto skalėje vertina savo sutikimą su teiginiu (1 – stiprus sutikimas, 5 – stiprus nesutikimas), jų atsakymų dažnių pasiskirstymas gali atrodyti taip:

  • 1: 30 respondentų
  • 2: 25 respondentų
  • 3: 20 respondentų
  • 4: 15 respondentų
  • 5: 10 respondentų

Iš šių absoliučių dažnių lengva apskaičiuoti santykinius dažnius (proporcijas) ir procentus: pvz., reikšmės 1 santykinis dažnis = 30/100 = 0,30 (30 %). Taip pat galima sudaryti kaupiamąjį dažnių pasiskirstymą (cumulative frequency), kuris parodo, kiek stebėjimų yra mažiau arba lygu tam tikrai reikšmei (pvz., iki 3 taškų – 30+25+20 = 75 respondentų).

Pavyzdys: ūgio duomenys ir intervalai

Kai kintamasis gali įgyti tolydžių reikšmių, sudaroma intervalinė dažnių lentele. Pavyzdžiui, klasės mokinių ūgiui dažnių lentelė gali būti:

  • 150–159 cm: 5 mokiniai
  • 160–169 cm: 12 mokinių
  • 170–179 cm: 20 mokinių
  • 180–189 cm: 8 mokiniai

Kiekvienai klasei kartais priskiriami dar tokie stulpeliai kaip klasės vidurkis (klasės vidurio taškas), klasės plotis (intervalo ilgis), santykinis dažnis ir kaupiamasis dažnis. Pvz., santykinis dažnis 170–179 cm klasei (jei bendras mokinių skaičius 45) = 20/45 ≈ 0,444 (44,4 %).

Kaip sudaryti gerą intervalinę lentelę

  • Pasirinkite klasių skaičių ir plotį taip, kad klasės būtų ne per daug siauros (triukšmas) ir ne per daug plačios (informacijos praradimas). Dažnai naudojamos taisyklės: Sturgeso taisyklė arba vizualus pasirinkimas.
  • Laikykitės neperlapančių intervalų ir aiškios ribos (pvz., [150–159], [160–169]).
  • Apsvarstykite, ar naudoti lygią taškų įtraukimą (pvz., 159,9) ar sveikųjų skaičių ribas pagal matavimo tikslumą.
  • Pateikite papildomus stulpelius: absoliutūs dažniai, santykiniai dažniai (proporcijos), procentai ir kaupiamieji dažniai.

Vizualizacijos

  • Histogramas – tinka intervaliniams duomenims; stačiakampių aukštis atitinka klasės dažnį arba santykinį dažnį.
  • Stulpelinė diagrama (bar chart) – tinka diskretiniams duomenims (pvz., Likerto skalė), kai aukštis rodo dažnį.
  • Dažnių poligonas – linija, sujungusi intervalų vidurio taškų reikšmes pagal dažnius; naudinga lyginant kelis pasiskirstymus.

Dažnių tipai ir pagrindinės sąvokos

  • Absoliutūs dažniai – kiek kartų pasitaiko konkreti reikšmė arba klasė.
  • Santykiniai dažniai – absoliutus dažnis padalintas iš bendro stebėjimų skaičiaus (dažnai pateikiami procentais).
  • Kaupiamieji dažniai – sukaupti dažniai iki tam tikros reikšmės ar klasės.
  • Moda – reikšmė arba klasė su didžiausiu dažniu.

Naudojimo paskirtis ir apribojimai

Dažnių pasiskirstymai yra pagrindinis aprašomosios statistikos įrankis: jie padeda greitai apibendrinti duomenis, rasti tipines reikšmes, aptikti išskirtinas reikšmes (anomalijas) ir paruošti duomenis tolimesnei analizei. Tačiau reikia atkreipti dėmesį:

  • Intervalų pasirinkimas gali pakeisti vizualinį pasiskirstymo įspūdį (binning efektas).
  • Sugrupuoti duomenys praranda informaciją apie atskiras reikšmes.
  • Mažos imtys gali duoti netikėtus dažnių rezultatus dėl atsitiktinumo.

Kai kurias praktinės patarimai

  • Visada nurodykite bendrą stebėjimų skaičių (imties dydį), kai pateikiate dažnių lentelę.
  • Jei įmanoma, pateikite tiek absoliučius, tiek santykinius dažnius — tai padeda skirtingų dydžių imčių palyginimui.
  • Naudokite histogramos papildomam pasirinktų intervalų įvertinimui ir patikrinkite, ar intervalų pasirinkimas neiškraipo pagrindinio modelio.

Apibendrinant, dažnių pasiskirstymas — tai paprastas, bet galingas būdas suprasti duomenis. Tinkamai sudarytas ir iliustruotas jis leidžia greitai pamatyti duomenų centrinę tendenciją, sklaidą ir formas, o tai yra pirmas žingsnis daugelyje statistinių analizės procesų.

(Absoliutaus) dažnių pasiskirstymo pavyzdys. Tai 2005 m. Angolos gyventojų piramidė.Zoom
(Absoliutaus) dažnių pasiskirstymo pavyzdys. Tai 2005 m. Angolos gyventojų piramidė.

Tai 2005 m. Kinijos gyventojų piramidė.Zoom
Tai 2005 m. Kinijos gyventojų piramidė.

Programos

Dažnumo lentelių duomenis tvarkyti ir jais naudotis daug paprasčiau nei neapdorotais duomenimis. Yra paprasti algoritmai, leidžiantys iš šių lentelių apskaičiuoti medianą, vidurkį (statistiką), standartinį nuokrypį ir kt.

Statistinių hipotezių tikrinimas grindžiamas dažnių pasiskirstymų skirtumų ir panašumų vertinimu. Šis vertinimas apima centrinio polinkio arba vidurkių matus, tokius kaip vidurkis ir mediana, ir kintamumo arba statistinės dispersijos matus, tokius kaip standartinis nuokrypis arba dispersija.

Sakoma, kad dažnių pasiskirstymas yra iškreiptas, kai jo vidurkis ir mediana skiriasi. Dažnių pasiskirstymo kurtozė - tai balų koncentracija ties vidurkiu arba pasiskirstymo viršūnė, jei pasiskirstymas pavaizduotas grafiškai, pavyzdžiui, histogramoje. Jei pasiskirstymas yra labiau smailėjantis nei normalusis pasiskirstymas, sakoma, kad jis yra leptokurtinis; jei mažiau smailėjantis, sakoma, kad jis yra platikurtinis.

Dažnių pasiskirstymai taip pat naudojami dažnių analizėje kodams nulaužti ir nurodo santykinį raidžių dažnį skirtingose kalbose.

Klausimai ir atsakymai

K: Kas yra dažnių pasiskirstymas?


Atsakymas: Dažnių pasiskirstymas - tai kintamojo reikšmių, kurias jis įgyja imtyje, sąrašas, išdėstytas pagal kiekį. Jis parodo, kiek kartų pasitaiko kiekviena reikšmė.

K: Kaip gali atrodyti atsakymų į penkių balų Likerto skalę dažnių pasiskirstymas?


A: Atsakymų į penkių balų Likerto skalę dažnių pasiskirstymas gali atrodyti kaip paprasta lentelė, rodanti, kiek žmonių įvertino kiekvieną skalės balą.

K: Kokie yra du tokio tipo lentelės naudojimo trūkumai?


A: Du šio tipo lentelių naudojimo trūkumai yra tai, kad gali būti sudėtinga ar net neįmanoma naudoti, kai susiduriama su tolydžiomis reikšmėmis arba kai yra per daug galimų reikšmių.

K: Kuo ši schema skiriasi, kai susiduriama su tolydžiomis reikšmėmis arba dideliu galimų reikšmių skaičiumi?


Atsakymas: Kai susiduriama su tolydžiomis reikšmėmis arba dideliu galimų reikšmių skaičiumi, galima naudoti šiek tiek kitokią schemą, pagrįstą reikšmių intervalu.

K: Kaip gali atrodyti mokinių ūgio dažnių lentelė?


A.: Mokinių ūgio dažnių lentelėje gali būti nurodyti intervalai ir kiek mokinių patenka į kiekvieną intervalą.


K: Kokią informaciją pateikia dažnių pasiskirstymas?


A: Dažnių pasiskirstymas suteikia informacijos apie tai, kaip dažnai tam tikri kintamieji pasitaiko imtyse ir kaip jie pasiskirsto tose imtyse.


Ieškoti
AlegsaOnline.com - 2020 / 2025 - License CC3