Standartinis nuokrypis – tai skaičius, parodantis, kiek stebėjimų (matuoimų) grupė paprastai skiriasi nuo vidurkio arba nuo tikėtinos vertės. Mažas standartinis nuokrypis reiškia, kad dauguma skaičių yra arti vidurkiui, o didelis – kad duomenys yra plačiau išsibarstę. Standartinis nuokrypis yra vienas svarbiausių dispersijos (išsibarstymo) matų: jo kvadratas yra dispersija (variance).

Kas svarbu žinoti trumpai

  • Standartinio nuokrypio vienetas yra toks pat kaip ir duomenų vienetas (pvz., metrai, eurai), todėl jį lengva interpretuoti.
  • Jei duomenys apietnormaliai pasiskirstę, apie ~68% reikšmių yra per 1 SD nuo vidurkio, ~95% per 2 SD ir ~99.7% per 3 SD (tai vadinama empirinio taisyklė arba 68–95–99.7 taisyklė).
  • Standartinis nuokrypis nurodo dispersiją tarp atskirų stebėjimų. Kai kalbame apie vidurkio tikslumą, naudojame standartinę paklaidą (standard error), kuri yra SD dalinta iš šaknies iš imties dydžio.

Kaip skaičiuojamas standartinis nuokrypis

Yra du dažniausi atvejai:

  • Populiacijos (visos grupės) standartinis nuokrypis (σ):
    σ = sqrt( (1/N) * Σ (xi − μ)² ), kur N – visų duomenų skaičius, μ – populiacijos vidurkis.
  • Imties standartinis nuokrypis (s) – kai turime tik imtį ir norime įvertinti populiacijos dispersiją:
    s = sqrt( (1/(n−1)) * Σ (xi − x̄)² ), kur n – imties dydis, x̄ – imties vidurkis. Dalinimas iš (n−1) (Bessel korekcija) suteikia nešališką dispersijos įvertį.

Skaičiavimo žingsniai (praktinis pavyzdys)

Tarkime, turime 5 skaičius: 4, 7, 6, 5, 8.

  • Apskaičiuojame vidurkį: x̄ = (4+7+6+5+8)/5 = 30/5 = 6.
  • Apskaičiuojame atstumus iki vidurkio ir jų kvadratus: (4−6)²=4, (7−6)²=1, (6−6)²=0, (5−6)²=1, (8−6)²=4. Suma = 10.
  • Populiacijos SD: σ = sqrt(10/5) = sqrt(2) ≈ 1.414.
  • Imties SD: s = sqrt(10/(5−1)) = sqrt(2.5) ≈ 1.581.
  • Standartinė paklaida (SE) = s / sqrt(n) ≈ 1.581 / sqrt(5) ≈ 0.707. Apie 95% pasitikėjimo intervalą vidurkiui galima apytiksliai daryti: x̄ ± 1.96·SE = 6 ± 1.386 ≈ (4.61, 7.39).

Interpretacija ir taikymai

  • Jei matome, kad tam tikra reikšmė yra daugiau nei 2 ar 3 SD nuo vidurkio, ją laikome neįprasta arba potencialiu atskirai stovinčiu atveju (outlier), ypač jei prielaida apie normalų pasiskirstymą pagrįsta.
  • Mokslininkai dažnai naudoja standartinį nuokrypį ir standartinę paklaidą priimdami sprendimus. Skirtumai laikomi reikšmingais, jei jie yra didesni nei keliskart standartinė paklaida ar standartinis nuokrypis, priklausomai nuo konteksto ir testuojamos hipotezės.
  • Finansų srityje standartinis nuokrypis (volatilumas) parodo, kiek grąža arba nuostoliai gali svyruoti aplink vidurkį: didesnis SD reiškia didesnę riziką / nepastovumą.
  • Matavimų tikslumo ir kokybės kontrolėje SD naudojamas nustatyti proceso stabilumą; mažas SD – didesnis atkuriamumas.
  • Statistikoje SD naudojamas kartu su z‑reikšmėmis, t‑testais, hipotezių testavimu ir pasitikėjimo intervalais.

Pranešama paklaida ir dažnos klaidos

Dažnai publikuojant rezultatų vidurkį pranešama paklaida reiškia ne standartinį nuokrypį, o standartinę paklaidą (SE = s / sqrt(n)). Dažnai pateikiami 95% pasitikėjimo intervalai yra maždaug x̄ ± 1.96·SE (apytiksliai ±2·SE). Svarbu atskirti SD (išsibarstymas tarp atskirų stebėjimų) nuo SE (vidurkio tikslumo matai).

Apribojimai ir alternatyvos

  • Standartinis nuokrypis jautrus ekstremaliems taškams (outlieriams). Jei duomenys labai netolygūs arba asimetriški, alternatyvos – tarpkvartilinis intervalas (IQR) arba medianos absoliutus nuokrypis (MAD).
  • Mažoms imtims imties SD yra ne toks stabilus; todėl kartais reikalinga atsargiai interpretuoti gautus įverčius arba naudoti neparametrinius metodus.

Dažnai susiduriant su praktiniais duomenimis verta patikrinti pasiskirstymo formą (pvz., histograma arba Q‑Q diagrama) ir pagal tai pasirinkti tinkamą dispersijos matą ar statistinį testą. Jei reikia, galiu pateikti paprastą skaičiavimo pavyzdį Excel, Python arba rankiniu būdu – praneškite, kokį variantą pageidaujate.

Daugeliu atvejų galima išmatuoti tik imtį arba grupės dalį. Tada skaičių, artimą visos grupės standartiniam nuokrypiui, galima rasti pagal imties standartinio nuokrypio lygtį, paaiškintą aukščiau.