Normalusis skirstinys yra tikimybinis skirstinys, dar vadinamas Gauso skirstiniu (jį aprašė C. F. Gaussas). Tai tolydus skirstinys, labai svarbus daugelyje mokslo ir inžinerijos sričių dėl dažno pasikartojimo realiame pasaulyje ir dėl centrinės ribos teoremos. Normalūs skirstiniai priklauso bendrosios formos šeimai, kurią nustato du parametrai: skirstinio vidurkis μ (apibrėžia vietą) ir standartinis nuokrypis σ (apibrėžia mastelį arba dispersiją σ2).

Normaliojo skirstinio tikimybinio tankio (PDF) formulė:

f(x) = 1 / (σ √(2π)) · exp( − (x − μ)² / (2 σ²) ),

kur x ∈ (−∞, ∞), μ — vidurkis, σ > 0 — standartinis nuokrypis. Iš šios formulės matyti, kad skirstinys yra simetriškas pagal x = μ, o reikšmės toliau nuo μ labai sparčiai mažina tikimybę („troskai“ arba „uodegos“).

Svarbiausios savybės

  • Simetrija: normalusis skirstinys yra simetriškas apie vidurkį μ.
  • Vidurkis = medianas = moda: visi trys mato vienodą reikšmę μ.
  • Parametrai: vieta (μ) ir mastelis (σ). Dispersija yra σ².
  • Neapibrėžtumas uodegose: reikšmės tolimose uodegose turi mažą, bet nenulinę tikimybę.
  • Integralas per visą realiąją liniją lygus 1 (normalizacija).

Standartinis normalusis skirstinys (Z)

Standartinis normalusis skirstinys (dar vadinamas Z skirstiniu) yra normalus skirstinys su vidurkiu μ = 0 ir dispersija σ² = 1 (t. y. σ = 1). Jo PDF yra f(z) = 1 / √(2π) · exp(−z²/2). Šį skirstinį paprastai piešiama kaip „varpo kreivė“ dėl charakteringos varpo formos (tikimybinio tankio grafikas) — todėl dažnai vartojamas terminas „varpo kreivė“.

Dažnai atsitiktinį dydį X, turintį normalų pasiskirstymą N(μ, σ²), standartizuojame taip:

Z = (X − μ) / σ,

tuo būdu gauname kintamąjį Z ~ N(0, 1). Tai leidžia naudoti bendras Z lenteles arba standartines funkcijas tikimybių radimui.

Empirinė taisyklė (68–95–99,7)

Normaliajai skirstiniui galioja vadinama empirinė taisyklė:

    ~68 % duomenų patenka į intervalą μ ± 1σ;
  • ~95 % duomenų patenka į intervalą μ ± 2σ;
  • ~99,7 % duomenų patenka į intervalą μ ± 3σ.

Tai yra patogus ir greitas būdas įvertinti, ar reikšmės yra įprasto svyravimo ribose, ar tai gali būti išimtiniai atvejai.

Kaip apskaičiuoti tikimybes

Tikimybių apskaičiavimui naudojama kumuliacinė funkcija (CDF) Φ(z) = P(Z ≤ z) standartiniam skirstiniui. Dėl to, kad CDF neturi uždaros formos elementarių funkcijų, praktikoje naudojamos Z lentelės arba kompiuterinės funkcijos (pvz., norm.cdf programavimo bibliotekoje, arba specialiosios funkcijos, susijusios su erf). Norint rasti P(a ≤ X ≤ b) su X ~ N(μ, σ²), standartizuokite ribas ir naudokite Φ:

P(a ≤ X ≤ b) = Φ((b − μ)/σ) − Φ((a − μ)/σ).

Tipiniai pavyzdžiai ir taikymai

Daugelis realių reiškinių yra gerai aproksimuojami normalia funkcija, ypač kai matavimai yra sudaryti iš daug smulkių nepriklausomų atsitiktinių įtakų (centrinės ribos teoremos dėka). Keletas pavyzdžių:

  • Žmogaus ūgis arba svoris didelėje, homogeneškoje populiacijoje (po tam tikrų korekcijų pagal lytį ir amžių) — dažnai artimas normalumui.
  • Matavimo klaidos instrumentuose — smulkios nepriklausomos klaidos linkusios susumuoti į normalų pasiskirstymą.
  • Testų balai (kai balų sistema susideda iš daug nedidelių priedų).
  • Ekonominių rodiklių proxys (kai daug nepriklausomų veiksnių sudaro galutinį rezultatą), statistinių testų ir konfidencialumo intervalų pagrindas.

Kada normalusis skirstinys netinka

  • Duomenys su stipriomis iškraipomis arba labai storomis uodegomis (pvz., finansinių grąžų ekstremalai) gali reikalauti kitų skirstinių (tokių kaip Student t, lognormali arba dvipusiai pasverti skirstiniai).
  • Dyskretūs duomenys arba riboto intervalo reikšmės (pvz., skaičius klaidų) netinka tiesiogiai normaliajai aproksimacijai be transformacijos arba papildomų prielaidų.

Praktiniai patarimai

  • Prieš taikant normališkumo prielaidą, patikrinkite duomenis grafiškai (histogramos, Q–Q grafikai) ir statistiškai (pvz., Shapiro–Wilk testas).
  • Standartizavimas (Z) leidžia perkelti bet kurį normalų skirstinį į standartinį ir pasinaudoti bendromis lentelėmis bei programinėmis funkcijomis.
  • Atkreipkite dėmesį į duomenų apdorojimą: išsklaidytos reikšmės ar netinkami duomenys gali klaidinti vidurkius ir σ įverčius.

Normalusis pasiskirstymas yra fundamentali statistikos priemonė — suprantant jo savybes, ribotumus ir praktinius naudojimo būdus galima efektyviau analizuoti duomenis ir interpretuoti rezultatus.