Statistikoje pasikliautinasis intervalas (dažnai vadinamas patikimumo intervalu) yra būdas pateikti ne vieną taškinį parametro įvertį, o intervalą galimų parametro verčių kartu su tikimybe, kad tikroji (nežinoma) parametro vertė pateks į šį intervalą. Intervalas gaunamas iš imties duomenų, todėl skirtingose imtyse jis kinta. Tikimybė, kad intervalo sudarymo procedūra duotu patikimumo lygiu užtikrina, jog intervalas apims tikrąją parametro vertę, vadinama patikimumo lygiu (dažniausiai nurodoma procentais, pvz., 95 %). Intervalo galiniai taškai vadinami pasikliautinumo ribomis. Kuo aukštesnis patikimumo lygis, tuo platesnis intervalas, jeigu ta pati įvertinimo procedūra ir imties dydis lieka nepakitę.

Apskaičiuojant pasikliautinį intervalą paprastai daromos prielaidos apie duomenų generavimo procesą — tai vadinamieji parametriniai metodai. Viena įprastų prielaidų yra, kad populiacijos, iš kurios paimta imtis, pasiskirstymas yra normalus. Tačiau daugeliu atvejų yra ir kitų galimybių (pvz., intervalai proporcijoms, t-intervalai, arba neparametrinės ir resampling metodikos), kurios leidžia gauti patikimus rezultatus ir be griežtos normalumo prielaidos.

Ką reiškia „95 %“ patikimumo lygis?

Teisingas šio reiškinio interpretavimas: jeigu daug kartų pakartotume tą pačią imties rinkimo ir intervalo konstravimo procedūrą, apie 95 % gautų intervalų apimtų tikrąją parametro vertę. Tai nereiškia, kad tikimybė, jog tam tikras konkretaus imties intervalas apima parametrą yra 95 % — parametrą laikome fiksuotu, o atsitiktinis yra intervalas.

Dažniausiai naudojamos formulės

Dažniausi atvejai — intervalo apskaičiavimas populiacijos vidurkiui arba proporcijai.

  • Vidurkis, kai žinomas populiacijos standartinis nuokrypis σ:
    x̄ ± zα/2 · σ / √n
    čia x̄ — imties vidurkis, zα/2 — standartinės normalios kvantilis (pvz., ≈1.96 95 % lygiui), n — imties dydis.
  • Vidurkis, kai σ nežinomas (mažesnėms imtims):
    x̄ ± tn−1,α/2 · s / √n
    čia s — imties standartinis nuokrypis, tn−1,α/2 — Studento t pasiskirstymo kvantilis su n−1 laisvės laipsniais.
  • Proporcija (pvz., dalis sėkmių):
    p̂ ± zα/2 · √[ p̂(1−p̂) / n ]
    čia p̂ — imties proporcija.

Pavyzdžiai

1) Vidurkio pavyzdys (σ žinomas): x̄ = 100, σ = 15, n = 25, 95 % lygis.
Margin of error = 1.96 · 15 / √25 = 1.96 · 3 = 5.88.
95 % CI = 100 ± 5.88 = (94.12, 105.88).

2) Proporcijos pavyzdys: p̂ = 0.60, n = 200, 95 % lygis.
SE = √[0.6·0.4/200] ≈ 0.03464, margin = 1.96·0.03464 ≈ 0.0679.
95 % CI ≈ (0.532, 0.668).

Kaip apskaičiuoti žingsnis po žingsnio

  • Nustatyti parametrą, kurį vertinate (vidurkis, proporcija ir t. t.).
  • Išsirinkti patikimumo lygį (pvz., 90 %, 95 %, 99 %) ir rasti atitinkamą kvantilį (z arba t).
  • Apskaičiuoti imties įvertį (x̄ arba p̂) ir standartinę klaidą SE.
  • Apskaičiuoti ribas: įvertis ± kvantilis × SE.
  • Patikrinti prielaidas (normalumas, nepriklausomybė, pakankamas imties dydis) arba naudoti alternatyvias metodikas, jei prielaidos laužomos.

Prielajos ir alternatyvos

Daugelis standartinių intervalų remiasi prielaidomis: imčių nepriklausomumas, pakankamai didelis n (centrinė ribinė teorema) arba normalumas. Jei šios prielaidos nėra tenkinamos, galima naudoti:

  • Studento t-intervalą mažoms imtims, kai σ nežinomas.
  • Wilson arba Agresti–Coull intervalus proporcijoms, ypač mažiems n arba p̂ artimam 0 arba 1.
  • Neparametrinius metodus ir resampling (pvz., bootstrap) — jie dažnai gerai veikia be griežtų prielaidų apie pasiskirstymą.
  • Bayesinius patikimumo atitinkamus intervalus — vadinamus "credible intervals" — kurie turi kitokią interpretaciją (tikimybė dėl parametro, atsižvelgiant į pradinę informaciją).

Kaip keičiasi intervalas

  • Aukštesnis patikimumo lygis (pvz., 99 % vietoje 95 %) daro intervalą platesnį.
  • Didesnis imties dydis n mažina standartinę klaidą ir susiaurina intervalą (∝ 1/√n).
  • Didesnis duomenų dispersijos (standartinis nuokrypis) didina intervalo plotį.

Dažni nesusipratimai ir gairės pranešimui

  • Patikimumo intervalas nėra tiesioginė tikimybė, kad tiksliai šis intervalas apima parametrą — tai procedūros savybė daugkartiniame kartojime.
  • Visada nurodykite: patikimumo lygį (pvz., 95 %), metodo pavadinimą (pvz., z-intervalas, t-intervalas, bootstrap) ir imties dydį.
  • Jei atliekama daug palyginimų, intervalų interpretacija gali pakeisti reikšmingumą (reikalingi koregavimai dėl kelių palyginimų).

Ryšys su hipotezių testavimu

Patikimumo intervalas glaudžiai susijęs su hipotezių testavimu: jei nulinei hipotezei H0 apie parametrą reikšmė yra už 95 % CI ribų, tada H0 būtų atmetama 5 % reikšmingumo lygiu (prielaidoms esant tenkinamoms). Tačiau visada svarbu nagrinėti prielaidas ir metodikos tinkamumą.

Išvados ir praktiniai patarimai

Patikimumo intervalai suteikia daugiau informacijos nei vien taškinis įvertis, nes parodo įvertinimo neapibrėžtumą. Tinkamai interpretuojant ir nurodant prielaidas, jie yra labai naudingi priimant sprendimus ir skelbiant rezultatus. Kai prielaidos abejojamos, rekomenduojama naudoti robustesnes ar neparametrines alternativas (pvz., bootstrap) ir aiškiai nurodyti naudojamą metodą.