Tikimybinio tankio funkcija – tai funkcija, kurią galima apibrėžti bet kokiam tolydžiam tikimybiniam pasiskirstymui. Tikimybės tankio funkcijos integralas intervale [ a , b ] {\displaystyle [a,b]} duoda tikimybę, kad tam tikras atsitiktinis kintamasis, turintis duotą tankį, yra pateiktame intervale. Paprasčiau tariant, PDF (probability density function) nurodo, kaip „tankiai“ paskirstyta tikimybė ties atskirais reikšmių taškais; tikimybė, kad kintamasis patenka į intervalą, lygi šio intervalo ploto po tankio funkcijos grafiku.
Svarbiausios savybės
- Neigiamumo sąlyga: f(x) ≥ 0 visiems x (tankis negali būti neigiamas).
- Normalizacija: integralas per visą reikšmių aibę lygus 1, t. y. ∫_{−∞}^{∞} f(x) dx = 1.
- Tikimybė intervalui: P(a ≤ X ≤ b) = ∫_a^b f(x) dx (įskaitant atvejus su atviromis/iš dalies atviromis ribomis, skirtumas nereiškingas dėl taško tikimybių nulio).
- Tikimybė taške: P(X = x0) = 0 bet kuriam konkrečiam x0, jei skirstinys yra tolygus (neįskaičiuojant mišrių atvejų su atomais).
Ryšys su paskirstymo funkcija (CDF)
Paskirstymo funkcija F(x) (CDF) ir PDF f(x) susijusios taip: F(x) = ∫_{−∞}^x f(t) dt. Jei F yra išvestinė tuo tašku, tai f(x) = F′(x) beveik visur. Iš CDF galima gauti tikimybes intervalams kaip skirtumą: P(a < X ≤ b) = F(b) − F(a).
Skirtumas tarp tolydžių ir diskretiškų pasiskirstymų
Tolydžių pasiskirstymų atveju naudojama PDF, o diskretiškiems skirstiniams – tikimybių masės funkcija (PMF). Pavyzdžiui, išmesti kauliuką duoda reikšmes 1–6 su tikimybe 1 6 {\displaystyle {\tfrac {1}{6}}} kiekvienam skaičiui — čia tai diskretus pasiskirstymas. Priešingai, dviejų žmonių ūgis ar svoris paprastai nėra identiškas, todėl aprašant tokius dydžius naudojama PDF: galima rasti tikimybę, kad ūgis bus tarp 180 cm ir 181 cm arba svoris tarp 80 kg ir 81 kg, nors tarp ribų yra begalė galimų reikšmių.
Pavyzdžiai
- Tolydusis tolyginis pasiskirstymas (Uniform): jeigu X ~ U(a,b), tai f(x) = 1/(b−a) už a ≤ x ≤ b, kitu atveju 0. Tikimybė bet kuriam subintervalui yra proporcinga to intervalui.
- Normalusis (Gauss) pasiskirstymas: tankis f(x) = (1/(√(2π) σ)) exp(−(x−μ)²/(2σ²)), plačiai naudojamas aukščiui, klaidoms modeliuoti.
- Eksponentinis pasiskirstymas: f(x) = λ e^{−λ x} už x ≥ 0, naudojamas laiko tarp įvykių modeliavimui (pvz., laikas tarp klientų atvykimo į parduotuvę).
Matematiniai momentai ir statistikų skaičiavimas
Vidurkis (laukimas) ir dispersija skaičiuojami per PDF:
- E[X] = ∫_{−∞}^{∞} x f(x) dx (jei integralas konverguoja).
- Var(X) = ∫_{−∞}^{∞} (x − E[X])² f(x) dx.
Praktinė reikšmė ir estavimo būdai
PDF yra kertinė sąvoka statistikoje, inžinerijoje, duomenų moksle ir mašininiame mokyme: ji leidžia skaičiuoti tikimybes, formuluoti hipotezes, statyti modelius ir vertinti riziką. Empirinį tankį galima apytiksliai atstatyti iš duomenų naudojant histogramas arba slenkstines metodikas, pvz., kernel density estimation (KDE).
Pastabos ir dažnos klaidos
- PDF vertė f(x) pati savaime nėra tikimybė — tai tik «tankis». Tikimybė gaunama integruojant f per intervalą.
- Nors P(X = x0) = 0 daugeliu atvejų, tai nereiškia, jog tokios reikšmės negali pasitaikyti empiriškai; tai reiškia, kad atsitiktinio kintamojo tikimybė patekti tiksliai į vieną tašką yra nulinė tol, kol pasiskirstymas yra grynai tolygus.
- Yra mišrių pasiskirstymų, kuriuose dalis masės yra diskretiška (atomai), o likusi dalis pasiskirstyta tolygiai; tokiais atvejais vien dalies paskirstymui reikalingas tiek PDF, tiek PMF aprašymas.
Santrauka: tikimybinio tankio funkcija (PDF) yra pagrindinis įrankis aprašant ir skaičiuojant tikimybes tolydžiuose pasiskirstymuose — ji nurodo, kaip paskirstyta tikimybės „masė“ per reikšmių aibę, o konkrečios tikimybės gaunamos integruojant šį tankį per atitinkamus intervalus.

