Simpsono paradoksas

Simpsono paradoksas yra statistikos paradoksas. Jis pavadintas britų statistiko Edvardo H. Simpsono, kuris pirmasis jį aprašė 1951 m., vardu. Labai panašų efektą 1899 m. aprašė statistikas Karlas Pearsonas. 1903 m. jį aprašė Udny Yule'as. Kartais jis vadinamas Yule-Simpsono efektu. Nagrinėjant grupių statistinius balus, šie balai gali kisti priklausomai nuo to, ar grupės nagrinėjamos po vieną, ar sujungtos į didesnę grupę. Šis atvejis dažnai pasitaiko socialinių mokslų ir medicinos statistikoje. Jis gali suklaidinti žmones, jei priežastiniam ryšiui paaiškinti naudojami dažnių duomenys. Kiti šio paradokso pavadinimai: apvertimo paradoksas ir amalgamacijos paradoksas.

Pavyzdys: Inkstų akmenų gydymas

Tai realus pavyzdys iš medicininio tyrimo, kuriame buvo lyginami dviejų inkstų akmenų gydymo būdų sėkmės rodikliai.

Lentelėje pateikiami gydymo sėkmės rodikliai ir procedūrų skaičius, kai gydomi maži ir dideli inkstų akmenys, kai gydymas A apima visas atviras procedūras, o gydymas B - perkutaninę nefrolitotomiją:

Gydymas A

Gydymas B

sėkmė

nesėkmė

sėkmė

nesėkmė

Maži akmenys

1 grupė

2 grupė

pacientų skaičius

81

6

234

36

93%

7%

87%

13%

Dideli akmenys

3 grupė

4 grupė

pacientų skaičius

192

71

55

25

73%

27%

69%

31%

Abu

1+3 grupė

2+4 grupė

pacientų skaičius

273

77

289

61

78%

22%

83%

17%

Paradoksali išvada yra ta, kad gydymas A yra veiksmingesnis, kai taikomas mažiems ir dideliems akmenims, tačiau gydymas B yra veiksmingesnis, kai vienu metu atsižvelgiama į abiejų dydžių akmenis. Šiame pavyzdyje nebuvo žinoma, kad inkstų akmenų dydis turi įtakos rezultatui. Statistikoje tai vadinama paslėptuoju kintamuoju (arba slypinčiuoju kintamuoju).

Kuris gydymo būdas laikomas geresniu, nustatoma pagal dviejų santykinių rodiklių nelygybę (sėkmės/iš viso). Simpsono paradoksą sukeliantis nelygybės tarp santykinių rodiklių pasikeitimas įvyksta dėl to, kad du poveikiai pasireiškia kartu:

  1. Grupių, kurios sujungiamos, kai neatsižvelgiama į pasislėpusį kintamąjį, dydžiai yra labai skirtingi. Gydytojai yra linkę skirti geresnį gydymą sunkiems atvejams (dideli akmenys) (A), o lengvesniems atvejams (maži akmenys) - prastesnį gydymą (B). Todėl bendroje sumoje dominuoja trečioji ir antroji grupės, o ne dvi daug mažesnės pirmoji ir ketvirtoji grupės.
  2. Didelę įtaką santykiams turi paslėptas kintamasis, t. y. sėkmės rodikliui didesnę įtaką daro atvejo sunkumas, o ne gydymo pasirinkimas. Todėl pacientų, kuriems nustatyti dideli akmenys, grupei, taikančiai gydymą A (trečioji grupė), sekasi prasčiau nei pacientų, kuriems nustatyti maži akmenys, grupei, net jei pastarieji taikė prastesnį gydymą B (antroji grupė).

AlegsaOnline.com - 2020 / 2023 - License CC3