Matematikoje ir statistikoje Spearmano ranginės koreliacijos koeficientas yra koreliacijos matas, pavadintas jo kūrėjo Charleso Spearmano vardu. Trumpai jis rašomas graikiška raide rho ( ρ {\displaystyle \rho } ) arba kartais r s {\displaystyle r_{s}}.
. Tai skaičius, rodantis, kaip glaudžiai susiję du duomenų rinkiniai. Jį galima naudoti tik duomenims, kuriuos galima išdėstyti eilės tvarka, pavyzdžiui, nuo didžiausio iki mažiausio.
Apibrėžimas ir prasmė
Spearmano ranginis koreliacijos koeficientas matuoja monotonišką priklausomybę tarp dviejų kintamųjų — t. y. ar vieno kintamojo vertės linkus didėti arba mažėti atitinka kito kintamojo vertes augimą arba mažėjimą. Skirtingai nei Pearsono koreliacija, Spearmano koeficientas ne reikalauja linikinės sąsajos ar normalios skirstinio formos; pakanka, kad ryšys būtų monotoniškas (nuosekliai didėjantis arba mažėjantis).
Formulė
Bendroji r s formulė {\displaystyle r_{s}} yra ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}}.
.
Šioje formulėje:
- n — stebinių skaičius (porų skaičius),
- d — atskiros stebinių poros skirtumas tarp jų rangų (d = rangas X − rangas Y),
- ∑ d² — kvadratų skirtumų suma per visas poras.
Vertinimas ir reikšmė
- ρ = +1 reiškia tobulą monotoninį teigiamą ryšį (kai X auga, Y visuomet auga).
- ρ = −1 reiškia tobulą monotoninį neigiamą ryšį (kai X auga, Y visuomet mažėja).
- ρ ≈ 0 reiškia, kad monotoniškumo požymių nėra (nėra nuoseklio didėjimo ar mažėjimo ryšio).
Kaip apskaičiuoti — žingsniai
- Rūšiuokite kiekvieną kintamąjį atskirai ir suteikite rangus (nuo 1 iki n).
- Jeigu yra lygių verčių (ties), priskirkite joms vidutinį (aritmetinį) rangą toje grupėje.
- Kiekvienai porai apskaičiuokite d = rangas_X − rangas_Y ir d².
- Suskaičiuokite ∑ d² ir įstatykite į formulę ρ = 1 − (6∑ d²) / (n(n² − 1)).
Kaip elgtis su lygiomis reikšmėmis (ties)
Jei du ar daugiau stebinių turi vienodas reikšmes viename kintamajame, jiems priskiriami vidutiniai rangai. Alternatyvus, ir dažnai patogesnis, būdas — priskirti rangus visiems duomenims (naudojant vidurkius ten, kur yra tiesų) ir tada apskaičiuoti paprastą Pearsono koreliaciją tarp šių rangų; rezultatas bus Spearmano koeficientas. Kai tiesų yra daug, formulės su korekcijos terminais gali būti naudojamos, bet praktikoje dažniausiai apskaičiavimas per rangus yra paprastesnis ir patikimas.
Pavyzdys (žingsnis po žingsnio)
Turime 5 kompiuterių duomenis: kaina ir sparta. Pirmiausia kiekvienam kintamajam priskiriame rangus, tada apskaičiuojame skirtumus ir kvadratus.
- Rangai X (kaina): 1, 2, 3, 4, 5
- Rangai Y (sparta): 1, 3, 2, 5, 4
- d = X_rank − Y_rank: 0, −1, 1, −1, 1
- d²: 0, 1, 1, 1, 1 → ∑ d² = 4
- ρ = 1 − (6·4) / (5(25 − 1)) = 1 − 24 / 120 = 1 − 0,2 = 0,8
Taigi ρ = 0,8 rodo stiprų teigiamą monotonišką ryšį tarp kainos ir spartos šiame pavyzdyje.
Statistinė reikšmė ir testavimas
Norint patikrinti, ar gautas ρ statistiškai reikšmingas (t. y. ar ryšys nėra atsitiktinis), galima naudoti kelis metodus:
- Mažiems imties dydžiams taikomi tikslūs signifikavimo testai (lentelės arba permutacijos testai).
- Didesnėms imtims dažnai naudojama approx. t-statistika: t = ρ √((n−2) / (1−ρ²)), kuri maždaug seka t-skirstinį su n−2 laisvės laipsniais (kai n pakankamai didelis).
- Permutacijų testai arba bootstrap metodai suteikia tikslesnį p‑vertės įvertinimą, ypač kai pasiskirstymo prielaidoms nepatikima.
Kada naudoti Spearmano koeficientą ir jo privalumai
- Jei kintamieji yra ordininiai arba duomenys nėra normaliai pasiskirstę.
- Jei ryšys yra monotoniškas, bet ne būtinai linijinis.
- Jis yra atsparesnis išimtinėms reikšmėms (outliers) nei Pearsono koreliacija.
- Lengvai apskaičiuojamas rankų metodu ir interpretuojamas.
Trūkumai ir apribojimai
- Jei ryšys nėra monotoniškas (pvz., U formos), ρ gali būti mažas arba nulinis, nors yra aiški nelineariška priklausomybė.
- Esant daug lygių reikšmių, prarandama informacija; reikia atidžiai taikyti korekcijas arba naudoti Pearsoną ant rangų.
Pavyzdžiui, jei turite duomenis apie skirtingų kompiuterių brangumą ir duomenis apie kompiuterių spartą, galite nustatyti, ar jie yra susiję ir kaip glaudžiai jie susiję, naudodami r s {\displaystyle r_{s}} .
Apibendrinant: Spearmano ranginis koreliacijos koeficientas yra patikimas ir paprastas būdas įvertinti monotonišką priklausomybę tarp dviejų kintamųjų, ypač kai duomenys nėra idealiai atitinkantys Pearsono prielaidas arba kai turime ordinius duomenis.