Spearmano ranginės koreliacijos koeficientas
Matematikoje ir statistikoje Spearmano ranginės koreliacijos koeficientas yra koreliacijos matas, pavadintas jo kūrėjo Charleso Spearmano vardu. Trumpai jis rašomas graikiška raide rho ( ρ {\displaystyle \rho } ) arba kartais r s {\displaystyle r_{s}}. . Tai skaičius, rodantis, kaip glaudžiai susiję du duomenų rinkiniai. Jį galima naudoti tik duomenims, kuriuos galima išdėstyti eilės tvarka, pavyzdžiui, nuo didžiausio iki mažiausio.
Bendroji r s formulė {\displaystyle r_{s}} yra ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}}. .
Pavyzdžiui, jei turite duomenis apie skirtingų kompiuterių brangumą ir duomenis apie kompiuterių spartą, galite nustatyti, ar jie yra susiję ir kaip glaudžiai jie susiję, naudodami r s {\displaystyle r_{s}} .
Dirbti su juo
Pirmas žingsnis
Norėdami apskaičiuoti r s {\displaystyle r_{s}}, pirmiausia turite įvertinti kiekvieną duomenų vienetą. Naudosime pavyzdį iš įvado apie kompiuterius ir jų greitį.
Taigi, kompiuteris, kurio kaina mažiausia, būtų 1 vietoje. Aukščiau esantis už jį užimtų 2 vietą. Toliau viskas kils aukštyn, kol bus išrikiuoti visi kompiuteriai. Tai reikia daryti su abiem duomenų rinkiniais.
Kaina ($) | R a n k 1 {\displaystyle Rank_{1}} | Greitis (GHz) | R a n k 2 {\displaystyle Rank_{2}} | |
A | 200 | 1 | 1.80 | 2 |
B | 275 | 2 | 1.60 | 1 |
C | 300 | 3 | 2.20 | 4 |
D | 350 | 4 | 2.10 | 3 |
E | 600 | 5 | 4.00 | 5 |
Antras žingsnis
Toliau turime rasti skirtumą tarp šių dviejų rangų. Tuomet skirtumą padauginkite iš savęs, o tai vadinama kvadratu. Skirtumas vadinamas d {\displaystyle d} , o skaičius, kurį gausite, kai d {\displaystyle d} pakelsite kvadratu, vadinamas d 2 {\displaystyle d^{2}}. .
R a n k 1 {\displaystyle Rank_{1}} | R a n k 2 {\displaystyle Rank_{2}} | d {\displaystyle d} | d 2 {\displaystyle d^{2}} |
1 | 2 | -1 | 1 |
2 | 1 | 1 | 1 |
3 | 4 | -1 | 1 |
4 | 3 | 1 | 1 |
5 | 5 | 0 | 0 |
Trečiasis žingsnis
Suskaičiuokite, kiek duomenų turime. Šie duomenys turi rangus nuo 1 iki 5, taigi turime 5 duomenis. Šis skaičius vadinamas n {\displaystyle n} .
Ketvirtas žingsnis
Galiausiai panaudokite viską, ką iki šiol išsiaiškinome pagal šią formulę: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}} .
∑ d 2 {\displaystyle \sum d^{2}} reiškia, kad imame visų skaičių, kurie buvo stulpelyje d 2 {\displaystyle d^{2}}, sumą. . Taip yra todėl, kad ∑ {\displaystyle \sum } reiškia bendrą sumą.
Taigi ∑ d 2 {\displaystyle \sum d^{2}} yra 1 + 1 + 1 + 1 + 1 {\displaystyle 1+1+1+1}, t. y. 4. Formulėje sakoma, kad reikia padauginti iš 6, t. y. 24.
n ( n 2 - 1 ) {\displaystyle n(n^{2}-1)} yra 5 × ( 25 - 1 ) {\displaystyle 5 kartų (25-1)}, t. y. 120.
Taigi, norėdami sužinoti r s {\displaystyle r_{s}} paprasčiausiai padarome 1 - 24 120 = 0,8 {\displaystyle 1-{{\cfrac {24}{120}}=0,8} .
Todėl Spearmano ranginės koreliacijos koeficientas šiam duomenų rinkiniui yra 0,8.
Ką reiškia skaičiai
r s {\displaystyle r_{s}} visada pateikia atsakymą nuo -1 iki 1. Skaičiai tarp jų yra tarsi skalė, kurioje -1 reiškia labai stiprų ryšį, 0 - jokio ryšio, o 1 - taip pat labai stiprų ryšį. Skirtumas tarp 1 ir -1 yra tas, kad 1 yra teigiamas ryšys, o -1 yra neigiamas ryšys. Duomenų, kurių r s {\displaystyle r_{s}} reikšmė yra -1, grafikas atrodytų kaip parodytasis, tik linija ir taškai eitų iš viršaus kairės į apačią dešinę.
Pavyzdžiui, pirmiau pateiktų duomenų atveju r s {\displaystyle r_{s}} buvo 0,8. Taigi tai reiškia, kad egzistuoja teigiama koreliacija. Kadangi jis artimas 1, tai reiškia, kad ryšys tarp dviejų duomenų rinkinių yra stiprus. Taigi galime sakyti, kad šie du duomenų rinkiniai yra susiję ir kyla kartu. Jei jis būtų -0,8, galėtume sakyti, kad jie yra susiję ir vienam kylant aukštyn, kitas krenta žemyn.
Jei du skaičiai yra vienodi
Kartais klasifikuojant duomenis pasitaiko, kad du ar daugiau skaičių yra vienodi. Kai taip atsitinka r s {\displaystyle r_{s}} , imame vienodų rangų vidurkį arba vidurkį. Šie rangai vadinami lygiaisiais rangais. Norėdami tai padaryti, susietus skaičius ranguojame taip, tarsi jie nebūtų susieti. Tada sudedame visus rangus, kuriuos jie turėtų, ir padalijame iš jų skaičiaus. Pavyzdžiui, tarkime, reitinguojame, kaip gerai skirtingi žmonės atliko rašybos testą.
Testo rezultatas | Rangas | Rangas (su susietas) |
4 | 1 | 1 |
6 | 2 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+3+4}{3}}=3} |
6 | 3 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+3+4}{3}}=3} |
6 | 4 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+3+4}{3}}=3} |
8 | 5 | 5 + 6 2 = 5,5 {\displaystyle {\tfrac {5+6}{2}}=5,5} |
8 | 6 | 5 + 6 2 = 5,5 {\displaystyle {\tfrac {5+6}{2}}=5,5} |
Šie skaičiai naudojami lygiai taip pat, kaip ir įprasti rangai.
Susiję puslapiai
Klausimai ir atsakymai
Klausimas: Kas yra Spearmano ranginės koreliacijos koeficientas?
A: Spearmano ranginės koreliacijos koeficientas yra koreliacijos matas, kuris parodo, kaip glaudžiai susiję du duomenų rinkiniai. Jį galima naudoti tik duomenims, kuriuos galima išdėstyti eilės tvarka, pavyzdžiui, nuo didžiausio iki mažiausio.
K: Kas sukūrė Spearmano ranginės koreliacijos koeficientą?
A: Spearmano ranginės koreliacijos koeficientą sukūrė Charlesas Spearmanas.
K: Kaip užrašoma bendroji Spearmano ranginės koreliacijos koeficiento formulė?
A: Bendroji Spearmano ranginės koreliacijos koeficiento formulė užrašoma taip: ρ = 1 - 6∑d2/n(n2-1).
K: Kada reikia naudoti Spearmano ranginės koreliacijos koeficientą?
A: Spearmano ranginės koreliacijos koeficientą turėtumėte naudoti, kai norite sužinoti, kaip glaudžiai susiję du duomenų rinkiniai ir ar jie apskritai susiję.
K: Su kokio tipo duomenimis jis veikia?
A: Jis tinka bet kokio tipo duomenims, kuriuos galima išdėstyti eilės tvarka, pavyzdžiui, nuo didžiausio iki mažiausio.
K: Ar galite pateikti pavyzdį, kur galėtumėte naudoti šią priemonę?
A: Pavyzdys, kur galėtumėte naudoti šią priemonę, galėtų būti toks: jei turite duomenis apie tai, kokie brangūs yra skirtingi kompiuteriai, ir duomenis apie tai, kokie greiti yra kompiuteriai, tada, naudodami r_s, galėtumėte pamatyti, ar jie yra susiję ir kaip glaudžiai jie yra susiję.