Tiesinė regresija

Tiesinė regresija - tai būdas paaiškinti priklausomo kintamojo ir vieno ar daugiau aiškinamųjų kintamųjų ryšį naudojant tiesę. Tai specialus regresinės analizės atvejis.

Tiesinė regresija buvo pirmasis griežtai ištirtas regresinės analizės tipas. Taip yra todėl, kad modelius, kurie tiesiškai priklauso nuo nežinomų parametrų, yra lengviau pritaikyti nei modelius, kurie yra netiesiškai susiję su savo parametrais. Be to, lengviau nustatyti gautų įverčių statistines savybes.

Tiesinė regresija turi daug praktinio pritaikymo būdų. Dauguma taikymų patenka į vieną iš šių dviejų plačių kategorijų:

Tiesinė regresija gali būti naudojama norint pritaikyti prognozavimo modelį stebimų verčių (duomenų) rinkiniui. Tai naudinga, jei siekiama numatyti, prognozuoti ar sumažinti. Sukūrus tokį modelį, jei vėliau suteikiama papildoma X reikšmė be ją lydinčios y reikšmės, pritaikytą modelį galima naudoti y reikšmei prognozuoti.
Turint kintamąjį y ir keletą kintamųjų X1, ..., Xp, kurie gali būti susiję su y, tiesinę regresinę analizę galima taikyti siekiant kiekybiškai įvertinti ryšio tarp y ir Xj stiprumą, įvertinti, kuris Xj visiškai nesusijęs su y, ir nustatyti, kuriuose Xj poaibiuose yra perteklinės informacijos apie y.

Tiesinės regresijos modeliuose stengiamasi, kad vertikalusis atstumas tarp tiesės ir duomenų taškų (pvz., liekanų) būtų kuo mažesnis. Tai vadinama "tiesės priderinimu prie duomenų". Dažnai tiesinės regresijos modeliais stengiamasi minimizuoti liekanų kvadratų sumą (mažiausių kvadratų), tačiau yra ir kitų pritaikymo būdų. Jie apima "nesutapimo" minimizavimą pagal kokią nors kitą normą (kaip mažiausiųjų absoliutinių nuokrypių regresijoje) arba mažiausiųjų kvadratų nuostolių funkcijos baudžiamosios versijos minimizavimą, kaip ridge regresijoje. Mažiausiųjų kvadratų metodas taip pat gali būti naudojamas modeliams, kurie nėra tiesiniai, pritaikyti. Kaip išdėstyta pirmiau, terminai "mažiausiųjų kvadratų" ir "tiesinis modelis" yra glaudžiai susiję, tačiau jie nėra sinonimai.

Siekiama rasti raudonąją kreivę, o mėlyni taškai yra tikrieji pavyzdžiai. Naudojant tiesinę regresiją visus taškus galima sujungti viena tiesia linija. Šiame pavyzdyje naudojama paprasta tiesinė regresija, kai atstumo tarp raudonos linijos ir kiekvieno imties taško kvadratas yra minimizuojamas.

Naudojimas

Ekonomika

Tiesinė regresija yra pagrindinė analizės priemonė ekonomikoje. Pavyzdžiui, ji naudojama vartojimo išlaidoms, išlaidoms investicijoms į ilgalaikį turtą, investicijoms į atsargas, šalies eksporto pirkimams, išlaidoms importui, likvidaus turto paklausai, darbo jėgos paklausai ir darbo jėgos pasiūlai nustatyti.

Klausimai ir atsakymai

K: Kas yra tiesinė regresija?

A: Linijinė regresija - tai būdas matematikos pagalba pažvelgti, kaip kas nors keičiasi, kai keičiasi kiti dalykai. Joje naudojamas priklausomas kintamasis ir vienas ar daugiau aiškinamųjų kintamųjų, kad būtų sudaryta tiesė, vadinama "regresijos linija".

K: Kokie yra tiesinės regresijos privalumai?

A: Modelius, kurie tiesiškai priklauso nuo savo nežinomų parametrų, lengviau pritaikyti negu modelius, kurie su savo parametrais susiję netiesiškai. Be to, lengviau nustatyti gautų įverčių statistines savybes.

K: Kokie yra praktiniai tiesinės regresijos panaudojimo būdai?

A: Tiesinė regresija gali būti naudojama norint pritaikyti prognozavimo modelį stebimoms reikšmėms (duomenims), kad būtų galima prognozuoti, numatyti ar sumažinti. Ji taip pat gali būti naudojama norint kiekybiškai įvertinti ryšių tarp kintamųjų stiprumą ir nustatyti duomenų pogrupius, kuriuose yra perteklinės informacijos apie kitą kintamąjį.

Klausimas: Kaip tiesinės regresijos modeliais stengiamasi sumažinti paklaidas?

A: Tiesinės regresijos modeliais stengiamasi, kad vertikalusis atstumas tarp tiesės ir duomenų taškų (liekanų) būtų kuo mažesnis. Tai daroma minimizuojant arba liekanų kvadratų sumą (mažiausiųjų kvadratų), arba nesutapimą pagal kokią nors kitą normą (mažiausius absoliutinius nuokrypius), arba minimizuojant mažiausiųjų kvadratų nuostolių funkcijos penalizuotą versiją (ridge regresija).

Klausimas: Ar įmanoma, kad tiesinės regresijos modeliai nebūtų grindžiami mažiausiųjų kvadratų principu?

A.: Taip, įmanoma, kad tiesinės regresijos modeliai nebūtų grindžiami mažiausiųjų kvadratų metodu, o būtų naudojami tokie metodai kaip nesutapimo minimizavimas pagal kokią nors kitą normą (mažiausi absoliutiniai nuokrypiai) arba mažiausiųjų kvadratų nuostolių funkcijos baudos minimizavimas (ridge regresija).

Klausimas: Ar "tiesinis modelis" ir "mažiausių kvadratų" yra sinonimai?

Atsakymas: Ne, tai nėra sinonimai. Nors jie glaudžiai susiję, "tiesinis modelis" reiškia būtent tiesės naudojimą, o "mažiausių kvadratų" reiškia būtent bandymą sumažinti klaidas, užtikrinant, kad tarp tiesės ir duomenų taškų būtų minimalus vertikalus atstumas.