Viacnásobná lineárna regresia - definícia MLR
Čo je to viacnásobná lineárna regresia - MLR?Viacnásobná lineárna regresia (MLR), známa tiež jednoducho ako viacnásobná regresia, je štatistická technika, ktorá používa niekoľko vysvetľujúcich premenných na predpovedanie výsledku reakčnej premennej. Cieľom viacnásobnej lineárnej regresie (MLR) je modelovať lineárny vzťah medzi vysvetľujúcimi (nezávislými) premennými a odozvou (závislou) premennou.
V podstate je viacnásobná regresia rozšírením obyčajnej regresie najmenších štvorcov (OLS), ktorá zahŕňa viac ako jednu vysvetľujúcu premennú.
Vzorec pre viacnásobnú lineárnu regresiu je
yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵ všade, pre pozorovania i = n: yi = závislá premenná xi = expanzívne premennéβ0 = y-priesečník (konštantný člen) βp = koeficienty sklonu pre každú vysvetľujúcu premennúϵ = chybový termín modelu (tiež známe ako zvyšky) \ begin {zarovnané} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {where, for} i = n \ textbf {pozorovania:} \\ & y_i = \ text {závislá premenná} \\ & x_i = \ text {rozširujúce premenné} \\ & \ beta_0 = \ text {y-intercept (konštantná) term)} \\ & \ beta_p = \ text {koeficienty sklonu pre každú vysvetľujúcu premennú} \\ & \ epsilon = \ text {chybový termín modelu (známy tiež ako zvyšky)} \\ \ end {zarovnaný} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵ všade, kde i = n pozorovania: yi = závislá premenná xi = expanzívne premennéβ0 = y-priesečník (konštantný člen) βp = Koeficienty sklonu pre každú vysvetľujúcu premennúϵ = chybový termín modelu (známy tiež ako zvyšky)
Vysvetlenie viacnásobnej lineárnej regresie
Jednoduchá lineárna regresia je funkcia, ktorá umožňuje analytikovi alebo štatistikovi robiť predpovede o jednej premennej na základe informácií, ktoré sú známe o inej premennej. Lineárnu regresiu je možné použiť iba v prípade, že jedna má dve nepretržité premenné - nezávislú premennú a závislú premennú. Nezávislá premenná je parameter, ktorý sa používa na výpočet závislej premennej alebo výsledku. Model viacnásobnej regresie sa rozširuje na niekoľko vysvetľujúcich premenných.
Model viacnásobnej regresie je založený na nasledujúcich predpokladoch:
- Medzi závislými premennými a nezávislými premennými existuje lineárny vzťah.
- Nezávislé premenné nie sú navzájom príliš korelované.
- Pozorovania sú vybrané nezávisle a náhodne z populácie.
- Zvyšky by sa mali normálne distribuovať s priemerom 0 a rozptylom σ.
Koeficient určenia (na druhú mocninu) je štatistická metrika, ktorá sa používa na meranie toho, do akej miery možno odchýlku vo výsledku vysvetliť odchýlkou v nezávislých premenných. R2 sa vždy zvyšuje, keď je do MLR modelu pridané viac prediktorov, aj keď prediktory nemusia súvisieť s výslednou premennou.
Samotný R2 sa preto nedá použiť na určenie, ktoré prediktory by sa mali zahrnúť do modelu a ktoré by sa mali vylúčiť. R2 môže byť iba medzi 0 a 1, kde 0 znamená, že výsledok nemôže byť predpovedaný žiadnou z nezávislých premenných a 1 znamená, že výsledok môže byť predpovedaný bez chyby z nezávislých premenných.
Pri interpretácii výsledkov viacnásobnej regresie sú beta koeficienty platné, zatiaľ čo všetky ostatné premenné zostávajú konštantné („všetky ostatné rovnaké“). Výstup z viacnásobnej regresie je možné zobraziť horizontálne ako rovnicu alebo vertikálne v podobe tabuľky.
Príklad použitia viacnásobnej lineárnej regresie
Napríklad analytik môže chcieť vedieť, ako pohyb trhu ovplyvňuje cenu Exxon Mobil (XOM). V tomto prípade bude mať jeho lineárna rovnica hodnotu indexu S&P 500 ako nezávislú premennú alebo prediktor a cenu XOM ako závislú premennú.
V skutočnosti existuje mnoho faktorov, ktoré predpovedajú výsledok udalosti. Napríklad cenový pohyb Exxon Mobil závisí viac ako len od výkonnosti celkového trhu. Ostatné prediktory, ako je cena ropy, úrokové sadzby a cenový pohyb ropných futures, môžu ovplyvniť cenu XOM a ceny akcií iných ropných spoločností. Na pochopenie vzťahu, v ktorom sú prítomné viac ako dve premenné, sa používa viacnásobná lineárna regresia.
Viacnásobná lineárna regresia (MLR) sa používa na určenie matematického vzťahu medzi množstvom náhodných premenných. Inými slovami, MLR skúma, ako viac nezávislých premenných súvisí s jednou závislou premennou. Akonáhle bol určený každý z nezávislých faktorov na predpovedanie závislej premennej, informácie o viacerých premenných sa môžu použiť na vytvorenie presnej predpovede o úrovni vplyvu, ktorý majú na výslednú premennú. Model vytvára vzťah vo forme priamky (lineárnej), ktorá najlepšie aproximuje všetky jednotlivé dátové body.
S odkazom na MLR rovnicu vyššie, v našom príklade:
- y i = závislá premenná: cena XOM
- x i1 = úrokové sadzby
- x i2 = cena ropy
- x i3 = hodnota indexu S&P 500
- x i4 = cena futures na ropu
- Bo = priesečník y v čase nula
- B 1 = regresný koeficient, ktorý meria zmenu jednotky v závislej premennej pri zmene x i1 - zmena ceny XOM pri zmene úrokovej sadzby
- B 2 = hodnota koeficientu, ktorá meria zmenu jednotky v závislej premennej pri zmene x i2 - zmena ceny XOM pri zmene ceny ropy
Odhady najmenších štvorcov, Bo, Bi, B2 ... Bp, sa obvykle vypočítavajú pomocou štatistického softvéru. Do regresného modelu môže byť zahrnutých toľko premenných, v ktorých je každá nezávislá premenná diferencovaná číslom - 1, 2, 3, 4 ... p. Model viacnásobnej regresie umožňuje analytikovi predpovedať výsledok na základe informácií poskytnutých o viacerých vysvetľujúcich premenných.
Model však nie je vždy úplne presný, pretože každý dátový bod sa môže mierne líšiť od výsledku predpovedaného modelom. Zvyšková hodnota E, ktorá je rozdielom medzi skutočným výsledkom a predpokladaným výsledkom, je zahrnutá do modelu, aby sa zohľadnili také malé odchýlky.
Za predpokladu, že spustíme náš regresný model XOM ceny pomocou softvéru na výpočet štatistík, ktorý vráti tento výstup:
Analytik by interpretoval tento výstup tak, že ak sa ostatné premenné držia na konštantnej hodnote, cena XOM sa zvýši o 7, 8%, ak sa cena ropy na trhoch zvýši o 1%. Model tiež ukazuje, že cena XOM sa zníži o 1, 5% po zvýšení úrokových sadzieb o 1%. R2 naznačuje, že 86, 5% z odchýlok v cene akcií Exxon Mobil možno vysvetliť zmenami úrokovej sadzby, ceny ropy, futures na ropu a indexu S&P 500.
Kľúčové jedlá
- Viacnásobná lineárna regresia (MLR), známa tiež jednoducho ako viacnásobná regresia, je štatistická technika, ktorá používa niekoľko vysvetľujúcich premenných na predpovedanie výsledku reakčnej premennej.
- Viacnásobná regresia je rozšírenie lineárnej (OLS) regresie, ktorá používa iba jednu vysvetľujúcu premennú.
- MLR sa vo veľkej miere používa v ekonometrii a finančnej analýze.
Rozdiel medzi lineárnou a viacnásobnou regresiou
Lineárna (OLS) regresia porovnáva reakciu závislej premennej na zmenu niektorej vysvetľujúcej premennej. Zriedkavo je však závislá premenná vysvetlená iba jednou premennou. V tomto prípade analytik používa viacnásobnú regresiu, ktorá sa pokúša vysvetliť závislú premennú pomocou viac ako jednej nezávislej premennej. Viaceré regresie môžu byť lineárne a nelineárne.
Viaceré regresie sú založené na predpoklade, že existuje lineárny vzťah medzi závislými aj nezávislými premennými. Nepočíta ani so žiadnou významnou koreláciou medzi nezávislými premennými.
Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.