Hlavná » algoritmické obchodovanie » Viacnásobná lineárna regresia - definícia MLR

Viacnásobná lineárna regresia - definícia MLR

algoritmické obchodovanie : Viacnásobná lineárna regresia - definícia MLR
Čo je to viacnásobná lineárna regresia - MLR?

Viacnásobná lineárna regresia (MLR), známa tiež jednoducho ako viacnásobná regresia, je štatistická technika, ktorá používa niekoľko vysvetľujúcich premenných na predpovedanie výsledku reakčnej premennej. Cieľom viacnásobnej lineárnej regresie (MLR) je modelovať lineárny vzťah medzi vysvetľujúcimi (nezávislými) premennými a odozvou (závislou) premennou.

V podstate je viacnásobná regresia rozšírením obyčajnej regresie najmenších štvorcov (OLS), ktorá zahŕňa viac ako jednu vysvetľujúcu premennú.

Vzorec pre viacnásobnú lineárnu regresiu je

yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵ všade, pre pozorovania i = n: yi = závislá premenná xi = expanzívne premennéβ0 = y-priesečník (konštantný člen) βp = koeficienty sklonu pre každú vysvetľujúcu premennúϵ = chybový termín modelu (tiež známe ako zvyšky) \ begin {zarovnané} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {where, for} i = n \ textbf {pozorovania:} \\ & y_i = \ text {závislá premenná} \\ & x_i = \ text {rozširujúce premenné} \\ & \ beta_0 = \ text {y-intercept (konštantná) term)} \\ & \ beta_p = \ text {koeficienty sklonu pre každú vysvetľujúcu premennú} \\ & \ epsilon = \ text {chybový termín modelu (známy tiež ako zvyšky)} \\ \ end {zarovnaný} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵ všade, kde i = n pozorovania: yi = závislá premenná xi = expanzívne premennéβ0 = y-priesečník (konštantný člen) βp = Koeficienty sklonu pre každú vysvetľujúcu premennúϵ = chybový termín modelu (známy tiež ako zvyšky)

Vysvetlenie viacnásobnej lineárnej regresie

Jednoduchá lineárna regresia je funkcia, ktorá umožňuje analytikovi alebo štatistikovi robiť predpovede o jednej premennej na základe informácií, ktoré sú známe o inej premennej. Lineárnu regresiu je možné použiť iba v prípade, že jedna má dve nepretržité premenné - nezávislú premennú a závislú premennú. Nezávislá premenná je parameter, ktorý sa používa na výpočet závislej premennej alebo výsledku. Model viacnásobnej regresie sa rozširuje na niekoľko vysvetľujúcich premenných.

Model viacnásobnej regresie je založený na nasledujúcich predpokladoch:

  • Medzi závislými premennými a nezávislými premennými existuje lineárny vzťah.
  • Nezávislé premenné nie sú navzájom príliš korelované.
  • Pozorovania sú vybrané nezávisle a náhodne z populácie.
  • Zvyšky by sa mali normálne distribuovať s priemerom 0 a rozptylom σ.

Koeficient určenia (na druhú mocninu) je štatistická metrika, ktorá sa používa na meranie toho, do akej miery možno odchýlku vo výsledku vysvetliť odchýlkou ​​v nezávislých premenných. R2 sa vždy zvyšuje, keď je do MLR modelu pridané viac prediktorov, aj keď prediktory nemusia súvisieť s výslednou premennou.

Samotný R2 sa preto nedá použiť na určenie, ktoré prediktory by sa mali zahrnúť do modelu a ktoré by sa mali vylúčiť. R2 môže byť iba medzi 0 a 1, kde 0 znamená, že výsledok nemôže byť predpovedaný žiadnou z nezávislých premenných a 1 znamená, že výsledok môže byť predpovedaný bez chyby z nezávislých premenných.

Pri interpretácii výsledkov viacnásobnej regresie sú beta koeficienty platné, zatiaľ čo všetky ostatné premenné zostávajú konštantné („všetky ostatné rovnaké“). Výstup z viacnásobnej regresie je možné zobraziť horizontálne ako rovnicu alebo vertikálne v podobe tabuľky.

Príklad použitia viacnásobnej lineárnej regresie

Napríklad analytik môže chcieť vedieť, ako pohyb trhu ovplyvňuje cenu Exxon Mobil (XOM). V tomto prípade bude mať jeho lineárna rovnica hodnotu indexu S&P 500 ako nezávislú premennú alebo prediktor a cenu XOM ako závislú premennú.

V skutočnosti existuje mnoho faktorov, ktoré predpovedajú výsledok udalosti. Napríklad cenový pohyb Exxon Mobil závisí viac ako len od výkonnosti celkového trhu. Ostatné prediktory, ako je cena ropy, úrokové sadzby a cenový pohyb ropných futures, môžu ovplyvniť cenu XOM a ceny akcií iných ropných spoločností. Na pochopenie vzťahu, v ktorom sú prítomné viac ako dve premenné, sa používa viacnásobná lineárna regresia.

Viacnásobná lineárna regresia (MLR) sa používa na určenie matematického vzťahu medzi množstvom náhodných premenných. Inými slovami, MLR skúma, ako viac nezávislých premenných súvisí s jednou závislou premennou. Akonáhle bol určený každý z nezávislých faktorov na predpovedanie závislej premennej, informácie o viacerých premenných sa môžu použiť na vytvorenie presnej predpovede o úrovni vplyvu, ktorý majú na výslednú premennú. Model vytvára vzťah vo forme priamky (lineárnej), ktorá najlepšie aproximuje všetky jednotlivé dátové body.

S odkazom na MLR rovnicu vyššie, v našom príklade:

  • y i = závislá premenná: cena XOM
  • x i1 = úrokové sadzby
  • x i2 = cena ropy
  • x i3 = hodnota indexu S&P 500
  • x i4 = cena futures na ropu
  • Bo = priesečník y v čase nula
  • B 1 = regresný koeficient, ktorý meria zmenu jednotky v závislej premennej pri zmene x i1 - zmena ceny XOM pri zmene úrokovej sadzby
  • B 2 = hodnota koeficientu, ktorá meria zmenu jednotky v závislej premennej pri zmene x i2 - zmena ceny XOM pri zmene ceny ropy

Odhady najmenších štvorcov, Bo, Bi, B2 ... Bp, sa obvykle vypočítavajú pomocou štatistického softvéru. Do regresného modelu môže byť zahrnutých toľko premenných, v ktorých je každá nezávislá premenná diferencovaná číslom - 1, 2, 3, 4 ... p. Model viacnásobnej regresie umožňuje analytikovi predpovedať výsledok na základe informácií poskytnutých o viacerých vysvetľujúcich premenných.

Model však nie je vždy úplne presný, pretože každý dátový bod sa môže mierne líšiť od výsledku predpovedaného modelom. Zvyšková hodnota E, ktorá je rozdielom medzi skutočným výsledkom a predpokladaným výsledkom, je zahrnutá do modelu, aby sa zohľadnili také malé odchýlky.

Za predpokladu, že spustíme náš regresný model XOM ceny pomocou softvéru na výpočet štatistík, ktorý vráti tento výstup:

Analytik by interpretoval tento výstup tak, že ak sa ostatné premenné držia na konštantnej hodnote, cena XOM sa zvýši o 7, 8%, ak sa cena ropy na trhoch zvýši o 1%. Model tiež ukazuje, že cena XOM sa zníži o 1, 5% po zvýšení úrokových sadzieb o 1%. R2 naznačuje, že 86, 5% z odchýlok v cene akcií Exxon Mobil možno vysvetliť zmenami úrokovej sadzby, ceny ropy, futures na ropu a indexu S&P 500.

Kľúčové jedlá

  • Viacnásobná lineárna regresia (MLR), známa tiež jednoducho ako viacnásobná regresia, je štatistická technika, ktorá používa niekoľko vysvetľujúcich premenných na predpovedanie výsledku reakčnej premennej.
  • Viacnásobná regresia je rozšírenie lineárnej (OLS) regresie, ktorá používa iba jednu vysvetľujúcu premennú.
  • MLR sa vo veľkej miere používa v ekonometrii a finančnej analýze.

Rozdiel medzi lineárnou a viacnásobnou regresiou

Lineárna (OLS) regresia porovnáva reakciu závislej premennej na zmenu niektorej vysvetľujúcej premennej. Zriedkavo je však závislá premenná vysvetlená iba jednou premennou. V tomto prípade analytik používa viacnásobnú regresiu, ktorá sa pokúša vysvetliť závislú premennú pomocou viac ako jednej nezávislej premennej. Viaceré regresie môžu byť lineárne a nelineárne.

Viaceré regresie sú založené na predpoklade, že existuje lineárny vzťah medzi závislými aj nezávislými premennými. Nepočíta ani so žiadnou významnou koreláciou medzi nezávislými premennými.

Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.

Súvisiace podmienky

Aké regresné opatrenia Regresia je štatistické meranie, ktoré sa pokúša určiť silu vzťahu medzi jednou závislou premennou (obvykle označenou Y) a radom ďalších meniacich sa premenných (známych ako nezávislé premenné). viac Čo je chybový termín "> Chybový termín je definovaný ako premenná v štatistickom modeli, ktorý sa vytvorí, keď model nepredstavuje skutočný vzťah medzi nezávislými a závislými premennými. viac Ako funguje metóda najmenších štvorcov najmenej metóda štvorcov je štatistická technika na určenie priamky najvhodnejšej pre daný model, špecifikovaná rovnicou s určitými parametrami pozorovaných údajov. viac Econometrics: Čo to znamená a ako sa používa Ekonometrics je aplikácia štatistických a matematických modelov na ekonomické údaje na účely testovania teórií, hypotéz a budúcich trendov viac R-Squared R-squared je štatistická miera, ktorá predstavuje pomer rozptylu pre závislú premennú, ktorý sa vysvetľuje nezávislou premennou. viac Ako funguje koeficient determinácie Koeficient určenia je miera použitá v štatistickej analýze na posúdenie toho, ako dobre model vysvetľuje a predpovedá budúce výsledky. Viac Pa rtner Odkazy
Odporúčaná
Zanechajte Svoj Komentár