Hlavná » algoritmické obchodovanie » Základy regresie pre obchodné analýzy

Základy regresie pre obchodné analýzy

algoritmické obchodovanie : Základy regresie pre obchodné analýzy

Ak ste sa niekedy pýtali, ako spolu súvisia dva alebo viac údajov (napr. Ako je HDP ovplyvnený zmenami v nezamestnanosti a inflácii), alebo či ste niekedy mali svojho šéfa požiadať, aby ste vytvorili prognózu alebo analyzovali predpovede založené na pokiaľ ide o vzťahy medzi premennými, potom by sa učenie regresnej analýzy malo oplatiť.

V tomto článku sa dozviete základy jednoduchej lineárnej regresie, niekedy nazývanej „obyčajné najmenšie štvorce“ alebo regresia OLS - nástroj bežne používaný pri prognózovaní a finančnej analýze. Začneme tým, že sa naučíme základné princípy regresie, najprv sa dozvieme o kovariancii a korelácii a potom sa dostaneme k budovaniu a interpretácii regresného výstupu. Populárny obchodný softvér, ako je Microsoft Excel, dokáže urobiť všetky regresné výpočty a výstupy, ale je stále dôležité naučiť sa základnú mechaniku.

premenné

Jadrom regresného modelu je vzťah medzi dvoma rôznymi premennými, ktoré sa nazývajú závislé a nezávislé premenné. Predpokladajme napríklad, že chcete predpovedať predaj pre svoju spoločnosť a vy ste dospeli k záveru, že tržby vašej spoločnosti sa zvyšujú a znižujú v závislosti od zmien v HDP.

Predaj, ktorý predpovedáte, by bol závislou premennou, pretože jeho hodnota „závisí“ od hodnoty HDP a HDP by bol nezávislou premennou. Potom budete musieť určiť silu vzťahu medzi týmito dvoma premennými, aby ste mohli predpovedať predaj. Ak sa HDP zvýši / zníži o 1%, o koľko sa zvýšia alebo znížia vaše tržby?

kovariancie

Cov (x, y) = ∑ (xn − xu) (yn − yu) N \ begin {zarovnané} a Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ end {zarovnané} Cov (x, y) = ∑N (xn −xu) (yn −yu)

Vzorec na výpočet vzťahu medzi dvoma premennými sa nazýva kovariancia. Tento výpočet ukazuje smer vzťahu. Keby sa jedna premenná zvýšila a druhá premenná by sa tiež zvýšila, kovariancia by bola pozitívna. Ak jedna premenná stúpa a druhá má tendenciu klesať, potom by kovarzia bola negatívna.

Skutočné číslo, ktoré získate výpočtom, sa dá ťažko interpretovať, pretože nie je štandardizované. Napríklad kovarianciu päť možno interpretovať ako pozitívny vzťah, ale silu vzťahu je možné povedať iba ako silnejšiu, ako keby bolo číslo štyri alebo slabšie ako keby bolo číslo šesť.

Korelačný koeficient

Korelácia = ρxy = Covxysxsy \ begin {Zarovnať} & Korelácia = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {Zarovnať} Korelácia = ρxy = sx sy Covxy

Potrebujeme štandardizovať kovarianciu, aby sme ju mohli lepšie interpretovať a používať pri prognózovaní, a výsledkom je výpočet korelácie. Korelačný výpočet jednoducho berie kovarianciu a delí ju súčinom štandardnej odchýlky týchto dvoch premenných. Týmto sa spojí korelácia medzi hodnotou -1 a +1.

Koreláciu +1 je možné interpretovať tak, že naznačuje, že obe premenné sa spolu pohybujú dokonale pozitívne a -1 znamená, že sú dokonale negatívne korelované. V našom predchádzajúcom príklade, ak je korelácia +1 a HDP sa zvýši o 1%, potom by sa predaj zvýšil o 1%. Ak je korelácia -1, zvýšenie HDP o 1% by malo za následok zníženie predaja o 1% - presne naopak.

Regresná rovnica

Teraz, keď vieme, ako sa počíta relatívny vzťah medzi týmito dvoma premennými, môžeme vyvinúť regresnú rovnicu na predpovedanie alebo predpovedanie premennej, ktorú požadujeme. Nižšie je uvedený vzorec pre jednoduchú lineárnu regresiu. „Y“ je hodnota, ktorú sa snažíme predvídať, „b“ je sklon regresnej priamky, „x“ je hodnota našej nezávislej hodnoty a „a“ predstavuje priesečník y. Regresná rovnica jednoducho popisuje vzťah medzi závislou premennou (y) a nezávislou premennou (x).

y = bx + a \ začiatok {zarovnané} & y = bx + a \\ \ end {zarovnané} y = bx + a

Priesečník alebo „a“ je hodnota y (závislá premenná), ak je hodnota x (nezávislá premenná) nula, a preto sa niekedy jednoducho označuje ako „konštanta“. Takže ak by nedošlo k žiadnej zmene HDP, vaša spoločnosť by stále uskutočňovala určité tržby - táto hodnota, keď je zmena HDP nulová, je odpočúvaním. Prezrite si nasledujúci graf, aby ste videli grafické znázornenie regresnej rovnice. V tomto grafe je iba päť údajových bodov reprezentovaných piatimi bodkami v grafe. Lineárna regresia sa pokúša odhadnúť priamku, ktorá najlepšie vyhovuje údajom (priamka najlepšej zhody) a rovnica tejto priamky vedie k regresnej rovnici.

Obrázok 1: Čiara, ktorá sa najlepšie hodí

Zdroj: Investopedia

Regresie v Exceli

Teraz, keď rozumiete niektorému pozadiu, ktoré prechádza do regresnej analýzy, urobme jednoduchý príklad pomocou regresných nástrojov programu Excel. Budeme stavať na predchádzajúcom príklade pokusu predpovedať predaj na budúci rok na základe zmien v HDP. V nasledujúcej tabuľke sú uvedené niektoré umelé údajové body, tieto čísla však môžu byť v reálnom živote ľahko dostupné.

rokodbytHDP
20141001, 00%
20152501, 90%
20162752, 40%
20172002, 60%
20183002, 90%

Len očami za stôl môžete vidieť, že medzi predajom a HDP bude pozitívna korelácia. Obaja majú tendenciu ísť spolu hore. V aplikácii Excel stačí kliknúť na rozbaľovaciu ponuku Nástroje, vybrať položku Analýza údajov a odtiaľ zvoliť regresiu . Vyskakovacie okno sa odtiaľ ľahko vyplní; váš rozsah vstupu Y je stĺpec „Predaj“ a rozsah vstupu X predstavuje zmenu stĺpca HDP; vyberte rozsah výstupu, pre ktorý chcete, aby sa dáta zobrazovali v tabuľke, a stlačte OK. Mali by ste vidieť niečo podobné tomu, čo je uvedené v nasledujúcej tabuľke:

Koeficienty regresnej štatistiky

Viacnásobné R0.8292243Intercept34, 58409

Námestie R


0.687613HDP88, 15552
Upravená
Námestie R


0.583484

-


-


Štandardná chyba51.021807-

-


vyjadrenie5

-


-


interpretácia

Hlavnými výstupmi, ktoré musíte brať do úvahy pri jednoduchej lineárnej regresii, sú R-kvadrát, priesečník (konštanta) a koeficient beta (b) HDP. R-kvadrát číslo v tomto príklade je 68, 7% - to ukazuje, ako dobre náš model predpovedá alebo predpovedá budúci predaj, čo naznačuje, že vysvetľujúce premenné v modeli predpovedali 68, 7% variácie závislej premennej. Ďalej máme zastaviť 34, 58, čo nám hovorí, že ak by sa predpokladalo, že zmena HDP bude nulová, náš predaj by bol asi 35 jednotiek. A nakoniec, koeficient beta beta alebo korelačný koeficient 88, 15 nám hovorí, že ak sa HDP zvýši o 1%, predaj sa pravdepodobne zvýši asi o 88 jednotiek.

Spodný riadok

Ako by ste teda vo svojom podnikaní použili tento jednoduchý model?

Toto je samozrejme iba jednoduchá regresia a existujú modely, ktoré môžete zostaviť pomocou niekoľkých nezávislých premenných nazývaných viacnásobné lineárne regresie. Viacnásobné lineárne regresie sú však komplikovanejšie a majú niekoľko problémov, ktoré by si vyžadovali prerokovanie iného článku.

Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.
Odporúčaná
Zanechajte Svoj Komentár