Hlavná » algoritmické obchodovanie » Koeficient stanovenia

Koeficient stanovenia

Čo je koeficient determinácie?

Koeficient určenia je miera použitá v štatistickej analýze, ktorá hodnotí, ako dobre model vysvetľuje a predpovedá budúce výsledky. Naznačuje to úroveň vysvetlenej variability v súbore údajov. Koeficient určenia, tiež známy ako „R-kvadrát“, sa používa ako návod na meranie presnosti modelu.

Jedným zo spôsobov interpretácie tohto čísla je povedať, že premenné obsiahnuté v danom modeli vysvetľujú približne x% pozorovanej variácie. Ak teda R2 = 0, 50, potom možno pomocou modelu vysvetliť približne polovicu pozorovanej variácie.

01:58

R-kvadrát

Kľúčové jedlá

Koeficient určenia je komplexná myšlienka zameraná na štatistickú analýzu budúceho modelu údajov.
Koeficient určenia sa používa na vysvetlenie, do akej miery môže byť variabilita jedného faktora spôsobená jeho vzťahom k inému faktoru.

Pochopenie koeficientu určenia

Koeficient určenia sa používa na vysvetlenie, do akej miery môže byť variabilita jedného faktora spôsobená jeho vzťahom k inému faktoru. Pri analýze trendov sa veľmi spolieha a predstavuje hodnotu medzi 0 a 1.

Čím bližšia je hodnota 1, tým lepšie sa hodí alebo vzťah medzi týmito dvoma faktormi. Koeficient určenia je druhá mocnina korelačného koeficientu, známa tiež ako „R“, ktorá mu umožňuje zobraziť stupeň lineárnej korelácie medzi dvoma premennými.

Táto korelácia sa nazýva „dobrota fit“. Hodnota 1, 0 znamená dokonalé prispôsobenie, a je teda veľmi spoľahlivým modelom pre budúce predpovede, čo naznačuje, že model vysvetľuje všetky pozorované variácie. Hodnota 0 na druhej strane by naznačovala, že model vôbec nedokáže správne modelovať údaje. Pre model s niekoľkými premennými, ako je napríklad model s viacnásobnou regresiou, je upravený R2 lepším koeficientom stanovenia. V ekonómii sa hodnota R2 nad 0, 60 považuje za užitočnú.

Výhody analýzy koeficientu stanovenia

Koeficient určenia je druhá mocnina korelácie medzi predpokladanými skóre v množine údajov verzus skutočná množina skóre. Môže byť tiež vyjadrená ako druhá mocnina korelácie medzi skóre X a Y, pričom X je nezávislá premenná a Y je závislá premenná.

Bez ohľadu na reprezentáciu znamená R-druhá mocnina rovná 0, že závislá premenná sa nedá predpovedať pomocou nezávislej premennej. Naopak, ak sa rovná 1, znamená to, že nezávislá premenná vždy predpovedá závislosť premennej.

Koeficient určenia, ktorý spadá do tohto rozsahu, meria rozsah, v akom nezávislá premenná predpovedá závislú premennú. Napríklad R na druhú hodnotu 0, 20 znamená, že nezávislá premenná predpovedá 20% závislej premennej.

Správnosť prispôsobenia alebo stupeň lineárnej korelácie meria vzdialenosť medzi osadenou čiarou v grafe a všetkými údajovými bodmi, ktoré sú rozptýlené po celom grafe. Úzka sada údajov bude mať regresnú čiaru, ktorá je veľmi blízko k bodom a má vysokú mieru prispôsobenia, čo znamená, že vzdialenosť medzi čiarou a údajmi je veľmi malá. Dobrý strih má štvorcový tvar R, ktorý je blízky 1.

R-kvadrát však nedokáže určiť, či sú dátové body alebo predpovede skreslené. Analytikovi ani používateľovi nehovorí, či je koeficient určovacej hodnoty dobrý alebo nie. Napríklad nízka R na druhú nie je zlá a je na osobe, aby sa rozhodla na základe R-druhej mocniny.

Koeficient určenia by sa nemal interpretovať naivne. Napríklad, ak je R-druhá mocnina modelu uvedená na 75%, rozptyl jeho chýb je o 75% menší ako rozptyl závislej premennej a štandardná odchýlka jej chýb je o 50% nižšia ako štandardná odchýlka závislej premennej variabilné. Štandardná odchýlka chýb modelu je asi jedna tretina veľkosti štandardnej odchýlky chýb, ktoré by ste získali pri modeli s konštantnou úrovňou.

Nakoniec, aj keď je hodnota na druhú mocninu veľká, nemusí existovať štatistická významnosť vysvetľujúcich premenných v modeli, alebo efektívna veľkosť týchto premenných môže byť z praktického hľadiska veľmi malá.

Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.

Súvisiace podmienky

Čo je to chybový termín? Chybový výraz je definovaný ako premenná v štatistickom modeli, ktorý sa vytvorí, keď model nepredstavuje skutočný vzťah medzi nezávislými a závislými premennými. viac Ako funguje viacnásobná lineárna regresia Viacnásobná lineárna regresia (MLR) je štatistická technika, ktorá používa niekoľko vysvetľujúcich premenných na predpovedanie výsledku reakčnej premennej. more Line Of Best Fit Line of Best Fit je výstup regresnej analýzy, ktorá predstavuje vzťah medzi dvoma alebo viacerými premennými v množine údajov. viac R-Squared R-squared je štatistická miera, ktorá predstavuje pomer rozptylu pre závislú premennú, ktorý sa vysvetľuje nezávislou premennou. viac Ako funguje metóda najmenších štvorcov Metóda najmenších štvorcov je štatistická technika na určenie priamky najvhodnejšej pre daný model, ktorá je určená rovnicou s určitými parametrami pre pozorované údaje. viac Heteroskedasticity V štatistikách heteroskedasticity nastane, keď sú štandardné odchýlky premennej, monitorované počas špecifického času, nekonzistentné. ďalšie partnerské odkazy

← Zatváranie Bell

Otočné dvere →

Odporúčaná

Zanechajte Svoj Komentár