Overfitting

algoritmické obchodovanie : Overfitting
Čo je to Overfitting?

Overfitting je chyba modelovania, ktorá sa vyskytne, keď je funkcia príliš blízko k obmedzenému súboru dátových bodov. Nadmerné prispôsobenie modelu má vo všeobecnosti podobu vytvorenia príliš komplexného modelu na vysvetlenie idiosynkrasií v skúmaných údajoch.

V skutočnosti majú často študované údaje určitý stupeň chyby alebo náhodného šumu. Pokus o to, aby bol model príliš prispôsobený na mierne nepresné údaje, môže teda model infikovať závažnými chybami a znížiť jeho predikčnú silu.

[Dôležité: Finanční odborníci si musia byť vždy vedomí nebezpečenstva nadmerného vybavenia modelu založeného na obmedzených údajoch.]

Pochopenie nadmerného vybavenia

Bežným problémom je napríklad použitie počítačových algoritmov na prehľadávanie rozsiahlych databáz historických údajov o trhu s cieľom nájsť vzory. Vzhľadom na dostatok štúdií je často možné vypracovať komplikované vety, ktoré podľa všetkého predpovedajú veci ako výnosy na akciovom trhu s presnosťou.

Ak sa však použijú na údaje mimo vzorky, môže sa stať, že takéto vety budú iba preplnením modelu tým, čo sa v skutočnosti stalo iba náhodou. Vo všetkých prípadoch je dôležité testovať model na údajoch, ktoré sú mimo vzorky použitej na jeho vývoj.

Kľúčové jedlá

  • Overfitting je chyba modelovania, ktorá sa vyskytne, keď je funkcia príliš blízko k obmedzenému súboru dátových bodov.
  • Finanční odborníci si musia byť vždy vedomí nebezpečenstva nadmerného vybavenia modelu založeného na obmedzených údajoch.
Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.

Súvisiace podmienky

Prečo je dôležitá štatistická dôležitosť Štatistická významnosť sa týka výsledku, ktorý sa pravdepodobne nevyskytne náhodne, ale skôr sa dá pripísať konkrétnej príčine. viac Ako funguje vyhladenie údajov Vyhlazovanie údajov sa vykonáva pomocou algoritmu na odstránenie šumu zo súboru údajov. To umožňuje vyniknúť dôležitým vzorom. Vyrovnávanie údajov sa môže použiť na predpovedanie trendov, ako sú napríklad trendy v cenách cenných papierov. viac Vzorka Vzorka je menšia, spravovateľná verzia väčšej skupiny. Vzorky sa používajú na štatistické testovanie, ak sú veľkosti populácie príliš veľké. viac Heteroskedasticity V štatistikách heteroskedasticity nastane, keď sú štandardné odchýlky premennej, monitorované počas špecifického času, nekonzistentné. viac Čítanie do stratifikovaného náhodného odberu vzoriek Stratifikovaný náhodný odber vzoriek je metóda odberu vzoriek, ktorá zahŕňa rozdelenie populácie na menšie skupiny známe ako strata. viac Ako fungujú jednoduché náhodné vzorky Jednoduchá náhodná vzorka je podskupina štatistickej populácie, v ktorej má každý člen podskupiny rovnakú pravdepodobnosť, že bude vybraný. Jednoduchá náhodná vzorka sa považuje za nezaujaté zobrazenie skupiny. ďalšie partnerské odkazy
Odporúčaná
Zanechajte Svoj Komentár