Hlavná » algoritmické obchodovanie » Neparametrická štatistika

Neparametrická štatistika

algoritmické obchodovanie : Neparametrická štatistika
Čo sú neparametrické štatistiky?

Neparametrická štatistika sa vzťahuje na štatistickú metódu, pri ktorej sa nevyžaduje, aby údaje zodpovedali normálnemu rozdeleniu. Neparametrická štatistika používa údaje, ktoré sú často ordinálne, čo znamená, že sa nespolieha na čísla, ale skôr na poradie alebo poradie druhov. Napríklad prieskum poskytujúci spotrebiteľské preferencie v rozsahu od nepáči po nepáči by sa považoval za ordinálne údaje.

Neparametrická štatistika zahŕňa neparametrickú deskriptívnu štatistiku, štatistické modely, inferencie a štatistické testy. Modelová štruktúra neparametrických modelov nie je a priori špecifikovaná, ale namiesto toho sa určuje z údajov. Termín neparametrický nemá za cieľ naznačovať, že takýmto modelom úplne chýbajú parametre, ale skôr to, že počet a povaha parametrov sú flexibilné a nie sú vopred stanovené. Histogram je príkladom neparametrického odhadu rozdelenia pravdepodobnosti.

Pochopenie neparametrických štatistík

V štatistike zahŕňajú parametrické štatistiky parametre ako priemer, medián, smerodajná odchýlka, rozptyl atď. Táto forma štatistiky používa pozorované údaje na odhad parametrov distribúcie. Podľa parametrických štatistík sa predpokladá, že údaje zodpovedajú normálnemu rozdeleniu s neznámymi parametrami μ (priemer populácie) a σ 2 (odchýlka populácie), ktoré sa potom odhadujú pomocou priemeru vzorky a odchýlky vzorky.

Neparametrická štatistika nepredpokladá veľkosť vzorky ani to, či sú pozorované údaje kvantitatívne.

Neparametrické štatistiky nepredpokladajú, že údaje sa získavajú z normálneho rozdelenia. Namiesto toho sa tvar distribúcie odhaduje podľa tejto formy štatistického merania. Aj keď existuje veľa situácií, v ktorých možno predpokladať normálnu distribúciu, existujú aj niektoré scenáre, v ktorých nebude možné určiť, či sa údaje budú normálne distribuovať.

Príklady neparametrických štatistík

V prvom príklade zvážte výskumného pracovníka, ktorý chce odhad počtu detí v Severnej Amerike narodených s hnedými očami, sa môže rozhodnúť odobrať vzorku 150 000 detí a vykonať analýzu súboru údajov. Meranie, ktoré odvodia, sa použije ako odhad celej populácie dojčiat s hnedými očami narodených v nasledujúcom roku.

Ako druhý príklad uvážte iného výskumného pracovníka, ktorý chce vedieť, či ísť do postele skoro alebo neskoro súvisí s tým, ako často človek ochorie. Za predpokladu, že vzorka je vybraná z populácie náhodne, možno predpokladať, že rozloženie veľkosti vzorky frekvencie chorôb je normálne. Avšak experiment, ktorý meria odolnosť ľudského tela voči kmeňom baktérií, nemôže mať normálnu distribúciu.

Je to z toho dôvodu, že náhodne vybrané údaje zo vzorky môžu byť rezistentné na kmeň. Na druhej strane, ak výskumník vezme do úvahy faktory, ako je genetické zloženie a etnicita, môže zistiť, že veľkosť vzorky vybraná pomocou týchto charakteristík nemusí byť rezistentná na kmeň. Preto nemožno predpokladať normálne rozdelenie.

Táto metóda je užitočná, ak údaje nemajú jasnú numerickú interpretáciu a je najlepšie ju použiť s údajmi, ktoré majú poradie tried. Napríklad test hodnotenia osobnosti môže mať hodnotenie svojich metrík nastavené ako silne nesúhlasím, nesúhlasím, ľahostajným, súhlasím a silne súhlasím. V takom prípade by sa mali použiť neparametrické metódy.

Osobitné úvahy

Neparametrické štatistiky získali ocenenie vďaka ich ľahkému použitiu. Keď sa potreba parametrov uľaví, údaje sa stanú viac použiteľnými pre väčšiu škálu testov. Tento typ štatistík sa môže použiť bez priemeru, veľkosti vzorky, štandardnej odchýlky alebo odhadu akýchkoľvek iných súvisiacich parametrov, ak žiadna z týchto informácií nie je k dispozícii.

Keďže neparametrická štatistika vytvára menšie predpoklady o vzorkách, jej rozsah je širší ako parametrická štatistika. V prípadoch, keď je vhodnejšie parametrické testovanie, budú neparametrické metódy menej efektívne. Je to tak preto, že výsledky získané z neparametrických štatistík majú nižší stupeň spoľahlivosti, než keby sa výsledky získali pomocou parametrických štatistík.

Kľúčové jedlá

  • Neparametrické štatistiky sa ľahko používajú, ale neponúkajú presnú presnosť iných štatistických modelov.
  • Tento typ analýzy je najvhodnejší pri zvažovaní poradia niečoho, kde aj keď sa číselné údaje zmenia, výsledky sa pravdepodobne nezmenia.
Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.

Súvisiace podmienky

Pochopenie distribúcie T Distribúcia AT je typ pravdepodobnostnej funkcie, ktorá je vhodná na odhad parametrov populácie pre malé veľkosti vzorky alebo neznáme odchýlky. viac Ako funguje distribúcia vzoriek Distribúcia vzoriek je rozdelenie pravdepodobnosti štatistických údajov získaných prostredníctvom veľkého počtu vzoriek odobratých zo špecifickej populácie. viac Ako sa používa Wilcoxonov test Wilcoxonov test, ktorý odkazuje na test Rank Sum alebo Test Signed Rank, je neparametrický test, ktorý porovnáva dve spárované skupiny. viac Neparametrická metóda Neparametrická metóda sa vzťahuje na typ štatistiky, ktorý nevyžaduje, aby analyzované údaje spĺňali určité predpoklady alebo parametre. viac Definícia T-testu T-test je typ inferenciálnej štatistiky, ktorá sa používa na určenie, či existuje významný rozdiel medzi prostriedkami dvoch skupín, ktoré môžu súvisieť s určitými vlastnosťami. viac Interval spoľahlivosti Interval spoľahlivosti meria pravdepodobnosť, že parameter populácie klesne medzi dve nastavené hodnoty. ďalšie partnerské odkazy
Odporúčaná
Zanechajte Svoj Komentár