Hlavná » algoritmické obchodovanie » Testovanie hypotéz vo financiách: koncept a príklady

Testovanie hypotéz vo financiách: koncept a príklady

algoritmické obchodovanie : Testovanie hypotéz vo financiách: koncept a príklady

Váš investičný poradca vám navrhuje mesačný investičný plán príjmu, ktorý sľubuje variabilnú návratnosť každý mesiac. Investujete do toho iba vtedy, ak máte istotu priemerného mesačného príjmu 180 dolárov. Váš poradca vám tiež povie, že za posledných 300 mesiacov mala schéma návratnosť investícií s priemernou hodnotou 190 dolárov a štandardnou odchýlkou ​​75 dolárov. Mali by ste investovať do tohto systému? Pomôcť pri takomto rozhodovaní je testovanie hypotéz.

Tento článok predpokladá čitateľovu znalosť pojmov normálnej distribučnej tabuľky, vzorca, p-hodnoty a súvisiacich základov štatistiky.

Čo je testovanie hypotéz?

Testovanie hypotéz alebo významnosti je matematický model na testovanie tvrdenia, nápadu alebo hypotézy o parametri, ktorý je predmetom záujmu v danom súbore populácie, s použitím údajov nameraných v súbore vzoriek. Výpočty sa vykonávajú na vybraných vzorkách, aby sa získali rozhodujúce informácie o charakteristikách celej populácie, čo umožňuje systematický spôsob testovania tvrdení alebo nápadov o celom súbore údajov.

Tu je jednoduchý príklad: Riaditeľ školy uvádza, že študenti v jej škole dosahujú v priemere 7 z 10 skúšok. Aby sme otestovali túto „hypotézu“, zaznamenávame známky asi 30 študentov (vzorka) z celej študentskej populácie školy (povedzme 300) a vypočítame priemer tejto vzorky. Potom môžeme porovnať (vypočítaný) priemer vzorky s priemerným údajom (vykázaným) a pokúsiť sa potvrdiť hypotézu.

Ako príklad uvedieme, že ročná návratnosť konkrétneho podielového fondu je 8%. Predpokladajme, že vzájomný fond existuje už 20 rokov. Odoberáme náhodnú vzorku ročných výnosov podielového fondu napríklad za päť rokov (vzorka) a vypočítame jeho priemer. Potom sme porovnali (vypočítaný) priemer vzorky s (nárokovaným) priemerom populácie, aby sme overili hypotézu.

Kritériá rozhodovania sa musia zakladať na určitých parametroch súborov údajov.

Na testovanie hypotéz existujú rôzne metodiky, sú však zapojené rovnaké štyri základné kroky:

Krok 1: Definujte hypotézu

Zvyčajne sa vykazovaná hodnota (alebo štatistika nárokov) uvádza ako hypotéza a predpokladá sa, že je pravdivá. Vo vyššie uvedených príkladoch bude hypotéza:

  • Príklad A: Študenti v škole dosahujú v priemere 7 z 10 na skúškach.
  • Príklad B: Ročný výnos podielového fondu je 8% ročne.

Tento opis predstavuje „ nulovú hypotézu (H 0 ) “ a predpokladá sa, že je pravdivý - spôsob, akým sa obžalovaný v súdnom konaní považuje za nevinný, pokiaľ sa nepreukáže dôkazom predloženým súdom. Podobne sa testovanie hypotéz začína uvedením a predpokladaním „nulovej hypotézy“ a potom proces určí, či je predpoklad pravdivý alebo nepravdivý.

Dôležité je poznamenať, že testujeme nulovú hypotézu, pretože existuje určitá pochybnosť o jej platnosti. Akékoľvek informácie, ktoré sú proti uvedenej nulovej hypotéze, sú zachytené v alternatívnej hypotéze (H1). Vo vyššie uvedených príkladoch bude alternatívnou hypotézou:

  • Študenti dosahujú priemer rovný 7.
  • Ročný výnos podielového fondu sa nerovná 8% ročne.

Inými slovami, alternatívna hypotéza je priamym protikladom nulovej hypotézy.

Rovnako ako v súdnom konaní, porota predpokladá nevinnosť odporcu (neplatná hypotéza). Prokurátor musí preukázať opak (alternatívna hypotéza). Podobne musí výskumný pracovník preukázať, že nulová hypotéza je buď pravdivá alebo nepravdivá. Ak prokurátor nepreukáže alternatívnu hypotézu, porota musí nechať obžalovaného ísť (rozhodnutie založí na neplatnej hypotéze). Podobne, ak výskumný pracovník nepreukáže alternatívnu hypotézu (alebo jednoducho neurobí nič), predpokladá sa, že neplatná hypotéza je pravdivá.

Krok 2: Nastavte kritériá

Kritériá rozhodovania sa musia zakladať na určitých parametroch množín údajov a práve tu prichádza do úvahy spojenie s normálnou distribúciou.

Podľa štandardnej štatistiky predpokladanej distribúcie vzorkovania: „Pre akúkoľvek veľkosť vzorky n je distribúcia vzorkovania X̅ normálna, ak je populácia X, z ktorej sa vzorka čerpá, normálne rozdelená.“ Pravdepodobnosť všetkých ostatných možných vzoriek teda znamená, že jeden by mohol vybrať, sú bežne distribuované.

Napríklad zistite, či je priemerný denný výnos ktorejkoľvek z akcií kótovaných na burze XYZ okolo Novoročného dňa väčší ako 2%.

H 0 : Nulová hypotéza: priemer = 2%

H 1 : Alternatívna hypotéza: stredná> 2% (to je to, čo chceme dokázať)

Odoberte vzorku (povedzte o 50 zásobách z celkových 500) a vypočítajte priemer vzorky.

Pri normálnom rozdelení leží 95% hodnôt v rámci dvoch štandardných odchýlok priemeru populácie. Preto tento normálny predpoklad distribúcie a centrálny limit pre súbor údajov vzorky nám umožňuje stanoviť 5% ako hladinu významnosti. Má zmysel, pretože za tohto predpokladu je menšia ako 5% pravdepodobnosť (100 - 95), že dôjde k odľahnutiu odľahlých hodnôt, ktoré presahujú dve štandardné odchýlky od priemeru populácie. V závislosti od povahy súborov údajov sa môžu stanoviť iné úrovne významnosti 1%, 5% alebo 10%. Pre finančné výpočty (vrátane financovania správania) je všeobecne akceptovaným limitom 5%. Ak nájdeme nejaké výpočty, ktoré idú nad rámec zvyčajných dvoch štandardných odchýlok, potom máme silný prípad odľahlých hodnôt, ktoré odmietnu nulovú hypotézu.

Graficky je znázornené takto:

Ak je v uvedenom príklade priemer vzorky omnoho väčší ako 2% (povedzme 3, 5%), odmietneme nulovú hypotézu. Je akceptovaná alternatívna hypotéza (priemer> 2%), ktorá potvrdzuje, že priemerný denný výnos zásob je skutočne nad 2%.

Ak však nie je pravdepodobné, že priemer vzorky bude výrazne vyšší ako 2% (a zostane na, povedzme, okolo 2, 2%), NEMÔŽEM odmietnuť nulovú hypotézu. Výzvou je, ako rozhodnúť o takýchto prípadoch s blízkym dosahom. Aby sa urobil záver z vybraných vzoriek a výsledkov, musí sa určiť úroveň významnosti, ktorá umožní urobiť záver o nulovej hypotéze. Alternatívna hypotéza umožňuje stanoviť úroveň závažnosti alebo koncepciu „kritickej hodnoty“ pre rozhodovanie o takýchto prípadoch blízkeho dosahu.

Podľa štandardnej definície učebnice „Kritická hodnota je medzná hodnota, ktorá definuje hranice, za ktoré je možné získať menej ako 5% prostriedkov vzorky, ak je neplatná hypotéza pravdivá. Vzorové prostriedky získané nad kritickú hodnotu povedú k rozhodnutiu o zamietnutí nulovej hypotézy. “Ak sme v uvedenom príklade definovali kritickú hodnotu ako 2, 1% a vypočítaný priemer je 2, 2%, potom nulovú hypotézu odmietneme. Kritická hodnota predstavuje jasné vymedzenie, pokiaľ ide o prijatie alebo zamietnutie.

Krok 3: Vypočítajte štatistiku

Tento krok zahŕňa výpočet požadovanej hodnoty, ktorá je známa ako štatistika testu (ako je priemer, z-skóre, p-hodnota atď.) Pre vybratú vzorku. (K týmto sa dostaneme v neskoršej časti.)

Krok 4: Dosiahnite záver

S vypočítanou hodnotou (hodnotami) sa rozhodnite pre nulovú hypotézu. Ak je pravdepodobnosť získania priemeru vzorky menšia ako 5%, záverom je zamietnutie nulovej hypotézy. V opačnom prípade akceptujte a zachovajte nulovú hypotézu.

Typy chýb

Pri rozhodovaní založenom na vzorkách môžu existovať štyri možné výsledky, pokiaľ ide o správnu uplatniteľnosť na celú populáciu:

Rozhodnutie o ponechaní


Rozhodnutie o zamietnutí


Vzťahuje sa na celú populáciu


korektné


nesprávny

(Chyba typu 1 - a)


Nevzťahuje sa na celú populáciu


nesprávny

(Chyba typu 2 - b)


korektné


„Správne“ prípady sú prípady, keď sa rozhodnutia prijaté na vzorkách skutočne vzťahujú na celú populáciu. Prípady chýb vznikajú, keď sa človek rozhodne zachovať (alebo odmietnuť) nulovú hypotézu založenú na výpočtoch vzorky, ale toto rozhodnutie sa v skutočnosti nevzťahuje na celú populáciu. Tieto prípady predstavujú chyby typu 1 (alfa) a typu 2 (beta), ako je uvedené v tabuľke vyššie.

Výber správnej kritickej hodnoty umožňuje odstrániť chyby typu 1 alfa alebo ich obmedziť na prijateľný rozsah.

Alfa označuje chybu na úrovni významnosti a je určená výskumníkom. Aby sa zachovala štandardná 5% hladina významnosti alebo spoľahlivosti pre výpočty pravdepodobnosti, udržiava sa na 5%.

Podľa platných referenčných kritérií a definícií rozhodovania:

  • „Toto (alfa) kritérium je zvyčajne nastavené na 0, 05 (a = 0, 05) a porovnávame hladinu alfa s hodnotou p. Ak je pravdepodobnosť chyby typu I menšia ako 5% (p <0, 05), rozhodli sme sa zamietnuť nulovú hypotézu; inak si ponecháme nulovú hypotézu. “
  • Technický výraz používaný pre túto pravdepodobnosť je p-hodnota . Je definovaná ako „pravdepodobnosť dosiahnutia výsledku vzorky, keďže hodnota uvedená v nulovej hypotéze je pravdivá. Hodnota p pre získanie výsledku vzorky sa porovná s úrovňou významnosti. ““
  • Chyba typu II alebo chyba beta je definovaná ako „pravdepodobnosť nesprávneho zachovania nulovej hypotézy, keď v skutočnosti nie je použiteľná pre celú populáciu.“

Niekoľko ďalších príkladov preukáže tento a ďalšie výpočty.

Príklad 1

Existuje systém investovania do mesačného príjmu, ktorý sľubuje variabilné mesačné výnosy. Investor doň bude investovať, iba ak bude mať priemerný mesačný príjem 180 dolárov. Má vzorku výnosov 300 mesiacov, čo znamená priemernú hodnotu 190 dolárov a štandardnú odchýlku 75 dolárov. Ak by do tohto systému investoval ">

Poďme vyriešiť problém. Investor bude investovať do systému, ak bude mať istotu, že mu bude prinesený priemerný výnos 180 dolárov.

H 0 : Nulová hypotéza: priemer = 180

H 1 : Alternatívna hypotéza: stredná hodnota> 180

Metóda 1: Prístup kritickej hodnoty

Určte kritickú hodnotu X L pre priemer vzorky, ktorá je dostatočne veľká na odmietnutie nulovej hypotézy - tj odmietnite nulovú hypotézu, ak priemer vzorky> = kritická hodnota X L

P (identifikujte alfa chybu typu I) = P (odmietnutie H 0 za predpokladu, že H 0 je pravda),

To by sa dosiahlo, keď priemer vzorky prekročí kritické limity.

= P (za predpokladu, že H0 je pravda) = alfa

Graficky to vyzerá takto:

Ak vezmeme alfa = 0, 05 (tj 5% hladinu významnosti), Z 0, 05 = 1, 645 (z tabuľky Z alebo normálnej distribučnej tabuľky)

=> XL = 180 + 1, 645 * (75 / sqrt (300)) = 187, 12

Pretože priemer vzorky (190) je väčší ako kritická hodnota (187, 12), nulová hypotéza sa zamieta a záver je taký, že priemerný mesačný výnos je skutočne vyšší ako 180 dolárov, takže investor môže zvážiť investovanie do tohto systému.

Metóda 2: Použitie štandardizovanej testovacej štatistiky

Je tiež možné použiť štandardizovanú hodnotu z.

Štatistický test, Z = (priemer vzorky - priemer populácie) / (std-dev / sqrt (počet vzoriek).

Potom sa oblasť odmietnutia stáva nasledujúcim:

Z = (190 - 180) / (75 / sqrt (300)) = 2, 309

Naša oblasť odmietnutia pri 5% hladine významnosti je Z> Z 0, 05 = 1, 645.

Pretože Z = 2, 309 je vyššia ako 1, 645, nulová hypotéza sa môže zamietnuť s podobným záverom uvedeným vyššie.

Metóda 3: Výpočet hodnoty P

Naším cieľom je identifikovať P (priemer vzorky> = 190, keď priemer = 180).

= P (Z> = (190 - 180) / (75 / sqrt (300))

= P (Z> = 2, 309) = 0, 0084 = 0, 84%

Nasledujúca tabuľka na odvodenie výpočtov hodnoty p dospela k záveru, že existujú potvrdené dôkazy o tom, že priemerný mesačný výnos je vyšší ako 180:

p-hodnota


Záver


menej ako 1%


Potvrdený dôkaz podporujúci alternatívnu hypotézu


medzi 1% a 5%


Silné dôkazy podporujúce alternatívnu hypotézu


medzi 5% a 10%


Slabé dôkazy podporujúce alternatívnu hypotézu


viac ako 10%


Žiadny dôkaz podporujúci alternatívnu hypotézu


Príklad 2

Nový maklér (XYZ) tvrdí, že jeho poplatky za sprostredkovanie sú nižšie ako poplatky vášho súčasného makléra (ABC). Údaje dostupné od nezávislej výskumnej spoločnosti naznačujú, že priemer a std-dev všetkých klientov brokerov ABC sú 18 USD a 6 USD.

Odoberie sa vzorka 100 klientov ABC a vypočítajú sa maklérske poplatky s novými sadzbami brokera XYZ. Ak je priemer vzorky 18, 75 USD a std-dev je rovnaký (6 USD), je možné urobiť akýkoľvek záver o rozdiele v priemernej brokerskej zmluve medzi brokermi ABC a XYZ ">

H 0 : Nulová hypotéza: priemer = 18

H 1 : Alternatívna hypotéza: priemer 18 (To je to, čo chceme dokázať.)

Oblasť rejekcie: Z <= - Z 2, 5 a Z> = Z 2, 5 (pri predpokladanej 5% hladine významnosti, rozdelená po 2, 5 na každej strane).

Z = (priemer vzorky - priemer) / (std-dev / sqrt (počet vzoriek))

= (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25

Táto vypočítaná hodnota Z patrí medzi dva limity definované:

- Z 2, 5 = -1, 96 a Z 2, 5 = 1, 96.

Tým sa dospelo k záveru, že neexistujú dostatočné dôkazy, na základe ktorých by bolo možné vyvodiť záver, že existuje rozdiel medzi sadzbami vášho existujúceho makléra a nového makléra.

Alternatívne, p-hodnota = P (Z1, 25)

= 2 * 0, 1056 = 0, 2112 = 21, 12%, čo je viac ako 0, 05 alebo 5%, čo vedie k rovnakému záveru.

Graficky to predstavuje:

Kritické body pre metódu hypotetického testovania:

  • Štatistická metóda založená na predpokladoch
  • Náchylné na chyby sú podrobne opísané z hľadiska chýb alfa a beta
  • Interpretácia p-hodnoty môže byť nejednoznačná, čo môže viesť k mätúcim výsledkom

Spodný riadok

Testovanie hypotéz umožňuje matematickému modelu overiť tvrdenie alebo nápad s určitou úrovňou spoľahlivosti. Rovnako ako väčšina štatistických nástrojov a modelov je však viazaná niekoľkými obmedzeniami. O použití tohto modelu na finančné rozhodnutia by sa malo uvažovať kriticky, pričom treba mať na pamäti všetky závislosti. Na uskutočnenie podobnej analýzy sa oplatí preskúmať aj alternatívne metódy, ako napríklad Bayesovská inferencia.

Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.
Odporúčaná
Zanechajte Svoj Komentár