Hlavná » makléri » T-test

T-test

makléri : T-test
Čo je T-test?

T-test je typ inferenčnej štatistiky použitej na určenie, či existuje významný rozdiel medzi prostriedkami dvoch skupín, ktoré môžu súvisieť s určitými znakmi. Používa sa väčšinou, keď súbory údajov, rovnako ako súbory údajov zaznamenané ako výsledok 100-násobného vyhodenia mincí, budú sledovať normálne rozdelenie a môžu mať neznáme odchýlky. T-test sa používa ako nástroj na testovanie hypotéz, ktorý umožňuje testovanie predpokladu uplatniteľného na populáciu.

T-test sa zameriava na štatistiku t, hodnoty distribúcie t a stupne voľnosti, aby sa určila pravdepodobnosť rozdielu medzi dvoma súbormi údajov. Na vykonanie testu s tromi alebo viacerými premennými sa musí použiť analýza rozptylu.

01:38

T-test

Vysvetlenie testu T

T-test v podstate umožňuje porovnávať priemerné hodnoty týchto dvoch súborov údajov a určiť, či pochádzajú z tej istej populácie. Ak by sme vo vyššie uvedených príkladoch odobrali vzorku študentov z triedy A a ďalšiu vzorku študentov z triedy B, neočakávali by sme, že budú mať presne rovnakú strednú a štandardnú odchýlku. Podobne by vzorky odobraté z kontrolnej skupiny kŕmenej placebom a vzorky odobraté zo skupiny predpísanej liečivom mali mať mierne odlišnú strednú a štandardnú odchýlku.

Matematicky t-test odoberie vzorku z každej z týchto dvoch sád a stanoví problémové vyhlásenie za predpokladu nulovej hypotézy, že tieto dva prostriedky sú rovnaké. Na základe použiteľných vzorcov sa určité hodnoty vypočítajú a porovnajú so štandardnými hodnotami a predpokladaná nulová hypotéza sa podľa toho akceptuje alebo zamietne.

Ak sa nulová hypotéza kvalifikuje ako zamietnutá, znamená to, že údaje sú silné a nie sú náhodné. T-test je iba jedným z mnohých testov použitých na tento účel. Štatistici musia navyše používať iné testy ako t-test, aby preskúmali viac premenných a testy s väčšími veľkosťami vzoriek. Pre veľkú veľkosť vzorky používajú štatistici z-test. Medzi ďalšie možnosti testovania patrí test chí-kvadrát a f-test.

Existujú tri typy t-testov a sú klasifikované ako závislé a nezávislé t-testy.

Kľúčové jedlá

  • T-test je typ inferenčnej štatistiky použitej na určenie, či existuje významný rozdiel medzi prostriedkami dvoch skupín, ktoré môžu súvisieť s určitými znakmi.
  • T-test je jedným z mnohých testov používaných na účely testovania hypotéz v štatistike.
  • Výpočet t-testu vyžaduje tri kľúčové hodnoty údajov. Zahŕňajú rozdiel medzi strednými hodnotami z každého súboru údajov (nazývaný stredný rozdiel), smerodajná odchýlka každej skupiny a počet hodnôt údajov z každej skupiny.
  • Existuje niekoľko rôznych typov t-testov, ktoré možno vykonať v závislosti od požadovaných údajov a typu analýzy.

Nejasné výsledky skúšky

Zvážte, že výrobca liekov chce testovať novo vynájdený liek. Postupuje podľa štandardného postupu vyskúšania lieku na jednej skupine pacientov a podania placeba inej skupine, ktorá sa nazýva kontrolná skupina. Placebo podávané kontrolnej skupine je látka bez zamýšľanej terapeutickej hodnoty a slúži ako meradlo na meranie toho, ako reaguje druhá skupina, ktorej je dané skutočné liečivo.

Po liekovej skúške hlásili členovia kontrolnej skupiny kŕmenej placebom priemernú dĺžku života o tri roky, zatiaľ čo členovia skupiny, ktorej bolo predpísané nové liečivo, uviedli zvýšenie priemernej dĺžky života o štyri roky. Okamžité pozorovanie môže naznačovať, že liek skutočne funguje, pretože výsledky sú pre skupinu, ktorá liek užíva, lepšie. Je však tiež možné, že pozorovanie môže byť spôsobené náhodnou udalosťou, najmä prekvapením. T-test je užitočný na zistenie, či sú výsledky skutočne správne a použiteľné pre celú populáciu.

V škole dosiahlo 100 študentov v triede A priemerne 85% so štandardnou odchýlkou ​​3%. Ďalších 100 študentov patriacich do triedy B dosiahlo v priemere 87% so štandardnou odchýlkou ​​4%. Aj keď je priemer triedy B lepší ako výkon triedy A, nemusí byť správne dospieť k záveru, že celkový výkon študentov v triede B je lepší ako výkon študentov v triede A. Je to preto, že spolu s znamená, že štandardná odchýlka triedy B je tiež vyššia ako odchýlka triedy A. Znamená to, že ich extrémne percentá boli na spodných a vyšších stranách oveľa rozmiestnené v porovnaní s triedou A. T-test môže pomôcť určiť ktorá trieda sa darila lepšie.

Predpoklady T-testu

  1. Prvý predpoklad týkajúci sa t-testov sa týka rozsahu merania. Predpokladom pre t-test je to, že mierka použitá na zozbierané údaje sleduje kontinuálnu alebo ordinálnu stupnicu, ako sú skóre pre IQ test.
  2. Druhým predpokladom je predpoklad jednoduchej náhodnej vzorky, že údaje sa zbierajú z reprezentatívnej, náhodne vybranej časti celkovej populácie.
  3. Tretím predpokladom sú údaje, keď sú vynesené do grafu, výsledkom je normálna distribučná krivka tvaru distribúcie.
  4. Štvrtý predpoklad je, že sa použije primerane veľká veľkosť vzorky. Väčšia veľkosť vzorky znamená, že rozdelenie výsledkov by sa malo priblížiť k normálnej zvonovitej krivke.
  5. Posledným predpokladom je homogenita rozptylu. Homogénna alebo rovnaká odchýlka existuje, keď sú štandardné odchýlky vzoriek približne rovnaké.

Výpočet T-testov

Výpočet t-testu vyžaduje tri kľúčové hodnoty údajov. Zahŕňajú rozdiel medzi strednými hodnotami z každého súboru údajov (nazývaný stredný rozdiel), smerodajná odchýlka každej skupiny a počet hodnôt údajov z každej skupiny.

Výsledkom t-testu je hodnota t. Táto vypočítaná t-hodnota sa potom porovná s hodnotou získanou z tabuľky kritických hodnôt (nazývanej tabuľka distribúcie T). Toto porovnanie pomáha určiť, aká je pravdepodobnosť, že rozdiel medzi prostriedkami, ktoré sa vyskytli náhodou, alebo či súbory údajov skutočne majú vnútorné rozdiely. T-test kladie otázku, či rozdiel medzi skupinami predstavuje skutočný rozdiel v štúdii alebo či je to pravdepodobne nezmyselný štatistický rozdiel.

T-distribučné tabuľky

Tabuľka distribúcie T je k dispozícii vo formátoch s jedným chvostom a s dvoma chvostmi. Prvý sa používa na posudzovanie prípadov, ktoré majú pevnú hodnotu alebo rozsah s jasným smerom (pozitívny alebo negatívny). Aká je napríklad pravdepodobnosť, že výstupná hodnota zostane pod -3, alebo sa dostane viac ako sedem pri hádzaní kociek? Ten sa používa na analýzu viazania rozsahu, napríklad na zisťovanie, či súradnice klesajú medzi -2 a +2.

Výpočty sa môžu vykonávať pomocou štandardných softvérových programov, ktoré podporujú potrebné štatistické funkcie, ako sú funkcie nájdené v MS Excel.

Hodnoty T a stupne slobody

Výsledkom t-testu sú dve hodnoty: t-hodnota a stupne voľnosti. Hodnota t je pomer rozdielu medzi strednou hodnotou dvoch súprav vzoriek a rozdielom, ktorý existuje v súpravách vzoriek. Zatiaľ čo hodnota čitateľa (rozdiel medzi priemerom dvoch vzoriek) je jednoduchá na výpočet, menovateľ (rozdiel, ktorý existuje v súboroch vzoriek) sa môže stať trochu komplikovaným v závislosti od typu použitých dátových hodnôt. Menovateľ pomeru je miera rozptylu alebo variability. Vyššie hodnoty t-hodnoty, tiež nazývané t-skóre, naznačujú, že medzi týmito dvoma súbormi vzoriek existuje veľký rozdiel. Čím je menšia hodnota t, tým väčšia podobnosť existuje medzi dvoma súbormi vzoriek.

  • Veľké t-skóre naznačuje, že skupiny sú rôzne.
  • Malé t-skóre naznačuje, že skupiny sú podobné.

Stupne slobody sa vzťahujú na hodnoty v štúdii, ktorá má slobodu meniť sa a sú nevyhnutné na posúdenie dôležitosti a platnosti nulovej hypotézy. Výpočet týchto hodnôt zvyčajne závisí od počtu dátových záznamov dostupných vo vzorke.

Korelovaný (alebo párový) T-test

Korelovaný t-test sa vykonáva, keď sa vzorky zvyčajne skladajú z párov podobných jednotiek alebo ak sa vyskytnú prípady opakovaných meraní. Napríklad môžu existovať prípady opakovaného testovania tých istých pacientov - pred a po prijatí konkrétnej liečby. V takýchto prípadoch sa každý pacient používa ako kontrolná vzorka proti sebe.

Táto metóda sa uplatňuje aj v prípadoch, keď sú vzorky nejakým spôsobom spojené alebo majú porovnateľné charakteristiky, ako je porovnávacia analýza zahŕňajúca deti, rodičov alebo súrodencov. Korelované alebo párové t-testy sú závislého typu, pretože sa jedná o prípady, keď sú dve súbory vzoriek navzájom prepojené.

Vzorec na výpočet t-hodnoty a stupňov voľnosti pre párový t-test je:

  • Priemer 1 a priemer 2 sú priemerné hodnoty každej zo súborov vzoriek, zatiaľ čo var1 a var2 predstavujú rozptyl každej zo súborov vzoriek.

Zostávajúce dva typy patria do nezávislých t-testov. Vzorky týchto typov sa vyberajú navzájom nezávisle - to znamená, že súbory údajov v týchto dvoch skupinách sa netýkajú rovnakých hodnôt. Patria sem prípady ako skupina 100 pacientov rozdelená do dvoch skupín po 50 pacientov. Jedna zo skupín sa stáva kontrolnou skupinou a dostáva sa placebo, zatiaľ čo druhá skupina dostáva predpísanú liečbu. Toto predstavuje dve nezávislé skupiny vzoriek, ktoré nie sú vzájomne spárované.

Test T s rovnakou odchýlkou ​​(alebo spoločnou)

T-test s rovnakou rozptylom sa používa, keď je počet vzoriek v každej skupine rovnaký alebo rozptyl oboch súborov údajov je podobný. Na výpočet t-hodnoty a stupňov voľnosti pre t-test s rovnakými rozptylmi sa používa tento vzorec:

T-hodnota = stredná1 - stredná2 (n1−1) × var12 + (n2−1) × var22n1 + n2−2 × 1n1 + 1n2 kdekoľvek: stredná hodnota1 a stredná hodnota2 = priemerná hodnota každej sady vzoriek1 a var2 = kolísanie každej z sample setsn1 an2 = počet záznamov v každej vzorkovacej sade \ begin {zarovnané} & \ text {T-value} = \ frac {mean1 - mean2} {\ sqrt {\ frac {(n1 - 1) \ times var1 ^ 2 + (n2 - 1) \ times var2 ^ 2} {n1 + n2 - 2}} \ times \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { kde:} \\ & mean1 \ text {and} mean2 = \ text {Priemerné hodnoty každého} \\ & \ text {zo súprav vzoriek} \\ & var1 \ text {a} var2 = \ text {Varianty každého z vzorové sady} \\ & n1 \ text {and} n2 = \ text {Počet záznamov v každej vzorkovacej sade} \\ \ end {zarovnaný} T-hodnota = n1 + n2−2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 priemer1 −2 priemer: kde stredný1 a stredný2 = priemerné hodnoty každého súboru vzoriekv1 a var2 = variácia každého súboru vzoriekn1 an2 = počet záznamov v každej vzorke sada

a

Stupne slobody = n1 + n2−2 kdekoľvek: n1 a n2 = Počet záznamov v každej vzorkovacej množine \ begin {zarovnané} & \ text {Stupne slobody} = n1 + n2 - 2 \\ & \ textbf {kde:} \\ & n1 \ text {and} n2 = \ text {Počet záznamov v každej vzorkovacej sade} \\ \ end {zarovnaný} Stupne slobody = n1 + n2−2 kdekoľvek: n1 a n2 = Počet záznamov v každej vzorkovacej sade

Test nerovnomernej variácie

Nerovnomerný rozptyl t-test sa používa, keď je počet vzoriek v každej skupine iný a rozptyl oboch súborov údajov je tiež rozdielny. Tento test sa tiež nazýva Welchov t-test. Na výpočet t-hodnoty a stupňov voľnosti pre t-test s nerovnakým rozptylom sa používa tento vzorec:

T-hodnota = stredná1 − stredná2var12n1 + var22n2 kdekoľvek: stredná1 a stredná2 = priemerné hodnoty každého súboru vzoriekvar1 a var2 = variácia každého súboru vzoriekn1 an2 = počet záznamov v každej vzorkovacej sade \ begin {align} & \ text {T-hodnota} = \ frac {mean1 - mean2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {kde:} \ \ & mean1 \ text {and} mean2 = \ text {Priemerné hodnoty každého} \\ & \ text {zo súprav vzoriek} \\ & var1 \ text {a} var2 = \ text {Odchýlky od všetkých súprav vzoriek} \ \ & n1 \ text {and} n2 = \ text {Počet záznamov v každej vzorkovacej sade} \\ \ end {zarovnaný} T-hodnota = n1var12 + n2var22 stredná1 − stredná2 kde: stredná1 a stredná2 = priemerné hodnoty z každého súboru vzoriekvar1 a var2 = Variácia každého súboru vzorieknn an2 = počet záznamov v každej skupine vzoriek

a

Stupne slobody = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2−1 kdekoľvek: var1 a var2 = variácia každej zo súboru vzoriekn1 an2 = počet záznamov v každej vzorkovacej sade \ begin {zarovnaný } & \ text {Degrees of Freedom} = \ frac {\ left (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ right) ^ 2} {\ frac {\ left ( \ frac {var1 ^ 2} {n1} \ right) ^ 2} {n1 - 1} + \ frac {\ left (\ frac {var2 ^ 2} {n2} \ right) ^ 2} {n2 - 1}} \\ & \ textbf {where:} \\ & var1 \ text {and} var2 = \ text {Variant každej zo súprav vzoriek} \\ & n1 \ text {a} n2 = \ text {Počet záznamov v každej vzorkovacej sade } \\ \ end {zarovnané} Stupne slobody = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 kde: var1 a var2 = variácie každého of sample setsn1 an2 = počet záznamov v každej vzorkovacej sade

Stanovenie správneho T-testu, ktorý sa má použiť

Nasledujúci vývojový diagram sa môže použiť na určenie toho, ktorý t-test by sa mal použiť na základe charakteristík súborov vzoriek. Medzi kľúčové položky, ktoré je potrebné zvážiť, patrí, či sú záznamy vzoriek podobné, počet záznamov s údajmi v každej sade vzoriek a rozptyl každej sady vzoriek.

Obrázok Julie Bang © Investopedia 2019

Príklad T-testu s nerovnakou odchýlkou

Predpokladajme, že vykonávame diagonálne meranie obrazov získaných v galérii umenia. Jedna skupina vzoriek obsahuje 10 obrazov, zatiaľ čo druhá skupina obsahuje 20 obrazov. Súbory údajov s príslušnými strednými a rozptylovými hodnotami sú nasledujúce:

Sada 1Sada 2
19.728.3
20.426.7
19.620.1
17.823.3
18.525.2
18.922.1
18.317.7
18.927.6
19.520.6
21.9513.7
23.2
17.5
20.6
18
23.9
21.6
24.3
20.4
23.9
13.3
znamenať19.421.6
odchýlka1.417.1

Aj keď priemer sady 2 je vyšší ako priemer sady 1, nemôžeme dospieť k záveru, že všetky maľby majú priemernú dĺžku okolo 21, 6 jednotiek, pretože rozptyl súpravy 2 je výrazne vyšší ako súprava 1. Je to náhodou alebo skutočne existujú rozdiely? v celkovej populácii všetkých obrazov získaných v galérii umenia ">

Pretože počet dátových záznamov je rozdielny (n1 = 10 a n2 = 20) a odchýlka je tiež odlišná, pre vyššie uvedenú množinu údajov sa vypočíta t-hodnota a stupne voľnosti pomocou vzorca uvedeného v teste nestejnej variácie T. oddiel.

Hodnota t je -2, 24787. Pretože znamienko mínus môže byť ignorované pri porovnávaní dvoch t-hodnôt, vypočítaná hodnota je 2, 24787.

Hodnota stupňov voľnosti je 24, 38 a je znížená na 24 v dôsledku definície vzorca, ktorá vyžaduje zaokrúhlenie hodnoty nadol na najmenšiu možnú celočíselnú hodnotu.

Vždy, keď sa predpokladá normálne rozdelenie, je možné ako kritérium prijateľnosti určiť úroveň pravdepodobnosti (hladina alfa, hladina významnosti, p ). Vo väčšine prípadov sa dá predpokladať 5% hodnota.

Pri použití hodnoty stupňa voľnosti ako 24 a 5% úrovne významnosti, pohľad na tabuľku distribúcie t-hodnôt dáva hodnotu 2, 064. Porovnanie tejto hodnoty s vypočítanou hodnotou 2, 247 naznačuje, že vypočítaná t-hodnota je vyššia ako hodnota v tabuľke pri hladine významnosti 5%. Preto je bezpečné odmietnuť nulovú hypotézu, že neexistuje žiadny rozdiel medzi prostriedkami. Súbor obyvateľov má vnútorné rozdiely a nie sú náhodné.

Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.

Súvisiace podmienky

Ako funguje analýza odchýlok (ANOVA) Analýza rozptylu (ANOVA) je nástroj štatistickej analýzy, ktorý rozdeľuje celkovú variabilitu zistenú v rámci súboru údajov na dve zložky: náhodné a systematické faktory. viac Porozumenie distribúcii T Distribúcia AT je typ pravdepodobnostnej funkcie, ktorá je vhodná na odhad parametrov populácie pre malé veľkosti vzorky alebo neznáme odchýlky. viac Definícia stupňov slobody Stupne slobody sa vzťahujú na maximálny počet logicky nezávislých hodnôt, čo sú hodnoty, ktoré sa môžu voľne meniť, vo vzorke údajov. viac Ako reziduálna štandardná odchýlka funguje Zvyšková štandardná odchýlka je štatistický pojem, ktorý sa používa na opis rozdielu v štandardných odchýlkach pozorovaných hodnôt oproti predpokladaným hodnotám, ako je znázornené bodmi v regresnej analýze. viac Ako funguje štatistika Chi Square Štatistika štvorca chi (χ2) je test, ktorý meria porovnávanie očakávaní so skutočnými pozorovanými údajmi (alebo výsledkami modelu). Údaje použité pri výpočte štatistiky štvorcov chi musia byť náhodné, nespracované, vzájomne sa vylučujúce, musia byť získané z nezávislých premenných a musia byť získané z dostatočne veľkej vzorky. viac Ako sa používa Wilcoxonov test Wilcoxonov test, ktorý odkazuje na test Rank Sum alebo Test Signed Rank, je neparametrický test, ktorý porovnáva dve spárované skupiny. ďalšie partnerské odkazy
Odporúčaná
Zanechajte Svoj Komentár