Hlavná » vedúci firmy » Chi Square (χ2) Štatistická definícia

Chi Square (χ2) Štatistická definícia

vedúci firmy : Chi Square (χ2) Štatistická definícia
Čo je štatistika Chi Square?

Štvorec chi ( χ 2 ) štatistika je test, ktorý meria porovnávanie očakávaní so skutočnými pozorovanými údajmi (alebo výsledkami modelu). Údaje použité pri výpočte štatistiky štvorcov chi musia byť náhodné, nespracované, vzájomne sa vylučujúce, musia byť získané z nezávislých premenných a musia byť získané z dostatočne veľkej vzorky. Napríklad výsledky vyhodenia mincí 100-krát spĺňajú tieto kritériá.

Testy chí kvadrát sa často používajú pri testovaní hypotéz.

Vzorec pre Chi Square Is

χc2 = ∑ (Oi − Ei) 2 kdekoľvek: c = stupne voľnostiO = pozorovaná hodnota (y) E = očakávaná hodnota (hodnoty) \ begin {zarovnané} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {pričom:} \\ & c = \ text {stupne slobody} \\ & O = \ text {pozorované hodnoty)} \\ & E ​​= \ text {očakávané hodnoty )} \\ \ end {zarovnané} χc2 = ∑Ei (Oi −Ei) 2, kde: c = stupne voľnostiO = pozorovaná hodnota (hodnoty) E = očakávaná hodnota (hodnoty)

Čo vám hovorí štatistika Chi Square?

Existujú dva hlavné druhy testov štvorcov chi: test nezávislosti, ktorý kladie otázku vzťahu, napríklad: „Existuje vzťah medzi skóre pohlaví a skóre SAT?“; a test dobrej zhody, ktorý sa pýta niečo ako „Ak je minca hodená 100-krát, príde to 50-krát hlava a 50-krát chvost?“

Pri týchto testoch sa používajú stupne voľnosti na určenie, či určitá nulová hypotéza môže byť odmietnutá na základe celkového počtu premenných a vzoriek v experimente.

Napríklad pri zvažovaní výberu študentov a kurzov nie je veľkosť vzorky 30 alebo 40 študentov dosť veľká na to, aby vygenerovala významné údaje. Získanie rovnakých alebo podobných výsledkov zo štúdie pomocou vzorky s veľkosťou 400 alebo 500 študentov je platnejšie.

V ďalšom príklade zvážte hodenie mince 100-krát. Očakávaný výsledok toho, že hodí vhodnú mincu 100-krát, je to, že hlavy prídu 50-krát a chvosty 50-krát. Skutočným výsledkom môže byť, že hlavy sa objavia 45-krát a chvosty 55-krát. Štvorcová štatistika chi ukazuje akékoľvek nezrovnalosti medzi očakávanými výsledkami a skutočnými výsledkami.

Kľúčové jedlá

  • Štvorec chi (χ 2 ) štatistika je test, ktorým sa meria porovnanie očakávaní so skutočnými pozorovanými údajmi.
  • Existujú dva hlavné druhy štvorcových testov: test nezávislosti údajov a testy vhodnosti modelu.
  • Tieto testy sa môžu použiť na určenie, či sa určitá nulová hypotéza môže pri testovaní hypotéz zamietnuť.

Príklad testu Chi Squared

Predstavte si, že náhodný prieskum sa uskutočnil u 2 000 rôznych voličov, mužov aj žien. Ľudia, ktorí odpovedali, boli klasifikovaní podľa pohlavia a podľa toho, či boli republikáni, demokrati alebo nezávislí. Predstavte si mriežku so stĺpcami označenými republikánsky, demokratický a nezávislý a dvoma riadkami označenými muž a žena. Predpokladajme, že údaje od 2 000 respondentov sú tieto:

republikánskydemokratNezávislýtotálnej
Muž400300100800
Žena5006001001200
totálnej9009002002000

Prvým krokom na výpočet štatistiky druhej mocniny je nájsť očakávané frekvencie. Vypočítajú sa pre každú „bunku“ v mriežke. Keďže existujú dve kategórie pohlavia a tri kategórie politického pohľadu, celkovo sa očakáva šesť frekvencií. Vzorec pre očakávanú frekvenciu je:

E (r, c) = n (r) × c (r) niekde: r = riadok v otázkec = stĺpec v otázke = zodpovedajúci celkový počet \ začiatok {zarovnaný} a E (r, c) = \ zlomok {n (r) \ times c (r)} {n} \\ & \ textbf {kde:} \\ & r = \ text {sporný riadok} \\ & c = \ text {sporný stĺpec} \\ & n = \ text {zodpovedajúci súčet } \\ \ end {zarovnané} E (r, c) = nn (r) × c (r) kde: r = riadok v otázkec = stĺpec v otázke = zodpovedajúci súčet

V tomto príklade sú očakávané frekvencie:

  • E (1, 1) = (900 x 800) / 2 000 = 360
  • E (1, 2) = (900 x 800) / 2 000 = 360
  • E (1, 3) = (200 x 800) / 2 000 = 80
  • E (2, 1) = (900 x 1200) / 2 000 = 540
  • E (2, 2) = (900 x 1200) / 2000 = 540
  • E (2, 3) = (200 x 1200) / 2000 = 120

Ďalej sa použijú tieto hodnoty na výpočet štatistiky chí kvadrát pomocou nasledujúceho vzorca:

Chi-kvadrát = ∑ [O (r, c) −E (r, c)] 2E (r, c) kde: O (r, c) = pozorované údaje pre daný riadok a stĺpec \ begin {align} & \ text {Chi-kvadrát} = \ sum \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {kde:} \\ & O (r, c) = \ text {pozorované údaje pre daný riadok a stĺpec} \\ \ end {zarovnané} Chi-kvadrát = ∑E (r, c) [O (r, c) −E (r, c)] 2 kde: O (r, c) = pozorované údaje pre daný riadok a stĺpec

V tomto príklade je výraz pre každú pozorovanú hodnotu:

  • O (1, 1) = (400 - 360) 2/360 = 4, 44
  • O (1, 2) = (300 - 360) 2/360 = 10
  • O (1, 3) = (100 - 80) 2/80 = 5
  • O (2, 1) = (500 - 540) 2/540 = 2, 96
  • O (2, 2) = (600 - 540) 2/540 = 6, 67
  • 0 (2, 3) = (100 - 120) 2/120 = 3, 33

Štatistika druhej mocniny sa potom rovná súčtu týchto hodnôt alebo 32, 41. Potom sa môžeme pozrieť na štatistickú tabuľku chi na druhú stranu, aby sme zistili, či je výsledok štatisticky významný alebo nie, vzhľadom na stupeň slobody v našej zostave.

Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.

Súvisiace podmienky

Definície stupňov slobody Stupne slobody sa vzťahujú na maximálny počet logicky nezávislých hodnôt, ktoré sú hodnotami, ktoré sa môžu voľne meniť, vo vzorke údajov. viac Definícia T-testu T-test je typ inferenciálnej štatistiky, ktorá sa používa na určenie, či existuje významný rozdiel medzi prostriedkami dvoch skupín, ktoré môžu súvisieť s určitými vlastnosťami. viac Čo nám hovorí inverzná korelácia Inverzná korelácia, známa tiež ako negatívna korelácia, je opačným vzťahom medzi dvoma premennými, takže sa pohybujú opačným smerom. viac Ako reziduálna štandardná odchýlka funguje Zvyšková štandardná odchýlka je štatistický pojem, ktorý sa používa na opis rozdielu v štandardných odchýlkach pozorovaných hodnôt oproti predpokladaným hodnotám, ako je znázornené bodmi v regresnej analýze. viac Ako funguje analýza odchýlok (ANOVA) Analýza rozptylu (ANOVA) je štatistický analytický nástroj, ktorý rozdeľuje celkovú variabilitu zistenú v rámci súboru údajov na dve zložky: náhodné a systematické faktory. viac Korelácia Korelácia je štatistická miera pohybu dvoch cenných papierov vo vzťahu k sebe navzájom. ďalšie partnerské odkazy
Odporúčaná
Zanechajte Svoj Komentár