Hlavná » makléri » Distribúcia vzoriek

Distribúcia vzoriek

Čo je distribúcia vzoriek?

Distribúcia vzoriek je rozdelenie pravdepodobnosti štatistických údajov získaných prostredníctvom veľkého počtu vzoriek odobratých zo špecifickej populácie. Distribúcia vzorkovania danej populácie je distribúcia frekvencií rôznych výstupov, ktoré by sa mohli vyskytnúť pre štatistiku populácie.

Pochopenie distribúcie vzoriek

Mnoho údajov, ktoré akademici, štatistici, vedci, obchodníci, analytici atď. Čerpajú a používajú, sú v skutočnosti vzorky, nie populácie. Vzorka je podskupinou populácie. Napríklad lekársky výskumník, ktorý chcel porovnávať priemernú hmotnosť všetkých detí narodených v Severnej Amerike od roku 1995 do roku 2005 s tými, ktoré sa narodili v Južnej Amerike v rovnakom časovom období, nemôže v primeranom čase načítať údaje za celú populáciu viac ako milión pôrodov, ku ktorým došlo za desaťročné obdobie. Namiesto toho použije iba váhu, povedzme, 100 detí na každom kontinente, aby urobil záver. Hmotnosť 200 použitých detí je vzorka a vypočítaná priemerná hmotnosť predstavuje priemer vzorky.

Teraz predpokladajme, že namiesto toho, aby z každého kontinentu odobral iba jednu vzorku 100 novonarodených závaží, lekársky výskumník odoberie opakované náhodné vzorky z bežnej populácie a vypočíta strednú hodnotu vzorky pre každú skupinu vzoriek. Pokiaľ ide o Severnú Ameriku, zhromažďuje údaje o 100 novonarodených závažiach zaznamenaných v USA, Kanade a Mexiku takto: štyri 100 vzoriek z vybraných nemocníc v USA, päť 70 vzoriek z Kanady a tri 150 záznamov z Mexika, a to celkom z 1200 hmotností novorodencov zoskupených do 12 sád. Zhromažďuje tiež vzorové údaje o 100 pôrodných hmotnostiach z každej z 12 krajín Južnej Ameriky.

Každá vzorka má svoj vlastný priemer vzorky a distribúcia prostriedkov vzorky je známa ako distribúcia vzorky.

Priemerná hmotnosť vypočítaná pre každú súpravu vzoriek je distribúcia vzorkovania strednej hodnoty. Zo vzorky sa dá vypočítať nielen priemer. Ostatné štatistické údaje, ako napríklad štandardná odchýlka, rozptyl, pomer a rozsah, sa dajú vypočítať z údajov vzorky. Štandardná odchýlka a rozptyl meria variabilitu distribúcie vzorkovania.

Počet pozorovaní v populácii, počet pozorovaní vo vzorke a postup použitý na zostavenie súborov vzoriek určujú variabilitu distribúcie vzorkovania. Štandardná odchýlka distribúcie vzorkovania sa nazýva štandardná chyba. Zatiaľ čo priemer distribúcie vzorkovania sa rovná priemeru populácie, štandardná chyba závisí od štandardnej odchýlky populácie, veľkosti populácie a veľkosti vzorky.

Znalosť toho, ako sú priemery každého súboru vzoriek od seba a od priemeru populácie rozptýlené, udáva, ako blízko je priemer vzorky k priemeru populácie. S rastúcou veľkosťou vzorky sa štandardná chyba distribúcie vzoriek znižuje.

Osobitné úvahy

Populácia alebo jedna vzorová množina čísel bude mať normálne rozdelenie. Pretože však distribúcia vzorkovania zahŕňa viac sérií pozorovaní, nemusí mať nevyhnutne zvonovito zakrivený tvar.

Podľa nášho príkladu má priemerná hmotnosť detí v Severnej Amerike a Južnej Amerike normálne rozloženie, pretože niektoré deti budú mať podváhu (pod priemerom) alebo nadváhu (nad priemerom), pričom väčšina detí sa bude pohybovať medzi (okolo priemeru) ). Ak je priemerná hmotnosť novorodencov v Severnej Amerike sedem libier, priemerná hmotnosť vzorky v každej z 12 sérií pozorovaní vzorky zaznamenaných pre Severnú Ameriku sa bude tiež blížiť k siedmim librám.

Ak však zakreslíte každý z priemerov vypočítaných v každej zo 1200 skupín vzoriek, výsledný tvar môže mať za následok rovnomerné rozdelenie, je však ťažké s istotou predpovedať, aký bude skutočný tvar. Čím viac vzoriek výskumník použije z populácie s viac ako miliónom čísel, tým viac grafu začne tvoriť normálnu distribúciu.

Distribúcia vzoriek je rozdelenie pravdepodobnosti štatistických údajov získaných prostredníctvom veľkého počtu vzoriek odobratých zo špecifickej populácie.
Distribúcia vzorkovania danej populácie je distribúcia frekvencií rôznych výstupov, ktoré by sa mohli vyskytnúť pre štatistiku populácie.
Mnoho údajov, ktoré akademici, štatistici, vedci, obchodníci a analytici čerpajú a používajú, sú v skutočnosti vzorky, nie populácie.

Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.

Súvisiace podmienky

Ako fungujú štandardné chyby Štandardná chyba je štandardná odchýlka vzorky. Meria presnosť, s akou vzorka predstavuje populáciu. viac Čo je to centrálna limitná veta (CLT)? Centrálna limitná veta uvádza, že distribúcia vzorky znamená približne normálne rozdelenie, keď sa veľkosť vzorky zväčšuje. viac Definícia T-testu T-test je typ inferenciálnej štatistiky, ktorá sa používa na určenie, či existuje významný rozdiel medzi prostriedkami dvoch skupín, ktoré môžu súvisieť s určitými vlastnosťami. viac Pochopenie štatistík populácie V štatistike je populácia celá skupina, z ktorej sa čerpá štatistická vzorka. Obyvateľstvo sa môže vzťahovať na celú skupinu ľudí, predmety, udalosti, návštevy nemocnice alebo merania. viac Ako funguje neparametrická štatistika Neparametrická štatistika sa vzťahuje na štatistickú metódu, pri ktorej údaje nie sú potrebné pre normálne rozdelenie. Hodnotenie by sa nemalo meniť. viac Pochopenie dvojstranných testov Dvojstranný test je štatistický test, v ktorom je kritická oblasť rozdelenia dvojstranná a testuje, či je vzorka väčšia alebo menšia ako určitý rozsah hodnôt. ďalšie partnerské odkazy

← Obchodna komora

nastavenie →

Odporúčaná

Zanechajte Svoj Komentár