vzorka

algoritmické obchodovanie : vzorka
Čo je to vzorka?

Vzorka sa týka menšej, spravovateľnej verzie väčšej skupiny. Je to podmnožina obsahujúca charakteristiky väčšej populácie. Vzorky sa používajú pri štatistickom testovaní, ak sú veľkosti populácie príliš veľké na to, aby test obsahoval všetky možné členy alebo pozorovania. Vzorka by mala predstavovať populáciu ako celok a nemala by odrážať žiadne skreslenie voči konkrétnemu atribútu.

Kľúčové jedlá

  • Vzorka sa týka menšej zvládnuteľnej verzie väčšej skupiny alebo podskupiny väčšej populácie.
  • Používanie vzoriek umožňuje vedcom uskutočňovať štúdie ľahko a včas.
  • Aby sa dosiahla nestranná vzorka, výber musí byť náhodný, takže každý z populácie má rovnakú a pravdepodobnú pravdepodobnosť, že sa pridá do skupiny vzoriek.
  • Pri jednoduchom náhodnom výbere je každá entita v populácii identická, zatiaľ čo stratifikovaný náhodný výber rozdeľuje celkovú populáciu do menších skupín.

Pochopenie vzoriek

Vzorka je nezaujatý počet pozorovaní odobratých z populácie. V základnom vyjadrení populácia predstavuje celkový počet jednotlivcov, zvierat, položiek, pozorovaní, údajov atď. Daného subjektu. Vzorka, inými slovami, je časťou, časťou alebo zlomkom celej skupiny a pôsobí ako podskupina populácie. Vzorky sa používajú v rôznych prostrediach, kde sa vykonáva výskum. Vedci, obchodníci, vládne agentúry, ekonómovia a výskumné skupiny patria medzi tých, ktorí používajú vzorky na svoje štúdie a merania.

Využitie celej populácie na výskum prichádza s výzvami, a preto sa používajú vzorky. Výskumní pracovníci môžu mať problémy s ľahkým prístupom k celej populácii. A kvôli charakteru niektorých štúdií môžu mať vedci ťažkosti so získaním požadovaných výsledkov včas. Preto ľudia, ktorí uskutočňujú štúdie, používajú vzorky. Použitie menšieho počtu ľudí, ktorí zastupujú celú populáciu, môže stále viesť k platným výsledkom a zároveň znižovať čas a zdroje.

Vzorky, ktoré používajú vedci, by sa mali veľmi podobať populácii. Všetci účastníci vzorky by mali mať rovnaké vlastnosti a vlastnosti. Takže, ak sa štúdia týka mužských vysokoškolákov, vzorka by mala byť malým percentom mužov, ktorí zodpovedajú tomuto popisu. Podobne, ak výskumná skupina vykonáva štúdiu o spánkových schémach slobodných žien nad 50 rokov, vzorka by mala zahŕňať iba ženy v rámci tejto demografickej skupiny.

Zoberme si tím akademických výskumníkov, ktorí chcú vedieť, koľko študentov študovalo na skúšku CFA menej ako 40 hodín a stále ich zložilo. Keďže skúšku absolvuje každý rok globálne viac ako 200 000 ľudí, oslovenie každého účastníka skúšky môže byť veľmi únavné a časovo náročné. V skutočnosti by v čase, keď boli údaje o populácii zhromaždené a analyzované, uplynulo niekoľko rokov, čo by viedlo k zbytočnej analýze, pretože by sa objavila nová populácia. Vedci môžu namiesto toho urobiť vzorku populácie a získať údaje z tejto vzorky.

Ak chcete získať nezaujatú vzorku, výber musí byť náhodný, takže každý z populácie má rovnakú šancu na pridanie do skupiny.

Aby sa dosiahla nestranná vzorka, výber musí byť náhodný, takže každý z populácie má rovnakú a pravdepodobnú pravdepodobnosť, že sa pridá do skupiny vzoriek. Je to podobné žrebovaniu z lotérií a je to základ jednoduchého náhodného výberu.

Druhy odberu vzoriek

Jednoduchý náhodný odber vzoriek

Jednoduchý náhodný výber je ideálny, ak je každá entita v populácii identická. Ak sa vedcom nezaujíma, či sú ich vzorkami všetci muži alebo ženy alebo či sú kombináciou oboch pohlaví v nejakej forme, môže byť náhodný výber náhodnou technikou.

Povedzme, že v roku 2016 sa na skúške CFA zúčastnilo 200 000 testujúcich, z ktorých 40% boli ženy a 60% muži. Náhodná vzorka vybraná z populácie by preto mala mať 400 žien a 600 mužov, čo je spolu 1 000 testovaných.

Ale čo prípady, keď je dôležité poznať pomer mužov a žien, ktorí prešli testom po štúdiu trvajúcom menej ako 40 hodín? Tu by bola vhodnejšia stratifikovaná náhodná vzorka ako jednoduchá náhodná vzorka.

Stratifikovaný náhodný odber vzoriek

Tento typ odberu vzoriek, tiež označovaný ako pomerný náhodný výber alebo náhodný výber podľa kvót, rozdeľuje celkovú populáciu do menších skupín. Sú známe ako vrstvy. Ľudia vo vrstvách majú podobné vlastnosti.

Čo keby bol vek dôležitým faktorom, ktorý by vedci chceli zahrnúť do svojich údajov? Použitím stratifikovanej náhodnej techniky vzorkovania by mohli vytvoriť vrstvy alebo vrstvy pre každú vekovú skupinu. Výber z každej vrstvy by musel byť náhodný, takže každý v zátvorke má pravdepodobne šancu byť zahrnutý do vzorky. Napríklad dvaja účastníci, Alex a David, majú 22 a 24 rokov. Výber vzorky nemôže vyberať jeden cez druhý na základe nejakého preferenčného mechanizmu. Obaja by mali mať rovnakú šancu byť vybraní zo svojej vekovej skupiny. Vrstva by mohla vyzerať asi takto:

Z tabuľky je populácia rozdelená do vekových skupín. Napríklad 30 000 ľudí vo veku od 20 do 24 rokov absolvovalo v roku 2016 skúšku CFA. Pri použití rovnakého podielu bude mať vzorová skupina (30 000 ÷ 200 000) x 1 000 = 150 osôb, ktoré patria do tejto skupiny. Alex alebo David - alebo oboje alebo žiadne - môžu byť zaradení medzi 150 účastníkov náhodnej skúšky.

Existuje mnoho ďalších vrstiev, ktoré by sa mohli zostaviť pri rozhodovaní o veľkosti vzorky. Niektorí vedci môžu pri rozhodovaní o tom, ako vytvoriť vzorku, naplniť pracovné funkcie, krajiny, rodinný stav atď.

Príklady vzoriek

V roku 2017 tvorila populácia sveta 7, 5 miliardy, z toho 49, 6% žien a 50, 4% mužov. Celkový počet ľudí v ktorejkoľvek danej krajine môže byť aj veľkosť populácie. Celkový počet študentov v meste môže byť považovaný za populáciu a celkový počet psov v meste je tiež veľkosť populácie. Z týchto populácií je možné odobrať vzorky na výskumné účely.

Podľa nášho príkladu skúšky CFA mohli výskumníci odobrať vzorku 1 000 účastníkov CFA z celkového počtu 200 000 testujúcich - populácie - a spustiť požadované údaje o tomto počte. Priemer tejto vzorky by sa použil na odhad priemeru účastníkov skúšok CFA, ktorí zložili skúšku, aj keď študovali iba menej ako 40 hodín.

Vybraná skupina vzoriek by nemala byť skreslená. To znamená, že ak je priemerný počet účastníkov z 1 000 účastníkov CFA 50, priemerný počet obyvateľov z 200 000 účastníkov testu by mal byť tiež približne 50.

Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.

Súvisiace podmienky

Čítanie do stratifikovaného náhodného odberu vzoriek Stratifikovaný náhodný odber vzoriek je metóda odberu vzoriek, ktorá zahŕňa rozdelenie populácie do menších skupín známych ako strata. viac Ako fungujú jednoduché náhodné vzorky Jednoduchá náhodná vzorka je podskupina štatistickej populácie, v ktorej má každý člen podskupiny rovnakú pravdepodobnosť, že bude vybraný. Jednoduchá náhodná vzorka sa považuje za nezaujaté zobrazenie skupiny. viac Reprezentatívna vzorka sa často používa na extrapoláciu širšieho sentimentu Reprezentatívna vzorka je podskupina populácie, ktorá odráža charakteristiky celej populácie. viac Vstupy a výstupy zo systematického vzorkovania Systematické vzorkovanie je metóda náhodného výberu, pri ktorej sa vyberá náhodná vzorka z väčšej populácie. viac Pochopenie štatistík populácie V štatistike je populácia celá skupina, z ktorej sa čerpá štatistická vzorka. Obyvateľstvo sa môže vzťahovať na celú skupinu ľudí, predmety, udalosti, návštevy nemocnice alebo merania. viac Definícia vzorkovania Vzorkovanie je proces používaný v štatistickej analýze, pri ktorej sa skupina pozorovaní extrahuje z väčšej populácie. ďalšie partnerské odkazy
Odporúčaná
Zanechajte Svoj Komentár