Hlavná » algoritmické obchodovanie » Stratifikovaný náhodný odber vzoriek

Stratifikovaný náhodný odber vzoriek

algoritmické obchodovanie : Stratifikovaný náhodný odber vzoriek
Čo je stratifikovaný náhodný odber vzoriek?

Stratifikovaný náhodný odber vzoriek je metóda odberu vzoriek, ktorá zahŕňa rozdelenie populácie do menších podskupín známych ako vrstvy. V stratifikovanom náhodnom výbere alebo stratifikácii sú vrstvy tvorené na základe spoločných atribútov alebo charakteristík členov, ako je príjem alebo dosiahnuté vzdelanie.

Stratifikovaný náhodný odber vzoriek sa nazýva aj proporcionálny náhodný odber vzoriek alebo náhodný odber podľa kvót.

[Dôležité: Stratifikovaný odber vzoriek sa používa na zvýraznenie rozdielov medzi skupinami v populácii, na rozdiel od jednoduchého náhodného výberu, v ktorom sa so všetkými členmi populácie zaobchádza rovnako ako s rovnakou pravdepodobnosťou odberu vzoriek.]

01:40

Stratifikovaný náhodný odber vzoriek

Ako funguje stratifikovaný náhodný odber vzoriek

Pri dokončení analýzy alebo výskumu skupiny subjektov s podobnými charakteristikami môže výskumník zistiť, že veľkosť populácie je príliš veľká na to, aby mohla dokončiť výskum. V záujme šetrenia času a peňazí môže analytik zvoliť prijateľnejší prístup výberom malej skupiny obyvateľstva. Malá skupina sa označuje ako veľkosť vzorky, ktorá je podskupinou populácie, ktorá sa používa na reprezentáciu celej populácie. Vzorka môže byť vybraná z populácie niekoľkými spôsobmi, jedným z nich je stratifikovaná metóda náhodného výberu.

Stratifikovaný náhodný výber zahŕňa rozdelenie celej populácie do homogénnych skupín nazývaných vrstvy (množné číslo pre vrstvu). Z každej vrstvy sa potom vyberú náhodné vzorky. Napríklad, zvážte akademického výskumníka, ktorý by chcel vedieť počet študentov MBA v roku 2007, ktorí dostali ponuku práce do troch mesiacov od ukončenia štúdia.

Čoskoro zistí, že v tomto roku bolo takmer 200 000 absolventov MBA. Môže sa rozhodnúť, že odoberie jednoduchú náhodnú vzorku 50 000 absolventov a uskutoční prieskum. Ešte lepšie je, že by mohol rozdeliť populáciu do vrstiev a z vrstiev odobrať náhodnú vzorku. Za týmto účelom by vytvoril skupiny obyvateľstva na základe pohlavia, vekového rozsahu, rasy, krajiny národnosti a kariérneho zázemia. Náhodná vzorka z každej vrstvy sa odoberie v množstve úmernom veľkosti vrstvy v porovnaní s populáciou. Tieto podmnožiny vrstiev sa potom spoja do náhodnej vzorky.

Kľúčové jedlá

  • Stratifikovaný náhodný odber vzoriek umožňuje výskumníkom získať vzorku vzoriek, ktorá najlepšie reprezentuje celú študovanú populáciu.
  • Stratifikovaný náhodný výber zahŕňa rozdelenie celej populácie do homogénnych skupín nazývaných vrstvy.
  • Stratifikovaný náhodný odber vzoriek sa líši od jednoduchého náhodného odberu vzoriek, ktorý zahŕňa náhodný výber údajov z celej populácie, takže je pravdepodobné, že dôjde ku každej možnej vzorke.

Príklad stratifikovaného náhodného odberu vzoriek

Predpokladajme, že výskumný tím chce určiť GPA vysokoškolských študentov v USA. Výskumný tím má problémy so zhromažďovaním údajov od všetkých 21 miliónov vysokoškolských študentov; rozhoduje sa odobrať náhodnú vzorku populácie pomocou 4 000 študentov.

Teraz predpokladajme, že tím skúma rôzne atribúty účastníkov a zázrakov, ak existujú nejaké rozdiely v GPA a veciach študentov. Predpokladajme, že zistí, že 560 študentov sú anglickí odborníci, 1 135 sú vedeckí odborníci, 800 sú počítačoví odborníci, 1 090 technických inžinierov a 415 vysokoškolských matematikov. Tím chce použiť proporcionálnu stratifikovanú náhodnú vzorku, ak je vrstva vzorky úmerná náhodnej vzorke v populácii.

Predpokladajme, že tím skúma demografiu vysokoškolských študentov v USA a zistí percento toho, čo študenti považujú za dôležitých v 12% angličtiny v angličtine, 28% v oblasti vedy, 24% v oblasti informatiky, 21% v oblasti strojárstva a 15% z nich v matematike. Takto sa z stratifikovaného náhodného vzorkovacieho procesu vytvorí päť vrstiev.

Tím potom musí potvrdiť, že vrstva populácie je úmerná vrstve vo vzorke; zistia však, že proporcie nie sú rovnaké. Tím potom musí znova vzorkovať 4 000 študentov z populácie a náhodne vybrať 480 študentov angličtiny, 1 120 vedy, 960 informatiky, 840 inžinierov a 600 študentov matematiky.

S nimi má primeranú stratifikovanú náhodnú vzorku vysokoškolských študentov, ktorá poskytuje lepšie zastúpenie vysokoškolských študentov študentov v USA. Výskumníci potom môžu zvýrazniť špecifickú vrstvu, pozorovať rôzne štúdie študentov vysokých škôl v USA a pozorovať rôzne priemery bodových bodov.,

Jednoduché náhodné versus stratifikované náhodné vzorky

Jednoduché náhodné vzorky a stratifikované náhodné vzorky sú štatistickými nástrojmi merania. Na reprezentáciu celej populácie údajov sa používa jednoduchá náhodná vzorka. Stratifikovaná náhodná vzorka rozdeľuje populáciu do menších skupín alebo vrstiev na základe zdieľaných charakteristík.

Jednoduchá náhodná vzorka sa často používa, keď je k dispozícii veľmi málo informácií o dátovej populácii, keď má dátová populácia príliš veľa rozdielov na to, aby sa rozdelila na rôzne podskupiny, alebo ak je medzi populáciou údajov iba jedna odlišná charakteristika.

Napríklad cukrovinková spoločnosť môže chcieť študovať nákupné zvyklosti svojich zákazníkov, aby určila budúcnosť svojej produktovej rady. Ak existuje 10 000 zákazníkov, môže ako náhodnú vzorku použiť 100 z nich. To, čo zistí od týchto 100 zákazníkov, potom môže uplatniť na zvyšok svojej základne. Na rozdiel od stratifikácie bude vzorkovať 100 členov čisto náhodne bez ohľadu na ich individuálne charakteristiky.

Pomerné a neprimerané stratifikácie

Stratifikovaný náhodný odber vzoriek zabezpečuje, že každá podskupina danej populácie je primerane zastúpená v celej vzorkovanej populácii výskumnej štúdie. Stratifikácia môže byť primeraná alebo neprimeraná. Pri proporcionálnej stratifikovanej metóde je veľkosť vzorky každej vrstvy úmerná veľkosti populácie vrstvy.

Napríklad, ak výskumný pracovník chcel vzorku 50 000 absolventov s použitím vekového rozpätia, získava sa pomerná stratifikovaná náhodná vzorka pomocou tohto vzorca: (veľkosť vzorky / veľkosť populácie) x veľkosť vrstvy. V nasledujúcej tabuľke sa predpokladá veľkosť populácie 180 000 absolventov MBA ročne.

Veková skupina


24-28


29-33


34-37


totálnej


Počet ľudí v stratum


90, 000


60.000


30.000


180.000


Veľkosť vzorky Strata


25, 000


16667


8333


50.000


Veľkosť vzorky vrstvy pre absolventov MBA vo veku od 24 do 28 rokov sa vypočíta ako (50 000/180 000) x 90 000 = 25 000. Rovnaká metóda sa používa pre ostatné vekové skupiny. Teraz, keď je známa veľkosť vzorky vrstiev, môže vedec vykonať jednoduchý náhodný odber vzoriek v každej vrstve, aby vybral svojich účastníkov prieskumu. Inými slovami, z celej populácie bude náhodne vybraných 25 000 absolventov vo vekovej skupine 24 - 28 rokov, z populácie bude náhodne vybratých 16 667 absolventov vo veku 29 až 33 rokov a tak ďalej.

V neprimeranej stratifikovanej vzorke nie je veľkosť každej vrstvy úmerná jej veľkosti v populácii. Výskumný pracovník sa môže rozhodnúť, že bude vzorkovať 1/2 absolventov vo vekovej skupine 34 - 37 rokov a 1/3 absolventov v rámci vekovej skupiny 29 - 33 rokov.

Je dôležité poznamenať, že jedna osoba sa nemôže zmestiť do viacerých vrstiev. Každá entita sa musí zmestiť iba do jednej vrstvy. Prekrývajúce sa podskupiny znamenajú, že niektorí jednotlivci budú mať väčšie šance na výber do prieskumu, čo úplne vylučuje koncept stratifikovaného výberu ako druhu pravdepodobnostného výberu.

[Dôležitá informácia: Správcovia portfólia môžu použiť stratifikovaný náhodný výber vzoriek na vytvorenie portfólia replikáciou indexu, ako je index dlhopisov.]

Výhody stratifikovaného náhodného odberu vzoriek

Hlavnou výhodou stratifikovaného náhodného výberu je to, že zachytáva kľúčové charakteristiky populácie vo vzorke. Podobne ako vážený priemer táto metóda odberu vzoriek vytvára vo vzorke charakteristiky, ktoré sú úmerné celkovej populácii. Stratifikovaný náhodný výber funguje dobre pre populácie s rôznymi atribútmi, ale inak nie je účinný, ak nie je možné vytvoriť podskupiny.

Stratifikácia poskytuje pri odhade menšiu chybu a väčšiu presnosť ako jednoduchá metóda náhodného výberu vzoriek. Čím väčšie sú rozdiely medzi vrstvami, tým väčší je zisk v presnosti.

Nevýhody stratifikovaného náhodného odberu vzoriek

Túto metódu výskumu bohužiaľ nemožno použiť v každej štúdii. Nevýhodou metódy je, že na jej správne použitie musí byť splnených niekoľko podmienok. Výskumní pracovníci musia identifikovať každého člena študovanej populácie a klasifikovať každú z nich do jednej a iba jednej subpopulácie. Výsledkom je, že stratifikovaný náhodný výber vzoriek je nevýhodný, keď vedci nemôžu s istotou klasifikovať každého člena populácie do podskupiny. Nájdenie úplného a definitívneho zoznamu celej populácie môže byť náročné.

Prekrývanie môže byť problémom, ak existujú predmety, ktoré patria do viacerých podskupín. Ak sa vykonáva jednoduchý náhodný výber, je pravdepodobnejšie, že sa vyberú tí, ktorí sú vo viacerých podskupinách. Výsledkom by mohla byť nesprávna prezentácia alebo nepresná reflexia populácie.

Vyššie uvedené príklady uľahčujú: vysokoškolák, absolvent, muž a žena sú jasne definované skupiny. V iných situáciách by to však mohlo byť oveľa ťažšie. Predstavte si, že zahŕňa vlastnosti ako rasa, etnická príslušnosť alebo náboženstvo. Proces triedenia sa stáva ťažším, čo robí stratifikovaný náhodný odber vzoriek neefektívnym a menej ako ideálnym spôsobom.

Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.

Súvisiace podmienky

Vzorka Vzorka je menšia, spravovateľná verzia väčšej skupiny. Vzorky sa používajú na štatistické testovanie, ak sú veľkosti populácie príliš veľké. viac Ako fungujú jednoduché náhodné vzorky Jednoduchá náhodná vzorka je podskupina štatistickej populácie, v ktorej má každý člen podskupiny rovnakú pravdepodobnosť, že bude vybraný. Jednoduchá náhodná vzorka sa považuje za nezaujaté zobrazenie skupiny. viac Reprezentatívna vzorka sa často používa na extrapoláciu širšieho sentimentu Reprezentatívna vzorka je podskupina populácie, ktorá odráža charakteristiky celej populácie. viac Vstupy a výstupy zo systematického vzorkovania Systematické vzorkovanie je metóda náhodného výberu, pri ktorej sa vyberá náhodná vzorka z väčšej populácie. viac Definícia vzorkovania Vzorkovanie je proces používaný v štatistickej analýze, pri ktorej sa skupina pozorovaní extrahuje z väčšej populácie. viac Definícia T-testu T-test je typ inferenciálnej štatistiky, ktorá sa používa na určenie, či existuje významný rozdiel medzi prostriedkami dvoch skupín, ktoré môžu súvisieť s určitými vlastnosťami. ďalšie partnerské odkazy
Odporúčaná
Zanechajte Svoj Komentár