kvartilu

algoritmické obchodovanie : kvartilu
Čo je kvartil?

Kvartil je štatistický pojem opisujúci rozdelenie pozorovaní do štyroch definovaných intervalov na základe hodnôt údajov a ich porovnania s celým súborom pozorovaní.

Pochopenie kvartilov

Aby sme porozumeli kvartilu, je dôležité chápať medián ako mieru centrálnej tendencie. Medián v štatistike je strednou hodnotou množiny čísel. Je to bod, v ktorom presne polovica údajov leží pod a nad strednou hodnotou.

Takže, pri množine 13 čísel by bol medián siedmym číslom. Šesť čísiel, ktoré predchádzajú tejto hodnote, sú najnižšie čísla v údajoch a šesť čísel za mediánom je najvyššie číslo v danom súbore údajov. Pretože stredná hodnota nie je ovplyvnená extrémnymi hodnotami alebo extrémnymi hodnotami v distribúcii, niekedy je uprednostnená pred strednou hodnotou.

Medián je spoľahlivý odhad polohy, ale nehovorí nič o tom, ako sú údaje na jednej alebo druhej strane jeho hodnoty rozptýlené alebo rozptýlené. Tam kvartil zasahuje. Kvartil meria šírenie hodnôt nad a pod priemer rozdelením rozdelenia do štyroch skupín.

Kľúčové jedlá

  • Kvartil meria šírenie hodnôt nad a pod priemerom rozdelením rozdelenia do štyroch skupín.
  • Kvartil rozdeľuje údaje do troch bodov - dolný kvartil, medián a horný kvartil, aby vytvorili štyri skupiny množín údajov.
  • Kvartily sa používajú na výpočet medzikvartilového rozsahu, ktorý je mierou variability okolo mediánu.

Ako fungujú kvartily

Rovnako ako stredná hodnota delí údaje na polovicu, takže 50% merania leží pod strednou hodnotou a 50% leží nad ňou, kvartil rozdeľuje údaje na štvrtiny, takže 25% merania je nižšie ako dolný kvartil, 50 % je menej ako priemer a 75% je menej ako horný kvartil.

Kvartil rozdeľuje údaje do troch bodov - dolný kvartil, medián a horný kvartil, aby vytvorili štyri skupiny množín údajov. Dolný kvartil alebo prvý kvartil sa označuje ako Q1 a je stredným číslom, ktoré spadá medzi najmenšiu hodnotu súboru údajov a medián. Druhý kvartil Q2 je tiež mediánom. Horný alebo tretí kvartil označený ako Q3 je stredný bod, ktorý leží medzi stredným a najvyšším počtom distribúcií.

Teraz môžeme zmapovať štyri skupiny tvorené z kvartilov. Prvá skupina hodnôt obsahuje najmenšie číslo do Q1; druhá skupina zahŕňa Q1 až medián; tretia súprava je stredná hodnota pre Q3; štvrtá kategória obsahuje Q3 až po najvyšší dátový bod celého súboru.

Každý kvartil obsahuje 25% z celkových pozorovaní. Údaje sú spravidla usporiadané od najmenších po najväčšie:

  1. Prvý kvartil: najnižšie 25% z čísel
  2. Druhý kvartil: medzi 25, 1% a 50% (do strednej hodnoty)
  3. Tretí kvartil: 51% až 75% (nad mediánom)
  4. Štvrtý kvartil: najvyšších 25% z čísel

Príklad kvartilu

Poďme pracovať s príkladom. Predpokladajme, že rozdelenie matematických skóre v triede 19 študentov vo vzostupnom poradí je:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98.

Najprv označte medián Q2, ktorý je v tomto prípade desiata hodnota: 75.

Q1 je stredný bod medzi najmenším skóre a mediánom. V tomto prípade Q1 spadá medzi prvé a piate skóre: 68. [Všimnite si, že stredná hodnota sa môže zahrnúť aj pri výpočte Q1 alebo Q3 pre nepárnu množinu hodnôt. Keby sme mali zahrnúť strednú hodnotu na oboch stranách stredného bodu, potom Q1 bude stredná hodnota medzi prvým a desiatym skóre, čo je priemer piateho a šiesteho skóre - (piate + šieste) / 2 = (68 + 69) / 2 = 68, 5].

Q3 je stredná hodnota medzi Q2 a najvyšším skóre: 84. [Alebo, ak uvediete strednú hodnotu, Q3 = (82 + 84) / 2 = 83].

Teraz, keď máme svoje kvartily, interpretujme ich počet. Skóre 68 (Q1) predstavuje prvý kvartil a predstavuje 25. percentil. 68 je stredná hodnota dolnej polovice skóre stanoveného v dostupných údajoch, tj stredná hodnota skóre od 59 do 75.

Q1 nám hovorí, že 25% skóre je menej ako 68 a 75% skóre triedy je vyššie. Q2 (medián) je 50. percentil a ukazuje, že 50% skóre je menej ako 75 a 50% skóre je nad 75. Nakoniec, Q3, 75. percentil, ukazuje, že 25% skóre je viac a 75% je menej ako 84.

Osobitné úvahy

Ak je dátový bod pre Q1 ďalej od mediánu ako Q3 od mediánu, potom môžeme povedať, že medzi menšími hodnotami súboru údajov je väčší rozptyl ako medzi väčšími hodnotami. Rovnaká logika platí, ak je Q3 ďalej od Q2 ako Q1 od mediánu.

Alternatívne, ak existuje párny počet údajových bodov, medián bude priemerom stredných dvoch čísel. V našom príklade vyššie, ak by sme mali 20 študentov namiesto 19, medián ich skóre bude aritmetickým priemerom desiateho a jedenásteho čísla.

Kvartily sa používajú na výpočet medzikvartilového rozsahu, ktorý je mierou variability okolo mediánu. Interkvartilný rozsah sa jednoducho vypočíta ako rozdiel medzi prvým a tretím kvartilom: Q3 - Q1. V skutočnosti je to rozsah strednej polovice údajov, ktorý ukazuje, ako sú údaje rozložené.

Pre veľké množiny údajov má program Microsoft Excel funkciu QUARTILE na výpočet kvartilov.

Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.

Súvisiace podmienky

Ako funguje kvantitatívna metóda Decile Decile je kvantitatívna metóda rozdelenia súboru klasifikovaných údajov do 10 rovnako veľkých podsekcií. Tento typ klasifikácie údajov sa vykonáva ako súčasť mnohých akademických a štatistických štúdií v oblasti financií a ekonómie. viac popisná štatistika Opisná štatistika je súbor krátkych popisných koeficientov, ktoré sumarizujú daný súbor údajov predstavujúci celú populáciu alebo vzorku. viac kvintilov Definícia Kvintil je štatistická hodnota súboru údajov, ktorá predstavuje 20% danej populácie. viac Ako používať priemer Winsorized Priemer Winsorized znamená metóda spriemerovania, ktorá spočiatku nahrádza najmenšie a najväčšie hodnoty údajmi, ktoré sú im najbližšie. Deje sa tak, aby sa obmedzil vplyv abnormálnych extrémnych hodnôt alebo odľahlých hodnôt na výpočet. viac Limity troch sigma: Čo potrebujete vedieť Limity troch sigma je štatistický výpočet, ktorý odkazuje na údaje v rámci troch štandardných odchýlok od priemeru. viac Definícia štandardnej odchýlky Štandardná odchýlka je štatistika, ktorá meria rozptyl súboru údajov v pomere k jeho priemeru a vypočíta sa ako druhá odmocnina rozptylu. Vypočíta sa ako druhá odmocnina rozptylu stanovením zmeny medzi každým dátovým bodom relatívne k priemeru. ďalšie partnerské odkazy
Odporúčaná
Zanechajte Svoj Komentár