Co je to Box Plot?
Schéma boxu nebo diagram typu „box a whisker“ je metoda uspořádání číselných dat podél jediné číselné čáry, která může být horizontální nebo vertikální. Skutečný rámeček, když je graf vodorovný, sedí mírně nad číselnou čarou a skládá se ze tří svislých čar spojených dohromady vodorovnými čarami. Vodorovné ohraničení rámečku představuje první a třetí kvartil (25. a 75. percentil), oddělený středovou čarou, což je střední nebo 50. percentil dat. Na obou stranách rámečku se od středu vodorovných čar rozkládají svislé čáry, někdy nazývané kníry. Když tyto dosáhnou minimálního a maximálního počtu datových sad, končí v menších vodorovných čarách, i když se to může mírně lišit v závislosti na šíření dat.
Existuje několik důležitých prvků, které tvoří dobrý rámeček, a čísla, která lidé potřebují vědět, když vytvářejí tyto grafy. První z nich se nazývá shrnutí pěti čísel, často zkráceně pět. součet. Toto je seznam prvního a třetího kvartilu, mediánu a minimálního a maximálního počtu dat. V některých aplikacích budou lidé muset tyto seznamy uvádět v blízkosti grafu, i když analýza grafu s dobrou číselnou čarou může tato čísla odvodit také při pohledu na tři vodorovné čáry a koncové vousy. Není to otázka kuře / vejce pro osobu, která kreslí spiknutí, protože pět num. součet. musí být použit k vytvoření spiknutí.
Lidé také potřebují znát číslo zvané interquartilní rozmezí (IQR). Odečtením prvního kvartilu od třetího kvartilu se získá IQR a pomocí různých softwarových nebo vědeckých kalkulaček lze také získat toto číslo a součet pěti čísel zadáním všech dat. IQR je důležité, protože čáry vedoucí z pole obvykle přesahují pouze 1,5krát IQR. Data za tímto bodem jsou označena tečkami místo souvislé čáry. Tyto tečky často naznačují, že data mají odlehlé hodnoty.
Pro plotr boxu existuje celá řada použití. Několik grafů může být nakresleno nad jednou číselnou čarou a mohlo by porovnat podobné soubory dat rozlišené podle nějakého důležitého faktoru. Například vědci nebo statistici mohou zaznamenávat srdeční frekvenci mužů a žen a poté sestavit dva skládané krabicové grafy, aby hledali významné rozdíly v rozsahu a kvartilech.
Krabicové grafy neřeší frekvenci dat. Chybějící další měřítko (vertikální nebo horizontální) vynechává informace o opakujících se číslech, velikosti datové sady a většině individuálních čísel. Osoba, která se dívá na krabicový graf, nejvíce porozumí souhrnu pěti čísel, rozsahu a tomu, zda data mají nějaké odlehlé hodnoty. Velikost pole, poměr mediánu k kvartilům a délka vousů mohou ukazovat, zda jsou data zkreslená, ale nemohou mluvit s věcmi, jako je průměr, režim nebo standardní odchylka. Jiné grafy, jako jsou histogramy, mohou být užitečnější, když lidé chtějí reprezentovat věci, jako je frekvence nebo získat lepší vizuální informace o distribuci dat.