Jaké jsou nejlepší tipy pro vytvoření histogramu?
Vytvoření histogramu je efektivní způsob zobrazení univariačních dat způsobem, který odráží distribuci dat. Při vytváření histogramů je třeba zvážit několik proměnných, počínaje skutečnou analýzou nezpracovaných údajů až po preference zamýšleného publika. Při vytváření optimálního histogramu je třeba pečlivě zvážit povahu údajů, analýzu dat, preference publika a software nebo materiály, které jsou k dispozici.
Před vytvořením histogramu je důležité zvážit povahu analyzovaných dat. Histogramy se obecně používají k zobrazení distribuce univariačních datových souborů. Konkrétněji, histogramy jsou vizuální reprezentací distribuce frekvence dat nebo funkce hustoty pravděpodobnosti. Před vytvořením histogramu je vhodné zvážit alternativní grafy, které by mohly lépe reprezentovat data.
Je-li histogram skutečně nejlepší volbou pro reprezentaci dat, další proměnnou, kterou je třeba zvážit, je zamýšlené publikum. Vysokoškolští profesoři, učitelé středních škol, matematičtí manažeři a spotřebitelé médií mohou mít různá očekávání a požadavky. Například, profesor matematiky může chtít vidět histogram konstruovaný na grafickém papíře ručně pro přiřazení ve statistice, zatímco inženýrský manažer může chtít vidět histogram ve specifickém formátu požadovaném společností. Ve všech případech jsou snadno čitelné štítky na osách a elegantní, přesná konstrukce žádoucími vlastnostmi.
Ruční vytváření histogramu je metoda, s níž se studenti statistik nejčastěji setkávají. Nejprve se vypočítají velikosti přihrádek a označí se na vodorovné stupnici. V praxi lze druhou mocninu počtu pozorování v sadě dat použít k určení počtu rovnoměrně rozložených zásobníků. Svislé měřítko je pak označeno kmitočty koše nebo relativními kmitočty. Nad každou přihrádkou se používá přímý okraj k nakreslení obdélníku s výškou rovnající se odpovídající frekvenci přihrádky a osy jsou jasně označeny.
K vytvoření histogramu lze také použít softwarové balíčky. Moderní statistické programy nabízejí celou řadu služeb, které přesahují rámec samotného histogramu. Tyto programy mohou vytvářet barevné histogramy, předpovídat normálnost dat, nabízet předpovědi funkce hustoty pravděpodobnosti překrývající se na samotných datech a vypočítávat jednoduché statistiky. Pro profesionální práci jsou softwarové balíčky často nejlepší volbou pro vytvoření histogramu z důvodu přidané sofistikovanosti v analýze a vylepšené prezentace.