Co jsou třídy histogramu?
Třídy histogramu jsou rozsahy hodnot, které obsahují datové body ve frekvenčním rozdělení nebo tabulku prvotních dat. Nazývají se také intervaly, zásobníky nebo šířky zásobníků. V histogramu, typu sloupcového grafu, jsou tyto třídy znázorněny jako vertikální sloupce, kde výška sloupce označuje počet datových bodů obsažených v rozsahu tříd. Typicky je vybrána třída histogramu pro zlepšení vizuální reprezentace statistik nebo trendů dat.
Pokud je k dispozici velké množství dat, je histogram zvláště užitečný pro znázornění tvaru jeho distribuce. Celý rozsah dat je rozdělen na intervaly a počet datových bodů, které spadají do každého, se spočítá, aby se dala frekvence třídy. Rozsah nebo šířka intervalu určuje počet tříd histogramu a ovlivňuje tvar grafu.
Pokud je interval příliš široký, mohou být vynechány významné informace, protože třídy jsou příliš obsáhlé. Pokud je výběr šířky intervalu příliš úzký, může nízká frekvence třídy dávat nepřiměřený význam tomu, co je vlastně náhodná změna. Existuje několik metod pro nastavení odpovídajícího počtu tříd histogramu pro datovou sadu.
Podle Sturgisova pravidla by měl být počet tříd blízký základnímu logu 2 datových bodů plus jedna. Podle Riceova pravidla by měl být počet definovaných tříd dvojnásobkem kořenové krychle počtu datových bodů. Bez ohledu na to, která metoda se používá při výběru počtu tříd histogramu, je třeba vyzkoušet několik různých šířek, aby se otestovala citlivost tvaru histogramu na velikost třídy. Správný počet tříd je ten, který nejlépe vystihuje distribuci dat.
Se správným počtem tříd histogramů pro rozsah dat by mělo dojít k smysluplnému grafickému znázornění, které umožní jasnou interpretaci. Histogram by měl ukazovat střed a šíření dat, jakoukoli skebnost nebo datovou asymetrii a odlehlé hodnoty nebo datové body vyskytující se mimo očekávaný rozsah hodnot. Režim nebo nejčastěji se vyskytující hodnota by měla být zřejmá stejně jako seskupení, která by mohla naznačovat vícenásobnou modalitu. Analýza histogramu může také naznačovat chyby v procesu sběru dat.
Histogramy, které se již dlouho používají ve financích a společenských vědách, se v grafických displejích spotřební elektroniky stávají více známými. Digitální fotografie je zvláště otevřená jejich použití, s mnoha fotoaparáty s barevným histogramem pro indikaci vyvážení bílé a expozice. Histogram digitální fotografie může také zobrazovat pixely jako třídy histogramu vynesené proti odstínům šedé.