Co je distribuce histogramu?

Distribuce histogramu ve statistikách označuje vzory, tvary a umístění univariačních datových sloupců na histogramu. Jak a kde jsou tyče distribuovány k analýze a vyvození závěrů o datech. Histogramová distribuční analýza je důležitá při identifikaci vlastností, jako je datová normalita, multimodální distribuce a zkosená data.

Histogram je univariační displej, který používá obdélníky úměrné v oblasti k frekvencím třídy nebo bin, aby vizuálně prokazovaly funkce dat. Datové body v histogramu jsou organizovány do zásobníků a samotná distribuce histogramu je vizuální aproximací distribuce frekvence dat nebo funkce hustoty pravděpodobnosti. Tvar distribuce se může změnit na základě počtu zásobníků.

analýza histogramu se často používá jako kvalitativní kontrola normality dat. Ačkoli existují analytické metody pro stanovení normality, histogramy lze použít k poskytnutí rychlé kontroly zdravého rozumu, aby se ušetřila čas. Pokud se data histogramu objeví zhruba a soustředěná na průměr, předpokládá se, že data jsou normální. Ačkoli je to rychlý a relativně snadný, tento druh kvalitativní kontroly je subjektivní a analytické metody by měly být použity, pokud je vyžadována vyšší úroveň přesnosti.

Stanovení, zda soubor dat vykazuje skewness, je další způsob, jak lze použít analýzu distribuce histogramu. Skewness dat je v datech definována jako výrazná asymetrie. Negativní zkosení nebo zkosení doleva je vidět v datových souborech s velmi málo nízkými hodnotami. Pozitivní zkosení nebo zkosení doprava se vyskytuje v datových souborech s několika vysokými hodnotami. Pozorování rozdělení histogramu může odhalit odlehlé hodnoty a zkosená data.

Kromě odhalení charakteristik dat s jediným režimem může tvar histogramu také odhalit vlastnosti multimodálních dat. Multimodální datové soubory obsahují více než jeden režim a jsou charakterIzed frekvenční rozdělení, které mají více než jeden vrchol nebo maxima. Politická příslušnost ve městě, průzkumy veřejného mínění a velikosti těla včel jsou příklady datových souborů, které mohou být multimodální. Pozorování tvaru histogramu a zaznamenávání různých vrcholů v multimodálních datech může často poskytnout výzkumníkovi více vhledu než jednoduché univariační statistické výpočty.

Analýza histogramů a distribuce dat jsou vysoce závislá na zvolených velikostech koše. V praxi lze počet zásobníků odhadnout tím, že vezme druhou odmocninu počtu pozorování, i když mohou být použity jiné velikosti koše. Například učitel se může rozhodnout analyzovat testovací stupně výběrem velikosti bin, které odrážejí známky písmen.

JINÉ JAZYKY

Pomohl vám tento článek? Děkuji za zpětnou vazbu Děkuji za zpětnou vazbu

Jak můžeme pomoci? Jak můžeme pomoci?