Co je distribuce histogramu?

Distribuce histogramu ve statistikách se týká vzorů, tvarů a umístění jednorozměrných datových pruhů na histogramu. Jak a kde jsou sloupce distribuovány, lze použít k analýze a vyvození závěrů o datech. Analýza distribuce histogramu je důležitá při identifikaci zvláštností, jako je datová normalita, multimodální distribuce a zkosená data.

Histogram je jednorozměrný datový displej, který používá vizuální obdélníky úměrné plošné frekvenci nebo kmitočtu bin k vizuálnímu zobrazení vlastností dat. Datové body v histogramu jsou uspořádány do zásobníků a samotné rozdělení histogramu je vizuální aproximací distribuce frekvence dat nebo funkce hustoty pravděpodobnosti. Tvar distribuce se může měnit na základě počtu zásobníků.

Analýza distribuce histogramu se často používá jako kvalitativní kontrola normality dat. Přestože existují analytické metody pro stanovení normality, lze histogramy použít k rychlé a běžné kontrole zdravého rozumu, aby se ušetřil čas. Pokud se data histogramu objeví přibližně rovnoměrně a na střed na střed, jsou data považována za normální. Přestože je tento druh kvalitativní kontroly rychlý a relativně snadný, je subjektivní a pokud je vyžadována vyšší úroveň přesnosti, měly by být použity analytické metody.

Dalším způsobem, jak lze použít analýzu distribuce histogramu, je stanovení, zda datová sada vykazuje šikmost. Skewness data je definována jako výrazná asymetrie v datech. Negativní zkosení nebo zkosení doleva je vidět v souborech dat s velmi nízkými nízkými hodnotami. Pozitivní zkosení nebo zkosení doprava se vyskytuje v souborech dat s několika vysokými hodnotami. Pozorování distribuce histogramu může odhalit odlehlé hodnoty a zkosená data.

Kromě odhalení charakteristik dat pomocí jediného režimu může tvar histogramu odhalit také charakteristiky multimodálních dat. Multimodální datové soubory obsahují více než jeden režim a jsou charakterizovány frekvenčními distribucemi, které mají více než jeden vrchol nebo maximum. Příkladem datových souborů, které mohou být multimodální, jsou politické vztahy ve městě, průzkumy veřejného mínění o schválení a velikost těla včel. Pozorování tvaru histogramu a zaznamenávání různých vrcholů v multimodálních datech může často poskytnout výzkumníkovi lepší přehled, než by jednoduché jednorozměrné statistické výpočty dokázaly.

Analýza histogramů a distribuce dat jsou vysoce závislé na zvolených velikostech zásobníku. V praxi lze počet zásobníků odhadnout na základě druhé odmocniny počtu pozorování, i když lze použít i jiné velikosti přihrádek. Učitel se například může rozhodnout analyzovat testovací známky výběrem velikostí zásobníků, které odrážejí stupně písmen.

JINÉ JAZYKY

Pomohl vám tento článek? Děkuji za zpětnou vazbu Děkuji za zpětnou vazbu

Jak můžeme pomoci? Jak můžeme pomoci?