Vad är Histogramdistribution?

Histogramfördelning i statistik hänvisar till mönstren, formerna och platserna för univariata datafält på ett histogram. Hur och var staplarna distribueras kan användas för att analysera och dra slutsatser om uppgifterna. Histogramfördelningsanalys är viktigt för att identifiera egenskaper såsom datanormalitet, multimodala fördelningar och skev data.

Ett histogram är en univariat datavisning som använder rektanglar som är proportionella i område till klass- eller binfrekvenser för att visuellt visa datafunktioner. Datapunkterna i histogrammet är organiserade i fack och själva histogramfördelningen är en visuell approximation av datans frekvensfördelning eller sannolikhetsdensitetsfunktion. Distributionens form kan ändras baserat på antalet fack.

Histogramfördelningsanalys används ofta som en kvalitativ kontroll av datanormalitet. Även om det finns analytiska metoder för att bestämma normalitet, kan histogram användas för att ge en snabb, sunt förnuftkontroll för att spara tid. Om histogramdata verkar ungefär jämnt och centreras på medelvärdet antas dataen vara normala. Även om det är snabbt och relativt enkelt, är denna typ av kvalitativ kontroll subjektiv och analysmetoder bör användas om en högre noggrannhetsstandard krävs.

Att bestämma om en datamängd uppvisar skevhet är ett annat sätt histogramfördelningsanalys kan användas. Dataskehet definieras som uttalad asymmetri i data. Negativt skev, eller snett åt vänster, ses i datauppsättningar med mycket få låga värden. Positiv skevhet, eller skevning till höger, uppstår i datauppsättningar med få höga värden. Att observera histogramfördelningen kan avslöja utskott och skev data.

Förutom att avslöja egenskaperna hos data med ett enda läge, kan formen på ett histogram också avslöja egenskaper för multimodal data. Multimodala datamängder innehåller mer än ett läge och kännetecknas av frekvensfördelningar som har mer än en topp eller maxima. Politiska tillhörigheter i en stad, opinionsundersökningar och godkännande av opinionsundersökningar och kroppsstorlekar av bin är exempel på datasätt som kan vara multimodala. Att observera formen på histogrammet och notera de olika topparna i multimodala data kan ofta ge en forskare mer insikt än enkla univariata statistiska beräkningar skulle göra.

Analysen av histogram och fördelningen av data är mycket beroende av de valda pappersstorlekarna. I praktiken kan antalet fack uppskattas genom att ta kvadratroten av antalet observationer, även om andra pappersstorlekar kan användas. Till exempel kan en lärare välja att analysera testbetyg genom att välja pappersstorlekar som återspeglar bokstavsbetyg.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?