Hvad er skæv distribution?

En skæv fordeling henviser til en sandsynlighedsfordeling, der er ujævn og asymmetrisk. I modsætning til en standard normal distribution, der ligner en klokkekurve i form, forskydes skæve fordelinger til den ene side, hvilket har en længere hale på den ene side i forhold til den anden side af medianen. Den anden side af kurven vil have en klynget top af værdier, hvor størstedelen af ​​datapunkter opstår. Denne type distributionskurve klassificeres normalt som at have enten et positivt skæv eller et negativt skævt, afhængigt af retningen af ​​kurvens skift.

Generelt siges en skæv fordeling at have positivt skæv, hvis kurvens hale er længere på højre side sammenlignet med venstre side. Denne skæve distribution omtales også som skæv til højre, fordi højre side besidder den bredere udvidelse af datapunkter. Positive skævkurver har det største antal værdier mod venstre side af kurven.

I modsætning hertil, negativt skæve disTributioner har flest datapunkter på højre side af kurven. Disse kurver har længere haler på venstre sider, så de siges at være skæve til venstre. En vigtig regel til bestemmelse af skævhedens retning er at overveje halens længde snarere end placeringen af ​​middelværdien eller medianen. Dette skyldes, at skævheden i sidste ende er forårsaget af de længste afgrænsede værdier, der strækker kurven ud mod den side af grafen.

At forstå egenskaberne ved en skæv fordeling er vigtig i mange statistiske anvendelser. Mange mennesker antager, at data følger en klokkekurve eller normal distribution, så de antager også, at en graf har nul skævhed. Disse antagelser kunne imidlertid føre dem til fejlagtigt information om den faktiske distribution.

En skæv distribution er i sagens natur ujævn, så den vil ikke følge standard normale mønstre såsom standard Deviation. Normale fordelinger involverer en standardafvigelse, der gælder for begge sider af kurven, men skæve fordelinger vil have forskellige standardafvigelsesværdier for hver side af kurven. Dette skyldes, at de to sider ikke er spejlbilleder af hinanden, så ligningerne, der beskriver den ene side, kan ikke anvendes på den anden. Standardafvigelsesværdien er generelt større for siden med den længere hale, fordi der er en bredere spredning af data på den side sammenlignet med den kortere hale.

ANDRE SPROG

Hjalp denne artikel dig? tak for tilbagemeldingen tak for tilbagemeldingen

Hvordan kan vi hjælpe? Hvordan kan vi hjælpe?