Hva er skjev distribusjon?

En skjev distribusjon refererer til en sannsynlighetsfordeling som er ujevn og asymmetrisk. I motsetning til en standard normalfordeling, som ligner en klokkekurve i form, flyttes skjeve fordelinger til den ene siden, og har en lengre hale på den ene siden i forhold til den andre siden av medianen. Den andre siden av kurven vil ha en gruppert topp av verdier der flertallet av datapunktene oppstår. Denne typen distribusjonskurve er vanligvis klassifisert som å ha enten en positiv skjevhet eller en negativ skjevhet, avhengig av retningen på kurvens skift.

Generelt sies en skjev distribusjon å ha positiv skeiv hvis halen på kurven er lengre på høyre side sammenlignet med venstre side. Denne skjeve distribusjonen blir også referert til som skjev til høyre fordi høyre side besitter den bredere utvidelsen av datapunkter. Positive skjevkurver har det største antallet verdier mot venstre side av kurven.

I kontrast, negativt skjevt disTribusjoner har flest datapunkter på høyre side av kurven. Disse kurvene har lengre haler på venstre side, så de sies å være skjev til venstre. En viktig regel for å bestemme retning av skjevhet er å vurdere halens lengde i stedet for plasseringen av middelet eller medianen. Dette er fordi skjevheten til slutt er forårsaket av de lengste utliggende verdiene, som strekker kurven ut mot den siden av grafen.

Å forstå egenskapene til en skjev distribusjon er viktig i mange statistiske anvendelser. Mange antar at data følger en klokkekurve, eller normalfordeling, så de antar også at en graf har null skeivhet. Disse forutsetningene kan imidlertid føre dem til å feiltolke informasjon om den faktiske distribusjonen.

En skjev distribusjon er iboende ujevn i naturen, så den vil ikke følge standard normale mønstre som standard deviation. Normale distribusjoner involverer ett standardavvik som gjelder begge sider av kurven, men skjeve distribusjoner vil ha forskjellige standardavvikverdier for hver side av kurven. Dette er fordi de to sidene ikke er speilbilder av hverandre, så ligningene som beskriver den ene siden ikke kan brukes på den andre. Standardavvikverdien er generelt større for siden med den lengre halen fordi det er en bredere spredning av data på den siden sammenlignet med den kortere halen.

ANDRE SPRÅK