Hva er skjev distribusjon?

En skjev fordeling refererer til en sannsynlighetsfordeling som er ujevn og asymmetrisk. I motsetning til en vanlig normalfordeling, som ligner en klokkekurve i form, blir skjeve fordelinger forskjøvet til den ene siden og har en lengre hale på den ene siden i forhold til den andre siden av medianen. Den andre siden av kurven vil ha en gruppert toppverdier der flertallet av datapunkter oppstår. Denne typen distribusjonskurve er vanligvis klassifisert som å ha enten en positiv skjevhet eller en negativ skjevhet, avhengig av retningen på kurvens skift.

Generelt sies en skjev fordeling å ha positiv skjevhet hvis kurvenes hale er lenger på høyre side sammenlignet med venstre side. Denne skjevfordelingen blir også referert til som skjev til høyre fordi høyresiden har bredere utvidelse av datapunkter. Positive skjevkurver har det største antall verdier mot venstre side av kurven.

I kontrast har negativt skjeve distribusjoner flest datapunkter på høyre side av kurven. Disse kurvene har lengre haler på venstre side, så de sies å være skjevt til venstre. En viktig regel for å bestemme retningen på skjevhet er å ta i betraktning lengden på halen fremfor plasseringen av middelverdien eller medianen. Dette er fordi skjevheten til slutt skyldes de fjerneste ytre verdiene, som strekker kurven ut mot den siden av grafen.

Å forstå egenskapene til en skjev fordeling er viktig i mange statistiske anvendelser. Mange antar at data følger en klokkekurve, eller normalfordeling, så de antar også at en graf har null skjevhet. Disse forutsetningene kan imidlertid føre til at de tolker informasjon om den faktiske fordelingen feil.

En skjev fordeling er iboende ujevn i naturen, så den vil ikke følge standard normale mønstre som standardavvik. Normale fordelinger innebærer ett standardavvik som gjelder på begge sider av kurven, men skjevfordelinger vil ha forskjellige standardavvikverdier for hver side av kurven. Dette er fordi de to sidene ikke er speilbilder av hverandre, slik at likningene som beskriver den ene siden ikke kan brukes på den andre. Standardavviksverdien er generelt større for siden med den lengre halen fordi det er en bredere spredning av data på den siden sammenlignet med den kortere halen.

ANDRE SPRÅK

Hjalp denne artikkelen deg? Takk for tilbakemeldingen Takk for tilbakemeldingen

Hvordan kan vi hjelpe? Hvordan kan vi hjelpe?