Vad är skev distribution?
En sned fördelning avser en sannolikhetsfördelning som är ojämn och asymmetrisk. Till skillnad från en vanlig normalfördelning, som liknar en klockkurva i form, flyttas skeva fördelningar till en sida och har en längre svans på ena sidan relativt den andra sidan av medianen. Den andra sidan av kurvan kommer att ha en klusterad topp av värden där majoriteten av datapunkter förekommer. Denna typ av fördelningskurva klassificeras vanligtvis som att ha antingen ett positivt skev eller ett negativt skev, beroende på kurvens riktning.
I allmänhet sägs en skev fördelning ha positiv skev om kurvans svans är längre på höger sida jämfört med vänster sida. Denna skev fördelning kallas också skev till höger eftersom höger sida har bredare utvidgning av datapunkter. Positiva skeva kurvor har det största antalet värden mot vänster sida av kurvan.
Däremot har negativt skev fördelning de flesta datapunkterna på höger sida av kurvan. Dessa kurvor har längre svansar på vänster sida, så de sägs vara sneda åt vänster. En viktig regel för att bestämma skevningsriktningen är att ta hänsyn till svansens längd snarare än medelvärdets eller medianens placering. Detta beror på att skevningen i slutändan orsakas av de längsta yttre värdena, som sträcker ut kurvan mot den sidan av diagrammet.
Att förstå egenskaperna för en sned fördelning är viktig i många statistiska tillämpningar. Många antar att data följer en klockkurva eller normalfördelning, så de antar också att en graf har noll skevhet. Dessa antaganden kan emellertid leda till att de misstolkar information om den faktiska fördelningen.
En sned fördelning är i sig ojämn i sin natur, så den kommer inte att följa normala normala mönster som standardavvikelse. Normala fördelningar involverar en standardavvikelse som gäller på båda sidor av kurvan, men skeva fördelningar har olika standardavvikelsevärden för varje sida av kurvan. Detta beror på att de två sidorna inte är spegelbilder av varandra, så att ekvationerna som beskriver den ena sidan inte kan tillämpas på den andra. Standardavvikelsevärdet är i allmänhet större för sidan med den längre svansen eftersom det finns en bredare spridning av data på den sidan jämfört med den kortare svansen.