Vad är skevdistribution?

En skevfördelning avser en sannolikhetsfördelning som är ojämn och asymmetrisk till sin natur. Till skillnad från en standard normalfördelning, som liknar en klockkurva i form, skiftas skeva fördelningar till ena sidan och har en längre svans på ena sidan relativt den andra sidan av medianen. Den andra sidan av kurvan kommer att ha en klusterad topp av värden där majoriteten av datapunkterna inträffar. Denna typ av distributionskurva klassificeras vanligtvis som att ha antingen en positiv skev eller ett negativt skev, beroende på riktningen för kurvans skift.

Generellt sägs en skev fördelning ha positiv skev om kurvans svans är längre på höger sida jämfört med vänster sida. Denna skeva distribution kallas också sned till höger eftersom höger sida har den bredare förlängningen av datapunkter. Positiva skevningskurvor har det största antalet värden mot vänster sida av kurvan.

Däremot är det negativt skevade disTributioner har flest datapunkter på höger sida av kurvan. Dessa kurvor har längre svansar på vänster sidor, så de sägs vara sned till vänster. En viktig regel för att bestämma riktningen för skev är att överväga svansens längd snarare än platsen för medelvärdet eller medianen. Detta beror på att skeven i slutändan orsakas av de längsta avlägsna värdena, som sträcker kurvan ut mot den sidan av grafen.

Att förstå egenskaperna hos en skevfördelning är viktigt i många statistiska tillämpningar. Många antar att data följer en klockkurva eller normalfördelning, så de antar också att en graf har noll skevhet. Dessa antaganden kan emellertid leda dem till att tolka information om den faktiska distributionen.

En skevdistribution är i sig ojämn till sin natur, så den kommer inte att följa standard normala mönster som standard deviation. Normala fördelningar involverar en standardavvikelse som gäller för båda sidor av kurvan, men skevfördelningar kommer att ha olika standardavvikelsevärden för varje sida av kurvan. Detta beror på att de två sidorna inte är spegelbilder av varandra, så ekvationerna som beskriver ena sidan kan inte tillämpas på den andra. Standardavvikelsevärdet är i allmänhet större för sidan med den längre svansen eftersom det finns en bredare spridning av data på den sidan jämfört med den kortare svansen.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?