Wat is scheve distributie?
Een scheve verdeling verwijst naar een waarschijnlijkheidsverdeling die ongelijk en asymmetrisch van aard is. In tegenstelling tot een standaard normale verdeling, die lijkt op een klokcurve in vorm, zijn scheve verdelingen verschoven naar de ene kant, met een langere staart aan de ene kant ten opzichte van de andere kant van de mediaan. De andere kant van de curve zal een geclusterde piek van waarden bezitten waar de meeste gegevenspunten voorkomen. Dit type distributiekromme wordt meestal geclassificeerd als een positieve scheefstand of een negatieve scheefstand, afhankelijk van de richting van de verschuiving van de curve.
In het algemeen wordt gezegd dat een scheve verdeling een positieve scheefstand heeft als de staart van de curve langer is aan de rechterkant in vergelijking met de linkerkant. Deze scheve verdeling wordt ook schuin naar rechts genoemd omdat de rechterkant de bredere uitbreiding van gegevenspunten bezit. Positieve scheef krommen bezitten het grootste aantal waarden aan de linkerkant van de kromme.
Negatief scheve distributies hebben daarentegen de meeste gegevenspunten aan de rechterkant van de curve. Deze bochten hebben langere staarten aan de linkerkant, dus er wordt gezegd dat ze scheef naar links staan. Een belangrijke regel bij het bepalen van de scheefrichting is om de lengte van de staart te overwegen in plaats van de locatie van het gemiddelde of de mediaan. Dit komt omdat de scheeftrekking uiteindelijk wordt veroorzaakt door de verste buitenliggende waarden, die de curve naar die kant van de grafiek uitstrekken.
Inzicht in de eigenschappen van een scheve verdeling is belangrijk in veel statistische toepassingen. Veel mensen nemen aan dat gegevens een belcurve of normale verdeling volgen, dus gaan ze er ook vanuit dat een grafiek geen scheefheid heeft. Deze veronderstellingen kunnen er echter toe leiden dat ze informatie over de feitelijke distributie verkeerd interpreteren.
Een scheve verdeling is inherent ongelijk van aard, dus het zal geen standaard normale patronen zoals standaarddeviatie volgen. Normale verdelingen omvatten één standaardafwijking die van toepassing is op beide zijden van de curve, maar scheve verdelingen hebben verschillende standaardafwijkingswaarden voor elke zijde van de curve. Dit komt omdat de twee zijden geen spiegelbeelden van elkaar zijn, dus de vergelijkingen die de ene zijde beschrijven, kunnen niet op de andere worden toegepast. De standaardafwijkingswaarde is over het algemeen groter voor de zijde met de langere staart, omdat er een bredere spreiding van gegevens aan die zijde is in vergelijking met de kortere staart.