Wat is scheve distributie?
Een scheve verdeling verwijst naar een waarschijnlijkheidsverdeling die ongelijk en asymmetrisch van aard is. In tegenstelling tot een standaard normale verdeling, die lijkt op een belcurve in vorm, worden scheve distributies naar één kant verschoven, met een langere staart aan de ene kant ten opzichte van de andere kant van de mediaan. De andere kant van de curve zal een geclusterde piek van waarden bezitten waar de meeste gegevenspunten optreden. Dit type verdelingscurve wordt meestal geclassificeerd als een positieve scheef of een negatieve scheeftrichting, afhankelijk van de richting van de verschuiving van de curve. Deze scheve verdeling wordt ook aangeduid als scheef naar rechts omdat de rechterkant de bredere uitbreiding van gegevenspunten bezit. Positieve scheefringen bezitten het grootste aantal waarden aan de linkerkant van de curve.
daarentegen, negatief scheve disTributions bezitten de meeste gegevenspunten aan de rechterkant van de curve. Deze bochten hebben langere staarten aan de linkerkant, dus er wordt gezegd dat ze links scheef staan. Een belangrijke regel bij het bepalen van de richting van schev is om de lengte van de staart te overwegen in plaats van de locatie van het gemiddelde of mediaan. Dit komt omdat de scheve uiteindelijk wordt veroorzaakt door de verste afgelegen waarden, die de curve uitstrekken naar die kant van de grafiek.
Inzicht in de eigenschappen van een scheve verdeling is belangrijk in veel statistische toepassingen. Veel mensen gaan ervan uit dat gegevens een belcurve of normale verdeling volgen, dus gaan ze er ook van uit dat een grafiek nul scheefheid heeft. Deze veronderstellingen kunnen er echter toe leiden dat ze informatie over de daadwerkelijke verdeling verkeerd interpreteren.
Een scheve verdeling is inherent ongelijk van aard, dus deze volgt geen standaard normale patronen zoals Standard Deviation. Normale distributies omvatten één standaardafwijking die van toepassing is op beide zijden van de curve, maar scheve distributies zullen verschillende standaardafwijkingswaarden hebben voor elke zijde van de curve. Dit komt omdat de twee zijden geen spiegelbeelden van elkaar zijn, dus de vergelijkingen die de ene kant beschrijven kunnen niet op de andere worden toegepast. De standaardafwijkingswaarde is over het algemeen groter voor de zijkant met de langere staart omdat er een bredere verspreiding van gegevens aan die kant is in vergelijking met de kortere staart.