Was ist eine verzerrte Verteilung?
Eine verzerrte Verteilung bezieht sich auf eine Wahrscheinlichkeitsverteilung, die ungleichmäßig und asymmetrisch ist. Im Gegensatz zu einer normalen Normalverteilung, die in ihrer Form einer Glockenkurve ähnelt, sind die Schrägverteilungen nach einer Seite verschoben und haben auf einer Seite einen längeren Schwanz im Vergleich zur anderen Seite des Medians. Die andere Seite der Kurve wird einen gruppierten Spitzenwert besitzen, bei dem die Mehrzahl der Datenpunkte auftritt. Diese Art der Verteilungskurve wird je nach Richtung der Kurvenverschiebung in der Regel als positiv oder negativ eingestuft.
Im Allgemeinen wird von einer Schrägverteilung ein positiver Schräglauf gesprochen, wenn das Ende der Kurve auf der rechten Seite länger ist als auf der linken Seite. Diese verzerrte Verteilung wird auch als nach rechts verzerrt bezeichnet, da die rechte Seite die breitere Ausdehnung von Datenpunkten besitzt. Positive Schrägkurven besitzen die größte Anzahl von Werten zur linken Seite der Kurve.
Negativ verzerrte Verteilungen besitzen dagegen die meisten Datenpunkte auf der rechten Seite der Kurve. Diese Kurven haben längere Schwänze auf der linken Seite, so dass sie nach links geneigt sein sollen. Eine wichtige Regel bei der Bestimmung der Richtung der Schräglage besteht darin, die Länge des Schwanzes und nicht die Position des Mittelwerts oder Medians zu berücksichtigen. Dies liegt daran, dass der Versatz letztendlich durch die am weitesten außen liegenden Werte verursacht wird, die die Kurve auf diese Seite des Diagramms ausdehnen.
In vielen statistischen Anwendungen ist es wichtig, die Eigenschaften einer verzerrten Verteilung zu verstehen. Viele Menschen gehen davon aus, dass die Daten einer Glockenkurve oder einer Normalverteilung folgen, und gehen daher auch davon aus, dass ein Diagramm keine Schiefe aufweist. Diese Annahmen könnten jedoch dazu führen, dass Informationen über die tatsächliche Verteilung falsch interpretiert werden.
Eine verzerrte Verteilung ist von Natur aus ungleichmäßig und folgt daher nicht den normalen Standardmustern wie der Standardabweichung. Normalverteilungen beinhalten eine Standardabweichung, die für beide Seiten der Kurve gilt, aber bei Schrägverteilungen werden für jede Seite der Kurve unterschiedliche Standardabweichungswerte verwendet. Dies liegt daran, dass die beiden Seiten keine Spiegelbilder voneinander sind, sodass die Gleichungen, die eine Seite beschreiben, nicht auf die andere angewendet werden können. Der Standardabweichungswert ist im Allgemeinen für die Seite mit dem längeren Schwanz größer, da sich auf dieser Seite eine größere Datenstreuung als auf der kürzeren Seite befindet.