Was ist der zentrale Grenzwertsatz?
Der zentrale Grenzwertsatz in der Statistik besagt, dass sich die Summe oder der Mittelwert einer großen Anzahl von Zufallsvariablen der Normalverteilung annähert. Es kann auch auf Binomialverteilungen angewendet werden. Je größer die Stichprobengröße ist, desto näher kommt die Verteilung der Normalverteilung.
Die Normalverteilung, an die sich der zentrale Grenzwertsatz annähert, ist wie eine symmetrische Glockenkurve geformt. Normalverteilungen werden durch den Mittelwert, der durch den griechischen Buchstaben mu dargestellt wird, und die Standardabweichung, die durch Sigma dargestellt wird, beschrieben. Der Mittelwert ist einfach der Durchschnitt und es ist der Punkt, an dem die Glockenkurve ihren Höhepunkt erreicht. Standardabweichungen geben an, wie verteilt die Variablen in der Verteilung sind. Eine niedrigere Standardabweichung führt zu einer engeren Kurve.
Wie die Zufallsvariablen verteilt sind, spielt für den zentralen Grenzwertsatz keine Rolle - die Summe oder der Mittelwert der Variablen nähert sich immer noch einer Normalverteilung, wenn es eine ausreichend große Stichprobengröße gibt. Die Stichprobengröße der Zufallsvariablen ist wichtig, da aus der Grundgesamtheit Zufallsstichproben gezogen werden, um die Summe oder den Mittelwert zu erhalten. Sowohl die Anzahl der gezogenen Proben als auch die Größe dieser Proben sind wichtig.
Um eine Summe aus einer Stichprobe zu berechnen, die aus Zufallsvariablen gezogen wurde, wird zunächst eine Stichprobengröße ausgewählt. Die Stichprobengröße kann bis zu zwei oder sehr groß sein. Es wird zufällig gezogen und dann werden die Variablen in der Stichprobe addiert. Diese Prozedur wird viele Male wiederholt und die Ergebnisse werden auf einer statistischen Verteilungskurve grafisch dargestellt. Wenn die Anzahl der Stichproben und die Stichprobengröße groß genug sind, liegt die Kurve sehr nahe an der Normalverteilung.
Stichproben werden für Mittelwerte im zentralen Grenzwertsatz wie für Summen gezogen, aber anstatt zu addieren, wird der Durchschnitt jeder Stichprobe berechnet. Eine größere Stichprobe führt zu Ergebnissen, die näher an der Normalverteilung liegen, und führt normalerweise auch zu einer geringeren Standardabweichung. Bei den Summen ergibt eine größere Anzahl von Abtastwerten eine bessere Annäherung an die Normalverteilung.
Der zentrale Grenzwertsatz gilt auch für Binomialverteilungen. Binomialverteilungen werden für Ereignisse mit nur zwei möglichen Ergebnissen verwendet, z. B. das Werfen einer Münze. Diese Verteilungen werden durch die Anzahl der durchgeführten Versuche n und die Erfolgswahrscheinlichkeit p für jeden Versuch beschrieben. Der Mittelwert und die Standardabweichung für eine Binomialverteilung werden mit n und p berechnet. Wenn n sehr groß ist, sind der Mittelwert und die Standardabweichung für die Binomialverteilung gleich wie für die Normalverteilung.