Co to jest twierdzenie o limicie centralnym?
Centralne twierdzenie graniczne w statystyce mówi, że suma lub średnia dużej liczby zmiennych losowych jest zbliżona do rozkładu normalnego. Można go również zastosować do rozkładów dwumianowych. Im większy rozmiar próbki, tym bliższy będzie rozkład normalny.
Rozkład normalny, do którego zbliża się centralne twierdzenie graniczne, ma kształt symetrycznej krzywej dzwonowej. Rozkłady normalne są opisane za pomocą średniej, która jest reprezentowana przez grecką literę mu, oraz odchylenie standardowe, reprezentowane przez sigma. Średnia to po prostu średnia i jest to punkt, w którym osiąga szczyt krzywej dzwonowej. Odchylenia standardowe wskazują, jak rozkładają się zmienne w rozkładzie - niższe odchylenie standardowe spowoduje węższą krzywą.
Sposób rozmieszczenia zmiennych losowych nie ma znaczenia dla centralnego twierdzenia granicznego - suma lub średnia zmiennych nadal będzie zbliżona do rozkładu normalnego, jeśli istnieje wystarczająco duża próbka. Wielkość próby zmiennych losowych jest ważna, ponieważ losowe próbki są pobierane z populacji, aby uzyskać sumę lub średnią. Ważna jest zarówno liczba pobranych próbek, jak i ich wielkość.
Aby obliczyć sumę z próbki pobranej ze zmiennych losowych, najpierw wybiera się wielkość próby. Rozmiar próbki może być tak mały jak dwa lub może być bardzo duży. Jest rysowany losowo, a następnie zmienne w próbce są dodawane razem. Procedurę tę powtarza się wiele razy, a wyniki przedstawiono na wykresie statystycznej krzywej rozkładu. Jeśli liczba próbek i wielkość próbki są wystarczająco duże, krzywa będzie bardzo zbliżona do rozkładu normalnego.
Próbki są losowane dla średnich w centralnym twierdzeniu granicznym w taki sam sposób jak dla sum, ale zamiast dodawania obliczana jest średnia dla każdej próbki. Większy rozmiar próbki daje wyniki bliższe normalnemu rozkładowi i zwykle powoduje również mniejsze odchylenie standardowe. Jeśli chodzi o sumy, większa liczba próbek daje lepsze przybliżenie rozkładu normalnego.
Twierdzenie o granicy centralnej dotyczy również rozkładów dwumianowych. Rozkłady dwumianowe są używane w przypadku zdarzeń z tylko dwoma możliwymi wynikami, takimi jak rzut monetą. Rozkłady te są opisane liczbą przeprowadzonych prób n oraz prawdopodobieństwem sukcesu p dla każdej próby. Średnią i odchylenia standardowe dla rozkładu dwumianowego oblicza się za pomocą n i p. Gdy n jest bardzo duże, średnia i odchylenia standardowe będą takie same dla rozkładu dwumianowego jak dla rozkładu normalnego.