Co je centrální limitní věta?
Centrální limitní věta ve statistice uvádí, že součet nebo průměr velkého počtu náhodných proměnných se blíží normálnímu rozdělení. Lze ji také použít na binomické distribuce. Čím větší je velikost vzorku, tím blíže bude distribuce k normální distribuci.
Normální rozdělení, k němuž se přistupuje centrální limitní věta, je tvarováno jako symetrická zvonová křivka. Normální distribuce jsou popsány průměrem, který je představován řeckým písmenem mu, a standardní odchylkou, reprezentovanou sigma. Průměr je jednoduše průměr a je to bod, ve kterém zvonová křivka vrcholí. Standardní odchylky ukazují, jak jsou rozprostřeny proměnné v distribuci - nižší směrodatná odchylka povede k užší křivce.
Jak jsou distribuovány náhodné proměnné, nezáleží na centrální limitní větě - součet nebo průměr proměnných se stále přiblíží k normálnímu rozdělení, pokud existuje dostatečně velká velikost vzorku. Velikost vzorku náhodných proměnných je důležitá, protože náhodné vzorky jsou odebírány z populace, aby se získala součet nebo průměr. Počet odebraných vzorků i velikost těchto vzorků je důležitý.
Pro výpočet součtu ze vzorku čerpaného z náhodných proměnných se nejprve vybere velikost vzorku. Velikost vzorku může být tak malá jako dvě nebo může být velmi velká. Je nakreslena náhodně a poté jsou proměnné ve vzorku sčítány. Tento postup se mnohokrát opakuje a výsledky jsou graficky znázorněny na statistické distribuční křivce. Pokud je počet vzorků a velikost vzorku dostatečně velký, bude křivka velmi blízká normálnímu rozdělení.
Vzorky se odebírají pro prostředky v centrální limitní větě stejným způsobem jako pro součty, ale místo sčítání se vypočítá průměr každého vzorku. Větší velikost vzorku dává výsledky blíže normální distribuci a obvykle také vede k menší standardní odchylce. Pokud jde o součty, větší počet vzorků poskytuje lepší přiblížení k normálnímu rozdělení.
Centrální limitní věta platí také pro binomické rozdělení. Binomické rozdělení se používá pro události, které mají pouze dva možné výsledky, jako je například převržení mince. Tato rozdělení jsou popsána počtem provedených pokusů, n a pravděpodobností úspěchu, p, pro každou zkoušku. Střední a standardní odchylky pro binomické rozdělení se vypočítají pomocí n a p. Pokud je n velmi velké, střední a standardní odchylky budou stejné pro binomické rozdělení jako pro normální rozdělení.