Wat is de centrale limietstelling?
De centrale limietstelling in de statistiek stelt dat de som of het gemiddelde van een groot aantal willekeurige variabelen de normale verdeling benadert. Het kan ook worden toegepast op binomiale distributies. Hoe groter de steekproefgrootte, hoe dichter de verdeling zal zijn bij de normale verdeling.
De normale verdeling, die wordt benaderd door de centrale limietstelling, heeft de vorm van een symmetrische klokkromme. Normale verdelingen worden beschreven door het gemiddelde, dat wordt voorgesteld door de Griekse letter mu, en de standaarddeviatie, voorgesteld door sigma. Het gemiddelde is eenvoudig het gemiddelde en het is het punt waarop de klokcurve een piek bereikt. Standaardafwijkingen geven aan hoe gespreid de variabelen in de verdeling zijn - een lagere standaardafwijking zal resulteren in een smallere curve.
Hoe de willekeurige variabelen worden verdeeld, maakt niet uit voor de centrale limietstelling - de som of het gemiddelde van de variabelen zal nog steeds een normale verdeling benaderen als de steekproefgrootte groot genoeg is. De steekproefgrootte van de willekeurige variabelen is belangrijk omdat willekeurige steekproeven worden getrokken uit de populatie om de som of het gemiddelde te krijgen. Zowel het aantal getrokken monsters als de grootte van die monsters is belangrijk.
Om een som te berekenen uit een steekproef getrokken uit willekeurige variabelen, wordt eerst een steekproefgrootte gekozen. De steekproefgrootte kan zo klein zijn als twee, of het kan erg groot zijn. Het wordt willekeurig getekend en vervolgens worden de variabelen in het monster bij elkaar opgeteld. Deze procedure wordt vele malen herhaald en de resultaten worden grafisch weergegeven op een statistische distributiekromme. Als het aantal monsters en de steekproefgrootte groot genoeg zijn, zal de curve heel dicht bij de normale verdeling liggen.
Monsters worden voor middelen in de centrale limietstelling op dezelfde manier getrokken als voor sommen, maar in plaats van toe te voegen, wordt het gemiddelde van elk monster berekend. Een grotere steekproef geeft de resultaten dichter bij de normale verdeling en resulteert meestal ook in een kleinere standaardafwijking. Wat de bedragen betreft, een groter aantal monsters geeft een betere benadering van de normale verdeling.
De centrale limietstelling is ook van toepassing op binomiale verdelingen. Binomiale distributies worden gebruikt voor evenementen met slechts twee mogelijke uitkomsten, zoals het omdraaien van een munt. Deze verdelingen worden beschreven door het aantal uitgevoerde proeven, n, en de kans op succes, p, voor elke proef. Het gemiddelde en de standaardafwijkingen voor een binomiale verdeling worden berekend met behulp van n en p. Wanneer n zeer groot is, zullen het gemiddelde en de standaardafwijkingen hetzelfde zijn voor de binomiale verdeling als voor de normale verdeling.