Vad är den centrala gränssatsen?

Den centrala gränssatsen i statistik anger att summan eller medelvärdet för ett stort antal slumpmässiga variabler är ungefär den normala fördelningen. Det kan också tillämpas på binomialfördelningar. Ju större provstorlek, desto närmare kommer distributionen att vara normalfördelningen.

Normaldistributionen, som närmar sig den centrala gränssteoremet, är formad som en symmetrisk klockkurva. Normala fördelningar beskrivs med medelvärdet, som representeras av den grekiska bokstaven mu, och standardavvikelsen, representerad av sigma. Medelvärdet är helt enkelt genomsnittet, och det är den punkt då klockkurvan toppar. Standardavvikelser indikerar hur spridda variablerna i fördelningen är - en lägre standardavvikelse kommer att resultera i en smalare kurva.

Hur de slumpmässiga variablerna fördelas spelar ingen roll för den centrala gränssatsen - summan eller medelvärdet för variablerna kommer fortfarande att närma sig en normalfördelning om det finns en tillräckligt stor provstorlek. Provstorleken för slumpmässiga variabler är viktig eftersom slumpmässiga prover dras från befolkningen för att få summan eller medelvärdet. Både antalet samlade prover och storleken på dessa prover är viktigt.

För att beräkna en summa från ett prov som dras från slumpmässiga variabler, väljs först ett provstorlek. Provstorleken kan vara så liten som två eller så kan den vara mycket stor. Det dras slumpmässigt och sedan läggs variablerna i provet samman. Denna procedur upprepas många gånger, och resultaten ritas på en statistisk fördelningskurva. Om antalet prover och provstorleken är tillräckligt stort kommer kurvan att vara mycket nära normalfördelningen.

Prover tas för medel i den centrala gränssatsen på samma sätt som för summor, men istället för att lägga till beräknas genomsnittet för varje prov. En större provstorlek ger resultat närmare normalfördelningen och ger vanligtvis också en mindre standardavvikelse. När det gäller summorna ger ett större antal prover en bättre tillnärmning till normalfördelningen.

Den centrala gränssatsen gäller även binomialfördelning. Binomialfördelningar används för händelser med endast två möjliga utfall, till exempel att vända ett mynt. Dessa fördelningar beskrivs av antalet utförda försök, n och sannolikheten för framgång, p, för varje försök. Medel- och standardavvikelserna för en binomialfördelning beräknas med n och p. När n är mycket stor kommer medel- och standardavvikelserna att vara desamma för binomialfördelningen som för normalfördelningen.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?