Vad är den centrala gräns teoremet?
Den centrala gräns teoremet i statistik säger att summan eller medelvärdet för ett stort antal slumpmässiga variabler ungefärligar normalfördelningen. Det kan också tillämpas på binomialfördelningar. Ju större provstorlek, desto närmare kommer distributionen att vara till normalfördelningen.
Den normala fördelningen, som närmar sig av den centrala gräns teoremet, är formad som en symmetrisk klockkurva. Normala distributioner beskrivs av medelvärdet, som representeras av den grekiska bokstaven MU, och standardavvikelsen, representerad av Sigma. Medelvärdet är helt enkelt medelvärdet, och det är den punkt där klockkurvan toppar. Standardavvikelser indikerar hur spridning av variablerna i distributionen är - en lägre standardavvikelse kommer att resultera i en smalare kurva.
Hur de slumpmässiga variablerna distribueras spelar ingen roll för den centrala gränsteoremet - summan eller medelvärdet för variablerna kommer fortfarande att närma sig en normalfördelning om det finns ett tillräckligt stort prov SIZe. Provstorleken för slumpmässiga variabler är viktig eftersom slumpmässiga prover dras från befolkningen för att få summan eller medelvärdet. Både antalet prover ritade och storleken på dessa prover är viktigt.
För att beräkna en summa från ett prov som dras från slumpmässiga variabler väljs först en provstorlek. Provstorleken kan vara så liten som två, eller så kan den vara mycket stor. Det ritas slumpmässigt och sedan läggs variablerna i provet samman. Denna procedur upprepas många gånger, och resultaten är graferade på en statistisk fördelningskurva. Om antalet prover och provstorleken är tillräckligt stor kommer kurvan att vara mycket nära normalfördelningen.
prover ritas för medel i den centrala gränsteoremet på samma sätt som för summor, men istället för att lägga till beräknas medelvärdet av varje prov. En större provstorlek ger resultat närmare normalfördelningen och USUallierad resulterar också i en mindre standardavvikelse. När det gäller summorna ger ett större antal prover en bättre tillnärmning till normalfördelningen.
Centralgränssteoremet gäller också binomialfördelningar. Binomialfördelningar används för händelser med endast två möjliga resultat, såsom att vända ett mynt. Dessa distributioner beskrivs av antalet genomförda försök, N, och sannolikheten för framgång, P, för varje försök. Medel- och standardavvikelserna för en binomial distribution beräknas med användning av N och P. När N är mycket stor kommer medel- och standardavvikelserna att vara desamma för binomialfördelningen som för normalfördelningen.