Hva er sentralt begrensningsteorem?
Den sentrale grense-setningen i statistikk sier at summen eller gjennomsnittet av et stort antall tilfeldige variabler tilnærmer seg normalfordelingen. Det kan også brukes på binomialfordelinger. Jo større prøvestørrelse, jo nærmere vil fordelingen være normalfordelingen.
Normaldistribusjonen, som blir nærmet av den sentrale grense-setningen, er formet som en symmetrisk bjellekurve. Normale fordelinger er beskrevet av middelverdien, som er representert med den greske bokstaven mu, og standardavviket, representert med sigma. Gjennomsnittet er ganske enkelt gjennomsnittet, og det er punktet hvor klokkekurven topper seg. Standardavvik indikerer hvor spredt variablene i fordelingen er - et lavere standardavvik vil resultere i en smalere kurve.
Hvordan de tilfeldige variablene blir fordelt spiller ingen rolle for den sentrale grense-setningen - summen eller gjennomsnittet av variablene vil fremdeles nærme seg en normalfordeling hvis det er en stor nok prøvestørrelse. Utvalgsstørrelsen til de tilfeldige variablene er viktig fordi tilfeldige prøver blir trukket fra populasjonen for å få summen eller gjennomsnittet. Både antall prøver som er trukket og størrelsen på disse prøvene er viktig.
For å beregne en sum fra et utvalg trukket fra tilfeldige variabler, velges først en prøvestørrelse. Prøvestørrelsen kan være så liten som to, eller den kan være veldig stor. Det tegnes tilfeldig og deretter legges variablene i prøven sammen. Denne prosedyren gjentas mange ganger, og resultatene graferes på en statistisk fordelingskurve. Hvis antall prøver og prøvestørrelse er stort nok, vil kurven være veldig nær normalfordelingen.
Det trekkes prøver for midler i sentralgrense-setningen på samme måte som for summer, men i stedet for å legge til, beregnes gjennomsnittet av hver prøve. En større prøvestørrelse gir resultater nærmere normalfordelingen, og resulterer vanligvis også i et mindre standardavvik. Når det gjelder summene, gir et større antall prøver en bedre tilnærming til normalfordelingen.
Den sentrale grense-setningen gjelder også binomialfordeling. Binomialfordelinger brukes til hendelser med bare to mulige utfall, for eksempel å slå en mynt. Disse fordelingene er beskrevet av antall utførte studier, n, og sannsynligheten for suksess, p, for hver prøve. Gjennomsnitt og standardavvik for en binomialfordeling beregnes ved å bruke n og p. Når n er veldig stor, vil middel- og standardavvikene være de samme for binomialfordelingen som for normalfordelingen.