Hva er tillitsintervaller?
I statistikk brukes konfidensintervaller som intervallestimater for populasjonsparametere. De brukes ofte i vitenskap og ingeniørfag for hypotesetesting, statistisk prosesskontroll og dataanalyse. Selv om det er mulig å beregne konfidensintervaller for hånd, er det vanligvis enklere og mye raskere å bruke spesialiserte statistikkprogrammer eller avanserte grafkalkulatorer.
Hvis en sannsynlighetsangivelse av formen P (L≤θ≤U) = 1 - α kan skrives slik at L og U utelukkende er funksjoner for eksempeldataene og θ er en parameter, er intervallet mellom L og U en tillit intervall. Denne definisjonen kan sies på en mer intuitiv og praktisk måte ved å si at et utsagn om at parameteren θ ligger i konfidensintervallet vil være sant 100 (1 - α) % av gangene utsagnet blir gitt. Begrepet (1 - α) er kjent som tillitskoeffisienten.
- z α/2 σ/√ n ≤ μ ≤ x + z α/2 σ/√ n , in which z α/2 is the upper 100 α/2 percentage point of the standard normal distribution curve. Når det gjelder en normalt fordelt populasjon med kjent gjennomsnittlig μ og kjent varians σ 2 , kan 100 (1 - α) konfidensintervall rundt gjennomsnittet beregnes med ligningen x - z α / 2 σ / √ n ≤ μ ≤ x + z α / 2 σ / √ n , der z α / 2 er de øvre 100 α / 2 prosentpoeng av standard normalfordelingskurve. Dette er en enkel sak, fordi det sanne middel og varians for hele befolkningen vanligvis ikke er kjent.
Tillitsintervaller brukes ofte for å bestemme hvor bra en bestemt parameter passer innenfor et gitt datasett. Hvis for eksempel konfidensintervallet for et gitt datasett spenner fra 45 til 55 med en konfidensskoeffisient på 0,95, kan man hevde at ethvert datapunkt som faller innenfor denne regionen hører hjemme i befolkningen med 95 prosent tillit. Å øke tillitskoeffisienten skjerper intervallet, noe som betyr at et mindre utvalg av variabler kan forklares med større tillit. Å redusere tillitskoeffisienten utvider intervallet, men reduserer tilliten.
For noen applikasjoner, for eksempel normalt fordelt populasjon med kjente midler og varianser, er ligningene som brukes for å beregne konfidensintervaller lett tilgjengelige. Statistiktabeller kan brukes til å finne verdier for z α / 2 . Andre applikasjoner, for eksempel dataanalyse i prosjektering, krever mer sofistikerte beregningsmetoder. Det er vanligvis mer praktisk å bruke et statistikkprogram for å bestemme konfidensintervaller for disse tilfellene. Statistikkprogrammer kan være spesielt nyttige når datasettene er ekstremt store og resultatene må presenteres grafisk.