Hvad er tillidsintervaller?
I statistikker bruges konfidensintervaller som intervallestimater for populationsparametre. De bruges ofte inden for videnskab og teknik til hypotesetestning, statistisk proceskontrol og dataanalyse. Selvom det er muligt at beregne konfidensintervaller for hånd, er det typisk lettere og meget hurtigere at bruge specialiserede statistikprogrammer eller avancerede grafregnemaskiner.
Hvis en sandsynlighedsangivelse af formen P (L≤θ≤U) = 1 - α kan skrives således, at L og U udelukkende er funktioner i eksempeldataene og θ er en parameter, er intervallet mellem L og U en tillid interval. Denne definition kan anføres på en mere intuitiv og praktisk måde ved at sige, at en erklæring om, at parameteren θ ligger i konfidensintervallet, vil være sandt 100 (1 - α) % af de gange, udsagnet afgives. Udtrykket (1 - α) er kendt som tillidskoefficienten.
- z α/2 σ/√ n ≤ μ ≤ x + z α/2 σ/√ n , in which z α/2 is the upper 100 α/2 percentage point of the standard normal distribution curve. For en normalt fordelt population med kendt gennemsnit μ og kendt varians σ 2 , kan konfidensintervallet 100 (1 - α) omkring middelværdien beregnes ved ligningen x - z α / 2 σ / √ n ≤ μ ≤ x + z α / 2 σ / √ n , hvor z α / 2 er det øverste 100 α / 2 procentpoint for den normale normalfordelingskurve. Dette er en simpel sag, fordi det sande middel og varians for hele befolkningen normalt ikke er kendt.
Tillidsintervaller bruges ofte til at bestemme, hvor godt en bestemt parameter passer inden for et givet datasæt. For eksempel, hvis konfidensintervallet for et givet datasæt spænder fra 45 til 55 med en konfidensskoefficient på 0,95, kunne man hævde, at ethvert datapunkt, der falder inden for denne region, hører til i befolkningen med 95 procent tillid. Forøgelse af tillidskoefficienten strammer intervallet, hvilket betyder, at et mindre interval af variabler kan forklares med større selvtillid. At reducere tillidskoefficienten udvider intervallet, men formindsker tilliden.
For nogle anvendelser, såsom normalt distribuerede populationer med kendte midler og afvigelser, er ligningerne, der bruges til at beregne konfidensintervaller, let tilgængelige. Statistiktabeller kan bruges til at finde værdier for z α / 2 . Andre applikationer, såsom dataanalyse inden for teknik, kræver mere sofistikerede beregningsmetoder. Det er normalt mere praktisk at bruge et statistikprogram til at bestemme tillidsintervaller for disse tilfælde. Statistikprogrammer kan være særligt nyttige, når datasæt er ekstremt store, og resultaterne skal præsenteres grafisk.