Vad är konfidensintervall?
I statistik används konfidensintervall som intervallberäkningar för populationsparametrar. De används ofta inom vetenskap och teknik för hypotesprovning, statistisk processkontroll och dataanalys. Although it is possible to calculate confidence intervals by hand, it typically is easier and much faster to use specialized statistics programs or advanced graphing calculators.
If a probability statement of the form P(L≤θ≤U) = 1 - α can be written such that L and U are exclusively functions of the sample data and θ is a Parameter, sedan intervallet mellan l och u är ett konfidensintervall. Denna definition kan anges på ett mer intuitivt och praktiskt sätt genom att säga att ett uttalande om att parametern θ ligger i konfidensintervallet kommer att vara sant 100 (1 - α) % av de gånger uttalandet görs. Termen (1 - α) är känd som förtroendetcoefficient.
For the case of a normally distributed population with known mean μ and known variance σ2, the 100(1 - α) confidence interval around the mean can be calculated by the equation x - zα/2σ/√n ≤ μ ≤ x + Z a/2 σ/√n , där z a/2 är den övre 100 α/2 Procentenheten för den vanliga normala distributionskurvan. Detta är ett enkelt fall, eftersom det verkliga medelvärdet och variansen för hela befolkningen vanligtvis inte är känd.
Konfidensintervall används oftast för att bestämma hur väl en viss parameter passar in i en given datauppsättning. Till exempel, om konfidensintervallet för en given datauppsättning sträcker sig från 45 till 55 med en konfidenskoefficient på 0,95, kan man hävda att alla datapunkt som faller inom denna region belONG i befolkningen med 95 procent förtroende. Att öka förtroendekoefficienten stramar intervallet, vilket innebär att ett mindre utbud av variabler kan förklaras med större förtroende. Att minska konfidenskoefficienten breddar intervallet men minskar förtroendet.
För vissa applikationer, såsom normalt distribuerade populationer med kända medel och variationer, är ekvationerna som används för att beräkna konfidensintervall lätt tillgängliga. Statistiktabeller kan användas för att hitta värden för z a/2 . Andra applikationer, såsom dataanalys inom teknik, kräver mer sofistikerade metoder för beräkning. Det är vanligtvis mer praktiskt att använda ett statistikprogram för att bestämma konfidensintervall för dessa fall. Statistikprogram kan vara särskilt användbara när datauppsättningarna är extremt stora och resultaten måste presenteras grafiskt.