Wat zijn betrouwbaarheidsintervallen?
In statistieken worden betrouwbaarheidsintervallen gebruikt als intervalschattingen voor populatieparameters. Ze worden vaak gebruikt in de wetenschap en techniek voor het testen van hypothesen, statistische procescontrole en gegevensanalyse. Hoewel het mogelijk is om betrouwbaarheidsintervallen met de hand te berekenen, is het meestal gemakkelijker en veel sneller om gespecialiseerde statistiekenprogramma's of geavanceerde grafische rekenmachines te gebruiken.
Als een waarschijnlijkheidsverklaring met de vorm P (L≤θ≤U) = 1 - α zodanig kan worden geschreven dat L en U uitsluitend functies van de voorbeeldgegevens zijn en θ een parameter is, is het interval tussen L en U een betrouwbaarheid interval. Deze definitie kan op een meer intuïtieve en praktische manier worden gesteld door te zeggen dat een verklaring dat de parameter θ ligt in het betrouwbaarheidsinterval 100 (1 - α) % van de keren dat de verklaring wordt afgelegd waar zal zijn. De term (1 - α) staat bekend als de betrouwbaarheidscoëfficiënt.
- z α/2 σ/√ n ≤ μ ≤ x + z α/2 σ/√ n , in which z α/2 is the upper 100 α/2 percentage point of the standard normal distribution curve. Voor een normaal verdeelde populatie met bekend gemiddelde μ en bekende variantie σ 2 , kan het 100 (1 - α) betrouwbaarheidsinterval rond het gemiddelde worden berekend met de vergelijking x - z α / 2 σ / √ n ≤ μ ≤ x + z α / 2 σ / √ n , waarin z α / 2 het bovenste 100 α / 2 procentpunt van de standaard normale distributiekromme is. Dit is een eenvoudig geval, omdat het werkelijke gemiddelde en de variantie van de gehele populatie meestal niet bekend is.
Meestal worden betrouwbaarheidsintervallen gebruikt om te bepalen hoe goed een bepaalde parameter binnen een gegeven gegevensset past. Als het betrouwbaarheidsinterval voor een bepaalde gegevensset bijvoorbeeld varieert van 45 tot 55 met een betrouwbaarheidscoëfficiënt van 0,95, zou je kunnen stellen dat elk gegevenspunt dat binnen deze regio valt, behoort tot de populatie met een betrouwbaarheid van 95 procent. Het verhogen van de betrouwbaarheidscoëfficiënt verkort het interval, wat betekent dat een kleiner bereik van variabelen met meer vertrouwen kan worden verklaard. Het verlagen van de betrouwbaarheidscoëfficiënt verbreedt het interval maar vermindert het vertrouwen.
Voor sommige toepassingen, zoals normaal verdeelde populaties met bekende gemiddelden en varianties, zijn de vergelijkingen die worden gebruikt om betrouwbaarheidsintervallen te berekenen, direct beschikbaar. Statistiekentabellen kunnen worden gebruikt om waarden voor z α / 2 te vinden . Andere toepassingen, zoals gegevensanalyse in engineering, vereisen meer geavanceerde berekeningsmethoden. Het is meestal praktischer om een statistisch programma te gebruiken om betrouwbaarheidsintervallen voor deze gevallen te bepalen. Statistiekenprogramma's kunnen met name handig zijn wanneer gegevenssets extreem groot zijn en de resultaten grafisch moeten worden gepresenteerd.