Was sind Konfidenzintervalle?
In der Statistik werden Konfidenzintervalle als Intervallschätzer für Populationsparameter verwendet. Sie werden in Wissenschaft und Technik häufig für Hypothesentests, statistische Prozesskontrolle und Datenanalyse verwendet. Obwohl es möglich ist, Konfidenzintervalle manuell zu berechnen, ist es in der Regel einfacher und schneller, spezialisierte Statistikprogramme oder erweiterte Grafikrechner zu verwenden.
Wenn eine Wahrscheinlichkeitsangabe der Form P (L ≤ & thgr; ≤ U) = 1 - & agr; so geschrieben werden kann, dass L und U ausschließlich Funktionen der Probendaten sind und & thgr; ein Parameter ist, dann ist das Intervall zwischen L und U ein Vertrauen Intervall. Diese Definition kann auf eine intuitivere und praktischere Weise angegeben werden, indem gesagt wird, dass eine Aussage, dass der Parameter & thgr; im Konfidenzintervall liegt, zu 100 (1 - & agr;) % der Häufigkeit der Aussage wahr ist. Der Term (1 - α) ist als Konfidenzkoeffizient bekannt.
- z α/2 σ/√ n ≤ μ ≤ x + z α/2 σ/√ n , in which z α/2 is the upper 100 α/2 percentage point of the standard normal distribution curve. Für den Fall einer normalverteilten Grundgesamtheit mit bekanntem Mittelwert μ und bekannter Varianz σ 2 kann das 100 (1 - α) -Konfidenzintervall um den Mittelwert nach der Gleichung x - z α / 2 σ / √ n ≤ μ ≤ x berechnet werden + z α / 2 σ / √ n , wobei z α / 2 der obere 100 α / 2- Prozentpunkt der Standardnormalverteilungskurve ist. Dies ist ein einfacher Fall, da der wahre Mittelwert und die Varianz der Gesamtbevölkerung in der Regel nicht bekannt sind.
Konfidenzintervalle werden am häufigsten verwendet, um zu bestimmen, wie gut ein bestimmter Parameter in einen bestimmten Datensatz passt. Wenn sich das Konfidenzintervall für einen bestimmten Datensatz beispielsweise auf 45 bis 55 mit einem Konfidenzkoeffizienten von 0,95 erstreckt, könnte man argumentieren, dass jeder Datenpunkt, der in diesen Bereich fällt, mit 95 Prozent Konfidenz in die Population gehört. Durch Erhöhen des Konfidenzkoeffizienten wird das Intervall enger, sodass ein kleinerer Bereich von Variablen mit größerer Konfidenz erklärt werden kann. Durch Verringern des Konfidenzkoeffizienten wird das Intervall verbreitert, aber das Vertrauen verringert.
Für einige Anwendungen, wie normalverteilte Populationen mit bekannten Mitteln und Varianzen, sind die zur Berechnung der Konfidenzintervalle verwendeten Gleichungen leicht verfügbar. Statistiktabellen können verwendet werden, um Werte für zα / 2 zu finden . Andere Anwendungen, wie die Datenanalyse im Engineering, erfordern komplexere Berechnungsmethoden. In der Regel ist es praktischer, ein Statistikprogramm zu verwenden, um Konfidenzintervalle für diese Fälle zu bestimmen. Statistikprogramme können besonders nützlich sein, wenn die Datenmengen extrem groß sind und die Ergebnisse grafisch dargestellt werden müssen.