Quali sono gli intervalli di confidenza?
Nelle statistiche, gli intervalli di confidenza vengono utilizzati come stime degli intervalli per i parametri della popolazione. Sono spesso utilizzati in ambito scientifico e ingegneristico per test di ipotesi, controllo statistico dei processi e analisi dei dati. Sebbene sia possibile calcolare manualmente gli intervalli di confidenza, in genere è più facile e molto più veloce utilizzare programmi statistici specializzati o calcolatori grafici avanzati.
Se una dichiarazione di probabilità della forma P (L≤θ≤U) = 1 - α può essere scritta in modo tale che L e U siano esclusivamente funzioni dei dati del campione e θ sia un parametro, l'intervallo tra L e U è una confidenza intervallo. Questa definizione può essere affermata in modo più intuitivo e pratico dicendo che un'affermazione secondo cui il parametro θ si trova nell'intervallo di confidenza sarà vera al 100 (1 - α) % delle volte in cui viene fatta l'affermazione. Il termine (1 - α) è noto come coefficiente di confidenza.
- z α/2 σ/√ n ≤ μ ≤ x + z α/2 σ/√ n , in which z α/2 is the upper 100 α/2 percentage point of the standard normal distribution curve. Nel caso di una popolazione normalmente distribuita con media nota nota e varianza nota σ 2 , l'intervallo di confidenza 100 (1 - α) attorno alla media può essere calcolato dall'equazione x - z α / 2 σ / √ n ≤ μ ≤ x + z α / 2 σ / √ n , in cui z α / 2 è il punto percentuale superiore di 100 α / 2 della curva di distribuzione normale standard. Questo è un caso semplice, perché la vera media e la varianza dell'intera popolazione di solito non sono note.
Gli intervalli di confidenza più spesso vengono utilizzati per determinare se un determinato parametro si adatta a un determinato set di dati. Ad esempio, se l'intervallo di confidenza per un determinato set di dati va da 45 a 55 con un coefficiente di confidenza di 0,95, si potrebbe sostenere che qualsiasi punto di dati che rientra in questa regione appartiene alla popolazione con confidenza al 95 percento. L'aumento del coefficiente di confidenza restringe l'intervallo, il che significa che un intervallo più piccolo di variabili può essere spiegato con maggiore confidenza. La riduzione del coefficiente di confidenza amplia l'intervallo ma diminuisce la confidenza.
Per alcune applicazioni, come le popolazioni normalmente distribuite con medie e varianze note, le equazioni utilizzate per calcolare gli intervalli di confidenza sono prontamente disponibili. Le tabelle statistiche possono essere utilizzate per trovare valori per z α / 2 . Altre applicazioni, come l'analisi dei dati in ingegneria, richiedono metodi di calcolo più sofisticati. Di solito è più pratico utilizzare un programma statistico per determinare gli intervalli di confidenza per questi casi. I programmi statistici possono essere particolarmente utili quando i set di dati sono estremamente grandi e i risultati devono essere presentati graficamente.