Che cos'è un coefficiente di determinazione?
Il coefficiente di determinazione è un calcolo matematico del quadrato di un coefficiente di correlazione. Il coefficiente di correlazione è un calcolo dell'accuratezza di un modello. Questi termini sono usati nell'analisi statistica per spiegare calcoli abbastanza logici.
In statistica, il compito di un analista è quello di esaminare i dati raccolti da uno scenario o evento specifico e creare un modello matematico che spieghi i dati. Al fine di creare questo modello, ci sono alcuni fatti che devono essere presi in considerazione.
Esiste la possibilità di errore in ogni calcolo e raccolta di dati. Poiché ciò è coerente, il tasso di errore deve essere incorporato nel modello. Considerando questo errore, cessa di essere rilevante per determinare se il modello proposto fornisce una solida spiegazione per i dati.
Il coefficiente effettivo di calcolo della determinazione è
R 2 = Somma degli errori al quadrato
Somma degli errori quadrati + Somma di regressione dei quadrati
Il coefficiente di determinazione è un calcolo dell'accuratezza del modello nello spiegare i dati.
Utilizzato nell'analisi statistica, questo valore fornisce informazioni sulla "bontà di adattamento" del modello statistico ai dati. Il valore del coefficiente è compreso tra 0 e 1. Un adattamento perfetto del modello per spiegare la variazione è 1 e 0 è il valore quando il modello non spiega affatto la variazione.
Il coefficiente di determinazione tiene conto degli errori con i dati o dei valori anomali e della somma della regressione dei quadrati. Non esiste un'unità per questo valore, poiché è essenzialmente un rapporto ed è completamente estraneo alla dimensione del campione. Maggiore è il valore, avvicinandosi a 1, migliore è la spiegazione della variazione fornita dal modello.
Un modo semplice per visualizzare questo concetto è quello di creare un grafico di tutti i dati che circondano un particolare evento. Metti tre vassoi di biscotti in una sala da pranzo, cioccolato, mandorle e arachidi. Osserva quando le persone entrano nella sala da pranzo e scrivono quanti biscotti prendono, che tipo e in quale ordine. Traccia questi dati su un grafico.
Crea una formula attorno al comportamento previsto. Un esempio potrebbe essere quello di prevedere che ogni persona che ha preso 1 biscotto al cioccolato ha preso anche 2 mandorle, ma senza arachidi. Una semplice equazione lineare può essere scritta sulla base di questo presupposto e rappresentata graficamente.
Traccia la linea che rappresenta l'equazione lineare di tale previsione. Confronta la linea con la raccolta dati effettiva nella tua osservazione. Calcola il coefficiente di determinazione per fornire una misura dell'accuratezza del comportamento previsto rispetto ai dati effettivi.
Il coefficiente di determinazione indica la quantità di diffusione dei dati attorno alla linea. Mostra quanto era buona o cattiva la previsione, rispetto ai valori reali. Il coefficiente di determinazione consente agli utenti di applicare un "controllo di realtà" ai dati proposti in un modello statistico. Esistono due valori, i valori osservati o effettivi e i valori modellati o previsti.
Questo tipo di analisi statistica è molto comune sia nella scienza che negli affari. Molte decisioni aziendali si basano su previsioni di comportamento futuro. È importante analizzare i risultati effettivi e confrontarli con le previsioni. Questo processo migliora il modello successivo e quindi l'accuratezza delle previsioni.