¿Qué es un coeficiente de determinación?
El coeficiente de determinación es un cálculo matemático del cuadrado de un coeficiente de correlación. El coeficiente de correlación es un cálculo de la precisión de un modelo. Estos términos se usan en el análisis estadístico para explicar cálculos bastante lógicos.
En estadística, el trabajo de un analista es mirar los datos recopilados de un escenario o evento específico y crear un modelo matemático que explique los datos. Para crear este modelo, hay ciertos hechos que deben tenerse en cuenta.
Existe la posibilidad de error en cada cálculo y recopilación de datos. Como esto es consistente, la tasa de error debe incorporarse al modelo. Al tener en cuenta este error, deja de ser relevante para determinar si el modelo propuesto proporciona una explicación sólida de los datos.
El cálculo real del coeficiente de determinación es
R 2 = Suma de los errores al cuadrado
Suma de los errores al cuadrado + Regresión suma de los cuadrados
El coeficiente de determinación es un cálculo de la precisión del modelo para explicar los datos.
Utilizado en el análisis estadístico, este valor proporciona información sobre la "bondad de ajuste" del modelo estadístico a los datos. El valor del coeficiente está entre 0 y 1. Un ajuste perfecto del modelo para explicar la variación es 1 y 0 es el valor cuando el modelo no explica la variación en absoluto.
El coeficiente de determinación tiene en cuenta los errores con los datos, o valores atípicos, y la suma de cuadrados de regresión. No hay una unidad para este valor, ya que es esencialmente una relación y no tiene relación alguna con el tamaño de la muestra. Cuanto mayor sea el valor, acercándose a 1, el modelo proporcionará una mejor explicación de la variación.
Una manera simple de visualizar este concepto es crear un gráfico de todos los datos que rodean un evento en particular. Coloque tres bandejas de galletas en un comedor, chocolate, almendras y maní. Observe a medida que las personas entran al comedor y escriba cuántas galletas toman, de qué tipo y en qué orden. Trace estos datos en un gráfico.
Crea una fórmula alrededor del comportamiento predicho. Un ejemplo sería predecir que cada persona que tomó 1 galleta de chocolate, también tomó 2 almendras, pero no maní. Se puede escribir una ecuación lineal simple basada en esta suposición y graficada.
Trace la línea que representa la ecuación lineal de esa predicción. Compare la línea con la recopilación de datos real en su observación. Calcule el coeficiente de determinación para proporcionar una medida de la precisión del comportamiento predicho en comparación con los datos reales.
El coeficiente de determinación indica la cantidad de propagación de los datos alrededor de la línea. Muestra cuán buena o mala fue la predicción, en comparación con los valores reales. El coeficiente de determinación permite a los usuarios aplicar un "control de realidad" a los datos propuestos en un modelo estadístico. Hay dos valores, los valores observados o reales, y los valores modelados o pronosticados.
Este tipo de análisis estadístico es muy común en la ciencia y en los negocios. Muchas decisiones comerciales se basan en predicciones de comportamiento futuro. Es importante analizar los resultados reales y compararlos con las predicciones. Este proceso mejora el siguiente modelo y, por lo tanto, la precisión de las predicciones.