Qu'est-ce qu'un coefficient de détermination?
Le coefficient de détermination est un calcul mathématique du carré d'un coefficient de corrélation. Le coefficient de corrélation est un calcul de la précision d'un modèle. Ces termes sont utilisés en analyse statistique pour expliquer des calculs assez logiques.
En statistique, le travail d'un analyste consiste à examiner les données collectées à partir d'un scénario ou d'un événement spécifique et à créer un modèle mathématique expliquant les données. Afin de créer ce modèle, certains faits doivent être pris en compte.
Il y a une possibilité d'erreur dans chaque calcul et collecte de données. Comme cela est cohérent, le taux d'erreur doit être intégré au modèle. En prenant en compte cette erreur, elle cesse d’être pertinente pour déterminer si le modèle proposé fournit une explication solide pour les données.
Le calcul du coefficient de détermination réel est
R 2 = somme des erreurs au carré
Somme des erreurs au carré + Somme de la régression des carrés
Le coefficient de détermination est un calcul de la précision du modèle pour expliquer les données.
Utilisée en analyse statistique, cette valeur donne un aperçu de la "qualité de l'ajustement" du modèle statistique aux données. La valeur du coefficient est comprise entre 0 et 1. Un ajustement parfait du modèle pour expliquer la variation est 1 et 0 correspond à la valeur lorsque le modèle n'explique pas du tout la variation.
Le coefficient de détermination prend en compte les erreurs avec les données, ou les valeurs aberrantes, et la somme des carrés de régression. Il n'y a pas d'unité à cette valeur, car il s'agit essentiellement d'un ratio et n'a aucun lien avec la taille de l'échantillon. Plus la valeur, proche de 1, est élevée, meilleure est l'explication de la variation fournie par le modèle.
Un moyen simple de visualiser ce concept consiste à créer un graphique de toutes les données entourant un événement particulier. Disposez trois plateaux de biscuits dans une salle à manger avec du chocolat, des amandes et des arachides. Observez les gens qui entrent dans la salle à manger et écrivez combien de cookies ils prennent, quels types et dans quel ordre. Tracer ces données sur un graphique.
Créez une formule autour du comportement prédit. Un exemple serait de prédire que chaque personne qui a pris un biscuit au chocolat a également pris deux amandes, mais pas d'arachides. Une équation linéaire simple peut être écrite sur la base de cette hypothèse et représentée graphiquement.
Tracez la ligne qui représente l'équation linéaire de cette prédiction. Comparez la ligne à la collecte de données réelle dans votre observation. Calculez le coefficient de détermination pour obtenir une mesure de la précision du comportement prévu par rapport aux données réelles.
Le coefficient de détermination indique la quantité de dispersion des données autour de la ligne. Il montre à quel point la prévision était bonne ou mauvaise par rapport aux valeurs réelles. Le coefficient de détermination permet aux utilisateurs d'appliquer un "contrôle de réalité" aux données proposées dans un modèle statistique. Il existe deux valeurs, les valeurs observées ou réelles et les valeurs modélisées ou prédites.
Ce type d’analyse statistique est très courant, qu’il soit scientifique ou commercial. De nombreuses décisions d’entreprise reposent sur des prévisions de comportement futur. Il est important d’analyser les résultats réels et de les comparer aux prévisions. Ce processus améliore le modèle suivant et donc la précision des prévisions.