Was ist ein Bestimmungskoeffizient?
Der Bestimmungskoeffizient ist eine mathematische Berechnung des Quadrats eines Korrelationskoeffizienten. Der Korrelationskoeffizient ist eine Berechnung der Genauigkeit eines Modells. Diese Begriffe werden in statistischen Analysen verwendet, um ziemlich logische Berechnungen zu erklären.
In der Statistik besteht die Aufgabe eines Analysten darin, die aus einem bestimmten Szenario oder Ereignis gesammelten Daten zu betrachten und ein mathematisches Modell zu erstellen, das die Daten erläutert. Um dieses Modell zu erstellen, müssen bestimmte Fakten berücksichtigt werden.
Bei jeder Berechnung und Erhebung von Daten kann es zu Fehlern kommen. Da dies konsistent ist, muss die Fehlerrate in das Modell einbezogen werden. Durch die Berücksichtigung dieses Fehlers ist es nicht mehr relevant zu bestimmen, ob das vorgeschlagene Modell eine solide Erklärung für die Daten liefert.
Die tatsächliche Bestimmungskoeffizientenberechnung beträgt
R 2 = Summe der Fehlerquadrate
Summe der Fehlerquadrate + Regressionssumme der Quadrate
Der Bestimmungskoeffizient ist eine Berechnung der Genauigkeit des Modells bei der Erläuterung der Daten.
Bei der statistischen Analyse liefert dieser Wert einen Einblick in die "Anpassungsgüte" des statistischen Modells an die Daten. Der Wert des Koeffizienten liegt zwischen 0 und 1. Eine perfekte Anpassung des Modells zur Erklärung der Variation ist 1 und 0 ist der Wert, wenn das Modell die Variation überhaupt nicht erklärt.
Der Bestimmungskoeffizient berücksichtigt Fehler bei den Daten oder Ausreißern und die Regressionssumme der Quadrate. Zu diesem Wert gibt es keine Einheit, da es sich im Wesentlichen um ein Verhältnis handelt und in keiner Beziehung zur Größe der Probe steht. Je höher der Wert, der sich 1 nähert, desto besser erklärt das Modell die Variation.
Eine einfache Möglichkeit, dieses Konzept zu visualisieren, besteht darin, ein Diagramm aller Daten zu erstellen, die ein bestimmtes Ereignis umgeben. Stellen Sie drei Tabletts mit Keksen, Schokolade, Mandeln und Erdnüssen in einen Speisesaal. Beobachten Sie, wie Leute in den Speisesaal kommen und notieren Sie, wie viele Kekse sie nehmen, welche Arten und in welcher Reihenfolge. Zeichnen Sie diese Daten in einem Diagramm.
Erstellen Sie eine Formel um das vorhergesagte Verhalten. Ein Beispiel wäre, vorauszusagen, dass jede Person, die 1 Schokoladenkeks nahm, auch 2 Mandeln, aber keine Erdnüsse nahm. Basierend auf dieser Annahme kann eine einfache lineare Gleichung geschrieben und grafisch dargestellt werden.
Zeichnen Sie die Linie, die die lineare Gleichung dieser Vorhersage darstellt. Vergleichen Sie die Linie mit der tatsächlichen Datenerfassung in Ihrer Beobachtung. Berechnen Sie den Bestimmungskoeffizienten, um ein Maß für die Genauigkeit des vorhergesagten Verhaltens im Vergleich zu den tatsächlichen Daten zu erhalten.
Der Bestimmungskoeffizient gibt den Umfang der Streuung der Daten um die Linie an. Es zeigt, wie gut oder schlecht die Vorhersage im Vergleich zu den tatsächlichen Werten war. Mit dem Bestimmungskoeffizienten können Benutzer die in einem statistischen Modell vorgeschlagenen Daten einer "Realitätsprüfung" unterziehen. Es gibt zwei Werte, die beobachteten oder tatsächlichen Werte und die modellierten oder vorhergesagten Werte.
Diese Art der statistischen Analyse ist in der Wissenschaft und in der Wirtschaft weit verbreitet. Viele Geschäftsentscheidungen basieren auf Vorhersagen des zukünftigen Verhaltens. Es ist wichtig, die tatsächlichen Ergebnisse zu analysieren und mit den Vorhersagen zu vergleichen. Dieser Prozess verbessert das nächste Modell und damit die Genauigkeit der Vorhersagen.