Wat is een bepalingscoëfficiënt?
De bepalingscoëfficiënt is een wiskundige berekening van het kwadraat van een correlatiecoëfficiënt. De correlatiecoëfficiënt is een berekening van de nauwkeurigheid van een model. Deze termen worden gebruikt in statistische analyse om redelijk logische berekeningen te verklaren.
In de statistiek is het de taak van een analist om te kijken naar de gegevens die zijn verzameld uit een specifiek scenario of evenement en een wiskundig model te maken dat de gegevens verklaart. Om dit model te creëren, zijn er bepaalde feiten waarmee rekening moet worden gehouden.
Er is een mogelijkheid van fouten in elke berekening en verzameling van gegevens. Aangezien dit consistent is, moet het foutenpercentage in het model worden opgenomen. Door deze fout te verwerken, is deze niet langer relevant om te bepalen of het voorgestelde model een solide verklaring voor de gegevens biedt.
De feitelijke berekening van de bepalingscoëfficiënt is
R 2 = Som van de kwadratenfouten
Som van de kwadratenfouten + regressiesom van vierkanten
De bepalingscoëfficiënt is een berekening van de nauwkeurigheid van het model bij het verklaren van de gegevens.
Gebruikt in statistische analyse, geeft deze waarde inzicht in de "goedheid van fit" van het statistische model voor de gegevens. De waarde van de coëfficiënt ligt tussen 0 en 1. Een perfecte pasvorm van het model om de variatie uit te leggen is 1 en 0 is de waarde wanneer het model de variatie helemaal niet verklaart.
De bepalingscoëfficiënt houdt rekening met fouten met de gegevens of uitbijters en de regressiesom van vierkanten. Er is geen eenheid voor deze waarde, omdat het in wezen een verhouding is en volledig los staat van de grootte van het monster. Hoe hoger de waarde, die 1 nadert, hoe beter het model de verklaring van de variatie kan geven.
Een eenvoudige manier om dit concept te visualiseren is om een grafiek te maken van alle gegevens rondom een bepaalde gebeurtenis. Zet drie bakjes met koekjes neer in een lunchroom, chocolade, amandel en pinda. Observeer als mensen de lunchroom binnenkomen en noteer hoeveel cookies ze nemen, welke soorten en in welke volgorde. Plot deze gegevens in een grafiek.
Maak een formule rond het voorspelde gedrag. Een voorbeeld zou zijn om te voorspellen dat elke persoon die 1 chocoladekoekje nam, ook 2 amandel nam, maar geen pinda. Een eenvoudige lineaire vergelijking kan op basis van deze veronderstelling worden geschreven en in een grafiek worden weergegeven.
Teken de lijn die de lineaire vergelijking van die voorspelling vertegenwoordigt. Vergelijk de lijn met de feitelijke gegevensverzameling in uw waarneming. Bereken de bepalingscoëfficiënt om een maat te geven voor de nauwkeurigheid van het voorspelde gedrag in vergelijking met de werkelijke gegevens.
De bepalingscoëfficiënt geeft de hoeveelheid spreiding van de gegevens over de lijn aan. Het laat zien hoe goed of slecht de voorspelling was, in vergelijking met de werkelijke waarden. Met de bepalingscoëfficiënt kunnen gebruikers een "reality check" toepassen op de gegevens die in een statistisch model worden voorgesteld. Er zijn twee waarden, de waargenomen of werkelijke waarden, en de gemodelleerde of voorspelde waarden.
Dit type statistische analyse is heel gebruikelijk in de wetenschap en in het bedrijfsleven. Veel zakelijke beslissingen zijn gebaseerd op voorspellingen van toekomstig gedrag. Het is belangrijk om de werkelijke resultaten te analyseren en te vergelijken met de voorspellingen. Dit proces verbetert het volgende model en daarmee de nauwkeurigheid van de voorspellingen.