Wat zijn de beste tips voor het berekenen van standaardafwijkingen?
De standaarddeviatie is een statistisch getal dat wordt berekend om de specifieke limieten van gegevensgroepen onder en boven het gemiddelde van een ideale populatie binnen een normale curve te geven. Met andere woorden, een berekende standaarddeviatie levert de gegevenslimieten op die worden aangegeven door drie equidistante lijnen aan weerszijden van de middelste lijn van een klokcurve. De meeste procedures voor het berekenen van standaardafwijkingen zonder statistische programma's of statistische rekenmachines worden "one pass" of "two pass" procedures genoemd, waarbij wordt verwezen naar het aantal keren dat elk nummer moet worden genoteerd en gemanipuleerd als onderdeel van de totale oplossing. Ondanks dat elk nummer een tweede keer moet worden behandeld, zijn "tweevoudige" methoden voor het berekenen van standaarddeviatie gemakkelijker uit te leggen zonder te verwijzen naar, of te begrijpen, de statistische formule die daadwerkelijk wordt berekend. De beste tips voor het berekenen van de standaarddeviatie zijn het werken met kleinere hoeveelheden gegevens bij het eerste leren van het proces, het gebruiken van een voorbeeldprobleem dat een student in het echt zou kunnen tegenkomen, al uw rekenkundige en berekeningen opschrijven om te controleren op fouten en begrijpen hoe uw individuele berekeningen resulteren in uw definitieve antwoord.
Overweeg om een redelijk voorbeeldprobleem vast te stellen de standaarddeviatie te berekenen op een lijst van 10 examengraden: 99, 78, 89, 71, 92, 88, 59, 68, 83 en 81.
De berekening wordt uitgevoerd met behulp van een formule die bekend staat als de methode van Welford:
s = √ (1 / n-1) (∑ (x - µ) 2
De variabelen in deze vergelijking zijn als volgt:
- s = standaardafwijking
- √ = vierkantswortel van de gehele berekening
- n = het aantal gegevens, bijvoorbeeld 10 testcijfers
- ∑ = sommatiesymbool dat aangeeft dat alle te berekenen berekende resultaten eenvoudig moeten worden opgeteld
- x = elk van de verschillende gegevensstukken, voor het voorbeeld van testcijfers: 99, 78, 89, enz.
- µ = het gemiddelde of gemiddelde van al uw gegevens; bijvoorbeeld alle 10 testcijfers bij elkaar opgeteld en gedeeld door 10
- (x - µ) 2 = het kwadraat van het resultaat van de vergelijking of het resultaat zelf vermenigvuldigen
Nu, terwijl u bepaalde variabelen oplost, voert u ze in de vergelijking in.
De allereerste stap is de gemakkelijkste. De noemer, n-1, van de fractie 1 / n-1 kan eenvoudig worden opgelost. Met n gelijk aan 10 testcijfers, zal de noemer duidelijk 10 - 1 of 9 zijn.
De volgende stap is om het gemiddelde - of gemiddelde - van alle testcijfers te verkrijgen door ze bij elkaar op te tellen en te delen door het aantal cijfers. Het resultaat moet µ = 80.8 zijn. Dit is de middelste lijn, of het gemiddelde, die de standaardcurve-grafiek in twee bilaterale helften deelt.
Trek vervolgens het gemiddelde - µ = 80.8 - af van elk van de 10 testgraden en kwadrateer elk van deze afwijkingen in een tweede passage door de gegevens. Dus,
99 - 80.8 = 18.2 | 331,24 |
78 - 80.8 = -2.8 | 7.84 |
89 - 80,8 = 8,2 | 67.24 |
71 - 80.8 = -9.8 | 96.04 |
92 - 80.8 = 11.2 | 125.44 |
88 - 80.8 = 7.2 | 51.84 |
59 - 80.8 = -21.8 | 475,24 |
68 - 80.8 = -12.8 | 163,84 |
83 - 80.8 = 2.2 | 4.84 |
81 - 80,8 = 0,2 | 0.04 |
Voeg al deze berekeningen toe om de som van de gegevens te bereiken zoals weergegeven door ∑. Basis rekenen geeft nu aan dat ∑ = 1.323,6
∑ moet nu worden vermenigvuldigd met 1/9 omdat de noemer van deze fractie is vastgesteld in de eerste stap van het berekenen van de standaarddeviatie. Dit resulteert in een product van 147,07.
Ten slotte vereist de standaarddeviatie van de computer dat de vierkantswortel van dit product wordt berekend als 12.13.
Dus voor ons voorbeeldprobleem met betrekking tot het onderzoek met 10 testcijfers variërend van 59 tot 99, was de gemiddelde testscore 80,8. Het berekenen van de standaarddeviatie voor ons voorbeeldprobleem resulteerde in een waarde van 12.13. Volgens de verwachte verdeling van een normale curve, konden we schatten dat 68 procent van de cijfers binnen één standaardafwijking van het gemiddelde zou liggen (68,67 tot 92,93), 95 procent van de cijfers binnen twee standaardafwijkingen van het gemiddelde zou liggen (56,54 tot 105.06) en 99,5 procent van de cijfers zou binnen drie standaarddeviaties van het gemiddelde liggen.