Kunnen statistieken misleidend zijn?
Er is een oud gezegde dat cijfers niet liegen, maar leugenaars weten hoe te figuur. In zekere zin vertegenwoordigt dit de wariness van mensen van statistieken. Statistische interpretatie kan ertoe leiden dat gegevens misleidend lijken. Het hangt af van de interpretatie van gegevens door de statisticus en welke cijfers naar voren komen als de belangrijkste punten van een statistisch rapport.
Op de middelbare school bijvoorbeeld, bestuderen studenten nu maatregelen van centrale tendens, die gemiddelde, mediaan, modus en bereik zijn. Het gemiddelde is een som van alle gegevens, gedeeld door het aantal gegevens. Men zou bijvoorbeeld de som van de testscores van een persoon kunnen krijgen en deze delen door het aantal tests om een cijfer te bepalen. Het gemiddelde kan echter worden beïnvloed door wat een uitbijter wordt genoemd, een getal dat ver buiten het normale testbereik ligt. Dit kan erop duiden dat gemiddelde een misleidende manier is om prestaties te beoordelen.
Als een persoon vijf tests perfect aflegt en er geen zesde test aflegt en dus een nul verdient, weerspiegelt het gemiddelde dit. Als alle testen bijvoorbeeld 100 punten waard zijn, is de gemiddelde score ongeveer 85%. Dit suggereert echter niet echt gemiddelde prestaties in dit geval vanwege de uitbijter van nul.
Een andere maat voor de centrale neiging die kan worden gebruikt, is de evaluatie van de mediaan. De mediaan is het middelste getal in een groep gegevens die numeriek zijn gerangschikt. Als een statisticus evalueert voor de mediaan, is dit mogelijk niet representatief voor een echt gemiddelde van de prestaties of voor wat er ook wordt geëvalueerd. De mediaan kan geen rekening houden met een gegevensbereik dat enorm kan zijn en dus misleidend kan zijn.
Centrale tendens geëvalueerd door modus betekent alleen kijken naar een getal dat het meest voorkomt in een set gegevens. Dus de testpersoon heeft bijvoorbeeld een modus van 100. Toch geeft dit niet aan dat de persoon die de test heeft gedaan, er geen heeft afgelegd, wat misleidend is.
Andere manieren waarop statistieken misleidend kunnen zijn, is de manier waarop vragen worden gesteld, misschien in een enquête, en de mate waarin de enquête een representatieve steekproef van een gemeenschap is. Als je een groep middelbare scholieren onderzoekt en vraagt: "Hoe blij ben je met je opleiding op een schaal van 1-5?", Krijg je misschien heel verschillende antwoorden, afhankelijk van of de groep representatief is voor de "gemiddelde" student.
Als je een groep studenten onderzoekt die allemaal gelijk krijgen en naar een fantastische, goed gefinancierde school gaan, is het opzettelijk misleidend om dergelijke gegevens als representatieve steekproef te publiceren. Als je leerlingen van verschillende scholen met verschillende cijfers vraagt, is een enquête waarschijnlijk representatiever en eerlijker. Als men de studenten echter vraagt wat zij van scholen vinden en de resultaten vervolgens publiceert als een representatieve steekproef van de algemene bevolking, zullen de antwoorden zeer scheef staan.
Cijfers kunnen heel concreet lijken, en sommige worden misleid door cijfers, simpelweg omdat ze feitelijk lijken en een onbetwistbare waarde hebben. Statistische gegevens kunnen dus vaak op een misleidende manier worden gebruikt om mensen met getallen te verbazen, en dingen in geschil meer op feiten lijken. Gerenommeerde statistici weten dat vragen moeten worden gegeneraliseerd en ook moeten worden gesteld aan mensen die een populatie vertegenwoordigen.
Cijfers en statistieken kunnen echter misleidend zijn omdat ze niet het individu vertegenwoordigen. Ze kunnen laten zien hoe mensen 'in het algemeen' reageren op een idee, op een product of op een politieke kandidaat. Ze kunnen niet laten zien hoe een enkele persoon in al zijn of haar oneindig variabele kwaliteiten zich zal voelen.