Kan statistikk være villedende?
Det er et gammelt ordtak som tallene ikke lyver, men løgnere vet hvordan de skal regnes. På en måte representerer dette folks varighet av statistikk. Statistisk tolkning kan føre til at data virker misvisende. Det avhenger av statistikerens tolkning av data og hvilke tall som blir fremmet som hovedpunktene i en statistisk rapport.
For eksempel i grammatikkskole studerer studentene nå mål med sentral tendens, som er middel, median, modus og rekkevidde. Gjennomsnittet er en sum av alle data, delt på antall data. For eksempel kan man få summen av en persons testresultater og dele den med antall tester for å bestemme en karakter. Imidlertid kan middel påvirkes av det som kalles en utlegger, et tall langt utenfor det normale testområdet. Dette kan antyde at middel kan være en misvisende måte å vurdere ytelse på.
Hvis en person tar fem tester perfekt og ikke klarer å ta en sjette test og dermed tjene null, gjenspeiler gjennomsnittet dette. Hvis testene for eksempel er verdt 100 poeng, er gjennomsnittlig poengsum omtrent 85%. Imidlertid antyder ikke egentlig gjennomsnittlig ytelse i dette tilfellet på grunn av outlier av null.
Et annet mål på sentral tendens som kan brukes, er evaluering av medianen. Medianen er det midtre tallet i en gruppe data ordnet numerisk. Hvis en statistiker evaluerer for medianen, kan det hende at dette ikke er representativt for et ekte gjennomsnitt av ytelse, eller for hva som blir evaluert. Median kan ikke redegjøre for et dataområde som kan være enormt og dermed kan være misvisende.
Sentral tendens evaluert etter modus betyr bare å se på et tall som forekommer oftest i et sett med data. Så testtakeren har for eksempel en modus på 100. Likevel gjenspeiler dette ikke personen som tar testen ikke klarte å ta en, noe som er misvisende.
Andre måter statistikk kan være misvisende på er måten spørsmål stilles, i en undersøkelse kanskje, og i hvilken grad undersøkelsen er et representativt utvalg av et samfunn. Hvis man kartlegger en gruppe elever på videregående skole og spør “Hvor lykkelig er du med utdannelsen din på en skala fra 1-5?”, Kan man få veldig forskjellige svar avhengig av om gruppen er representativ for den “gjennomsnittlige” studenten.
Hvis man kartlegger en gruppe studenter som alle blir rett As og går på en fantastisk, godt finansiert skole, er det å bevisst misvise å publisere slike data som et representativt utvalg. Hvis man spør elever på forskjellige skoler med forskjellige karakterer, vil en undersøkelse sannsynligvis være mer representativ og mer rettferdig. Imidlertid, hvis man spør elevene hva de synes om skoler og deretter publiserer resultatene som et representativt utvalg av befolkningen generelt, vil svarene da være svært skjevt.
Tall kan virke veldig konkrete, og noen blir villedet av tall ganske enkelt fordi de ser ut til å være faktiske og har en udiskutabel verdi. Dermed kan statistiske data ofte brukes på en misvisende måte for å wow folk med tall, og få ting som er i tvist til å virke mer som faktum. Anerkjente statistikere vet at spørsmål må generaliseres, og at de også må stilles til folk som representerer befolkninger.
Imidlertid kan tall og statistikk være misvisende fordi de ikke representerer individet. De kan vise hvordan folk “generelt” reagerer på en idé, et produkt eller en politisk kandidat. De kan ikke vise hvordan en enkelt person i alle hans eller hennes uendelig varierende egenskaper vil føles.