Kan statistik være vildledende?
Der er et gammelt ordsprog, hvor tallene ikke lyver, men løgnere ved hvordan man regner. På en måde repræsenterer dette folks opmærksomhed omkring statistik. Statistisk fortolkning kan få data til at virke vildledende. Det afhænger af statistikerens fortolkning af data, og hvilke tal, der fremmes som de vigtigste punkter i en statistisk rapport.
For eksempel studerer studerende i grammatikskole målinger af central tendens, som er middelværdi, median, tilstand og rækkevidde. Middelværdien er en sum af alle data divideret med antallet af data. For eksempel kan man få summen af en persons testresultater og dele den med antallet af test for at bestemme en karakter. Imidlertid kan middelværdien påvirkes af det, der kaldes en outlier, et nummer langt uden for det normale testområde. Dette kan antyde, at middelværdien kan være en vildledende måde at vurdere præstation på.
Hvis en person udtager fem test perfekt og undlader at tage en sjette test, hvorved han tjener nul, afspejler middelværdien dette. Hvis testene alle for eksempel er 100 point værd, er den gennemsnitlige score cirka 85%. Dette antyder dog ikke rigtig gennemsnitlig ydelse i dette tilfælde på grund af outlier-nul.
Et andet mål for den centrale tendens, der kan bruges, er evaluering af medianen. Medianen er det midterste antal i en gruppe data arrangeret numerisk. Hvis en statistiker evaluerer for medianen, er dette muligvis ikke repræsentativt for et ægte gennemsnit af ydeevne eller for hvad der evalueres. Medianen kan ikke redegøre for et dataområde, der kan være enormt og således kan være vildledende.
Central tendens evalueret efter tilstand betyder blot at se på et tal, der oftest forekommer i et datasæt. Så testmanden har for eksempel en tilstand på 100. Alligevel afspejler dette ikke den person, der tager testen, ikke har taget en, hvilket er vildledende.
Andre måder, hvorpå statistikker kan være vildledende, er den måde, hvorpå spørgsmål stilles, måske i en undersøgelse, og i hvilken grad undersøgelsen er et repræsentativt udvalg af et samfund. Hvis man undersøger en gruppe gymnasieelever og spørger ”Hvor glad er du med din uddannelse på en skala fra 1-5?” Kan man få meget forskellige svar, afhængigt af om gruppen er repræsentativ for den ”gennemsnitlige” studerende.
Hvis man undersøger en gruppe studerende, som alle kommer lige As og går til en fantastisk, godt finansieret skole, er det med vilje at vildlede vildledende at offentliggøre sådanne data som en repræsentativ prøve. Hvis man spørger elever på forskellige skoler med forskellige kvaliteter, vil en undersøgelse sandsynligvis være mere repræsentativ og mere retfærdig. Men hvis man spørger eleverne, hvad de synes om skoler og derefter offentliggør resultaterne som et repræsentativt udvalg af den samlede befolkning, vil svarene derefter være meget skæve.
Tal kan virke meget konkret, og nogle er vildledt af tal, blot fordi de ser ud til at være faktiske og har en udiskutabel værdi. Således kan statistiske data ofte bruges på en vildledende måde til at wow folk med tal, og få tingene i tvist til at virke mere som faktiske forhold. Anerkendte statistikere ved, at spørgsmål skal generaliseres, og at de også skal stilles til mennesker, der repræsenterer befolkninger.
Tall og statistik kan imidlertid være vildledende, fordi de ikke repræsenterer personen. De kan vise, hvordan folk ”generelt” reagerer på en idé, et produkt eller en politisk kandidat. De kan ikke vise, hvordan en enkelt person i alle hans eller hendes uendeligt varierende egenskaber vil føles.