Kan statistikker være vildledende?

Der er et gammelt ordsprog, som tal ikke lyver, men løgnere ved, hvordan de skal regne. På en måde repræsenterer dette folks skridt med statistikker. Statistisk fortolkning kan få data til at virke vildledende. Det afhænger af statistikerens fortolkning af data, og hvilke tal der bringes frem som nøglepunkterne i en statistisk rapport.

For eksempel i grammatikskole studerer studerende nu målinger af central tendens, som er middel, median, tilstand og rækkevidde. Gennemsnittet er en sum af alle data, divideret med antallet af data. For eksempel kan man få summen af en persons testresultater og dele den med antallet af test for at bestemme en karakter. Gennemsnit kan imidlertid påvirkes af det, der kaldes en outlier, et tal langt uden for det normale testområde. Dette kan antyde, at gennemsnittet kan være en vildledende måde at vurdere ydelsen på.

Hvis en person tager fem test perfekt og undlader at tage en sjette test og dermed tjene et nul, afspejler middelværdien dette. Hvis testene alle er værd 100 pOints for eksempel er den gennemsnitlige score cirka 85%. Dette antyder dog ikke rigtig gennemsnitlig ydelse i dette tilfælde på grund af outlier af nul.

Et andet mål for central tendens, der kan bruges, er evaluering af medianen. Medianen er det midterste nummer i en gruppe data arrangeret numerisk. Hvis en statistiker vurderer for medianen, er dette muligvis ikke repræsentativt for et ægte gennemsnit af ydeevne eller hvad der evalueres. Medianen kan ikke redegøre for et dataområde, der kan være enormt og dermed kan være vildledende.

central tendens evalueret ved tilstand betyder blot at se på et tal, der ofte forekommer i et datasæt. Så testoptageren for eksempel har en tilstand på 100. Alligevel afspejler dette ikke den person, der tager testen, kunne ikke tage en, hvilket er vildledende.

Andre måder, hvorpå statistik kan være vildledende, er den måde, hvorpå spørgsmålbliver måske i en undersøgelse spurgt i en undersøgelse, og i hvilken grad undersøgelsen er en repræsentativ prøve af et samfund. Hvis man undersøger en gruppe gymnasiestuderende og spørger "Hvor glad er du med din uddannelse i en skala fra 1-5?" Man kan få meget forskellige svar afhængigt af om gruppen er repræsentativ for den ”gennemsnitlige” studerende.

Hvis man undersøger en gruppe studerende, der alle kommer lige som og går til en fantastisk, velfinansieret skole, skal du offentliggøre sådanne data som en repræsentativ prøve med vilje vildledende. Hvis man spørger studerende på forskellige skoler med forskellige kvaliteter, vil en undersøgelse sandsynligvis være mere repræsentativ og mere retfærdig. Men hvis man spørger studerende, hvad de synes om skoler og derefter offentliggør resultaterne som en repræsentativ prøve af den generelle befolkning, vil svarene derefter være meget skævt.

Numre kan virke meget konkrete, og nogle bliver vildledt af tal, simpelthen fordi de ser ud til at være kendsgerning og har en udiskutabel værdi. Således statistisk DATA kan ofte bruges på en vildledende måde til at wow folk med tal, og få ting om tvist til at virke mere som kendsgerning. Anerkendte statistikere ved, at spørgsmål skal generaliseres, og at de også skal stilles til mennesker, der repræsenterer befolkninger.

Numre og statistik kan imidlertid være vildledende, fordi de ikke repræsenterer individet. De kan vise, hvordan folk "generelt" reagerer på en idé, på et produkt eller på en politisk kandidat. De kan ikke vise, hvordan en enkelt person i alle hans eller hendes uendeligt variable kvaliteter vil føles.

Kan statistikker være vildledende?

ANDRE SPROG

RELATEREDE ARTIKLER

Hvordan kan vi hjælpe?