Czy statystyki mogą wprowadzać w błąd?
Istnieje stare przysłowie, że figurki nie kłamią, ale kłamcy wiedzą, jak to wymyślić. W pewnym sensie reprezentuje to ostrożność ludzi w statystyce. Interpretacja statystyczna może powodować, że dane wydają się wprowadzać w błąd. Zależy to od interpretacji danych przez statystę i od tego, jakie liczby są wysuwane na pierwszy plan jako kluczowe punkty raportu statystycznego.
Na przykład w gimnazjum uczniowie uczą się obecnie miar tendencji centralnej, tj. Średniej, mediany, trybu i zasięgu. Średnia to suma wszystkich danych podzielona przez liczbę danych. Na przykład można uzyskać sumę wyników testu danej osoby i podzielić ją przez liczbę testów w celu ustalenia oceny. Jednak na wartość średnią może wpływać tak zwana wartość odstająca, liczba znacznie wykraczająca poza normalny zakres testowania. Może to sugerować, że środek może być mylącym sposobem oceny wyników.
Jeśli dana osoba doskonale zdaje pięć testów i nie zdaje szóstego testu, uzyskując w ten sposób zero, średnia odzwierciedla to. Jeśli na przykład wszystkie testy są warte 100 punktów, średni wynik wynosi około 85%. Jednak tak naprawdę nie sugeruje to średniej wydajności w tym przypadku ze względu na wartość zerową.
Inną miarą tendencji centralnej, którą można zastosować, jest ocena mediany. Mediana jest środkową liczbą w grupie danych ułożonych numerycznie. Jeśli statystyki oceni medianę, może to nie być reprezentatywne dla prawdziwej średniej wydajności lub tego, co jest oceniane. Mediana nie może uwzględniać zakresu danych, który może być ogromny, a zatem może wprowadzać w błąd.
Tendencja centralna oceniana przez tryb oznacza jedynie patrzenie na liczbę występującą najczęściej w zbiorze danych. Na przykład osoba przeprowadzająca test ma tryb 100. Nie odzwierciedla to jednak tego, że osoba biorąca udział w teście nie zdała egzaminu, co jest mylące.
Inne sposoby, w jakie statystyki mogą wprowadzać w błąd, to sposób zadawania pytań, być może w ankiecie, oraz stopień, w jakim ankieta jest reprezentatywną próbą społeczności. Jeśli ktoś sonduje grupę uczniów szkół średnich i pyta: „Jaki jesteś zadowolony ze swojego wykształcenia w skali 1-5?”, Możesz uzyskać bardzo różne odpowiedzi w zależności od tego, czy grupa jest reprezentatywna dla „przeciętnego” ucznia.
Jeśli ktoś przeprowadzi ankietę wśród grupy uczniów, którzy dostają się na prostą As i pójdzie do fantastycznej, dobrze finansowanej szkoły, opublikowanie takich danych jako reprezentatywnej próby będzie celowo wprowadzać w błąd. Jeśli ktoś zapyta uczniów różnych szkół o różnych klasach, to badanie może być bardziej reprezentatywne i bardziej sprawiedliwe. Jednak jeśli ktoś zapyta uczniów, co myślą o szkołach, a następnie opublikuje wyniki jako reprezentatywną próbę populacji ogólnej, odpowiedzi będą mocno wypaczone.
Liczby mogą wydawać się bardzo konkretne, a niektóre są wprowadzane w błąd przez liczby po prostu dlatego, że wydają się być faktami i mają niepodważalną wartość. Dlatego dane statystyczne mogą być często wykorzystywane w sposób wprowadzający w błąd, aby oczarować ludzi liczbami i sprawić, że sporne sprawy wydają się bardziej faktyczne. Renomowani statystycy wiedzą, że pytania należy uogólniać, a także zadawać pytania osobom reprezentującym populacje.
Jednak liczby i statystyki mogą wprowadzać w błąd, ponieważ nie reprezentują osoby. Mogą pokazać, jak ludzie „ogólnie” reagują na pomysł, produkt lub kandydata politycznego. Nie mogą pokazać, jak czuje się jedna osoba we wszystkich swoich nieskończenie zmiennych cechach.