Les statistiques peuvent-elles être trompeuses?
Il existe un vieil adage selon lequel les chiffres ne mentent pas, mais les menteurs savent comment calculer. En un sens, cela représente la méfiance des gens vis-à-vis des statistiques. L'interprétation statistique peut donner l'impression que les données sont trompeuses. Cela dépend de l'interprétation des données par le statisticien et des chiffres mis en avant comme éléments clés d'un rapport statistique.
Par exemple, au lycée, les étudiants étudient maintenant les mesures de la tendance centrale, qui sont la moyenne, la médiane, le mode et la plage. La moyenne est la somme de toutes les données, divisée par le nombre de données. Par exemple, on peut obtenir la somme des résultats d'une personne et la diviser par le nombre de tests permettant de déterminer une note. Toutefois, la valeur moyenne peut être affectée par ce que l’on appelle une valeur aberrante, un nombre qui dépasse de loin la plage normale des tests. Cela peut suggérer que la moyenne peut être une manière trompeuse d’évaluer la performance.
Si une personne subit cinq tests à la perfection et ne réussit pas un sixième test, gagnant ainsi un zéro, la moyenne en est le reflet. Si les tests valent tous 100 points par exemple, le score moyen est d'environ 85%. Cependant, cela ne suggère pas vraiment une performance moyenne dans ce cas en raison de la valeur aberrante de zéro.
Une autre mesure de la tendance centrale qui peut être utilisée est l’évaluation de la médiane. La médiane est le nombre du milieu dans un groupe de données classées numériquement. Si un statisticien évalue la médiane, cela peut ne pas être représentatif d'une moyenne réelle de la performance ou de tout ce qui est évalué. La médiane ne peut pas rendre compte d'une plage de données qui peut être énorme et peut donc être trompeuse.
La tendance centrale évaluée par mode consiste simplement à regarder un nombre qui apparaît le plus souvent dans un ensemble de données. Ainsi, le candidat a par exemple un mode 100. Cependant, cela ne reflète pas le fait que la personne qui passe le test n'a pas réussi à en passer un, ce qui est trompeur.
Les statistiques peuvent également induire en erreur, notamment dans le cadre d’une enquête, et dans quelle mesure l’enquête constitue-t-elle un échantillon représentatif d’une communauté. Si vous interrogez un groupe d'élèves du secondaire et leur demandez: «Quel est votre degré de satisfaction avec votre éducation sur une échelle de 1 à 5?», Vous obtiendrez des réponses très différentes selon que le groupe est représentatif ou non de l'étudiant «moyen».
Si l’on interroge un groupe d’élèves qui vont tous droit au but et vont dans une école fantastique et bien financée, publier de telles données en tant qu’échantillon représentatif est délibérément trompeur. Si l’on interroge des élèves de différentes écoles et de niveaux différents, une enquête sera probablement plus représentative et plus équitable. Cependant, si l’on demande aux élèves ce qu’ils pensent des écoles et que l’on publie ensuite les résultats en tant qu’échantillon représentatif de la population générale, les réponses seront très biaisées.
Les chiffres peuvent sembler très concrets, et certains sont induits en erreur simplement parce qu'ils semblent être des faits et ont une valeur indiscutable. Ainsi, les données statistiques peuvent souvent être utilisées de manière trompeuse pour impressionner les gens avec des chiffres et faire en sorte que les choses en litige ressemblent davantage à des faits. Les statisticiens réputés savent que les questions doivent être généralisées et doivent également être posées aux personnes représentant les populations.
Cependant, les chiffres et les statistiques peuvent être trompeurs car ils ne représentent pas l'individu. Ils peuvent montrer comment les gens «en général» répondent à une idée, à un produit ou à un candidat politique. Ils ne peuvent pas montrer comment une seule personne ressentira dans toutes ses qualités infiniment variables.