Наука

Может ли статистика вводить в заблуждение?

Существует старая пословица, что фигуры не лгут, но лжецы знают, как фигурировать. В некотором смысле это представляет собой настороженность людей в статистике. Статистическая интерпретация может привести к тому, что данные будут вводить в заблуждение. Это зависит от интерпретации данных статистиком и того, какие цифры представлены в качестве ключевых пунктов статистического отчета.

Например, в гимназии учащиеся в настоящее время изучают показатели центральной тенденции: среднее значение, медиана, режим и диапазон. Среднее значение представляет собой сумму всех данных, деленную на количество данных. Например, можно получить сумму баллов за тестирование человека и разделить ее на количество тестов, чтобы определить оценку. Однако среднее значение может зависеть от того, что называется выбросом, числом, выходящим далеко за пределы нормального диапазона тестирования. Это может указывать на то, что среднее значение может быть неверным способом оценки эффективности.

Если человек с успехом проходит пять тестов и не проходит шестой тест, получая при этом ноль, среднее значение отражает это. Например, если все тесты стоят 100 баллов, средний балл составляет примерно 85%. Тем не менее, это не означает, что средняя производительность в этом случае из-за выброса нуля.

Другой показатель центральной тенденции, который можно использовать, - это оценка медианы. Медиана - это среднее число в группе данных, расположенных в числовом формате. Если статистик оценивает медиану, это может не отражать истинного среднего показателя эффективности или того, что оценивается. Медиана не может учитывать диапазон данных, который может быть огромным и, следовательно, может вводить в заблуждение.

Центральная тенденция, оцениваемая по моде, просто означает просмотр числа, которое чаще всего встречается в наборе данных. Так, например, у тестируемого есть режим 100. Тем не менее, это не означает, что человек, проходящий тест, не смог его пройти, что вводит в заблуждение.

Другими способами, которыми статистика может вводить в заблуждение, является способ, которым задаются вопросы, возможно, в опросе, и степень, в которой опрос является репрезентативной выборкой сообщества. Если опросить группу учеников старших классов и спросить «Насколько вы довольны своим образованием по шкале от 1 до 5?», Вы можете получить очень разные ответы в зависимости от того, является ли группа представителем «среднего» ученика.

Если кто-то опрашивает группу учеников, которые все получают «как» и идут в фантастическую, хорошо финансируемую школу, публиковать такие данные в качестве репрезентативной выборки - это намеренно вводить в заблуждение. Если задать вопрос ученикам разных школ с разными оценками, то опрос, скорее всего, будет более представительным и более справедливым. Тем не менее, если кто-то спросит учащихся, что они думают о школах, а затем опубликует результаты в качестве репрезентативной выборки для населения в целом, ответы будут сильно искажены.

Числа могут показаться очень конкретными, а некоторые вводятся в заблуждение числами просто потому, что они кажутся фактами и имеют неоспоримую ценность. Таким образом, статистические данные часто могут вводить в заблуждение, чтобы удивить людей цифрами, и сделать спорные вещи более похожими на факты. Авторитетные статистики знают, что вопросы должны быть обобщены, а также должны задаваться людям, которые представляют группы населения.

Тем не менее, цифры и статистика могут вводить в заблуждение, потому что они не представляют человека. Они могут показать, как люди «в целом» реагируют на идею, продукт или политического кандидата. Они не могут показать, как будет чувствовать себя один человек во всех его или ее бесконечно изменчивых качествах.