Skip to main content

Что такое классы гистограммы?

Классы гистограммы - это диапазоны значений, которые содержат точки данных в частотном распределении или табулировании необработанных данных. Они также называются интервалами, ячейками или шириной ячейки. На гистограмме, типе гистограммы, эти классы изображены в виде вертикальных столбцов, где высота столбца указывает количество точек данных, содержащихся в диапазоне классов. Как правило, выбор класса гистограммы делается для улучшения визуального представления статистики или трендов данных.

Когда требуется отобразить большое количество данных, гистограмма особенно полезна для изображения формы ее распределения. Весь диапазон данных разбит на интервалы, и количество точек данных, попадающих в каждую, подсчитывается для получения частоты класса. Диапазон или ширина интервала определяет количество классов гистограммы и влияет на форму графика.

Если интервал слишком велик, значительная информация может быть опущена из-за слишком широкого включения классов. Когда выбор ширины интервала слишком узок, низкая частота класса может придавать чрезмерное значение тому, что на самом деле является случайным изменением. Есть несколько методов для установки соответствующего количества классов гистограмм для набора данных.

Согласно правилу Стерджиса, количество классов должно быть близко к основанию 2 log числа точек данных плюс один. Используя правило Райса, количество определенных классов должно быть вдвое больше корня куба от числа точек данных. Какой бы метод не использовался при выборе количества классов гистограммы, следует попробовать несколько различных значений ширины, чтобы проверить чувствительность формы гистограммы к размеру класса. Правильное количество классов - это то, которое наиболее точно отображает распределение данных.

При правильном количестве классов гистограмм для диапазона данных должно получиться осмысленное графическое представление, обеспечивающее четкую интерпретацию. Гистограмма должна показывать центр и разброс данных, любую асимметрию или асимметрию данных, а также выбросы или точки данных, возникающие за пределами ожидаемого диапазона значений. Режим или наиболее часто встречающееся значение должно быть очевидным, а также группировки, которые могут указывать на множественную модальность. Анализ гистограммы также может указывать на ошибки в процессе сбора данных.

Давно используемые в финансах и социальных науках, гистограммы становятся все более знакомыми в графических дисплеях бытовой электроники. Цифровая фотография особенно открыта для их использования, так как многие камеры снабжены цветной гистограммой для отображения баланса белого и экспозиции. Гистограмма цифровой фотографии может также отображать пиксели в виде классов гистограммы, нанесенных на оттенки серого.