Cosa sono le classi di istogrammi?
Le classi di istogrammi sono intervalli di valori che contengono punti dati in una distribuzione di frequenza o tabulazione di dati grezzi. Sono anche indicati come intervalli, bin o larghezze del cestino. In un istogramma, un tipo di grafico a barre, queste classi sono rappresentate come colonne verticali in cui l'altezza della colonna indica il numero di punti dati contenuti nell'intervallo di classi. In genere, la scelta della classe dell'istogramma viene effettuata per migliorare la rappresentazione visiva delle statistiche o delle tendenze dei dati.
Quando è presente una grande quantità di dati da visualizzare, un istogramma è particolarmente utile per rappresentare la forma della sua distribuzione. Un'intera gamma di dati viene suddivisa in intervalli e il numero di punti dati che cadono in ciascuno viene conteggiato per fornire la frequenza della classe. L'intervallo o la larghezza dell'intervallo determina il numero di classi di istogrammi e influenza la forma del grafico.
Se l'intervallo è troppo ampio, le informazioni significative potrebbero essere omesse dalle classi essendo troppo inclusive. Quando la scelta della larghezza dell'intervallo è troppo stretta, una frequenza di classe bassa potrebbe dare un'indebita importanza a ciò che è in realtà una variazione casuale. Esistono diversi metodi per impostare un numero appropriato di classi di istogrammi per un set di dati.
Secondo la regola di Sturgis, il numero di classi dovrebbe essere vicino al registro di base 2 del numero di punti dati, più uno. Usando la regola di Rice, il numero di classi definite dovrebbe essere il doppio della radice del cubo del numero di punti dati. Qualunque sia il metodo utilizzato per selezionare il numero di classi di istogrammi, è necessario provare diverse larghezze diverse per testare la sensibilità della forma dell'istogramma rispetto alla dimensione della classe. Il numero corretto di classi è quello che descrive più accuratamente la distribuzione dei dati.
Con il numero corretto di classi di istogrammi per un intervallo di dati, dovrebbe risultare una rappresentazione grafica significativa che consenta una chiara interpretazione. Un istogramma dovrebbe mostrare il centro e la diffusione dei dati, qualsiasi asimmetria, asimmetria dei dati e valori anomali o punti di dati che si verificano al di fuori dell'intervallo di valori previsto. La modalità, o il valore più frequente, dovrebbe essere evidente così come i raggruppamenti che potrebbero indicare una modalità multipla. L'analisi dell'istogramma potrebbe anche indicare errori nel processo di raccolta dei dati.
Da tempo utilizzati nella finanza e nelle scienze sociali, gli istogrammi stanno diventando più familiari nelle visualizzazioni grafiche dell'elettronica di consumo. La fotografia digitale è particolarmente aperta al loro utilizzo, con molte fotocamere che incorporano un istogramma a colori per indicare il bilanciamento del bianco e l'esposizione. Un istogramma di fotografia digitale potrebbe anche mostrare pixel come classi di istogrammi tracciate contro sfumature di grigio.