Histogram Dağılımı Nedir?

İstatistiklerdeki histogram dağılımı, histogramdaki tek değişkenli veri çubuklarının desenlerini, şekillerini ve konumlarını ifade eder. Çubukların nasıl ve nerede dağıtıldığı veriler hakkında sonuçlar çıkarmak ve bunları analiz etmek için kullanılabilir. Histogram dağılım analizi, veri normalliği, multimodal dağılımlar ve eğri veriler gibi özellikleri tanımlamak için önemlidir.

Histogram, verilerin özelliklerini görsel olarak göstermek için alana sınıfla veya bölme frekanslarıyla orantılı dikdörtgenleri kullanan tek değişkenli bir veri ekranıdır. Histogramdaki veri noktaları kutulara ayrılmıştır ve histogram dağılımının kendisi verilerin frekans dağılımının veya olasılık yoğunluğu fonksiyonunun görsel bir yaklaşımıdır. Dağıtımın şekli, kutu sayısına bağlı olarak değişebilir.

Histogram dağılım analizi genellikle veri normalliği için nitel bir kontrol olarak kullanılır. Normallik tespiti için analitik yöntemler mevcut olmasına rağmen, zaman tasarrufu için hızlı, sağduyulu bir kontrol sağlamak için histogramlar kullanılabilir. Histogram verileri kabaca düz görünüyorsa ve ortalamaya ortalanmışsa, verilerin normal olduğu varsayılır. Hızlı ve nispeten kolay olmasına rağmen, bu tür nitel kontrol özneldir ve daha yüksek bir doğruluk standardı gerekiyorsa analitik yöntemler kullanılmalıdır.

Bir veri setinin eğiklik gösterip göstermediğinin belirlenmesi, histogram dağılım analizi kullanmanın başka bir yoludur. Veri eğriliği, verilerde belirgin asimetri olarak tanımlanır. Negatif çarpıklık veya sola çarpıklık, çok az düşük değerli veri setlerinde görülür. Pozitif çarpıklık veya sağa çarpıklık, birkaç yüksek değere sahip veri kümelerinde meydana gelir. Histogram dağılımını gözlemlemek aykırı noktaları ve eğri verileri ortaya çıkarabilir.

Verilerin özelliklerini tek bir modla ortaya çıkarmanın yanı sıra, bir histogramın şekli, multimodal verilerin özelliklerini de gösterebilir. Multimodal veri setleri birden fazla mod içerir ve birden fazla tepe veya maksimaya sahip frekans dağılımları ile karakterize edilir. Bir şehirdeki politik ilişkiler, onaylama anketleri ve vücut büyüklüğü arıları, multimodal olabilen veri kümelerine örnektir. Histogramın şeklini gözlemlemek ve çok modlu verilerde çeşitli tepe noktalarını not etmek, bir araştırmacıya basit tek değişkenli istatistiksel hesaplamaların yapabileceğinden daha fazla içgörü sağlayabilir.

Histogramların analizi ve verilerin dağılımı, seçilen kutu boyutlarına oldukça bağlıdır. Uygulamada, gözenek sayısının karekökü alınarak bölmelerin sayısı tahmin edilebilir, bununla birlikte diğer kutu boyutları kullanılabilir. Örneğin, bir öğretmen harf notlarını yansıtan kutu boyutlarını seçerek test notlarını analiz etmeyi seçebilir.