Co to jest krzywa rozkładu częstotliwości?
Krzywa rozkładu częstotliwości jest rodzajem statystyki opisowej przedstawionej jako wykres, który pokazuje częstotliwość występowania danej zmiennej, gdzie x reprezentuje pewną miarę występowania zmiennej, a y reprezentuje liczbę przypadków na każdej częstotliwości. W przypadku bardzo dużych populacji mówi się, że krzywa rozkładu częstotliwości przypomina statystyczny ideał krzywej dzwonowej i przyjmuje właściwości rozkładu normalnego. Krzywa dzwonowa - znana również jako krzywa normalna - jest trafnie nazwana. Przypomina zaokrąglony dzwonek z symetrycznymi końcami zwężającymi się i opadającymi w kierunku częstotliwości zerowej na osi x. Krzywa dzwonowa jest podzielona na dwie części przez wyidealizowaną identyczną średnią (μ), medianę i tryb wszystkich zmierzonych danych, z połową każdego wykresu po obu stronach.
Jeżeli zakłada się, że przykładowa krzywa rozkładu częstotliwości posiada właściwości idealnej krzywej dzwonowej, wówczas można również przyjąć aspekty badanej populacji. Ponadto standardowe formuły statystyczne mogą dawać stopień, na którym można polegać na takich założeniach. Przy idealnej krzywej dzwonowej zakłada się, że średnia populacji, mediana i tryb są równe. Obliczenie odchylenia standardowego, σ, daje miarę „rozproszenia” danych populacji. Na idealnej krzywej wszystkie oprócz 0,25 procent całkowitych danych populacji znajdują się w granicach plus minus trzy odchylenia standardowe od średniej krzywej rozkładu częstotliwości lub między μ-3σ a μ + 3σ.
Chociaż idealna krzywa dzwonowa różni się od krzywej rozkładu częstotliwości próbki na wiele sposobów, pozwala ona na pewne przypuszczalne zrozumienie zarówno populacji próbki, jak i nawet lokalizacji pojedynczego pomiaru w całej populacji próbek. W idealnej krzywej 68 procent wartości zmiennej mierzonej w próbce i przypuszczalnie w populacji będzie mieściło się w granicach jednego odchylenia standardowego od średniej w obu kierunkach lub μ-1σ i μ + 1σ. Idąc dalej wzdłuż krzywej dzwonowej, wartości dla 95 procent próbki i populacji będą znajdować się w granicach plus lub minus dwóch standardowych odchyleń od średniej lub μ-2σ i μ + 2σ. Na samym brzegu krzywej rozkładu częstotliwości wszystkie oprócz 0,25 procent mieszczą się w granicach plus minus trzy odchylenia standardowe. Te rzadkie pomiary, które mieszczą się w 0,25 procent poza miarami trzech odchyleń standardowych, są znane jako wartości odstające i często są usuwane z danych podczas obliczeń wnioskowania.