Qu'est-ce qu'une courbe de distribution de fréquence?
Une courbe de distribution de fréquence est un type de statistique descriptive décrite sous forme de graphique qui montre la fréquence d'apparition d'une variable donnée, où x représente une mesure de l'occurrence de la variable et y représente le nombre d'observations à chaque fréquence. Avec de très grandes populations, on dit qu'une courbe de distribution de fréquence ressemble à l'idéal statistique d'une courbe en cloche et assume les propriétés d'une distribution normale. La courbe en cloche - également appelée courbe normale - porte bien son nom. Cela ressemble à une cloche arrondie avec des extrémités symétriques se rétrécissant vers le bas et descendant vers une fréquence nulle sur l'axe des x. La courbe en cloche est divisée en deux par la moyenne (µ), la médiane et le mode identiques idéalisés de toutes les données mesurées, avec la moitié de chaque graphique de chaque côté.
Lorsqu'on suppose qu'une courbe de distribution de fréquence d'échantillonnage possède les propriétés d'une courbe en cloche idéale, on peut également supposer certains aspects de la population étudiée. De plus, les formules statistiques standard peuvent donner une idée suffisante de ces hypothèses. Avec la courbe en cloche idéale, la moyenne, la médiane et le mode d'une population sont supposés être égaux. Le calcul de l'écart type, σ, donne ensuite une mesure de la "dispersion" des données de population. Dans la courbe idéale, toutes les données d'une population, sauf 0,25%, se trouvent à plus ou moins trois écarts-types de la moyenne de la courbe de distribution de fréquence, ou entre μ-3σ et μ + 3σ.
Bien que la courbe en cloche idéale diffère de plusieurs manières de la courbe de distribution de fréquence d'un échantillon, elle permet de mieux comprendre à la fois la population de l'échantillon et même le lieu d'une seule mesure dans la population de l'échantillon global. Dans une courbe idéale, 68% des valeurs de la variable mesurée dans l’échantillon, et vraisemblablement dans la population, se situeront dans les limites d’un écart-type de la moyenne dans un sens ou dans l’autre, ou μ-1σ et μ + 1σ. En continuant le long de la courbe en cloche, les valeurs de 95% de l'échantillon et de la population seront situées à plus ou moins deux écarts-types de la moyenne, soit μ-2σ et μ + 2σ. Aux limites mêmes de la courbe de distribution de fréquence, tous sauf 0,25% se situent à plus ou moins trois écarts-types. Les rares mesures qui se situent dans les 0,25% au-delà des mesures de trois écarts-types sont appelées valeurs aberrantes et sont souvent supprimées des données lorsque des calculs par déduction ont lieu.