O que é uma curva de distribuição de frequência?
Uma curva de distribuição de frequência é um tipo de estatística descritiva representada como um gráfico que demonstra a frequência da ocorrência de uma variável, em que x representa alguma medida da ocorrência da variável e y representa o número de casos em cada frequência. Com populações muito grandes, diz-se que uma curva de distribuição de frequência se assemelha ao ideal estatístico de uma curva de sino e assume as propriedades de uma distribuição normal. A curva de sino - também conhecida como curva normal - é apropriadamente chamada. Assemelha-se a um sino arredondado com extremidades simétricas afinando para baixo e para fora em direção a uma frequência zero no eixo x. A curva de sino é dividida pela média idêntica idealizada (μ), mediana e modo de todos os dados medidos, com metade de cada gráfico de cada lado.
Quando se supõe que uma curva de distribuição de frequência da amostra possua as propriedades de uma curva de sino ideal, também podem ser assumidos aspectos da população em estudo. Além disso, as fórmulas estatísticas padrão podem dar um grau em que essas suposições podem ser baseadas. Com a curva de sino ideal, assume-se que a média, mediana e moda de uma população são iguais. O cálculo do desvio padrão, σ, fornece uma medida do "spread" dos dados da população. Na curva ideal, todos, exceto 0,25% do total de dados de uma população, são encontrados dentro de mais ou menos três desvios-padrão da média da curva de distribuição de frequência ou entre μ-3σ e μ + 3σ.
Embora a curva de sino ideal seja diferente de uma curva de distribuição de frequência da amostra de várias maneiras, ela permite uma compreensão suposta da população da amostra e até da localização de uma única medição na população geral da amostra. Em uma curva ideal, 68% dos valores para a variável medida na amostra e presumivelmente na população estarão dentro de um desvio padrão da média em qualquer direção, ou μ-1σ e μ + 1σ. Movendo-se mais ao longo da curva de sino, os valores para 95% da amostra e a população estarão localizados dentro de mais ou menos dois desvios padrão da média, ou μ-2σ e μ + 2σ. Nas extremidades da curva de distribuição de frequência, todos, exceto 0,25%, caem dentro de mais ou menos três desvios padrão. Essas medidas raras que se situam nos 0,25% além das medidas de três desvios-padrão são conhecidas como outliers e geralmente são removidas dos dados quando ocorrem cálculos inferenciais.