O que é um enredo de caixa?
Um gráfico de caixa ou um diagrama de caixa e whisker é um método para organizar dados numéricos ao longo de uma única linha numérica, que pode ser horizontal ou vertical. A caixa real, quando o gráfico é horizontal, fica ligeiramente acima da linha numérica e é composta por três linhas verticais, conectadas por linhas horizontais. Os limites horizontais da caixa representam o primeiro e o terceiro quartis (percentis 25 e 75), separados pela linha do meio, que é a mediana ou o 50º percentil dos dados. Em ambos os lados do gráfico da caixa do meio das linhas horizontais, as linhas verticais, às vezes chamadas de bigodes, se estendem. Quando eles atingem o número mínimo e máximo do conjunto de dados, eles terminam em linhas horizontais menores, embora isso possa variar um pouco, dependendo da propagação de dados.
Existem alguns elementos importantes que compõem um bom enredo de caixa e alguns números que as pessoas precisam saber quando criam esses gráficos. O primeiro deles é chamado de resumo de cinco números, muitas vezes abreviado as cinco num. soma. Esta é uma lista de primeiros e terceiros quartis, mediana e número mínimo e máximo dos dados. Em algumas aplicações, as pessoas precisarão listá -las próximas ao enredo, embora a análise de um enredo com uma boa linha de números também possa derivar esses números olhando as três linhas horizontais e os bigodes finais. Não é uma pergunta de galinha/ovo para a pessoa que desenha um enredo porque os cinco números. soma. deve ser usado para criar o gráfico.
As pessoas também precisam saber um número chamado intervalo interquartil (IQR). Subtrair o primeiro quartil do terceiro quartil deriva o IQR, e o uso de software ou calculadoras científicas diferentes também pode obter esse número e o resumo do número de cinco números inserindo todos os dados. O IQR é importante porque as linhas que se estendem da caixa geralmente se estendem apenas a 1,5 vezes o IQR. Dados além desse ponto são indicados por pontos em vez de um contínuolinha. Esses pontos geralmente sugerem que os dados têm outliers.
Existe uma variedade de usos para o gráfico da caixa. Várias gráficos podem ser desenhadas acima de uma linha numérica e podem comparar conjuntos semelhantes de dados diferenciados por algum fator importante. Por exemplo, cientistas ou estatísticos podem registrar a freqüência cardíaca de homens e mulheres e, em seguida, construir duas parcelas empilhadas para procurar diferenças significativas no alcance e quartis.
Gráficos de caixas não abordam a frequência de dados. A falta de uma escala adicional (vertical ou horizontal) omite informações sobre os números repetidos, o tamanho do conjunto de dados e a maioria dos números individuais. A pessoa que olha para um gráfico de caixas entenderá mais o resumo de cinco números, o alcance e se os dados têm algum outlier. O tamanho da caixa, a relação da mediana com os quartis e a duração dos bigodes podem mostrar se os dados estão distorcidos, mas não podem falar com coisas como mau, modo ou desvio padrão. Outros gráficos como histogramas podem ser mais úteis quando as pessoas querem representar coisas comofrequência ou derivar melhores visuais sobre a distribuição de dados.