O que é um gráfico de caixa?
Um gráfico de caixa ou diagrama de caixa e bigode é um método para organizar dados numéricos em uma única linha numérica, que pode ser horizontal ou vertical. A caixa real, quando a plotagem é horizontal, fica ligeiramente acima da linha numérica e é composta por três linhas verticais, conectadas entre si por linhas horizontais. Os limites horizontais da caixa representam o primeiro e o terceiro quartis (percentis 25 e 75), separados pela linha do meio, que é a mediana dos dados ou o percentil 50. Nos dois lados da caixa, a partir do meio das linhas horizontais, as linhas verticais, às vezes chamadas de bigodes, se estendem. Quando atingem os números mínimo e máximo do conjunto de dados, terminam em linhas horizontais menores, embora isso possa variar um pouco, dependendo da propagação dos dados.
Existem alguns elementos importantes que compõem um bom gráfico de caixa e alguns números que as pessoas precisam saber quando criam esses gráficos. O primeiro deles é chamado de resumo de cinco números, frequentemente abreviado como cinco num. soma. Esta é uma lista do primeiro e terceiro quartis, mediana e número mínimo e máximo dos dados. Em algumas aplicações, as pessoas precisarão listá-las perto da plotagem, embora a análise de uma plotagem com uma boa linha numérica também possa derivar esses números observando as três linhas horizontais e os bigodes finais. Não é uma questão de galinha / ovo para a pessoa que desenha um enredo porque os cinco num. soma. deve ser usado para criar a plotagem.
As pessoas também precisam conhecer um número chamado intervalo interquartil (IQR). Subtrair o primeiro quartil do terceiro quartil deriva do IQR e o uso de diferentes softwares ou calculadoras científicas também pode obter esse número e o resumo de cinco números, inserindo todos os dados. O IQR é importante porque as linhas que se estendem da caixa geralmente se estendem apenas a 1,5 vezes o IQR. Dados além desse ponto são indicados por pontos, em vez de uma linha contínua. Esses pontos geralmente sugerem que os dados possuem valores discrepantes.
Existe uma variedade de usos para o gráfico de caixas. Vários gráficos podem ser desenhados acima de uma linha numérica e podem comparar conjuntos de dados semelhantes diferenciados por algum fator importante. Por exemplo, cientistas ou estatísticos podem registrar a freqüência cardíaca de homens e mulheres e, em seguida, construir dois gráficos de caixas empilhadas para procurar diferenças significativas em alcance e quartis.
Os gráficos de caixa não abordam a frequência dos dados. A falta de uma escala adicional (vertical ou horizontal) omite informações sobre números repetidos, tamanho do conjunto de dados e a maioria dos números individuais. A pessoa que estiver visualizando um gráfico de caixas entenderá melhor o resumo de cinco números, o intervalo e se os dados têm discrepâncias. O tamanho da caixa, a relação da mediana com os quartis e o comprimento dos bigodes pode mostrar se os dados estão distorcidos, mas não podem falar de coisas como média, modo ou desvio padrão. Outros gráficos, como histogramas, podem ser mais úteis quando as pessoas desejam representar coisas como frequência ou obter melhores visuais sobre a distribuição de dados.