Hvad er en æskediagram?
Et boks plot eller box-and-whisker diagram er en metode til at organisere numeriske data langs en enkelt talelinje, der enten kan være vandret eller lodret. Den egentlige boks, når plottet er vandret, sidder lidt over talelinjen og består af tre lodrette linjer, der er forbundet med vandrette linjer. De vandrette grænser for boksen repræsenterer det første og det tredje kvartil (25. og 75. procentil), adskilt af den midterste linje, som er dataens median eller 50. percentil. På hver side af kassen strækker man sig fra midten af de vandrette linjer, lodrette linjer, nogle gange kaldet whiskers. Når disse når minimums- og maksimumsnumre for datasættet, slutter de i mindre vandrette linjer, skønt dette kan variere lidt afhængigt af dataspredningen.
Der er nogle vigtige elementer, der udgør et godt boks plot, og nogle tal, som folk har brug for at vide, når de opretter disse diagrammer. Den første af disse kaldes sammendraget af fem numre, ofte forkortet til fem num. sum. Dette er en liste over første og tredje kvartil, median og minimum og maksimum antal data. I nogle applikationer er folk nødt til at liste disse nær plot, skønt analyse af et plot med en god talelinje også kan udlede disse tal ved at se på de tre vandrette linjer og de afsluttende whiskers. Det er ikke et kylling / ægspørgsmål for den person, der tegner et plot, fordi fem num. sum. skal bruges til at oprette plot.
Folk har også brug for at kende et tal kaldet interquartile range (IQR). Trækker den første kvartil fra den tredje kvartil stammer IQR, og ved hjælp af forskellige software eller videnskabelige regnemaskiner kan også få dette nummer og de fem numre resumé ved at indtaste alle data. IQR er vigtig, fordi linjer, der strækker sig fra boksen, normalt kun strækker sig til 1,5 gange IQR. Data ud over dette punkt angives med prikker i stedet for en kontinuerlig linje. Disse prikker antyder ofte, at dataene har outliers.
Der findes forskellige anvendelsesformål til kassen. Flere plot kan tegnes over en talelinje og kunne sammenligne lignende datasæt, der er differentieret med en eller anden vigtig faktor. For eksempel kan videnskabsmænd eller statistikere registrere hjerterytme for mænd og kvinder og derefter konstruere to stablede kasseplott til at se efter betydelige forskelle i rækkevidde og kvartiler.
Boksdiagrammer adresserer ikke datafrekvens. Manglen på en yderligere skala (lodret eller vandret) udelader information om gentagelse af tal, datasætstørrelse og de fleste individuelle tal. Personen, der kigger på en kasse-plot, vil mest forstå femtalsoversigten, rækkevidden og om dataene har nogen outliers. Kassestørrelse, forhold mellem median og kvartiler og længde på snørre kan vise, om data er skæve, men det kan ikke tale med ting som middel, tilstand eller standardafvigelse. Andre diagrammer som histogrammer kan være mere nyttige, når folk ønsker at repræsentere ting som hyppighed eller udlede bedre visuelle oplysninger om datadistribution.