Vad är en ruta tomt?
Ett låddiagram eller ruta-och-vispdiagram är en metod för att organisera numeriska data längs en enda sifferrad, som kan vara antingen horisontell eller vertikal. Den faktiska rutan, när tomten är horisontell, sitter något ovanför siffrelinjen och består av tre vertikala linjer, sammankopplade med horisontella linjer. De horisontella gränserna för rutan representerar den första och tredje kvartilen (25: e och 75: e percentilen), åtskilda med mittlinjen, vilket är datans median eller 50: e percentilen. På vardera sidan av lådan plottas från mitten av de horisontella linjerna, sträcker sig vertikala linjer, ibland kallade whiskers. När dessa når minsta och högsta antal av datauppsättningen, slutar de i mindre horisontella linjer, men detta kan variera något beroende på dataspridning.
Det finns några viktiga element som utgör en bra ruta plot, och vissa nummer som folk behöver veta när de skapar dessa diagram. Den första av dessa kallas sammanfattningen av fem nummer, ofta förkortad till fem num. summa. Detta är en lista över första och tredje kvartiler, median, och minsta och maximala antalet data. I vissa applikationer kommer människor att behöva lista dessa nära tomten, även om analys av en tomt med en bra sifferrad också kan härleda dessa siffror genom att titta på de tre horisontella linjerna och de avslutande whiskersna. Det är inte en kyckling / äggfråga för den person som tecknar en tomt eftersom fem num. summa. måste användas för att skapa tomten.
Människor behöver också känna till ett nummer som kallas interkvartilområdet (IQR). Att subtrahera den första kvartilen från den tredje kvartilen härleder IQR, och att använda olika mjukvaror eller vetenskapliga kalkylatorer kan också få detta nummer och sammanfattningen av fem nummer genom att mata in all data. IQR är viktigt eftersom linjer som sträcker sig från rutan vanligtvis bara sträcker sig till 1,5 gånger IQR. Data bortom den punkten indikeras med punkter i stället för en kontinuerlig linje. Dessa punkter tyder ofta på att uppgifterna har utdelare.
En mängd olika användningsområden finns för lådan. Flera tomter kan ritas över en siffra och kan jämföra liknande uppsättningar av data som är differentierade med någon viktig faktor. Till exempel kan forskare eller statistiker registrera hjärtfrekvensen för män och kvinnor och sedan konstruera två staplade lådor för att leta efter betydande skillnader i räckvidd och kvartiler.
Boxrutor adresserar inte datafrekvens. Avsaknaden av en extra skala (vertikal eller horisontell) utelämnar information om upprepade siffror, datauppsättningens storlek och de flesta individuella nummer. Personen som tittar på en ruta-tomt kommer mest att förstå sammanfattningen av fem siffror, intervall och om uppgifterna har några utskott. Rutstorlek, förhållande mellan median och kvartiler och längd på vispor kan visa om data är sned, men det kan inte tala till saker som medelvärde, läge eller standardavvikelse. Andra diagram som histogram kan vara mer användbara när människor vill representera saker som frekvens eller hämta bättre bilder om datadistribution.