Vad är ett brett karaktär?
Ett brett tecken är ett datortecken som har en storlek som överstiger standardmätningen med 8 bitar. Tecken i en datoruppsättning som Universal Character Set (USC) illustrerar ett utmärkt exempel på breda tecken, eftersom USC kan kodas i 16-bitars eller 32-bitarsformat. Detta skiljer sig från äldre, standardiserade teckenuppsättningar som American Standard Code for Information Interchange (ASCII), som använder tecken på högst 7-bitar. Fördelen med att koda teckenuppsättningar i breda tecken är att det möjliggör mer andningsutrymme när det är dags att lägga till ytterligare och komplexa symboler till uppsättningen, vilket ger karaktärsdesigners ett större utbud av frihet. Nackdelar kommer i form av ytterligare minneskonsumtion, eftersom breda teckenuppsättningar använder mer systemminne när de är aktiva på datorn.
Teckenuppsättningar måste anpassas för att fungera med specifika operativsystem, och breda tecken är inte annorlunda. För Windows®-operativsystem - både 32- och 64-bitarsversioner - måste breda teckenuppsättningar skräddarsys för att passa in i en 16-bitars ram, vilket erbjuder två gånger lagringskapaciteten för varje tecken jämfört med en "standard" 8-bitarsuppsättning. Unix®, å andra sidan, kräver breda tecken för att passa en 32-bitars ram, vilket erbjuder fyra gånger kapaciteten för en grundläggande teckenuppsättning.
Den största fördelen med breda teckenuppsättningar är att de möjliggör symboler som inte är standard och större mångsidighet i att inkludera olika språk i sina gränssnitt. Till exempel kan breda teckenuppsättningar inkludera det vanliga engelska alfabetet, tillsammans med språk som kyrilliska och grekiska samtidigt. Detta innebär att en enda uppsättning breda tecken kan tillämpas på individer som spänner över flera länder, i motsats till att de kräver en unik uppsättning tecken som inte är bred för varje enskilt språkområde.
Även om det är användbart för att standardisera versioner av programvara i olika språkregioner, kommer uppsättningar med breda tecken till ett pris. Det priset är en extra kostnad i minnet. Medan en 16-bitars teckenuppsättning erbjuder dubbla kapaciteten för en standard 8-bitarsuppsättning, förbrukar den också dubbelt så mycket minne. Detsamma gäller 32-bitars teckenuppsättningar, som sväljer ett betydande fyra gånger så mycket minne som konventionella teckenuppsättningar.
Från beräkningar och statistiska perspektiv är detta en betydande "kostnad" för minnet. I praktisk tillämpning är dock kostnaden inte så stora som det kan verka. Moderna datorer innehåller ofta fyra eller fler gigabyte systemminne, vilket gör lagring av till och med en stor 32-bitars teckenuppsättning ganska försumbar i praktiken. Endast de mest överarbetade - eller underpowered - datorerna kommer att märka en betydande prestanda hit med hjälp av uppsättningar med breda tecken.