Hva er en bred karakter?
Et bredt tegn er en datamaskinkarakter som har en størrelse som overstiger standard 8-biters måling. Tegn i et datamaskinsett som Universal Character Set (USC) illustrerer et godt eksempel på brede tegn, da USC kan kodes i 16-biters eller 32-biters formater. Dette skiller seg fra eldre, standardiserte tegnsett som den amerikanske standardkoden for informasjonsutveksling (ASCII), som bruker ikke mer enn 7 biter. Fordelen med å kode tegnsett i brede tegn er at det gir rom for mer pusterom når det er på tide å legge til flere og komplekse symboler til settet, noe som gir karakterdesignere et bredere spekter av frihet. Ulemper kommer i form av ekstra minneforbruk, ettersom brede tegnsett bruker mer systemminne mens du er aktiv på datamaskinen.
Karakterer må tilpasses for å fungere med spesifikke operativsystemer, og brede tegn er ikke forskjellige. For Windows®-operativsystemer - både 32 og 64-bits versjoner - må brede tegnsett tilpasses for å passe innenfor en 16-biters ramme, og tilbyr dobbelt lagringskapasitet for hvert tegn sammenlignet med et "standard" 8-bits sett. Unix® krever derimot brede tegn for å passe til et 32-biters rammeverk, og tilbyr fire ganger kapasiteten til et grunnleggende tegnsett.
Den største fordelen med brede tegnsett er at de gir rom for ikke-standard symboler og større allsidighet ved å inkludere forskjellige språk i grensesnittene. For eksempel kan brede tegnsett inkludere det vanlige engelske alfabetet, sammen med språk som kyrillisk og gresk på samme tid. Dette betyr at et enkelt sett med brede tegn kan gjelde for individer som spenner over flere land, i motsetning til å kreve et unikt sett med ikke-brede tegn for hvert språk.
Selv om det er nyttig for å standardisere versjoner av programvare i forskjellige språkregioner, kommer sett med brede tegn til en pris. Den prisen er en ekstra kostnad i minnet overhead. Mens et 16-bits tegnsett tilbyr dobbelt så stor kapasitet som et standard 8-bits sett, bruker det også dobbelt så mye minne. Det samme gjelder 32-bits tegnsett, som svelger en betydelig fire ganger så mye minne som konvensjonelle tegnsett.
Fra databehandling og statistiske perspektiver er dette en betydelig "kostnad" for minnet. I praktisk anvendelse er imidlertid kostnadene ikke så store som det kan virke. Moderne datamaskiner inneholder ofte fire eller flere gigabyte systemminne, noe som gjør lagring av til og med et stort 32-bits tegnsett nokså ubetydelig i praksis. Bare de mest overarbeidede - eller underkraftige - datamaskinene vil merke en betydelig ytelse fra bruk av sett med brede tegn.