Hvad er en bred karakter?
En bred karakter er en computerkarakter, der har en størrelse, der overstiger standard 8-bit-måling. Tegn i et computersæt, såsom Universal-tegnsættet (USC), illustrerer et godt eksempel på bredkarakterer, da USC kan kodes i 16-bit eller 32-bit formater. Dette adskiller sig fra ældre, standardiserede tegnsæt, såsom den amerikanske standardkode til informationsudveksling (ASCII), der bruger karakter af højst 7-bit. Fordelen ved at kode tegnsæt i brede karakterer er, at det giver mulighed for mere åndedrætsværelse, når det er tid til at tilføje yderligere og komplekse symboler til sættet, hvilket giver karakterdesignere en bredere række frihed. Ulemper kommer i form af yderligere hukommelsesforbrug, da brede karaktersæt bruger mere systemhukommelse, mens de er aktive på computeren.
tegnsæt skal tilpasses til at arbejde med specifikke operativsystemer, og brede tegn er ikke forskellige. Til Windows®-operativsystemer-både 32 og 64-bit versioner-i hele CHaracter-sæt skal være skræddersyet til at passe inden for en 16-bit ramme, der tilbyder to gange lagerkapaciteten for hver karakter sammenlignet med et "standard" 8-bit sæt. UNIX® kræver på den anden side brede tegn, der passer til en 32-bit ramme, der tilbyder fire gange kapaciteten af et grundlæggende tegnsæt.
Den største fordel ved brede karaktersæt er, at de giver mulighed for ikke-standardsymboler og større alsidighed i at inkludere forskellige sprog inden for deres grænseflader. For eksempel kan brede karaktersæt omfatte det standard engelske alfabet sammen med sprog som kyrillisk og græsk på samme tid. Dette betyder, at et enkelt sæt brede karakterer kan gælde for enkeltpersoner, der spænder over flere lande, i modsætning til at kræve et unikt ikke-bredt sæt karakterer til hver enkelt sprogregion.
Selvom det er nyttigt at hjælpe med at standardisere versioner af software på tværs af forskellige sprogregIoner, sæt brede karakterer kommer til en pris. Denne pris er en ekstra omkostning i hukommelsesomkostningen. Mens et 16-bit tegnsæt tilbyder dobbelt så stor kapacitet på et standard 8-bit sæt, forbruger det også dobbelt så meget hukommelse. Det samme gælder for 32-bit tegnsæt, der sluger en betydelig fire gange så meget hukommelse som konventionelle karaktersæt.
Fra computing og statistiske perspektiver er dette en betydelig "omkostning" til hukommelsen. I praktisk anvendelse er omkostningerne imidlertid ikke så store, som det kan se ud. Moderne computere indeholder ofte fire eller flere gigabyte af systemhukommelse, hvilket gør opbevaring af endda et stort 32-bit tegnsæt, der er temmelig ubetydeligt i praksis. Kun de mest overarbejdede - eller underpowered - computere vil bemærke et betydeligt præstationshit fra at bruge sæt brede karakterer.