Hvad er en bred karakter?

Et bredt tegn er en computerkarakter, der har en størrelse, der overstiger standard 8-bitmåling. Tegn i et computersæt, såsom Universal Character Set (USC), illustrerer et fremragende eksempel på brede tegn, da USC kan kodes i 16-bit eller 32-bit formater. Dette adskiller sig fra ældre, standardiserede tegnsæt, såsom den amerikanske standardkode for informationsudveksling (ASCII), der bruger karakter på højst 7-bit. Fordelen ved at kode tegnsæt i brede tegn er, at det giver mulighed for mere åndedrætsværelse, når det er tid til at tilføje yderligere og komplekse symboler til sættet, hvilket giver tegnet designere et større udvalg af frihed. Ulemper kommer i form af yderligere hukommelsesforbrug, da brede tegnsæt bruger mere systemhukommelse, mens de er aktive på computeren.

Karaktersæt skal tilpasses, så de fungerer med specifikke operativsystemer, og brede tegn er ikke forskellige. For Windows®-operativsystemer - både 32 og 64-bit versioner - skal brede tegnsæt tilpasses, så de passer inden for en 16-bit ramme, der tilbyder dobbelt lagerkapacitet for hvert tegn sammenlignet med et "standard" 8-bit sæt. På den anden side kræver Unix® brede tegn for at passe til en 32-bit ramme, der tilbyder fire gange kapaciteten i et grundlæggende tegnsæt.

Den største fordel ved brede tegnsæt er, at de giver mulighed for ikke-standard symboler og større alsidighed ved at inkludere forskellige sprog i deres grænseflader. F.eks. Kan brede tegnsæt omfatte det almindelige engelske alfabet sammen med sprog som kyrillisk og græsk på samme tid. Dette betyder, at et enkelt sæt med brede tegn kan gælde for individer, der spænder over flere lande, i modsætning til at kræve et unikt ikke-bredt sæt tegn for hvert individuelt sprogområde.

Selvom det er nyttigt at hjælpe med at standardisere versioner af software på tværs af forskellige sprogregioner, kommer sæt med brede tegn til en pris. Denne pris er en ekstra omkostning i hukommelsesomkostninger. Mens et 16-bit tegnsæt tilbyder dobbelt så stor kapacitet som et standard 8-bit sæt, forbruger det også dobbelt så meget hukommelse. Det samme gælder 32-bit tegnsæt, der sluger en markant fire gange så meget hukommelse som konventionelle tegnsæt.

Fra computing og statistiske perspektiver er dette en betydelig "omkostning" til hukommelsen. I praktisk anvendelse er omkostningerne imidlertid ikke så store, som det kan se ud til. Moderne computere indeholder ofte fire eller flere gigabyte af systemhukommelse, hvilket gør lagring af endda et stort 32-bit tegnsæt ret praktisk ubetydeligt. Kun de mest overarbejdede - eller undermagtsfulde - computere bemærker et betydeligt ydeevne fra brug af sæt med brede tegn.

Hvad er en bred karakter?

Hjalp denne artikel dig?