Wat is een breed karakter?

Een breed karakter is een computerkarakter dat groter is dan de standaard 8-bit meting. Tekens in een computerset zoals de Universal Character Set (USC) illustreren een goed voorbeeld van brede tekens, omdat USC kan worden gecodeerd in 16-bits of 32-bits indelingen. Dit verschilt van oudere, gestandaardiseerde tekensets zoals de American Standard Code for Information Interchange (ASCII), die een karakter van niet meer dan 7 bits gebruikt. Het voordeel van het coderen van tekensets in brede tekens is dat het voor meer ademruimte zorgt wanneer het tijd is om extra en complexe symbolen aan de set toe te voegen, waardoor tekenontwerpers meer vrijheid krijgen. Nadelen komen in de vorm van extra geheugenverbruik, omdat brede tekensets meer systeemgeheugen gebruiken terwijl ze actief zijn op de computer.

Tekensets moeten worden aangepast om te werken met specifieke besturingssystemen, en brede tekens zijn niet anders. Voor Windows®-besturingssystemen - zowel 32- als 64-bits versies - moeten brede tekensets worden aangepast om binnen een 16-bits framework te passen, met tweemaal de opslagcapaciteit voor elk teken in vergelijking met een "standaard" 8-bits set. Unix® daarentegen vereist brede tekens die passen in een 32-bits framework en biedt vier keer de capaciteit van een basistekenset.

Het grootste voordeel van brede tekensets is dat ze niet-standaard symbolen en een grotere veelzijdigheid mogelijk maken door verschillende talen in hun interfaces op te nemen. Brede tekensets kunnen bijvoorbeeld het standaard Engelse alfabet bevatten, samen met talen zoals Cyrillisch en Grieks tegelijkertijd. Dit betekent dat een enkele reeks brede tekens van toepassing kan zijn op personen in meerdere landen, in tegenstelling tot het vereisen van een unieke niet-brede reeks tekens voor elke afzonderlijke taalregio.

Hoewel nuttig om te helpen bij het standaardiseren van softwareversies in verschillende taalregio's, zijn sets met brede tekens duur. Die prijs is een extra kost voor geheugenoverhead. Hoewel een 16-bits tekenset dubbel zoveel capaciteit biedt als een standaard 8-bits set, verbruikt deze ook twee keer zoveel geheugen. Hetzelfde geldt voor 32-bits tekensets, die een aanzienlijk vier keer zoveel geheugen inslikken als conventionele tekensets.

Vanuit computer- en statistisch oogpunt zijn dit aanzienlijke "kosten" voor het geheugen. In de praktische toepassing zijn de kosten echter niet zo hoog als het lijkt. Moderne computers bevatten vaak vier of meer gigabytes systeemgeheugen, waardoor de opslag van zelfs een grote 32-bits tekenset in de praktijk tamelijk te verwaarlozen is. Alleen de meest overwerkte - of ondermaatse - computers zullen een aanzienlijke prestatiehit merken door het gebruik van sets van brede karakters.

ANDERE TALEN

heeft dit artikel jou geholpen? bedankt voor de feedback bedankt voor de feedback

Hoe kunnen we helpen? Hoe kunnen we helpen?