Wat is een breed personage?

Een breed teken is een computerteken met een grootte die de standaard 8-bit meting overschrijdt. Tekens in een computerset zoals de Universal Character Set (USC) illustreren een goed voorbeeld van brede karakter, omdat USC kan worden gecodeerd in 16-bit of 32-bits formaten. Dit verschilt van oudere, gestandaardiseerde tekensets zoals de American Standard Code for Information Interchange (ASCII), die het karakter van niet meer dan 7-bits gebruikt. Het voordeel voor het coderen van tekensets in brede tekens is dat het meer ademruimte mogelijk maakt wanneer het tijd is om extra en complexe symbolen aan de set toe te voegen, waardoor karakterontwerpers een breder scala aan vrijheid hebben. Nadelen komen in de vorm van extra geheugenverbruik, omdat brede tekensets meer systeemgeheugen gebruiken terwijl actief op de computer.

tekensets moeten worden aangepast om te werken met specifieke besturingssystemen en brede tekens zijn niet anders. Voor Windows®-besturingssystemen-zowel 32 als 64-bit versies-brede cHaracter-sets moeten worden aangepast om binnen een 16-bits framework te passen, en biedt twee keer de opslagcapaciteit voor elk personage in vergelijking met een "standaard" 8-bits set. Unix® daarentegen vereist dat brede tekens een 32-bits framework passen en vier keer de capaciteit van een basiskarakterset bieden.

Het grootste voordeel van brede tekensets is dat ze niet-standaard symbolen en grotere veelzijdigheid mogelijk maken bij het opnemen van verschillende talen in hun interfaces. Brede tekensets kunnen bijvoorbeeld het standaard Engelse alfabet bevatten, samen met talen zoals Cyrillic en Grieks tegelijkertijd. Dit betekent dat een enkele set brede karakters van toepassing kan zijn op individuen die meerdere landen overspannen, in tegenstelling tot een unieke niet-brede set karakters voor elke afzonderlijke taalregio.

Hoewel nuttig om te helpen bij het standaardiseren van versies van software in verschillende taal Regionen, sets brede karakters hebben een prijs. Die prijs is een extra kosten in geheugenoverhead. Hoewel een 16-bits tekenset het dubbele van de capaciteit van een standaard 8-bits set biedt, verbruikt deze ook twee keer zoveel geheugen. Hetzelfde geldt voor 32-bit tekensets, die een significant vier keer zoveel geheugen doorslikken als conventionele tekensets.

Vanuit computer- en statistische perspectieven is dit een belangrijke "kosten" voor het geheugen. In de praktische toepassing zijn de kosten echter niet zo groot als het lijkt. Moderne computers bevatten vaak vier of meer gigabytes systeemgeheugen, waardoor de opslag van zelfs een grote 32-bits tekens is die in de praktijk redelijk te verwaarlozen is. Alleen de meest overwerkte - of ondermacht - computers zullen een aanzienlijke prestatiehit opmerken van het gebruik van sets brede tekens.

ANDERE TALEN