Wat is karaktercodering?

Karaktercodering, in computerprogrammering, is een methode of algoritme die wordt gebruikt om een meestal numerieke weergave van een teken, glyph of symbool te vinden. Het gebruik van tekencodering in computers is noodzakelijk omdat informatie binnen computergeheugen en op computer-leesbare media wordt opgeslagen als sequenties van bits of cijfers. Dit vereist het gebruik van codering om niet-numerieke tekens te vertalen die worden gebruikt voor display of mens-leesbare uitvoer in een vorm die een computer kan manipuleren. In een meer specifieke toepassing kunnen documenten HyperText Markup Language (HTML) die worden gelezen door webbrowsers definiëren welk type tekencodes ze gebruiken om de browser te laten weten welk specifieke teken ingesteld is om de informatie in het document weer te geven. Er zijn verschillende coderingsschema's in gebruik, hoewel veel van deze eigen en legacy -sets langzaam worden vervangen door de Unicode® -coderingsstandaard.

In de begindagen van computers, toen er beperkte geheugenruimte was, werden de basiskarakters van het Engelse alfabet-inclusief interpunctie en cijfers-opgeslagen in 7-bits sequenties die 128 verschillende tekens mogelijk maken. In dit oorspronkelijke schema vertegenwoordigde elke 7-bit byte één karakter van het Engelse alfabet, genummerd in volgorde. Deze karaktercodering was efficiënt en werd uiteindelijk gestandaardiseerd en gebruikt in de meeste computers die werden geproduceerd. Hoewel het coderingssysteem is geëvolueerd naar de Standaard van Unicode® coderen, bleef het concept hetzelfde. Namelijk, elk enkel teken in een taal is direct gerelateerd aan een enkel nummer binnen een grote standaard tekenset, en dat nummer is wat een computer gebruikt om het teken op te slaan, te verwerken en te indexeren.

Andere soorten karaktercodering werden om verschillende redenen ontwikkeld. Sommigen die specifiek op het Engelse alfabet waren gericht en bedoeld waren om te worden gebruikt voor tekst, heeft alleen hun charact in kaart gebrachters op 7-bit sequenties en verspreiden ze vervolgens over 8-bit bytes of octetten. Dit had het effect van het besparen van 1 bit per octet, effectief met behulp van karaktercodering als een type compressie. Andere coderende schema's probeerden basisinformatie over een personage te verstrekken, en vervolgens aanvullende tekens om speciale accenten te vertegenwoordigen die konden worden gebruikt bij het schrijven in een andere taal, hoewel deze grotendeels werden verlaten voor de eenvoudigere één-op-één coderingsmethoden.

In HTML -documenten is het coderen van tekens ongeveer hetzelfde als het bredere concept, behalve dat de gedefinieerde codering een hele reeks tekens omvat. Dit kan niet alleen belangrijk zijn voor vreemde talen, maar voor documenten die specifieke symbolen gebruiken voor wetenschap of wiskunde die niet aanwezig zijn in alle tekensets. Het kan ook nuttig zijn voor het gebruik van interpunctie en andere glyphs die mogelijk niet aanwezig zijn of anders worden toegewezen in coderingsschema's. Documenten die niet goed een niet-standaard karakter definiërenCodering kan onjuist weergeven of worden gevuld met onzinnige tekens en tijdelijke aanduidingen in plaats van leesbare informatie.

Wat is karaktercodering?

ANDERE TALEN