Co je kódování postav?
kódování znaků, v počítačovém programování, je metoda nebo algoritmus používaný k nalezení obvykle numerické reprezentace znaku, glyf nebo symbolu. Použití kódování znaků v počítačích je nezbytné, protože informace v paměti počítače a na počítačově čitelném médiu jsou uloženy jako sekvence bitů nebo čísel. To vyžaduje použití kódování k překladu nenumerických znaků, které se používají pro zobrazení nebo člověka čitelný výstup do formy, který může počítač manipulovat. V konkrétnější aplikaci mohou dokumenty Hypertext Markup Language (HTML), které jsou čteny webovými prohlížeči, definovat, jaký typ kódování znaků používají, aby mohli prohlížeč vědět, který konkrétní znak je při zobrazování informací v dokumentu. Existuje několik používaných schémat kódování, i když mnoho z těchto proprietárních a dědických sad je pomalu nahrazováno standardem kódování Unicode®.
V prvních dnech počítačů, kdy byl omezený paměťový prostor, byly základní znaky anglické abecedy-včetně interpunkce a čísel-uloženy v 7bitových sekvencích umožňujících 128 různých znaků. V tomto původním schématu představoval každý 7bitový bajt jeden znak anglické abecedy, očíslovaný v sekvenci. Toto kódování znaků bylo efektivní a bylo nakonec standardizováno a použity ve většině vyrobených počítačů. Ačkoli se kódovací systém vyvinul do standardu kódování Unicode®, koncept zůstal stejný. Konkrétně každý znak v jazyce přímo souvisí s jedním číslem v rámci velké standardní znakové sady a toto číslo je to, co počítač používá k ukládání, zpracování a indexování znaku.
Další typy kódování znaků byly vyvinuty z různých důvodů. Někteří, kteří byli zaměřeni konkrétně na anglickou abecedu a měli být použity pro text pouze mapovali jejich charakterers na 7bitové sekvence a poté je rozložte na 8bitové bajty nebo oktety. To mělo za následek úsporu 1 bit na oktet a efektivně používal kódování znaků jako typ komprese. Další schémata kódování se pokusila poskytnout základní informace o znaku a poté další znaky, které představují speciální akcenty, které by mohly být použity při psaní v jiném jazyce, i když byly do značné míry opuštěny pro jednodušší metody kódování one-to-one.
V dokumentech HTML je kódování znaků zhruba stejné jako širší koncept, s výjimkou definovaného kódování zahrnuje celou sadu znaků. To může být důležité nejen pro cizí jazyky, ale také pro dokumenty, které používají specifické symboly pro vědu nebo matematiku, které nejsou přítomny ve všech znakových sadách. Může být také užitečné pro použití interpunkční a jiných glyfů, které by nemohly být přítomny nebo jsou mapovány odlišně napříč kódovacími schématy. Dokumenty, které nedefinují nestandardní znakKódování by se mohlo namísto čitelných informací zobrazit nesprávně nebo být naplněno nesmyslnými znaky a zástupnými symboly.