Co to jest szeroki charakter?

Szeroki znak to znak komputerowy o rozmiarze przekraczającym standardowy 8-bitowy pomiar. Znaki w zestawie komputerowym, takim jak Universal Character Set (USC), stanowią doskonały przykład szerokich znaków, ponieważ USC może być kodowany w formacie 16-bitowym lub 32-bitowym. Różni się to od starszych, znormalizowanych zestawów znaków, takich jak amerykański standardowy kod wymiany informacji (ASCII), który wykorzystuje znaki nie więcej niż 7-bitowe. Zaletą kodowania zestawów znaków w szerokich znakach jest to, że pozwala ono na więcej czasu na dodanie dodatkowych i złożonych symboli do zestawu, dając projektantom znaków szerszy zakres swobody. Wady polegają na dodatkowym zużyciu pamięci, ponieważ szerokie zestawy znaków zużywają więcej pamięci systemowej, gdy są aktywne na komputerze.

Zestawy znaków należy dostosować do pracy z określonymi systemami operacyjnymi, a szerokie znaki nie różnią się od siebie. W systemach operacyjnych Windows® - zarówno w wersji 32-bitowej, jak i 64-bitowej - należy dostosować szeroki zestaw znaków, aby pasował do 16-bitowej struktury, oferując dwukrotnie większą pojemność dla każdego znaku w porównaniu do „standardowego” zestawu 8-bitowego. Z drugiej strony Unix® wymaga szerokich znaków, aby dopasować się do 32-bitowego frameworka, oferując czterokrotnie większą pojemność niż podstawowy zestaw znaków.

Największą zaletą szerokich zestawów znaków jest to, że pozwalają one na niestandardowe symbole i większą wszechstronność w włączaniu różnych języków do ich interfejsów. Na przykład szerokie zestawy znaków mogą zawierać standardowy alfabet angielski, a także języki takie jak cyrylica i grecki w tym samym czasie. Oznacza to, że jeden zestaw szerokich znaków może dotyczyć osób z wielu krajów, w przeciwieństwie do wymagania unikalnego zestawu znaków o małej szerokości dla każdego regionu językowego.

Chociaż przydatne w standaryzacji wersji oprogramowania w różnych regionach językowych, zestawy szerokich znaków są w cenie. Ta cena stanowi dodatkowy koszt narzutu pamięci. 16-bitowy zestaw znaków oferuje podwójną pojemność w porównaniu ze standardowym zestawem 8-bitowym, ale zużywa dwa razy więcej pamięci. To samo dotyczy 32-bitowych zestawów znaków, które połykają znaczącą czterokrotnie więcej pamięci niż konwencjonalne zestawy znaków.

Z punktu widzenia obliczeń i statystyki jest to znaczny „koszt” pamięci. W praktyce jednak koszt nie jest tak wielki, jak mogłoby się wydawać. Współczesne komputery często zawierają cztery lub więcej gigabajtów pamięci systemowej, co sprawia, że ​​przechowywanie nawet dużego 32-bitowego zestawu znaków jest praktycznie nieistotne w praktyce. Tylko najbardziej przepracowane - lub słabo wyposażone - komputery zauważą znaczny spadek wydajności przy użyciu zestawu szerokich postaci.

INNE JĘZYKI

Czy ten artykuł był pomocny? Dzięki za opinie Dzięki za opinie

Jak możemy pomóc? Jak możemy pomóc?