Skip to main content

O que é um caractere amplo?

Um caractere amplo é um caractere de computador que possui um tamanho que excede a medição padrão de 8 bits. Os caracteres de um conjunto de computador, como o Universal Character Set (USC), ilustram um excelente exemplo de caracteres largos, pois o USC pode ser codificado em formatos de 16 ou 32 bits. Isso difere dos conjuntos de caracteres padronizados mais antigos, como o ASCII (American Standard Code for Information Interchange), que utiliza caracteres de não mais que 7 bits. A vantagem de codificar conjuntos de caracteres em caracteres largos é que ele permite mais espaço para respirar quando chega a hora de adicionar símbolos adicionais e complexos ao conjunto, oferecendo aos designers de caracteres uma ampla gama de liberdade. As desvantagens surgem na forma de consumo adicional de memória, pois conjuntos amplos de caracteres usam mais memória do sistema enquanto estão ativos no computador.

Os conjuntos de caracteres devem ser personalizados para trabalhar com sistemas operacionais específicos, e os caracteres amplos não são diferentes. Para sistemas operacionais Windows® - versões de 32 e 64 bits - os conjuntos de caracteres amplos devem ser adaptados para caber em uma estrutura de 16 bits, oferecendo o dobro da capacidade de armazenamento de cada caractere em comparação com um conjunto de 8 bits "padrão". O Unix®, por outro lado, requer caracteres largos para se ajustar a uma estrutura de 32 bits, oferecendo quatro vezes a capacidade de um conjunto de caracteres básico.

A maior vantagem dos conjuntos de caracteres amplos é que eles permitem símbolos fora do padrão e maior versatilidade na inclusão de diferentes idiomas em suas interfaces. Por exemplo, conjuntos de caracteres amplos podem incluir o alfabeto inglês padrão, além de idiomas como cirílico e grego ao mesmo tempo. Isso significa que um único conjunto de caracteres amplos pode ser aplicado a indivíduos em vários países, em vez de exigir um conjunto não amplo de caracteres exclusivo para cada região de idioma individual.

Embora útil para ajudar a padronizar versões de software em diferentes regiões de idiomas, conjuntos de caracteres largos têm um preço. Esse preço é um custo adicional na sobrecarga de memória. Enquanto um conjunto de caracteres de 16 bits oferece o dobro da capacidade de um conjunto padrão de 8 bits, ele também consome o dobro de memória. O mesmo se aplica aos conjuntos de caracteres de 32 bits, que consomem quatro vezes mais memória do que os conjuntos de caracteres convencionais.

Do ponto de vista computacional e estatístico, esse é um "custo" significativo para a memória. Na aplicação prática, no entanto, o custo não é tão alto quanto parece. Os computadores modernos geralmente contêm quatro ou mais gigabytes de memória do sistema, tornando o armazenamento de até um grande conjunto de caracteres de 32 bits praticamente insignificante na prática. Somente os computadores mais sobrecarregados - ou com pouca energia - perceberão um impacto substancial no desempenho ao usar conjuntos de caracteres largos.