ワイドキャラクターとは
ワイド文字とは、標準の8ビット測定値を超えるサイズのコンピューター文字です。 USCは16ビットまたは32ビット形式でエンコードできるため、ユニバーサルキャラクターセット(USC)などのコンピューターセットの文字は、ワイド文字の代表的な例を示しています。 これは、7ビット以下の文字を使用する情報交換用の米国標準コード(ASCII)などの古い標準化された文字セットとは異なります。 ワイド文字で文字セットをエンコードすることの利点は、セットに追加の複雑なシンボルを追加するときに、より広いスペースを確保できることです。これにより、キャラクター設計者はより広い範囲の自由を得ることができます。 ワイド文字セットはコンピューター上でアクティブになっている間、より多くのシステムメモリを使用するため、追加のメモリ消費という欠点があります。
文字セットは、特定のオペレーティングシステムで動作するようにカスタマイズする必要があり、ワイド文字も同じです。 Windows®オペレーティングシステム(32ビットバージョンと64ビットバージョンの両方)の場合、ワイド文字セットは16ビットフレームワーク内に収まるように調整する必要があり、「標準」8ビットセットと比較して2文字のストレージ容量を提供します。 一方、Unix®は、32ビットフレームワークに適合するためにワイド文字を必要とし、基本的な文字セットの4倍の容量を提供します。
ワイド文字セットの最大の利点は、非標準のシンボルと、インターフェイス内にさまざまな言語を含める際の汎用性が高いことです。 たとえば、ワイド文字セットには、標準の英語のアルファベットと、キリル文字やギリシャ語などの言語を同時に含めることができます。 これは、個々の言語地域ごとに一意の非ワイド文字セットを要求するのではなく、複数の国にまたがる個人にワイド文字の単一セットを適用できることを意味します。
さまざまな言語地域でソフトウェアのバージョンを標準化するのに役立ちますが、ワイド文字のセットにはコストがかかります。 その価格は、メモリオーバーヘッドの追加コストです。 16ビット文字セットは標準の8ビットセットの2倍の容量を提供しますが、2倍のメモリを消費します。 同じことが32ビット文字セットにも当てはまります。これは、従来の文字セットの4倍のメモリを飲み込みます。
計算と統計の観点から、これはメモリにとって大きな「コスト」です。 ただし、実際のアプリケーションでは、コストは見かけほど大きくありません。 最近のコンピューターには、4ギガバイト以上のシステムメモリが含まれていることが多く、大きな32ビット文字セットでさえ、実際にはほとんど無視できます。 最も働きがいのある(または能力の低い)コンピューターのみが、ワイド文字のセットを使用することでパフォーマンスが大幅に低下することに気付くでしょう。