Karakter Kodlaması Nedir?

Karakter kodlaması, bilgisayar programlamada, bir karakter, glif veya sembolün genellikle sayısal bir gösterimini bulmak için kullanılan bir yöntem veya algoritmadır. Bilgisayarlarda karakter kodlamanın kullanılması gereklidir, çünkü bilgisayar belleği içindeki ve bilgisayar tarafından okunabilen ortamlardaki bilgiler bit veya sayı dizileri olarak depolanır. Bu, ekran veya insan tarafından okunabilir çıktı için kullanılan sayısal olmayan karakterleri bir bilgisayarın manipüle edebileceği bir şekle çevirmek için kodlamanın kullanılmasını gerektirir. Daha spesifik bir uygulamada, web tarayıcıları tarafından okunan HyperText Markup Language (HTML) belgeleri, tarayıcıda, belgede bilgileri görüntülerken hangi özel karakter setinin kullanılacağını bilmesini sağlamak için hangi karakter kodlamasını kullanacaklarını tanımlayabilir. Kullanılan bazı kodlama şemaları vardır, ancak bu özel ve eski setlerin çoğu yavaşça Unicode® kodlama standardı ile değiştirilmektedir.

Bilgisayarların ilk günlerinde, sınırlı bellek alanı olduğunda, İngilizce alfabenin temel karakterleri - noktalama işaretleri ve sayılar da dahil olmak üzere, 7 farklı dizide 128 farklı karaktere izin verildi. Bu orijinal şemada, her bir 7-bit bayt sırayla numaralandırılmış İngiliz alfabesinin bir karakterini temsil ediyordu. Bu karakter kodlaması etkiliydi ve sonunda standart hale getirildi ve üretilen bilgisayarların çoğunda kullanıldı. Kodlama sistemi Unicode® kodlama standardına geliştiyse de, konsept aynı kaldı. Yani, bir dildeki her bir karakter büyük bir standart karakter kümesindeki tek bir sayı ile doğrudan ilgilidir ve bu sayı bir bilgisayarın karakteri depolamak, işlemek ve dizine almak için kullandığı sayıdır.

Farklı nedenlerden dolayı başka karakter kodlaması türleri geliştirilmiştir. Özellikle İngiliz alfabesine göre düzenlenmiş ve metin için kullanılmak üzere tasarlanan bazı metinler yalnızca karakterlerini 7 bit dizilerle eşleştirdi ve sonra bunları 8 bit bayt veya oktetlere yaydı. Bu, etkin bir sıkıştırma türü olarak karakter kodlamasını kullanarak, oktet başına 1 bit tasarruf etkiye sahipti. Diğer kodlama şemaları, bir karakter hakkında temel bilgiler ve daha sonra bire bir kodlama yöntemleri için büyük ölçüde terk edilmiş olmalarına rağmen, farklı bir dilde yazarken kullanılabilecek özel aksanları temsil eden ek karakterler sunmaya çalışmıştır.

HTML belgelerinde, karakter kodlaması kabaca daha geniş bir konseptle aynıdır, ancak tanımlanan kodlamanın tamamı karakter kümesini kapsaması dışındadır. Bu sadece yabancı diller için değil, fen veya matematik için tüm karakter setlerinde bulunmayan belirli semboller kullanan belgeler için önemli olabilir. Ayrıca, noktalama işaretlerini ve bulunmayan veya kodlama şemaları arasında farklı şekilde eşlenebilecek diğer glifleri kullanmak için de yararlı olabilir. Standart olmayan bir karakter kodlamasını doğru şekilde tanımlamamış belgeler yanlış görüntülenebilir veya okunabilir bilgiler yerine saçma olmayan karakterler ve yer tutucularla doldurulabilir.

Karakter Kodlaması Nedir?

Bu makale faydalı oldu mu?