HTML Karakter Kümeleri


Bir HTML sayfasını doğru bir şekilde görüntülemek için tarayıcının hangi karakter setini (kodlama) kullanacağını bilmesi gerekir:

Örnek

<meta charset="UTF-8">

HTML Karakter Kümeleri

HTML5 spesifikasyonu, web geliştiricilerini UTF-8 karakter setini kullanmaya teşvik eder!

Bu her zaman böyle olmamıştır. Erken web için karakter kodlaması ASCII idi.

Daha sonra, HTML 2.0'dan HTML 4.01'e, ISO-8859-1 standart karakter seti olarak kabul edildi.

XML ve HTML5 ile UTF-8 nihayet geldi ve birçok karakter kodlama problemini çözdü.


Başlangıçta: ASCII

Bilgisayar verileri elektronikte ikili kodlar (01000101) olarak saklanır.

Metnin depolanmasını standart hale getirmek için, Bilgi Değişimi için Amerikan Standart Kodu (ASCII) oluşturuldu. 0-9 arasındaki sayıları, büyük ve küçük harf alfabesini (az, AZ) ve ! $ + - ( ) @ < > , .

ASCII karakter için 7 bit kullandığından, sadece 128 farklı karakteri temsil edebilir.

ASCII ile ilgili en büyük zayıflık, İngilizce olmayan harfleri hariç tutmasıydı.

ASCII, özellikle büyük ana bilgisayar sistemlerinde bugün hala kullanılmaktadır.

Daha yakından bakmak için lütfen Eksiksiz ASCII Referansımızı inceleyin .


Windows'ta: Windows-1252

Windows-1252, Windows 95'e kadar Windows'ta varsayılan karakter kümesiydi.

Eklenen uluslararası karakterlerle ASCII'nin bir uzantısıdır.

256 farklı karakteri temsil etmek için tam bir bayt (8 bit) kullanır.

Windows-1252, Windows'ta varsayılan olduğundan, tüm tarayıcılar tarafından desteklenir.

Daha yakından bakmak için lütfen şu makaleyi inceleyin: Tam Windows-1252 Referansı .



HTML 4'te: ISO-8859-1

HTML 4'te en sık kullanılan karakter seti ISO-8859-1 idi.

ISO-8859-1, eklenen uluslararası karakterlerle ASCII'nin bir uzantısıdır.

Örnek

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

HTML 4'te, <meta> etiketinde ISO-8859-1'den farklı bir karakter kümesi belirtilebilir:

Örnek

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Tüm HTML 4 işlemcileri ayrıca UTF-8'i destekler:

Örnek

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

Bir tarayıcı ISO-8859-1'i algıladığında, Windows-1252'de 32 uluslararası karakter daha olduğundan, normalde varsayılan olarak Windows-1252'ye ayarlanır.

Daha yakından bakmak için lütfen inceleyin: Eksiksiz ISO-8859-1 Referansı


HTML5'te: Unicode UTF-8

HTML5 spesifikasyonu, web geliştiricilerini UTF-8 karakter setini kullanmaya teşvik eder.

Örnek

<meta charset="UTF-8">

<meta> etiketinde UTF-8'den farklı bir karakter kümesi belirtilebilir:

Örnek

<meta charset="ISO-8859-1">

Unicode Konsorsiyumu, ISO-8859 karakter kümelerinin sınırlı olması ve çok dilli bir ortamla uyumlu olmaması nedeniyle UTF-8 ve UTF-16 standartlarını geliştirdi.

Unicode Standardı (neredeyse) dünyadaki tüm karakterleri, noktalama işaretlerini ve sembolleri kapsar.

Tüm HTML5 ve XML işlemciler UTF-8, UTF-16, Windows-1252 ve ISO-8859'u destekler.

Daha yakından bakmak için lütfen inceleyin: Tam Unicode Referansı .