Unicode, dünyanın tüm karakterlerini bilgisayarlarda tutarlı bir şekilde temsil etmek ve işlemek için tasarlanmış uluslararası bir standarttır.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
ASCII, UTF-8, UTF-16, HTML varlıkları ve URL kodlamasına dönüştürebilirsiniz.
-
-
-
UTF-8 ağırlıklı olarak webde kullanılır ve iyi ASCII uyumluluğuna sahiptir. UTF-16 Doğu Asya karakterleri için verimlidir ve Java/Windowsta kullanılır.
Çoğunlukla eksik charset bildirimi veya sunucu/istemci kodlama uyumsuzluğu nedeniyle. kontrol edin.
Çoğu emoji UTF-8de 4 bayt olarak kodlanır. (Örnek: 😊 = F0 9F 98 8A)