Unicode è uno standard internazionale progettato per rappresentare e gestire in modo coerente tutti i caratteri del mondo sui computer.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
Lunghezza variabile (1-4 byte), compatibile ASCII, standard web
Lunghezza variabile (2-4 byte), la maggior parte dei caratteri BMP in 2 byte
Digita una stringa per convertirla rapidamente in ASCII, UTF-16, UTF-8, entità HTML o codifica URL.
-
-
-
UTF-8 è utilizzato principalmente sul web e ha una buona compatibilità ASCII. UTF-16 è efficiente per i caratteri dellAsia orientale ed è utilizzato in Java/Windows.
Principalmente a causa della mancanza di dichiarazione charset o incompatibilità di codifica server/client. Verifica .
La maggior parte degli emoji è codificata come 4 byte in UTF-8. (Esempio: 😊 = F0 9F 98 8A)