Unicode este un standard internațional conceput pentru a reprezenta și gestiona în mod consecvent toate caracterele din lume pe computere.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
Lungime variabilă (1-4 octeți), compatibil ASCII, standard web
Lungime variabilă (2-4 octeți), majoritatea caracterelor BMP în 2 octeți
Introduceți un șir pentru a-l vedea rapid în formatele ASCII, UTF-16, UTF-8, entități HTML sau codificare URL.
-
-
-
UTF-8 este folosit în principal pe web și are o bună compatibilitate ASCII. UTF-16 este eficient pentru caracterele din Asia de Est și este folosit în Java/Windows.
De obicei din cauza lipsei declarației charset sau incompatibilității de codare server/client. Verificați .
Majoritatea emoji-urilor sunt codate ca 4 bytes în UTF-8. (Exemplu: 😊 = F0 9F 98 8A)