A Unicode egy nemzetközi szabvány, amely a világ minden karakterének egységes megjelenítését és kezelését teszi lehetővé számítógépeken.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
Konvertálhat ASCII, UTF-8, UTF-16, HTML entitások és URL kódolás formátumokba.
-
-
-
Az UTF-8-at főként a weben használják, és jó ASCII kompatibilitással rendelkezik. Az UTF-16 hatékony a kelet-ázsiai karakterekhez, és Java/Windows környezetben használatos.
Általában hiányzó charset deklaráció vagy szerver/kliens kódolás eltérés miatt. Ellenőrizze a beállítást.
A legtöbb emoji 4 bájtként van kódolva az UTF-8-ban. (Példa: 😊 = F0 9F 98 8A)