Unicode to międzynarodowy standard zaprojektowany w celu spójnej reprezentacji i obsługi wszystkich znaków świata na komputerach.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
Możesz konwertować na ASCII, UTF-8, UTF-16, encje HTML i kodowanie URL.
-
-
-
UTF-8 jest głównie używany w internecie i ma dobrą kompatybilność z ASCII. UTF-16 jest wydajny dla znaków wschodnioazjatyckich i używany w Java/Windows.
Głównie z powodu braku deklaracji charset lub niezgodności kodowania serwer/klient. Sprawdź .
Większość emoji jest kodowana jako 4 bajty w UTF-8. (Przykład: 😊 = F0 9F 98 8A)