Unicode — это международный стандарт, предназначенный для последовательного представления и обработки всех символов мира на компьютерах.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
Переменная длина (1-4 байта), совместим с ASCII, веб-стандарт
Переменная длина (2-4 байта), большинство символов BMP в 2 байтах
Введите любую строку, чтобы быстро конвертировать ее в ASCII, UTF-16, UTF-8, HTML-сущности или URL-кодировку и увидеть результат.
-
-
-
UTF-8 в основном используется в Интернете и имеет хорошую совместимость с ASCII. UTF-16 эффективен для восточноазиатских символов и используется в Java/Windows.
Обычно из-за отсутствия объявления charset или несоответствия кодировки сервер/клиент. Проверьте .
Большинство эмодзи кодируются как 4 байта в UTF-8. (Пример: 😊 = F0 9F 98 8A)