Unicode — це міжнародний стандарт, призначений для послідовного представлення та обробки всіх символів світу на компютерах.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
Змінна довжина (1-4 байти), сумісний з ASCII, веб-стандарт
Змінна довжина (2-4 байти), більшість символів BMP у 2 байтах
Введіть рядок, щоб швидко побачити його у форматах ASCII, UTF-16, UTF-8, HTML-сутностей або кодування URL.
-
-
-
UTF-8 в основному використовується в Інтернеті і має хорошу сумісність з ASCII. UTF-16 ефективний для східноазійських символів і використовується в Java/Windows.
Зазвичай через відсутність оголошення charset або невідповідність кодування сервер/клієнт. Перевірте .
Більшість емодзі кодуються як 4 байти в UTF-8. (Приклад: 😊 = F0 9F 98 8A)