Unicode es un estándar internacional diseñado para representar y manejar de manera consistente todos los caracteres del mundo en computadoras.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
Puedes convertir a ASCII, UTF-8, UTF-16, entidades HTML y codificación URL.
-
-
-
UTF-8 se usa principalmente en la web y tiene buena compatibilidad con ASCII. UTF-16 es eficiente para caracteres de Asia oriental y se usa en Java/Windows.
Normalmente por falta de declaración charset o incompatibilidad de codificación servidor/cliente. Verifica .
La mayoría de los emojis se codifican como 4 bytes en UTF-8. (Ejemplo: 😊 = F0 9F 98 8A)