Unicode es un estándar internacional diseñado para representar y manejar de manera consistente todos los caracteres del mundo en computadoras.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
Longitud variable (1-4 bytes), compatible con ASCII, estándar web
Longitud variable (2-4 bytes), la mayoría de caracteres BMP en 2 bytes
Ingresa una cadena y transfórmala rápidamente a formatos ASCII, UTF-16, UTF-8, entidades HTML o codificación URL.
-
-
-
UTF-8 se usa principalmente en la web y tiene buena compatibilidad con ASCII. UTF-16 es eficiente para caracteres de Asia oriental y se usa en Java/Windows.
Normalmente por falta de declaración charset o incompatibilidad de codificación servidor/cliente. Verifica .
La mayoría de los emojis se codifican como 4 bytes en UTF-8. (Ejemplo: 😊 = F0 9F 98 8A)