Unicode é um padrão internacional projetado para representar e manipular de forma consistente todos os caracteres do mundo em computadores.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
Você pode converter para ASCII, UTF-8, UTF-16, entidades HTML e codificação URL.
-
-
-
UTF-8 é usado principalmente na web e tem boa compatibilidade com ASCII. UTF-16 é eficiente para caracteres do Leste Asiático e é usado em Java/Windows.
Geralmente por falta de declaração charset ou incompatibilidade de codificação servidor/cliente. Verifique .
A maioria dos emojis é codificada como 4 bytes em UTF-8. (Exemplo: 😊 = F0 9F 98 8A)