Unicode er en international standard designet til at repræsentere og håndtere alle verdens tegn på en konsistent måde på computere.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
Du kan konvertere til ASCII, UTF-8, UTF-16, HTML entiteter, URL kodning.
-
-
-
UTF-8 bruges hovedsageligt på nettet og har god ASCII-kompatibilitet. UTF-16 er effektivt til østasiatiske tegn og bruges i Java/Windows.
Normalt på grund af manglende charset-erklæring eller server/klient kodningsuoverensstemmelse. Tjek .
De fleste emoji kodes som 4 bytes i UTF-8. (Eksempel: 😊 = F0 9F 98 8A)