Unicode is een internationale standaard die is ontworpen om alle tekens in de wereld consistent weer te geven en te verwerken op computers.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
Variabele lengte (1-4 bytes), ASCII-compatibel, webstandaard
Variabele lengte (2-4 bytes), meeste BMP-tekens in 2 bytes
Voer een tekenreeks in om deze snel te converteren naar ASCII, UTF-16, UTF-8, HTML-entiteiten of URL-codering.
-
-
-
UTF-8 wordt voornamelijk gebruikt op het web en heeft goede ASCII-compatibiliteit. UTF-16 is efficiënt voor Oost-Aziatische tekens en wordt gebruikt in Java/Windows.
Meestal door een ontbrekende charset-declaratie of server/client encoding incompatibiliteit. Controleer .
De meeste emojis worden gecodeerd als 4 bytes in UTF-8. (Voorbeeld: 😊 = F0 9F 98 8A)