Unicode ist ein internationaler Standard zur konsistenten Darstellung und Verarbeitung aller Schriftzeichen der Welt auf Computern.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
Variable Länge (1-4 Bytes), ASCII-kompatibel, Web-Standard
Variable Länge (2-4 Bytes), die meisten BMP-Zeichen in 2 Bytes
Sie können in ASCII, UTF-8, UTF-16, HTML-Entitäten und URL-Kodierung konvertieren.
-
-
-
UTF-8 wird hauptsächlich im Web verwendet und bietet gute ASCII-Kompatibilität. UTF-16 ist effizient für ostasiatische Zeichen und wird in Java/Windows verwendet.
Hauptsächlich aufgrund fehlender Charset-Deklaration oder Inkompatibilität der Server-/Client-Kodierung. Prüfen Sie .
Die meisten Emojis werden in UTF-8 als 4 Bytes kodiert. (Beispiel: 😊 = F0 9F 98 8A)