Unicode ist ein internationaler Standard zur konsistenten Darstellung und Verarbeitung aller Schriftzeichen der Welt auf Computern.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
Sie können in ASCII, UTF-8, UTF-16, HTML-Entitäten und URL-Kodierung konvertieren.
-
-
-
UTF-8 wird hauptsächlich im Web verwendet und bietet gute ASCII-Kompatibilität. UTF-16 ist effizient für ostasiatische Zeichen und wird in Java/Windows verwendet.
Hauptsächlich aufgrund fehlender Charset-Deklaration oder Inkompatibilität der Server-/Client-Kodierung. Prüfen Sie .
Die meisten Emojis werden in UTF-8 als 4 Bytes kodiert. (Beispiel: 😊 = F0 9F 98 8A)