Unicode je mezinárodní standard navržený k reprezentaci a zpracování všech znaků světa konzistentním způsobem na počítačích.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
Můžete převádět na ASCII, UTF-8, UTF-16, HTML entity, URL kódování.
-
-
-
UTF-8 se používá hlavně na webu a má dobrou kompatibilitu s ASCII. UTF-16 je efektivní pro východoasijské znaky a používá se v Javě/Windows.
Většinou kvůli chybějící deklaraci charset nebo nekompatibilitě kódování server/klient. Zkontrolujte .
Většina emoji se v UTF-8 kóduje jako 4 bajty. (Příklad: 😊 = F0 9F 98 8A)