Unicode je medzinárodný štandard navrhnutý na konzistentné reprezentovanie a spracovanie všetkých znakov sveta na počítačoch.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
Môžete konvertovať na ASCII, UTF-8, UTF-16, HTML entity a URL kódovanie.
-
-
-
UTF-8 sa používa hlavne na webe a má dobrú kompatibilitu s ASCII. UTF-16 je efektívny pre východoázijské znaky a používa sa v Jave/Windows.
Zvyčajne kvôli chýbajúcej deklarácii charset alebo nekompatibilite kódovania server/klient. Skontrolujte .
Väčšina emoji je kódovaná ako 4 bajty v UTF-8. (Príklad: 😊 = F0 9F 98 8A)