ยูนิโค้ดเป็นมาตรฐานสากลที่ออกแบบมาเพื่อนำเสนอและจัดการอักขระทั้งหมดของโลกอย่างสม่ำเสมอบนคอมพิวเตอร์
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
ความยาวแปรผัน (1-4 ไบต์), เข้ากันได้กับ ASCII, มาตรฐานเว็บ
ความยาวแปรผัน (2-4 ไบต์), อักขระ BMP ส่วนใหญ่ใช้ 2 ไบต์
ใส่สตริงแล้วแปลงเป็น ASCII, UTF-16, UTF-8, HTML Entities หรือ URL encode ได้อย่างรวดเร็ว
-
-
-
UTF-8 ใช้งานบนเว็บเป็นหลักและเข้ากันได้ดีกับ ASCII UTF-16 มีประสิทธิภาพสำหรับอักขระเอเชียตะวันออกและใช้ใน Java/Windows
มักเกิดจากไม่มีการประกาศ charset หรือการเข้ารหัสระหว่างเซิร์ฟเวอร์/ไคลเอ็นต์ไม่ตรงกัน ตรวจสอบ
อีโมจิส่วนใหญ่ถูกเข้ารหัสเป็น 4 ไบต์ใน UTF-8 (ตัวอย่าง: 😊 = F0 9F 98 8A)