Unicode là một tiêu chuẩn quốc tế được thiết kế để đại diện và xử lý nhất quán tất cả các ký tự trên thế giới trên máy tính.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
Độ dài biến đổi (1-4 byte), tương thích ASCII, tiêu chuẩn web
Độ dài biến đổi (2-4 byte), hầu hết ký tự BMP trong 2 byte
Nhập chuỗi và xem nhanh dưới dạng ASCII, UTF-16, UTF-8, HTML entity hoặc mã hóa URL.
-
-
-
UTF-8 chủ yếu được sử dụng trên web và có khả năng tương thích tốt với ASCII. UTF-16 hiệu quả cho các ký tự Đông Á và được sử dụng trong Java/Windows.
Thường là do thiếu khai báo charset hoặc không khớp mã hóa giữa máy chủ/máy khách. Kiểm tra .
Hầu hết emoji được mã hóa thành 4 byte trong UTF-8. (Ví dụ: 😊 = F0 9F 98 8A)