Unicode là một tiêu chuẩn quốc tế được thiết kế để đại diện và xử lý nhất quán tất cả các ký tự trên thế giới trên máy tính.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
Bạn có thể chuyển đổi sang ASCII, UTF-8, UTF-16, thực thể HTML và mã hóa URL.
-
-
-
UTF-8 chủ yếu được sử dụng trên web và có khả năng tương thích tốt với ASCII. UTF-16 hiệu quả cho các ký tự Đông Á và được sử dụng trong Java/Windows.
Thường là do thiếu khai báo charset hoặc không khớp mã hóa giữa máy chủ/máy khách. Kiểm tra .
Hầu hết emoji được mã hóa thành 4 byte trong UTF-8. (Ví dụ: 😊 = F0 9F 98 8A)