Unicode adalah standar internasional yang dirancang untuk merepresentasikan dan menangani semua karakter di dunia secara konsisten di komputer.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
Anda dapat mengonversi ke ASCII, UTF-8, UTF-16, entitas HTML, dan pengodean URL.
-
-
-
UTF-8 terutama digunakan di web dan memiliki kompatibilitas ASCII yang baik. UTF-16 efisien untuk karakter Asia Timur dan digunakan di Java/Windows.
Biasanya karena deklarasi charset yang hilang atau ketidaksesuaian pengodean server/klien. Periksa .
Sebagian besar emoji dikodekan sebagai 4 byte dalam UTF-8. (Contoh: 😊 = F0 9F 98 8A)