Unicode ialah piawaian antarabangsa yang direka untuk mewakili dan mengendalikan semua aksara dunia secara konsisten di komputer.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
Panjang berubah (1-4 bait), serasi ASCII, standard web
Panjang berubah (2-4 bait), kebanyakan aksara BMP dalam 2 bait
Masukkan rentetan untuk menukarnya dengan cepat kepada ASCII, UTF-16, UTF-8, entiti HTML atau pengekodan URL.
-
-
-
UTF-8 digunakan terutamanya di web dan mempunyai keserasian ASCII yang baik. UTF-16 berkesan untuk aksara Asia Timur dan digunakan dalam Java/Windows.
Biasanya disebabkan oleh pengisytiharan charset yang hilang atau ketidakserasian pengekodan pelayan/klien. Semak .
Kebanyakan emoji dikodkan sebagai 4 bait dalam UTF-8. (Contoh: 😊 = F0 9F 98 8A)