Unicode on kansainvälinen standardi, joka on suunniteltu esittämään ja käsittelemään johdonmukaisesti kaikkia maailman merkkejä tietokoneilla.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
Muuttuva pituus (1-4 tavua), ASCII-yhteensopiva, web-standardi
Muuttuva pituus (2-4 tavua), useimmat BMP-merkit 2 tavussa
Syötä merkkijono ja muunna se nopeasti ASCII-, UTF-16-, UTF-8-, HTML-entiteeteiksi tai URL-koodaukseksi.
-
-
-
UTF-8 on pääasiassa käytössä verkossa ja sillä on hyvä ASCII-yhteensopivuus. UTF-16 on tehokas itäaasialaisten merkkien koodaamiseen ja sitä käytetään Javassa/Windowsissa.
Yleensä puuttuvan charset-määrityksen tai palvelimen/asiakkaan koodauksen yhteensopimattomuuden vuoksi. Tarkista .
Useimmat emojit koodataan 4 tavuna UTF-8:ssa. (Esimerkki: 😊 = F0 9F 98 8A)