Laskin/Tietokonelaskin/ Unicode-laskin

Mikä on Unicode?

Unicode on kansainvälinen standardi, joka on suunniteltu esittämään ja käsittelemään johdonmukaisesti kaikkia maailman merkkejä tietokoneilla.

Tärkeimmät koodausmenetelmät

ASCII

7비트, 영문 대소문자 및 기본 기호만 표현 (128자)

UTF-8

Muuttuva pituus (1-4 tavua), ASCII-yhteensopiva, web-standardi

UTF-16

Muuttuva pituus (2-4 tavua), useimmat BMP-merkit 2 tavussa

Syötä merkkijono ja muunna se nopeasti ASCII-, UTF-16-, UTF-8-, HTML-entiteeteiksi tai URL-koodaukseksi.

Syötekenttä


Esimerkkitiedot
Merkkimäärä: 0
Tavumäärä: 0
Koodipisteiden määrä: 0

Tulos


ASCII

-

Unicode(UTF-16)

-

Unicode(UTF-8) Hex

-

HTML-entiteetti

-

URL-koodaus

-

Yksityiskohtainen merkkikohtainen analyysi

UTF-8-koodauksen visualisointi

1. Unicode-koodipiste

-

2. UTF-8-koodausprosessi

-

3. Lopputulos

-

Usein kysytyt kysymykset

Mikä on ero UTF-8:n ja UTF-16:n välillä?

UTF-8 on pääasiassa käytössä verkossa ja sillä on hyvä ASCII-yhteensopivuus. UTF-16 on tehokas itäaasialaisten merkkien koodaamiseen ja sitä käytetään Javassa/Windowsissa.

Miksi korealaiset merkit näyttävät rikkilta verkossa?

Yleensä puuttuvan charset-määrityksen tai palvelimen/asiakkaan koodauksen yhteensopimattomuuden vuoksi. Tarkista .

Montako tavua emojit ovat?

Useimmat emojit koodataan 4 tavuna UTF-8:ssa. (Esimerkki: 😊 = F0 9F 98 8A)