Kalkylator/Datorkalkylator/ Unicode-kalkylator

Vad är Unicode?

Unicode är en internationell standard som är utformad för att konsekvent representera och hantera alla tecken i världen på datorer.

Huvudsakliga kodningsmetoder

ASCII

7비트, 영문 대소문자 및 기본 기호만 표현 (128자)

UTF-8

Variabel längd (1-4 byte), ASCII-kompatibel, webbstandard

UTF-16

Variabel längd (2-4 byte), de flesta BMP-tecken i 2 byte

Mata in en sträng för att snabbt omvandla den till ASCII, UTF-16, UTF-8, HTML-entiteter eller URL-kodning.

Inmatning


Exempeldata
Antal tecken: 0
Antal bytes: 0
Antal kodpunkter: 0

Resultat


ASCII

-

Unicode(UTF-16)

-

Unicode(UTF-8) Hex

-

HTML-entitet

-

URL-kodning

-

Detaljerad analys per tecken

UTF-8-kodningsvisualisering

1. Unicode-kodpunkt

-

2. UTF-8-kodningsprocess

-

3. Slutresultat

-

Vanliga frågor

Vad är skillnaden mellan UTF-8 och UTF-16?

UTF-8 används främst på webben och har god ASCII-kompatibilitet. UTF-16 är effektivt för östasiatiska tecken och används i Java/Windows.

Varför visas koreanska tecken skadat på webben?

Oftast på grund av saknad charset-deklaration eller server/klient-kodningsinkompatibilitet. Kontrollera .

Hur många bytes är emoji?

De flesta emoji kodas som 4 bytes i UTF-8. (Exempel: 😊 = F0 9F 98 8A)