Bộ tính/Bộ tính máy tính/ Máy tính Unicode

Unicode là gì?

Unicode là một tiêu chuẩn quốc tế được thiết kế để đại diện và xử lý nhất quán tất cả các ký tự trên thế giới trên máy tính.

Các phương pháp mã hóa chính

ASCII

7비트, 영문 대소문자 및 기본 기호만 표현 (128자)

UTF-8

Độ dài biến đổi (1-4 byte), tương thích ASCII, tiêu chuẩn web

UTF-16

Độ dài biến đổi (2-4 byte), hầu hết ký tự BMP trong 2 byte

Nhập chuỗi và xem nhanh dưới dạng ASCII, UTF-16, UTF-8, HTML entity hoặc mã hóa URL.

Nhập liệu


Dữ liệu mẫu
Số lượng ký tự: 0
Số lượng byte: 0
Số lượng điểm mã: 0

Kết quả


ASCII

-

Unicode(UTF-16)

-

Unicode(UTF-8) Hex

-

HTML Entity

-

Mã hóa URL

-

Phân tích chi tiết theo ký tự

Hình dung mã hóa UTF-8

1. Điểm mã Unicode

-

2. Quá trình mã hóa UTF-8

-

3. Kết quả cuối cùng

-

Câu hỏi thường gặp

Sự khác biệt giữa UTF-8 và UTF-16 là gì?

UTF-8 chủ yếu được sử dụng trên web và có khả năng tương thích tốt với ASCII. UTF-16 hiệu quả cho các ký tự Đông Á và được sử dụng trong Java/Windows.

Tại sao ký tự Hàn Quốc hiển thị bị lỗi trên web?

Thường là do thiếu khai báo charset hoặc không khớp mã hóa giữa máy chủ/máy khách. Kiểm tra .

Emoji có bao nhiêu byte?

Hầu hết emoji được mã hóa thành 4 byte trong UTF-8. (Ví dụ: 😊 = F0 9F 98 8A)