Unicode 是一个国际标准,旨在在计算机上一致地表示和处理世界上所有的字符。
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
您可以转换为 ASCII、UTF-8、UTF-16、HTML 实体和 URL 编码。
-
-
-
UTF-8 主要用于网络,具有良好的 ASCII 兼容性。UTF-16 对东亚字符高效,用于 Java/Windows。
通常由于缺少 charset 声明或服务器/客户端编码不匹配。请检查 。
大多数表情符号在 UTF-8 中编码为 4 字节。(例如:😊 = F0 9F 98 8A)