ユニコードは、世界中のすべての文字をコンピュータ上で一貫して表現・処理できるように設計された国際標準です。
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
ASCII、UTF-8、UTF-16、HTMLエンティティ、URLエンコーディングに変換できます。
-
-
-
UTF-8は主にWebで使用され、ASCIIとの互換性が良いです。UTF-16は東アジアの文字に効率的で、Java/Windowsで使用されています。
主にcharset宣言の欠如やサーバー/クライアント間のエンコーディング不一致が原因です。を確認してください。
UTF-8では多くの絵文字が4バイトでエンコードされます。(例:😊 = F0 9F 98 8A)