یونیکد یک استاندارد بینالمللی است که برای نمایش و پردازش یکپارچه تمام کاراکترهای جهان در کامپیوتر طراحی شده است.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
میتوانید به ASCII، UTF-8، UTF-16، موجودیتهای HTML و رمزگذاری URL تبدیل کنید.
-
-
-
UTF-8 عمدتاً در وب استفاده میشود و سازگاری خوبی با ASCII دارد. UTF-16 برای کاراکترهای آسیای شرقی کارآمد است و در Java/Windows استفاده میشود.
معمولاً به دلیل عدم تعریف charset یا عدم تطابق رمزگذاری سرور/کلاینت است. را بررسی کنید.
اکثر ایموجیها در UTF-8 به صورت 4 بایت رمزگذاری میشوند. (مثال: 😊 = F0 9F 98 8A)