ইউনিকোড হল একটি আন্তর্জাতিক মান যা সারা বিশ্বের সকল অক্ষরকে কম্পিউটারে সুসঙ্গতভাবে উপস্থাপন এবং পরিচালনা করার জন্য ডিজাইন করা হয়েছে।
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
ASCII, UTF-8, UTF-16, HTML এন্টিটি, URL এনকোডিং এ রূপান্তর করতে পারবেন।
-
-
-
UTF-8 প্রধানত ওয়েবে ব্যবহৃত হয় এবং ASCII এর সাথে ভালো সামঞ্জস্য রয়েছে। UTF-16 পূর্ব এশিয়ার অক্ষরের জন্য দক্ষ এবং Java/Windows এ ব্যবহৃত হয়।
এটি সাধারণত charset ঘোষণা অনুপস্থিত থাকার বা সার্বার/ক্লায়েন্ট এনকোডিং অসমঞ্জস্যতার কারণে ঘটে। পরীক্ষা করুন।
UTF-8 এ বেশিরভাগ ইমোজি 4 বাইটে এনকোড করা হয়। (উদাহরণ: 😊 = F0 9F 98 8A)