ইউনিকোড হল একটি আন্তর্জাতিক মান যা সারা বিশ্বের সকল অক্ষরকে কম্পিউটারে সুসঙ্গতভাবে উপস্থাপন এবং পরিচালনা করার জন্য ডিজাইন করা হয়েছে।
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
পরিবর্তনশীল দৈর্ঘ্য (1-4 বাইট), ASCII সামঞ্জস্যপূর্ণ, ওয়েব স্ট্যান্ডার্ড
পরিবর্তনশীল দৈর্ঘ্য (2-4 বাইট), বেশিরভাগ BMP অক্ষর 2 বাইটে
স্ট্রিং টাইপ করলে তা সহজেই ASCII, UTF-16, UTF-8, HTML entity বা URL encode এ রূপান্তর ও দেখা যাবে।
-
-
-
UTF-8 প্রধানত ওয়েবে ব্যবহৃত হয় এবং ASCII এর সাথে ভালো সামঞ্জস্য রয়েছে। UTF-16 পূর্ব এশিয়ার অক্ষরের জন্য দক্ষ এবং Java/Windows এ ব্যবহৃত হয়।
এটি সাধারণত charset ঘোষণা অনুপস্থিত থাকার বা সার্বার/ক্লায়েন্ট এনকোডিং অসমঞ্জস্যতার কারণে ঘটে। পরীক্ষা করুন।
UTF-8 এ বেশিরভাগ ইমোজি 4 বাইটে এনকোড করা হয়। (উদাহরণ: 😊 = F0 9F 98 8A)