यूनिकोड एक अंतरराष्ट्रीय मानक है जो दुनिया के सभी अक्षरों को कंप्यूटर पर निरंतर प्रतिनिधित्व और प्रबंधित करने के लिए डिज़ाइन किया गया है।
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
परिवर्तनीय लंबाई (1-4 बाइट), ASCII संगत, वेब मानक
परिवर्तनीय लंबाई (2-4 बाइट), अधिकांश BMP वर्ण 2 बाइट में
कोई भी स्ट्रिंग दर्ज करें और उसे ASCII, UTF-16, UTF-8, HTML एंटिटी या URL एन्कोडिंग में तेज़ी से बदलकर देखें।
-
-
-
UTF-8 मुख्य रूप से वेब पर उपयोग किया जाता है और इसमें ASCII के साथ अच्छी संगतता है। UTF-16 पूर्वी एशियाई वर्णों के लिए कुशल है और Java/Windows में उपयोग किया जाता है।
मुख्य रूप से charset घोषणा गायब होने या सर्वर/क्लाइंट एन्कोडिंग असंगति के कारण। की जाँच करें।
अधिकांश इमोजी UTF-8 में 4 बाइट्स के रूप में एन्कोड होते हैं। (उदाहरण: 😊 = F0 9F 98 8A)