यूनिकोड एक अंतरराष्ट्रीय मानक है जो दुनिया के सभी अक्षरों को कंप्यूटर पर निरंतर प्रतिनिधित्व और प्रबंधित करने के लिए डिज़ाइन किया गया है।
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
가변 길이 (1-4바이트), ASCII 호환, 웹 표준
가변 길이 (2-4바이트), BMP 대부분 2바이트
आप ASCII, UTF-8, UTF-16, HTML एंटिटी और URL एन्कोडिंग में परिवर्तित कर सकते हैं।
-
-
-
UTF-8 मुख्य रूप से वेब पर उपयोग किया जाता है और इसमें ASCII के साथ अच्छी संगतता है। UTF-16 पूर्वी एशियाई वर्णों के लिए कुशल है और Java/Windows में उपयोग किया जाता है।
मुख्य रूप से charset घोषणा गायब होने या सर्वर/क्लाइंट एन्कोडिंग असंगति के कारण। की जाँच करें।
अधिकांश इमोजी UTF-8 में 4 बाइट्स के रूप में एन्कोड होते हैं। (उदाहरण: 😊 = F0 9F 98 8A)