יוניקוד הוא תקן בינלאומי שנועד לייצג ולטפל בכל התווים בעולם באופן עקבי במחשבים.
7비트, 영문 대소문자 및 기본 기호만 표현 (128자)
אורך משתנה (1-4 בתים), תואם ASCII, תקן אינטרנט
אורך משתנה (2-4 בתים), רוב תווי BMP ב-2 בתים
הקלידו מחרוזת כדי להציג אותה במהירות בפורמטים כמו ASCII, UTF-16, UTF-8, ישויות HTML או קידוד URL.
-
-
-
UTF-8 משמש בעיקר באינטרנט ויש לו תאימות טובה ל-ASCII. UTF-16 יעיל לתווי מזרח אסיה ומשמש ב-Java/Windows.
בדרך כלל בגלל הצהרת charset חסרה או אי-התאמה בקידוד שרת/לקוח. בדוק את .
רוב האמוג׳ים מקודדים כ-4 בתים ב-UTF-8. (דוגמה: 😊 = F0 9F 98 8A)