在Java中,字符和字符串默认使用Unicode编码
- 使用
\u
表示法:
public class UnicodeExample { public static void main(String[] args) { char unicodeChar = '你'; // 你 System.out.println("Unicode character: " + unicodeChar); String unicodeString = "你好"; // 你好 System.out.println("Unicode string: " + unicodeString); } }
- 使用
Character
类的方法:
public class UnicodeExample { public static void main(String[] args) { char unicodeChar = Character.toChars(0x4F60)[0]; // 你 System.out.println("Unicode character: " + unicodeChar); } }
- 使用
String
类的构造函数:
public class UnicodeExample { public static void main(String[] args) { byte[] unicodeBytes = new byte[]{(byte) 0xE4, (byte) 0xBD, (byte) 0xA0}; // 你 try { String unicodeString = new String(unicodeBytes, "UTF-8"); System.out.println("Unicode string: " + unicodeString); } catch (UnsupportedEncodingException e) { e.printStackTrace(); } } }
注意:在处理Unicode字符时,请确保源代码文件的编码格式与Unicode字符匹配。通常情况下,建议使用UTF-8编码。