Java中的split()方法使用正则表达式作为分隔符来分割字符串。正则表达式支持以下特性:
- 字面字符:普通的未经转义的字符,如字母、数字、汉字等,表示自身。例如,
a
表示字符 ‘a’。 - 元字符:具有特殊含义的字符,用于表示匹配模式。例如,
.
表示任意单个字符,*
表示前面的元素可以重复0次或多次,?
表示前面的元素可以重复0次或1次。 - 限定符:用于限制元字符的重复次数。例如,
{n}
表示前面的元素恰好重复n次,{n,}
表示前面的元素至少重复n次,{n,m}
表示前面的元素至少重复n次,最多重复m次。 - 字符类:用方括号
[]
包含一组字符,表示其中任意一个字符。例如,[abc]
表示匹配任意一个字母(a、b或c)。 - 分组:用圆括号
()
包含一组字符或元字符,表示将这组字符整体进行匹配。分组可以用于限定限定符的作用范围,也可以用于提取匹配的子字符串。 - 选择:用竖线
|
表示或的关系,表示匹配其中的任意一个模式。例如,a|b
表示匹配字符 ‘a’ 或 ‘b’。 - 转义字符:使用反斜杠
\
对特殊字符进行转义,使其表示自身。例如,\.
表示匹配字符 ‘.’ 而不是任意单个字符。 - 预定义字符类:Java的正则表达式提供了一些预定义的字符类,如
\d
表示数字,\D
表示非数字,\w
表示单词字符(字母、数字或下划线),\W
表示非单词字符,\s
表示空白字符(空格、制表符或换行符),\S
表示非空白字符。
这些特性可以组合使用,以创建复杂的正则表达式来匹配各种字符串模式。在使用split()方法时,需要确保正则表达式正确地描述了要分割的字符串的模式。