Java StringTokenizer 类本身并不能直接处理 HTML 标签,但你可以通过编写一个简单的函数来解析 HTML 标签并提取所需的内容。以下是一个示例函数,用于解析 HTML 标签并返回标签名称和内容:
import java.util.StringTokenizer; public class HtmlParser { public static void main(String[] args) { String html = ""; StringTokenizer tokenizer = new StringTokenizer(html); while (tokenizer.hasMoreTokens()) { String token = tokenizer.nextToken(); if (isHtmlTag(token)) { System.out.println("Tag: " + token); } else { System.out.println("Content: " + token); } } } public static boolean isHtmlTag(String token) { return token.startsWith("<") && token.endsWith(">"); } }这是一个 示例 HTML 文本。
这个示例中的 isHtmlTag
函数用于检查给定的字符串是否是一个 HTML 标签。如果是,它将返回 true,否则返回 false。在 main
函数中,我们使用 StringTokenizer 类遍历 HTML 字符串,并使用 isHtmlTag
函数判断每个令牌是否是 HTML 标签。如果是标签,我们打印标签名称;否则,我们打印内容。
请注意,这个示例仅用于演示目的,实际应用中可能需要更复杂的解析器来处理嵌套标签和属性。在这种情况下,可以考虑使用 Java 的 Jsoup 库,它是一个功能强大的 HTML 解析库。