您在Java中推荐哪些HTML解析库

您在Java中推荐哪些HTML解析库

What HTML parsing libraries do you recommend in Java

我想解析一些HTML,以便找到某些属性/标签等的值。

您推荐什么HTML解析器? 任何利弊?


NekoHTML,TagSoup和JTidy将允许您解析HTML,然后使用XPath等XML工具进行处理。


我已经尝试过HTML Parser,这简直就是死路。


您需要对HTML进行完整的解析吗? 如果您只是在内容中查找特定的值(特定的标记/参数),则简单的正则表达式可能就足够了,并且可能会更快。


推荐阅读