优秀的HTML分析器
谁能推荐一个好的HTML/XHTML解析器,类似于
HTMLParser.HTMLParser或htmllib.HTMLParser,但能够智能
是否知道某些标记(如
)是隐式闭合的?我需要
遍历整个DOM,构建一个DOM路径,但stdlib
解析器不会为任何隐式关闭的标记调用handdendtag().
我查看了BeautifulSoup,但它似乎只能通过首先解析才能工作
整个文档,然后允许您查询该文档
之后.我需要像SAX解析器这样的东西.
谁能推荐一个好的HTML/XHTML解析器,类似于
HTMLParser.HTMLParser或htmllib.HTMLParser,但能够智能
是否知道某些标记(如
)是隐式闭合的?我需要
遍历整个DOM,构建一个DOM路径,但stdlib
解析器不会为任何隐式关闭的标记调用handdendtag().
我查看了BeautifulSoup,但它似乎只能通过首先解析才能工作
整个文档,然后允许您查询该文档
之后.我需要像SAX解析器这样的东西.