python mechanize/libxml2dom问题

你好...
我有以下情况,具有以下测试URL:
" http://schedule.psu.edu/soc/fall/alloz/a-c/acctg.html#".
我可以为页面上的课程生成想要的表格列表.
但是,当我尝试创建XPath查询并将其插入XPath时
在Python中,我缺少一些东西.如果我有父母XPath查询,那
生成结果/节点的列表...然后如何使用个人
父节点并触发它,以获取更多信息.
我尝试使用以下代码,没有运气.
#是课程文件中的HTML
d = libxml2dom.parsestring(s,html = 1)
#在这一点上,我们应该有一个vaild" d"表示
打印" sdddd =",s
aa = libxml2dom.tostring(d)
打印" thereeeeee \ n \ n \ n"
打印" AA",AA
#sys.exit()
#****课程名称
cpath ='// table [posites()> 0]/descendant :: td [position()= 2] [@width =" 85%"] /../ t
D [1]/font/a [2]/text()'
cpath _ = []
cpath_ = d.xpath(cpath)
打印" len =",len(cpath_)
如果len(cpath _)> 0:
对于CPATH _的CPATH _:
#获取coursename信息
cname = cpath.tostring()
打印" cpath =",cpath
打印" cname =",cname
rr =" ./../../../../../../../../ paster-sibling :: table // tr [position()> 1]"
rr = cpath.xpath()
打印" rrlen =",len(rr)
打印RR [0] .ToString()
sys.exit()
我假设有一个libxml2node方法可以做我需要的
我迷路了...
指针/评论在这里会有所帮助...
谢谢!

# 回答1


布鲁斯写道:
[剥离的代码示例]
您应该真正使用LXML.它具有可叫XPath的对象
python函数及其元素对象具有获取的getParent()方法
您到节点的父母.另外,您从一个
XPath评估还具有getParent()方法,该方法返回元素
容纳文本的对象.我认为这就是您想要的.
Stefan

标签: python

添加新评论