从lynx捕获stdout..

我有一个巨大的数据库,其中包含我需要的大量html
翻译成ASCII..
我已经尝试使用html2ext.py:http://www.aaronsw.com/2002/html2text/
但我想不出如何导入它并将其用作图书馆
而不会到处出现错误..
所以我决定尝试使用带有-DUMP开关的Lynx..
它在命令行中工作得很好,但我在捕获
将输出转换为一个python变量..
我想出来的唯一办法就是:
S=子进程(args='/sw/bin/lynx',标准输出=子进程.PIPE)
但我想不出怎么给它发"-转储"或者
并检索输出..
如有任何帮助,我们将不胜感激.

# 回答1


这是你想要的吗?
导入操作系统
FileName="test.html"
Cmd=os.popen("lynx-转储%s"%文件名)
输出=cmd.Read()
Cmd.Close()
打印输出
# 回答2


完美!
这真是太棒了!
谢谢!

标签: python

添加新评论