从lynx捕获stdout..
我有一个巨大的数据库,其中包含我需要的大量html
翻译成ASCII..
我已经尝试使用html2ext.py:http://www.aaronsw.com/2002/html2text/
但我想不出如何导入它并将其用作图书馆
而不会到处出现错误..
所以我决定尝试使用带有-DUMP开关的Lynx..
它在命令行中工作得很好,但我在捕获
将输出转换为一个python变量..
我想出来的唯一办法就是:
S=子进程(args='/sw/bin/lynx',标准输出=子进程.PIPE)
但我想不出怎么给它发"-转储"或者
如有任何帮助,我们将不胜感激.