文件上的正则表达式

有什么办法regex non-string / unicode对象.我将像把大文件通过正则表达式和似乎没有相对困难在整个文件在内存中.即使有缓冲似乎很难得到regex表明他们没有因为缓冲终止和部分比赛是可恢复的似乎是不可能的.再保险公司真正需要什么接口的src对象?--罗宾·贝克尔

# 回答1

在星期一,2005年4月25日16:01:45 + 0100,罗宾·贝克尔< ro * * * @reportlab.com >写道:ISTM分裂是一种特殊的情况,您可以很容易地通过一个文件块和分裂,因为如果分裂当前块成功,可以肯定的是,所有但尾管有效[1].所以你可以做一个迭代器,收益率除了最后一个,然后去年+ newchunk设置缓冲区继续,直到没有更多的块,和尾巴的部分将是一个有效的分割.例如,(不是测试超出了你所看到的,)…"这将是分裂5 X \ nlike""XXXXX"但我们将使用一个缓冲\ n的"XXXXX""长度2迫使缓冲附加.会尝试一个分配器:净化工艺\""XXXXX"' \ n '[1]在某些情况下的regex超前上下文,您可能必须检查最后一块不仅存在,而且超过了马克斯超前长度,以防有< withlookahead > | <平原>的正则表达式中<超前>早就成功了与另一块附加到缓冲区,但<平原>.问候,本格里克特

标签: python

添加新评论