关于爬虫的正则表达式一点记录

时间：2019-11-29 23:48:17 阅读：83 评论：0 收藏：0 [点我收藏+]

今天再爬虫的正则表达式里纠结了很久，记录下来，防止忘记再浪费时间

 content = requests.get(url)
        
 m=re.findall(r‘<a href=\"([0-9a-zA-Z\_\/\.\%\?\=\-\&]+)\"‘,content.text,re.I)

一开始，我把content变成str(content)放在正则匹配式中，无法匹配，可能是因为str(content)是空的。

所以一定要用content.text来匹配

原文：https://www.cnblogs.com/crayszhangblog/p/11960754.html

踩

(0)

评论一句话评论（0）

分享档案

更多>