初级爬虫（二）

时间：2019-03-12 10:44:58 阅读：158 评论：0 收藏：0 [点我收藏+]

正则专题一

import re
# re.findall(re,str)  基本语法
s1="total income is $750000,pretty good income"
a=re.findall("income",s1)
print(a)
a=re.findall("income$",s1)#从后匹配
print(a)
a=re.findall("$750000",s1)#$没有转义
print(a)
a=re.findall("\$750000",s1)#$有转义
print(a)
a=re.findall("[0-9]+",s1)
print(a)
a=re.findall("[^0-9]+",s1)#[]中的^是取非的意思，在[]外是从头开始匹配，不一样
print(a)

正则专题二

import re
# re.findall(re,str)  基本语法
url="https://www.baidu.com/asdioiqd/dacqefqe"
a=re.findall("https://(.+?)/",url)#只返回（）中的内容
print(a)
a=re.sub("(?<=https://).*?(?=/)","xinglang",url)#字符串替换，只替换中间的.*？前后部分辅助限制
print(a)

初级爬虫（二）

原文：https://blog.51cto.com/14156081/2360674

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)