首页 > 其他 > 详细

初级爬虫(二)

时间:2019-03-12 10:44:58      阅读:153      评论:0      收藏:0      [点我收藏+]
正则专题一

import re
# re.findall(re,str)  基本语法
s1="total income is $750000,pretty good income"
a=re.findall("income",s1)
print(a)
a=re.findall("income$",s1)#从后匹配
print(a)
a=re.findall("$750000",s1)#$没有转义
print(a)
a=re.findall("\$750000",s1)#$有转义
print(a)
a=re.findall("[0-9]+",s1)
print(a)
a=re.findall("[^0-9]+",s1)#[]中的^是取非的意思,在[]外是从头开始匹配,不一样
print(a)

正则专题二

import re
# re.findall(re,str)  基本语法
url="https://www.baidu.com/asdioiqd/dacqefqe"
a=re.findall("https://(.+?)/",url)#只返回()中的内容
print(a)
a=re.sub("(?<=https://).*?(?=/)","xinglang",url)#字符串替换,只替换中间的.*?前后部分辅助限制
print(a)

初级爬虫(二)

原文:https://blog.51cto.com/14156081/2360674

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!