首页 > 其他 > 详细

实例练习:正则表达式爬取百度贴吧照片

时间:2020-02-25 22:42:38      阅读:87      评论:0      收藏:0      [点我收藏+]

  代码出自小甲鱼,复盘,省略了图片的下载部分

  正则真的太好用了,不过关键在你想不想的到最高效的正则表达式

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3 import urllib.request
 4 import re
 5 
 6 url = "https://tieba.baidu.com/p/6512141636"
 7 
 8 def web(url):
 9     response = urllib.request.urlopen(url)
10     html = response.read().decode(UTF-8,ignore)
11     test = r<img class="BDE_Image" src="([^"]+\.jpg)"
12     out = re.findall(test,html)
13     print(out)
14 web(url)

 

实例练习:正则表达式爬取百度贴吧照片

原文:https://www.cnblogs.com/vhhi/p/12363937.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!