首页 > 编程语言 > 详细

python3抓取超链接

时间:2017-11-08 00:34:02      阅读:349      评论:0      收藏:0      [点我收藏+]
import re
import urllib.request
#(http://\S*?)[\"] 提取不带"
#http://\S*?[\"] 提取的时候带"
#\S非空字符 *0-多个 ?非贪婪 \"|>|)三个符号其中之一为结束
httpre=re.compile(r"(http://\S*?)[\"|>|)]",re.IGNORECASE)
for line in urllib.request.urlopen("http://www.baidu.com"):
line=line.decode("utf-8")
mylist = httpre.findall(line)
if mylist:
print(mylist)

python3抓取超链接

原文:http://www.cnblogs.com/888ewe/p/7802001.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!