首页 > Web开发 > 详细

php正则抓取网站

时间:2020-02-21 15:00:03      阅读:36      评论:0      收藏:0      [点我收藏+]

通过crul抓取到网站之后,通过 preg_match(单一数据) preg_match_all(重复数据,如ul内的li内容或者多个格式一样的控件)来截取自己想要的部分


正则归纳

表示包含所有元素  .*?

空格 \s

图片 "/(href|src)=([\"|‘]?)([^\"‘>]+.(jpg|JPG|jpeg|JPEG|gif|GIF|png|PNG))/i"

a标签 ‘/<a href=\"(.*?)\".*?>(.*?)<\/a>/i‘

preg_match(‘/<div\sclass="content_list">.*?<\/div>/s‘,$html,$divList);

 

php正则抓取网站

原文:https://www.cnblogs.com/slothful/p/12340945.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!