目标:获取土豆网视频地址:
一、小偷程序:
1 file_get_contents() 或curl()
2 正则分析视频地址
缺点:
1 慢,html页面比较大,有大量的渣滓信息
2 如果页面改版了,采集规则可能失效
二、利用土豆的API得到XML信息
1 分析纯数据的XML,内容少,获取速度快
2 因为是纯数据信息,比如标题,时长,这是不会改变的,很难改变
各大网站都有自己的开放接口,application programming interface API
利用网站API,就可以查询信息
如豆瓣的书籍信息,土豆视频
1 寻找土豆的API,土豆视频开发平台
basename — 返回路径中的文件名部分
dirname — 返回路径中的目录部分
pathinfo — 返回文件路径的信息
获取到xml文件,内容是视频的标题时长等信息
用php把xml各个节点信息,解析出来:
知识点:DOM解析 DOMDocument类解析
不用DOM,利用字符串操作或正则获取
$source = file_get_contents($api);
$start = stripos($source, ‘<html5Url>‘);
$end = stripos($source, ‘</html5Url>‘);
$noad = substr($source, start,$end-$start);
获取地址:
本文出自 “杜国栋个人PHP学习博文” 博客,请务必保留此出处http://duguodong.blog.51cto.com/7667978/1386401
时间:2014年3月27日10:47:14实例:获取土豆视频无广告地址,布布扣,bubuko.com
时间:2014年3月27日10:47:14实例:获取土豆视频无广告地址
原文:http://duguodong.blog.51cto.com/7667978/1386401