首页 > Web开发 > 详细

htmlcleaner使用及xpath语法

时间:2016-02-02 16:41:17      阅读:303      评论:0      收藏:0      [点我收藏+]

一、HtmlCleaner

1、创建htmlCleaner对象

HtmlCleaner htmlCleaner = new HtmlCleaner();

2、调用clean方法

TagNode tagNode = htmlCleaner.clean(html内容或url);

3、使用XPath

Object[] aArr = tagNode.evaluateXPath("//div[@class=‘breadcrumb‘]//a");

二、XPath

例:div,属性class为breadcrumb下面的所有a标签

//div[@class=‘breadcrumb‘]//a

常用路径表达式:

表达式描述
nodename 选取此节点的所有子节点。
/ 从根节点选取。
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
. 选取当前节点。
.. 选取当前节点的父节点。
@ 选取属性。

参考资料

http://blog.csdn.net/reesun/article/details/8021201

htmlcleaner使用及xpath语法

原文:http://www.cnblogs.com/sysout/p/5177738.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!