首页 > Web开发 > 详细

Asp.net Core 使用AngleSharp 爬虫图片

时间:2017-11-14 18:22:29      阅读:315      评论:0      收藏:0      [点我收藏+]

AngleSharp 简介

AngleSharp是基于.NET(C#)开发的专门解析HTML源码的DLL组件。

整个DOM已传输到逻辑类结构中。这种结构的一部分可以如下图所示解决。请注意,该图片显示了较旧的DOM模型。anglesharp的当前版本实现了最新的DOM模型,这是稍有不同。尽管如此,这幅图仍然是有用的,以获得正确的想法。

AngleSharp是一个.NET库,使您能够解析基于角度的超文本,如HTML,SVG和MathMLAngleSharp的一个重要方面是CSS也可以被解析。解析器是建立在官方的W3C规范之上的。

参考

http://www.cnblogs.com/pandait/p/AngleSharp.html

https://www.cnblogs.com/liguobao/p/6130121.html

通过NuGet获取AngleSharp

将AngleSharp整合到您的项目中最简单的方法是使用NuGet。您可以通过打开软件包管理器控制台(PM)并输入以下语句来安装AngleSharp:

Install-Package AngleSharp

您也可以使用图形库包管理器(“管理解决方案的NuGet包”)。在官方的NuGet在线源中搜索“AngleSharp”将会找到这个库。

示例
//创建一个(可重用)解析器前端
 var parser = new HtmlParser();
//html DOM节点
var source = "<h1>Some example source</h1><p>This is a paragraph element";
//解析源文件
var document = parser.Parse(source);
//创建P标签
var p = document.CreateElement("p");
p.TextContent = "This is another paragraph.";
//添加到DOM
document.Body.AppendChild(p);
//返回完整html
var html = document.DocumentElement.OuterHtml;
ViewData["html"] = html;

效果展示

技术分享

 

Asp.net Core 使用AngleSharp 爬虫图片

原文:http://www.cnblogs.com/miskis/p/7833744.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!