AngleSharp是基于.NET(C#)开发的专门解析HTML源码的DLL组件。
整个DOM已传输到逻辑类结构中。这种结构的一部分可以如下图所示解决。请注意,该图片显示了较旧的DOM模型。anglesharp的当前版本实现了最新的DOM模型,这是稍有不同。尽管如此,这幅图仍然是有用的,以获得正确的想法。
AngleSharp是一个.NET库,使您能够解析基于角度的超文本,如HTML,SVG和MathML。AngleSharp的一个重要方面是CSS也可以被解析。解析器是建立在官方的W3C规范之上的。
http://www.cnblogs.com/pandait/p/AngleSharp.html
https://www.cnblogs.com/liguobao/p/6130121.html
将AngleSharp整合到您的项目中最简单的方法是使用NuGet。您可以通过打开软件包管理器控制台(PM)并输入以下语句来安装AngleSharp:
Install-Package AngleSharp
您也可以使用图形库包管理器(“管理解决方案的NuGet包”)。在官方的NuGet在线源中搜索“AngleSharp”将会找到这个库。
//创建一个(可重用)解析器前端 var parser = new HtmlParser(); //html DOM节点 var source = "<h1>Some example source</h1><p>This is a paragraph element"; //解析源文件 var document = parser.Parse(source); //创建P标签 var p = document.CreateElement("p"); p.TextContent = "This is another paragraph."; //添加到DOM document.Body.AppendChild(p); //返回完整html var html = document.DocumentElement.OuterHtml; ViewData["html"] = html;
效果展示
Asp.net Core 使用AngleSharp 爬虫图片
原文:http://www.cnblogs.com/miskis/p/7833744.html