delphi的httpclient库能够操作http和https链接。应该是XE以后新出的库。试了试用来抓网页还行。里面使用了HtmlParserEx库。只支持xe3以后的版本,看说明还能支持其他平台。该库使我们能够调用css选择器或xpath来取得我们需要的数据。
program 获取图片链接; {$APPTYPE CONSOLE} {$R *.res} uses System.SysUtils, System.Net.HttpClient, HtmlParserEx in ‘HtmlParserEx.pas‘; const url:string=‘https://www.italika.mx/Modelos/Trabajo/‘; var stext:string; LHtml:IHtmlElement; LList:IHtmlElementList; begin try var http:THTTPClient:=THTTPClient.Create; http.UserAgent:=‘Mozilla/5.0‘; stext:=http.Get(url).ContentAsString(); LHtml:=ParserHtml(stext); if LHtml <> nil then begin LList := LHtml.Find(‘li.display_tCell img‘); for LHtml in LList do Writeln(‘url:‘, lhtml.Attributes[‘src‘]); end; http.Free; except on E: Exception do Writeln(E.ClassName, ‘: ‘, E.Message); end; readln; end.
通过选择器处理后取得图片链接。效果如图:
HtmlParserEx库下载:https://files.cnblogs.com/files/FanXiaoLei/HtmlParserEx.zip
原文:https://www.cnblogs.com/FanXiaoLei/p/14242685.html