如何爬取网站代码

时间：2021-09-06 03:59:37 阅读：46 评论：0 收藏：0 [点我收藏+]

private static String getHtml(String urlInfo) throws Exception {
        //读取目的网页URL地址，获取网页源码
        URL url = new URL(urlInfo);
        HttpURLConnection httpUrl = (HttpURLConnection)url.openConnection();
        httpUrl.setConnectTimeout(30000);//连接主机的超时时间(单位：毫秒)
        httpUrl.setReadTimeout(30000);//从主机读取数据的超时时间(单位：毫秒)
        System.out.println(httpUrl.getContentEncoding());
        InputStream is = httpUrl.getInputStream();
        if("gzip".equals(httpUrl.getContentEncoding())){
            //处理gzip压缩
            is = new GZIPInputStream(is);
        }
        BufferedReader br = new BufferedReader(new InputStreamReader(is,"gb2312"));
        StringBuilder sb = new StringBuilder();
        String line;
        while ((line = br.readLine()) != null) {
            sb.append(line);
        }
        is.close();
        br.close();
        return sb.toString().trim();

    }

如何爬取网站代码

原文：https://www.cnblogs.com/xing-nb/p/15226831.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)