java爬取https上的图片

时间：2021-04-21 17:23:13 阅读：40 评论：0 收藏：0 [点我收藏+]

/**
 * @author szc
 * @date 2021/4/21 - 16:42
 */
public class test4 {
    public static void main(String[] args) throws IOException {

        String strUrl = "https://www.plap.cn/index/downloadDetailsImage.html?id=47444E7BA2CC4E788A7709791AC41AA8";
        HTTPSTrustManager.retrieveResponseFromServer(strUrl);
        URL url = new URL(strUrl);

        //构造连接
        HttpsURLConnection conn = (HttpsURLConnection) url.openConnection();

        //这个网站要模拟浏览器才行
        conn.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko");

        //打开连接
        conn.connect();
        //打开这个网站的输入流
        InputStream inStream = conn.getInputStream();

        //用这个做中转站 ，把图片数据都放在了这里，再调用toByteArray()即可获得数据的byte数组
        ByteArrayOutputStream outStream = new ByteArrayOutputStream();
        //用这个是很好的，不用一次就把图片读到了文件中
        //要是需要把图片用作其他用途呢？所以直接把图片的数据弄成一个变量，十分有用
        //相当于操作这个变量就能操作图片了

        byte[] buf = new byte[1024];
        //为什么是1024？
        //1024Byte=1KB，分配1KB的缓存
        //这个就是循环读取，是一个临时空间，多大都没关系
        //这没有什么大的关系，你就是用999这样的数字也没有问题，就是每次读取的最大字节数。
        //byte[]的大小，说明你一次操作最大字节是多少
        //虽然读的是9M的文件，其实你的内存只用1M来处理，节省了很多空间．
        //当然，设得小，说明I/O操作会比较频繁，I/O操作耗时比较长，
        //这多少会有点性能上的影响．这看你是想用空间换时间，还是想用时间换空间了．
        //时间慢总比内存溢出程序崩溃强．如果内存足够的话，我会考虑设大点．
        int len = 0;
        //读取图片数据    
        while ((len = inStream.read(buf)) != -1) {
            System.out.println(len);
            outStream.write(buf, 0, len);
        }
        inStream.close();
        outStream.close();
        //把图片数据填入文件中
        File file = new File("d://t.jpg");

        FileOutputStream op = new FileOutputStream(file);

        op.write(outStream.toByteArray());

        op.close();


    }
}

java爬取https上的图片

原文：https://www.cnblogs.com/szc1998/p/14685895.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)