首页 > 编程语言 > 详细

paip.抓取网页内容--java php python

时间:2014-03-10 19:34:51      阅读:455      评论:0      收藏:0      [点我收藏+]
paip.抓取网页内容--java php python.txt

作者Attilax  艾龙, EMAIL:1466519819@qq.com
来源:attilax的专栏
地址:http://blog.csdn.net/attilax

//////////java
String urlContent = WebpageContent("http://www.123cha.com/ip/?q="+ip,"utf-8");



///////////php
file_get_contents($url);
 curl_init()>>>curl_exec
 fopen->fread->fclose
 
 
 /////python
 urllib.urlopen(url).read()
 response = urllib2.urlopen(‘http://www.baidu.com/‘)  
html = response.read()  
 
 ///ahk
 UrlDownloadToFile, URL, Filename

 
 
 public String downloadPage(String Url, String encode) {
        try {
            URL pageUrl = new URL(Url);
            // Open connection to URL for reading.
            BufferedReader reader = new BufferedReader(new InputStreamReader(
                    pageUrl.openStream(), encode));
            // BufferedReader br = new BufferedReader(new InputStreamReader(in,
            // "gbk"));
            // Read page into buffer.
            String line;
            StringBuffer pageBuffer = new StringBuffer();
            while ((line = reader.readLine()) != null) {
                pageBuffer.append(line);
            }
            String s = pageBuffer.toString();
            return s;
            // System.out.println(s);
            // return pageBuffer.toString();
        } catch (Exception e) {
            // return null;
            throw new RuntimeException(e);
        }

    }

 
 
 参考:
 php获取网页内容方法总结_php技巧_脚本之家.htm
 Python 3 抓取网页资源的 N 种方法.htm

paip.抓取网页内容--java php python,布布扣,bubuko.com

paip.抓取网页内容--java php python

原文:http://blog.csdn.net/attilax/article/details/20920247

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!