首页 > 其他 > 详细

爬取安居客二手房房屋信息

时间:2020-07-04 20:15:49      阅读:61      评论:0      收藏:0      [点我收藏+]

目标

1 打开安居客二手房页面,如 https://nanning.anjuke.com/sale/?from=navigation 。得到如下页面。

   通过分析发现,每个页面有60个二手房信息。一共有50页。

技术分享图片技术分享图片

 

 

 

 

 

2 打开其中一个二手房的信息后,跳转到如下页面。我们的目标是要得到下图所示框起来的“房屋信息”的内容。

  也就是我们需要爬取 50 * 60 = 3000 个“房屋信息”

技术分享图片

 

 

思路

1 打开安居客二手房页面,获取源码后,使用xpath抓取每个页面的二手房标题的跳转链接。如下图所示。以便进入跳转页面。

技术分享图片

 

 

  当使用reques请求页面源码后,安居客的反爬机制会检测出我们的请求,提示如下页面。为了解决这个问题,我们应该使用代理IP。我们本次使用蘑菇代理IP。

1 import requests
2 url = https://nanning.anjuke.com/sale/p1/#filtersort
3 response = requests.get(url)
4 print(response.text)

 

 

技术分享图片

 

爬取安居客二手房房屋信息

原文:https://www.cnblogs.com/weifeng1998/p/13236137.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!