首页 > 其他 > 详细

影评推荐系统

时间:2018-12-17 00:45:29      阅读:116      评论:0      收藏:0      [点我收藏+]

1、创建django

创建文件夹保存文件:

mkdir 文件夹

cd 文件夹

django-admin startproject  项目名称

在项目下创建应用

技术分享图片

 

影评数据采用爬虫知识,使用scrapy库从bing搜索引擎采取和抽取

1、爬取数据

必应英语:Bing,台港称Bing)是一款由微软公司推出的网络搜索引擎

 

 

简短几十行代码之后你已经能够开始抓取一部电影的全部短评和评分了。在这之前,记得在settings里加一个DOWNLOAD_DELAY = 2,不然的话爬不到一半就会被豆瓣给禁了。

 我们的应用(spider文件夹)使用两个蜘蛛:

一只从影评URL抽取数据(movice_link_results.py)

另外一只生成所有链接到初始影评URL的网页连接图(recursive_link_results.py)

 

将爬取到的数据保存到Django model PageItem中

 

影评推荐系统

原文:https://www.cnblogs.com/foremostxl/p/10129028.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!