百度百科的定义: 爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 网站一般肯定都不喜欢让你爬取。 反爬机制:对应的载体是网站,防止爬虫爬取数据。 反反爬策略:对应的载体是爬虫程序 常见的反爬机制及应对策略: 1.校验Headers,查看请求头,是浏览器还是机器,以及对Referer ...
分类:
其他 时间:
2019-06-30 11:51:36
收藏:
0 评论:
0 赞:
1 阅读:
112
1.django项目准备 1.settings.py配置 1.settings.py中配置公网ip才允许访问: 2.settings.py中追加静态文件路径配置代码: 3.settings.py中关闭开发调试模式: 2.生成requirements.txt 3.将gg项目打包成zip包 2.上传项目 ...
分类:
Web开发 时间:
2019-06-30 11:51:09
收藏:
0 评论:
0 赞:
0 阅读:
90
爬取结果预览图: 爬取过程中碰到了许多错误,比如poppler与wkhtmltopdf为引入软件,需要将其bin目录添加至环境变量path中; 整个脚本只写了主函数~,习惯有大问题,得慢慢纠正! 整个脚本都做了注释,其中爬取地址为局域网址,如需参考,请按需求更改~ 打包为.exe文件使用的是pyin ...
分类:
编程语言 时间:
2019-06-30 11:50:41
收藏:
0 评论:
0 赞:
0 阅读:
117
在Linux和WINDOWS两系统并存时就需要安装GRUB(Grand Unified Bootloader),GRUB被广泛地用于替代lilo,GRUB支持在启动时使用命令行模式,支持md5加密保护 还可以从ext2/ext3、ReiseFS、JFS、FAT、minix及FFS文件系统上启动其配置 ...
分类:
系统服务 时间:
2019-06-30 11:49:58
收藏:
0 评论:
0 赞:
0 阅读:
118
进程就是运行中的程序,一个运行着的程序,可能有多个进程。 比如 LinuxSir.Org 所用的WWW服务器是apache服务器,当管理员启动服务后,可能会有好多人来访问,也就是说许多用户来同时请求httpd服务,apache服务器将会创建有多个httpd进程来对其进行服务。 1、 进程分类 进程一 ...
分类:
系统服务 时间:
2019-06-30 11:49:35
收藏:
0 评论:
0 赞:
0 阅读:
107
上面是个 test*.py,,这个是main.py skip跳过测试用例 生成html文件 ...
分类:
其他 时间:
2019-06-30 11:48:47
收藏:
0 评论:
0 赞:
0 阅读:
131
一、Python解释器 python写的.py文件想要运行必须通过python解释器转化为CPU可以识别的代码(0101...)。python存在多种解释器,由不同的语言开发,常见的解释器如下: Cpython Cpython是官方网站推荐的解释器,它是用C语言开发的,我们从官网下载python后, ...
分类:
编程语言 时间:
2019-06-30 11:48:26
收藏:
0 评论:
0 赞:
0 阅读:
185
瀑布模型 是线性模型中的一种,在所有模型中占有重要地位,是所有其他模型的一个基础 每个阶段执行一次,按线性顺序进行软件开发 测试的切入点 测试阶段处于软件实现后,必须在代码完成后留出足够的时间给测试活动,否则将导致测试不充分,很多问题到项目后期才暴露 优点 开发的各个阶段比较清晰 强调早期计划及需求 ...
分类:
其他 时间:
2019-06-30 11:48:05
收藏:
0 评论:
0 赞:
0 阅读:
97
概述 当复杂的构建过程通常不变,改变的只是内部的实现算法和业务逻辑时使用;将复杂的构建过程和具体的内部实现相分离,使得构建过程公用化。 UML ? 结构 产品(Product):需要被建造的目标;抽象建造者(Builder):规划好建造者类要执行的任务,如需要实现A项任务,B项任务和C项任务,需要返 ...
分类:
其他 时间:
2019-06-30 11:47:40
收藏:
0 评论:
0 赞:
0 阅读:
76
转自:https://www.cnblogs.com/kevingrace/p/7693042.html 一、RabbitMQ简单介绍在日常工作环境中,你是否遇到过两个(多个)系统间需要通过定时任务来同步某些数据?你是否在为异构系统的不同进程间相互调用、通讯的问题而苦恼、挣扎?如果是,那么恭喜你,消 ...
分类:
其他 时间:
2019-06-30 11:46:06
收藏:
0 评论:
0 赞:
0 阅读:
123
要是官方文档写得好的话,我也许就不用自己做个笔记。 官方文档 Babel 是一个工具链,主要用于将 ECMAScript 2015+ 版本的代码转换为向后兼容的 JavaScript 语法,以便能够运行在当前和旧版本的浏览器或其他环境中。下面列出的是 Babel 能为你做的事情: 1、语法转换 2、 ...
分类:
其他 时间:
2019-06-30 11:45:18
收藏:
0 评论:
0 赞:
0 阅读:
94
注意: crontab执行时间与用date命令显示出时间不一致, 很有可以能是没有重启服务导致的. 查看系统时间 vagrant@homestead:~$ timedatectl status Local time: Fri 2019-06-28 09:48:56 CST #本地时间 Univers ...
分类:
其他 时间:
2019-06-30 11:44:50
收藏:
0 评论:
0 赞:
0 阅读:
107
1.服务的作用: 用于解决不同组件之间无法像互相调用的问题,放在service中,使得所有组件都可以使用公共的方法。 创建服务的命令 1>引入并且配置服务 在app.module.ts中 import {名称} from ‘路径’ 在providers:[ ]中配置 2>在服务文件中写个方法 3>在 ...
分类:
其他 时间:
2019-06-30 11:44:22
收藏:
0 评论:
0 赞:
0 阅读:
190
利用struts完成增删改查: 思路: 1、导入相关的pom依赖(struts、自定义标签库的依赖) 2、分页的tag类导入、z.tld、完成web.xml的配置 3、dao层去访问数据 4、web层去调用dao层给前台返回数据 5、在struts_sy.xml进行配置 6、写jsp界面 1、导入相 ...
分类:
其他 时间:
2019-06-30 11:43:56
收藏:
0 评论:
0 赞:
0 阅读:
81
Percona XtraDB Cluster(下文简称PXC集群)提供了MySQL高可用的一种实现方法。集群是有节点组成的,推荐配置至少3个节点,但是也可以运行在2个节点上。 PXC原理描述: 一些名词介绍: PXC环境所涉及的端口: 1.有3个节点 2.防火墙设置 01关闭防火墙 02或开启防火墙 ...
分类:
数据库技术 时间:
2019-06-30 11:43:09
收藏:
0 评论:
0 赞:
0 阅读:
125
...
分类:
其他 时间:
2019-06-30 11:41:44
收藏:
0 评论:
0 赞:
0 阅读:
225
Linux 系统有 7 个运行级别,Linux 系统任何时候都运行在一个指定的运行级别上,不同的运行级别所运行的程序和服务不尽相同,所要完成的工作和要达到的目的也不相同 · 运行级别 0 系统停机(halt)状态,系统的默认运行级别不能设为 0,否则不能正常启动 · 运行级别 1 单用户工作(sin ...
分类:
系统服务 时间:
2019-06-30 11:41:18
收藏:
0 评论:
0 赞:
0 阅读:
114
题目链接:洛谷 题目描述:求整数$x\in [a,b]$使得$|2px \ mod \ 2q-q|$最小,如果有多个$x$输出最小的。 数据范围:$1\leq a,b,p,q\leq 10^9$ 第一道类欧的不是模板的题?? 首先一看就尝试一下二分,如何判断$2px \ mod \ 2q \in [ ...
分类:
其他 时间:
2019-06-30 11:40:57
收藏:
0 评论:
0 赞:
0 阅读:
115
top命令用来显示系统当前的进程状况。 格式:top [选项] 主要选项如下。 d:指定更新的间隔,以秒计算。 q:没有任何延迟的更新。如果使用者有超级用户,则top命令将会以最高的优先序执行。 c:显示进程完整的路径与名称。 S:累积模式,会将已完成或消失的子进程的CPU时间累积起来。 s:安全模 ...
分类:
系统服务 时间:
2019-06-30 11:40:37
收藏:
0 评论:
0 赞:
0 阅读:
91
18event-demo.html ...
分类:
编程语言 时间:
2019-06-30 11:40:08
收藏:
0 评论:
0 赞:
0 阅读:
136