首页 > 编程语言
[Python]网络爬虫(二):利用urllib2通过指定的URL抓取网页内容(转)
版本号:Python2.7.5,Python3改动较大,各位另寻教程。所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。类似于使用程序模拟IE浏览器的功能,把URL作为HTTP请求的内容发送到服务器端, 然后读取服务器端的响应资源。在Python中,我们使用urllib2...
分类:编程语言   时间:2014-05-27 00:11:57    收藏:0  评论:0  赞:0  阅读:507
[Python]网络爬虫(一):抓取网页的含义和URL基本构成(转)
一、网络爬虫的定义网络爬虫,即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页的。从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这...
分类:编程语言   时间:2014-05-27 00:15:37    收藏:0  评论:0  赞:0  阅读:326
JAVA中重写equals()方法的同时要重写hashcode()方法
object对象中的 public boolean equals(Object obj),对于任何非空引用值 x 和 y,当且仅当 x 和 y 引用同一个对象时,此方法才返回 true;注意:当此方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 方法的常规协定,该协定声...
分类:编程语言   时间:2014-05-27 00:18:29    收藏:0  评论:0  赞:0  阅读:464
C语言宏#和##
C语言宏#和##一、基本用途#用于将宏定义中的参数转换为字符串。例:存在宏#define TO_STRING(x) #x则TO_STRING(hello)展开为"hello"##用于拼接Token。例:存在宏#define DECLARE_HANDLER(x) x##_handler则DECLARE...
分类:编程语言   时间:2014-05-27 00:18:50    收藏:0  评论:0  赞:0  阅读:439
Python字符编码详解(转)
1. 字符编码简介1.1. ASCIIASCII(American Standard Code for Information Interchange),是一种单字节的编码。计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号。不过ASCII只用到了...
分类:编程语言   时间:2014-05-27 00:34:19    收藏:0  评论:0  赞:0  阅读:387
Python线程指南(转)
1. 线程基础1.1. 线程状态线程有5种状态,状态转换的过程如下图所示:1.2. 线程同步(锁)多线程的优势在于可以同时运行多个任务(至少感觉起来是这样)。但是当线程需要共享数据时,可能存在数据不同步的问题。考虑这样一种情况:一个列表里所有元素都是0,线程"set"从后向前把所有元素改成1,而线程...
分类:编程语言   时间:2014-05-27 00:38:43    收藏:0  评论:0  赞:0  阅读:422
Python正则表达式指南(转)
1. 正则表达式基础1.1. 简单介绍正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实...
分类:编程语言   时间:2014-05-27 00:41:07    收藏:0  评论:0  赞:0  阅读:479
Spring -- 5.0
五一过后,一直是懒散的状态,好久没有写东西了。 spring3.x企业应用开发实战 看完了第十章,写点spring中数据库吧。 数据库之前在大学里也学过,但是当时尼玛说句实话,都不知道干什么的,很多很重要的知识在当时感觉好无聊。就像你在大西北给你一个救生圈玩,好玩吗?现在我再看这些知识,感觉...
分类:编程语言   时间:2014-05-27 00:40:45    收藏:0  评论:0  赞:0  阅读:453
linux下多线程下载工具axel的编译安装
axel是Linux命令行下多线程的下载工具,支持断点续传,速度通常情况下是Wget的几倍官方主页:http://axel.alioth.debian.org/源码下载:#curl-Ohttp://pkgs.fedoraproject.org/repo/pkgs/axel/axel2.4.tar.gz/a2a762fce0c96781965c8f9786a3d09d/axel-2.4.tar.gz编译安装:#tar-xvf..
分类:编程语言   时间:2014-05-22 17:41:08    收藏:0  评论:0  赞:0  阅读:602
[python] python单元测试经验总结
python写单元大多数都会用到unittest和mock,测试代码覆盖率都会用到coverage,最后再用nose把所有的东西都串起来,这样每次出版本,都能把整个项目的单元测试都运行一遍。 Unittest unittest就不详细介绍了,注意几点: 测试类继承unittest.TestCase测试类、测试方法名字最好以test开头,很多工具能根据名字来自动运行,很方便测试类里...
分类:编程语言   时间:2014-05-22 23:21:50    收藏:0  评论:0  赞:0  阅读:439
线程基础知识
什么是线程:...
分类:编程语言   时间:2014-05-23 00:19:30    收藏:0  评论:0  赞:0  阅读:551
JavaScript(15)jQuery 选择器
jQuery 选择器 选择器允许对元素组或单个元素进行操作。 jQuery 元素选择器和属性选择器允许通过标签名、属性名或内容对 HTML 元素进行选择。 在 HTML DOM 术语中:选择器允许对 DOM 元素组或单个 DOM 节点进行操作。 上面的看完了我也不知道选择器是什么。。。来点自己的理解和总结。。。 选择器语法:$("......")...
分类:编程语言   时间:2014-05-23 01:12:41    收藏:0  评论:0  赞:0  阅读:605
Window上python开发--4.Django的用户登录模块User
django的用户注册和登录...
分类:编程语言   时间:2014-05-23 00:51:20    收藏:0  评论:0  赞:0  阅读:1031
可以进行自动补全的python的eclipse配置方法
可以进行自动补全的python开发环境...
分类:编程语言   时间:2014-05-23 01:31:54    收藏:0  评论:0  赞:0  阅读:644
python用正则表达式怎么查询unicode码字符
import re data = open('a.txt') fh = open('b.txt', 'w') """Search the string begining with '【'""" p = re.compile(r'\s*[\u3010]') for each_d in data:     if re.match('\s*3\d{4}', each_d):    ...
分类:编程语言   时间:2014-05-22 17:25:58    收藏:0  评论:0  赞:0  阅读:493
每天进步一点点——Linux中的线程局部存储(一)
在Linux系统中使用C/C++进行多线程编程时有些数据无需使用锁即可做到快速高效,本文从线程局部存储出发讨论如何高效的实现无锁编程。...
分类:编程语言   时间:2014-05-22 22:49:24    收藏:0  评论:0  赞:0  阅读:642
玩转VC++实现程序开机运行及注册表修改
一、方案 要实现Windows程序开机运行,需要在注册表中相关位置加入键值。所谓的键可以是你程序的名称,值就是你程序的所在目录。所谓的相关位置有两处: 主键HKEY_LOCAL_MACHINE,Software\Microsoft\Windows\CurrentVersion\Run下。 主键HKEY_CURRENT_USER, Software\Micros...
分类:编程语言   时间:2014-05-22 22:38:15    收藏:0  评论:0  赞:0  阅读:594
Java几种常用的实现排序方法
import java.util.Random; public class NumberSort{ /** * 私有构造方法,禁止实例化 */ private NumberSort(){ super(); } /** * 冒泡排序 * 比较相邻的元素。如果第一个比第二个大,就叫唤他们两个位置。 * 对每一组相邻的元素作同样的工作,从开始的第一对到结束后的最后一对,这样剩下的...
分类:编程语言   时间:2014-05-23 02:12:55    收藏:0  评论:0  赞:0  阅读:504
DAG图的拓扑排序 python
在DAG中DFS中顶点的出栈顺序即逆拓扑序。 def topological_sort( graph ): is_visit = dict( ( node, False ) for node in graph ) li = [] def dfs( graph, start_node ): for end_node in...
分类:编程语言   时间:2014-05-22 23:11:06    收藏:0  评论:0  赞:0  阅读:839
要点Java19 java.util.Arrays
Arrays 数组帮助类 示例程序(JUnit演示) 数组转化为List @Test public void testUserArraysChangeArraytoList() { // 类Arrays // public static List asList(T... a) // Returns a fixed-s...
分类:编程语言   时间:2014-05-22 18:38:05    收藏:0  评论:0  赞:0  阅读:401
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!