这两天在写一个java多线程的爬虫,以广度优先爬取网页,设置两个缓存:
一个保存已经访问过的URL:vistedUrls
一个保存没有访问过的URL:unVistedUrls
需要爬取的数据量不大,对URL压缩后,可以把这两个数据结构都放入内存,vistedUrls很显然用HashSet实现,因为已经访问的URL只会添加,不会删除和修改,使用HashSet可以高效...
分类:
编程语言 时间:
2015-04-28 18:32:19
收藏:
0 评论:
0 赞:
0 阅读:
258
Xiao Ming's Hope
Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)
Total Submission(s): 1515 Accepted Submission(s): 1015
Problem Description
Xiao Ming...
分类:
其他 时间:
2015-04-28 18:32:10
收藏:
0 评论:
0 赞:
0 阅读:
295
什么是 IP 地址
IP 地址(Internet Protocol Address)也称为网间地址、网际地址。IP地址是指互联网协议地址(英语:Internet
Protocol Address,又译为网际协议地址),是IP Address的缩写。IP地址是IP协议提供的一种统一的地址格式,它为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。
IP 地址...
分类:
其他 时间:
2015-04-28 18:32:02
收藏:
0 评论:
0 赞:
0 阅读:
254
上一篇博客中对比了各种mysql集群方案,本博客将讲解其中在同步复制功能方面比较出色的percona xtradb cluster的安装步骤...
分类:
数据库技术 时间:
2015-04-28 18:31:40
收藏:
0 评论:
0 赞:
0 阅读:
343
建造者模式将客户端与包含多个组成部分的复杂对象的创建过程分离,客户端压根不用知道复杂对象的内部组成部分与装配方式,只需要知道所需建造者的类型即可。它关注如何一步一步创建一个的复杂对象,不同的具体建造者定义了不同的创建过程,且具体建造者相互独立,增加新的建造者非常方便。...
分类:
其他 时间:
2015-04-28 18:31:30
收藏:
0 评论:
0 赞:
0 阅读:
200
1、序列化有什么用?为什么要用序列化?我回答是按照中国大多数BLOG上说的那样回答的,貌似他们不赞同。
序列化就是一种用来处理对象流的机制,所谓对象流也就是将对象的内容进行流化。可以对流化后的对象进行读写操作,也可将流化后的对象传输于网络之间。序列化是为了解决在对对象流进行读写操作时所引发的问题。序列化的实现:将需要被序列化的类实现Serializable接口,该接口没有需要实现的方法,impl...
分类:
编程语言 时间:
2015-04-28 18:31:20
收藏:
0 评论:
0 赞:
0 阅读:
216
这个题要注意啦 1 在这个题中也是素数。 唉 害我苦苦找了这么久 后来人注意就行了
#include
#define num 100010
long long mark[num+10]={0},visit[num+10]={1},t=0,rec[num+10];
int main()
{
for(long long i=2;i<=num;i++)
{
if(!visit[i])...
分类:
其他 时间:
2015-04-28 18:31:10
收藏:
0 评论:
0 赞:
0 阅读:
289
文件的上传存在的意义
在项目中经常上传文件:qq上传图片,相册上传图片,资料的共享……
实现文件上传的步骤
1.指定表单的类型为文件上传表单
必须指定表单的属性 enctype="multipart/form-data"
2.提交方式必须为post
手动上传文件处理
...
分类:
Web开发 时间:
2015-04-28 18:31:00
收藏:
0 评论:
0 赞:
0 阅读:
303
Intel Galileo Gen 2入门
本文所介绍内容Intel Galileo Gen 2简介
在Ubuntu上搭建环境
使用Arduino IDE刷入Sketch
在Galileo Gen 2中刷入定制版Linux系统
在Galileo Gen 2中刷入Debian系统
在Galileo Gen 2中编译运行OpenCV
Intel Galileo Gen 2简介Intel Galile...
分类:
其他 时间:
2015-04-28 18:30:50
收藏:
0 评论:
0 赞:
0 阅读:
414
二、编译和运行脚本
7. 编译和运行脚本主要步骤
1) 将编写的脚本复制到ns-3.22/scratch目录下(可以在ubuntu窗口界面直接复制)
进入ns3目录: /ns-3.22
$ cp examples/tutorial/first.cc scratch/myfirst.cc将脚本复制到scratch目录下
2) 构建(编译)
$ ./waf
3) 运行
$ ./waf...
分类:
其他 时间:
2015-04-28 18:30:39
收藏:
0 评论:
0 赞:
0 阅读:
727
%直方图均衡化 MATLAB 程序实现如下:
I=imread('e:\role0\003i.bmp');
I=rgb2gray(I);
figure;
subplot(2,2,1);
imshow(I);
subplot(2,2,2);
imhist(I);
I1=histeq(I);
figure;
subplot(2,2,1);
imshow(I1);
subplot(2,2...
分类:
其他 时间:
2015-04-28 18:30:29
收藏:
0 评论:
0 赞:
0 阅读:
284
一、概述
本篇博客为大家讲述一下Mongo DB是如何导入导出数据,还有就是备份数据的。
在下面操作的时候需要把Mongo DB的服务端打开才能操作。
二、导出。
MongoDB的导出非常简单打开cmd 输入下面命令
mongoexport -d foobar -c persons -o D:/persons.json
...
分类:
数据库技术 时间:
2015-04-28 18:30:19
收藏:
0 评论:
0 赞:
0 阅读:
280
f[n]=3*f[n-1]-f[n-2]+2
1002: [FJOI2007]轮状病毒
Time Limit: 1 Sec Memory Limit: 162 MB
Submit: 2959 Solved: 1644
[Submit][Status][Discuss]
Description
给定n(N
Input
第一行有1个正整数n。
Outp...
分类:
其他 时间:
2015-04-28 18:30:10
收藏:
0 评论:
0 赞:
0 阅读:
222
对于WCF,我们有了前面的理论基础,今天通过一个计算器的实例主要给大家讲解怎么一步一步地创建一个完整的WCF应用。
一、创建整个解决方案
Calculator.Service:一个类库项目,定义服务契约(Service Contract),应用System.ServiceModel程序集;提供对WCF服务的实现。
Calculator....
分类:
其他 时间:
2015-04-28 18:30:00
收藏:
0 评论:
0 赞:
0 阅读:
200
#include
using namespace std;
class CFraction
{
private:
int nume; // 分子
int deno; // 分母
void simplify(); //化简(使分子分母没有公因子)
public:
CFraction(int nu = 0, int de = 1); //构造函...
分类:
其他 时间:
2015-04-28 18:29:49
收藏:
0 评论:
0 赞:
0 阅读:
185
一、概述
GridFS是MongoDB的一种存储机制,用来存储大型二进制文件。
优点:
1.使用GridFS能够简化你的栈。如果已经在使用MongoDB,那么可以使用GridFS来代替独立的文件存储工具
2.GridFS会自动平衡已有的复制或者为MongoDB设置的自动分片,所以对文件存储做故障转移或...
分类:
数据库技术 时间:
2015-04-28 18:29:40
收藏:
0 评论:
0 赞:
0 阅读:
267
相信大家在使用eclipse的git插件提交文件时,都会遇到这样一个问题:就是有可能不小心把不必要的文件也被提交了(如.project,.classpath文件或者.settings文件夹及其下面的文件等),那有没有办法把这些文件忽略掉呢?
方法很简单,就是在项目目录下新建.gitignore文件,然后在里面声明要忽略的文件夹或者文件就可以了。麻烦的地方来了,因为该文件是点开头,没有文件名,没办法...
分类:
Windows开发 时间:
2015-04-28 18:29:19
收藏:
0 评论:
0 赞:
0 阅读:
465
在最新的mathematics软件中使用如下代码,无法产生程序:
在搜索了Mathematics 9.0 -> 帮助 -> 参考资料中心的内容,查到一个更简单好用的函数,正确结果如下:...
分类:
其他 时间:
2015-04-28 18:29:09
收藏:
0 评论:
0 赞:
0 阅读:
206
关于审计:
11g默认启用的审计选项,AUDIT_TRAIL参数的缺省值为DB,表示审计数据将记录在数据库中的SYS.AUD$审计字典基表上。而在Oracle 10g中该参数默认值为none,即不启用审计。Oracle官方宣称默认启用的审计日志不会对绝大多数产品数据库的性能带来过大的负面影响,同时Oracle公司还推荐使用基于OS文件的审计日志记录方式(OS
audit trail file...
分类:
数据库技术 时间:
2015-04-28 18:28:59
收藏:
0 评论:
0 赞:
0 阅读:
237
1、 标签
2、FrameLayout>RelationLayout>LinearLayout
3、LinearLayout中少用layout_weight参数
4、布局中减少Layout层次嵌套和不必要节点,代码中减少不必要的infalte(e.g. 局部变量->全局变量)
5、用TextView代替TextView+ImageView的组合(实用drawableTop属性等)
6、首次不需要显示使用的节点设置android:visibili...
分类:
移动平台 时间:
2015-04-28 18:28:50
收藏:
0 评论:
0 赞:
0 阅读:
276