首页 > 2015年12月18日 > 全部分享
[python爬虫] Selenium定向爬取海量精美图片及搜索引擎杂谈
我自认为这是自己写过博客中一篇比较优秀的文章,同时也是在深夜凌晨2点满怀着激情和愉悦之心完成的。首先通过这篇文章,你能学到以下几点: 1.可以了解Python简单爬取图片的一些思路和方法 2.学习Selenium自动、测试分析动态网页和正则表达式的区别和共同点 3.了解作者最近学习得比较多的搜索引擎...
分类:编程语言   时间:2015-12-18 06:53:33    收藏:0  评论:0  赞:0  阅读:359
[lintcode medium] Delete digits
Delete DigitsGiven string A representative a positive integer which has N digits, remove any k digits of the number, the remaining digits are arranged...
分类:其他   时间:2015-12-18 06:53:23    收藏:0  评论:0  赞:0  阅读:239
[Javascript] Intro to Recursion - Refactoring to a Pure Function
Previous post:http://www.cnblogs.com/Answer1215/p/4990418.htmllet input, config, tasks;input = ['dist'];config = { "dist": ["build", "deploy"], "bui.....
分类:编程语言   时间:2015-12-18 06:53:13    收藏:0  评论:0  赞:0  阅读:305
lintcode medium Best Time to Buy and Sell Stock I,II,III
Best Time to Buy and Sell StockSay you have an array for which theithelement is the price of a given stock on dayi.If you were only permitted to compl...
分类:其他   时间:2015-12-18 06:53:03    收藏:0  评论:0  赞:0  阅读:220
[CSS3] Interactive Pseudo-Classes :link :visited :hover :active
The interactive pseudo-classes for links (and buttons) allow us to make sure the user knows what elements on the page are interactive and that they ca...
分类:Web开发   时间:2015-12-18 06:52:53    收藏:0  评论:0  赞:0  阅读:287
拓扑序列变形 之 poj 1094 Sorting It All Out
/*拓扑序列变形之poj1094SortingItAllOut 变形: 在每消去唯一一个入度为0的点后,只剩下唯一一个入度为0的点。 这样获得的n个点才是排序好的。*/ 1 #include 2 #include 3 #include 4 #include 5 #include ...
分类:其他   时间:2015-12-18 06:52:43    收藏:0  评论:0  赞:0  阅读:268
c++ 随机数相关的一些函数
随机数的原理介绍,有兴趣的话不妨阅读以下:http://blog.skyoung.org/2013/08/27/generate-random-numberC语言风格的随机数生成主要是两个函数srand(), rand(). srand()设置随机数种子,rand得到[0, RAND_MAX]中的元...
分类:编程语言   时间:2015-12-18 06:52:33    收藏:0  评论:0  赞:0  阅读:329
[python爬虫] Selenium定向爬取PubMed生物医学摘要信息
本文主要是自己的在线代码笔记,在生物医学本体Ontology构建过程中,我使用Selenium定向爬取生物医学PubMed数据库的内容。PubMed是一个免费的搜寻引擎,提供生物医学方面的论文搜寻以及摘要。它的数据库来源为MEDLINE(生物医学数据库),其核心主题为医学,但亦包括其他与医学相关的领...
分类:编程语言   时间:2015-12-18 06:52:23    收藏:0  评论:0  赞:0  阅读:759
js渐渐入门之懒人框架- laz.js
一 前言 js 是一门神奇的语言。我们在使用js过程中,难免会使用到自己封装的小接口,即使我们已经有了完备的jquery框架。因此我准备记录下来laz.js 框架的编写过程, 也是记录自己的学习过程。框架编写除了有好的抽象思维和恰当的使用环境之外,自然需要最简单的接口。而正如水里的鸭子,表面平静水下...
分类:Web开发   时间:2015-12-18 06:52:13    收藏:0  评论:0  赞:0  阅读:263
[Python爬虫] scrapy爬虫系列 <一>.安装及入门介绍
前面介绍了很多Selenium基于自动测试的Python爬虫程序,主要利用它的xpath语句,通过分析网页DOM树结构进行爬取内容,同时可以结合Phantomjs模拟浏览器进行鼠标或键盘操作。但是,更为广泛使用的Python爬虫框架是——Scrapy爬虫。这是一篇在Windows系统下介绍 Scra...
分类:编程语言   时间:2015-12-18 06:52:03    收藏:0  评论:0  赞:0  阅读:389
[Python爬虫] Selenium自动访问Firefox和Chrome并实现搜索截图
该篇文章主要介绍在Windows下通过Selenium+Python实现自动访问Firefox和Chrome并实现访问百度自动搜索并截图的功能。这是一个使用Selenium的简单应用,并附有详细的注释,参考官方文档,希望对你有所帮助~
分类:编程语言   时间:2015-12-18 06:51:53    收藏:0  评论:0  赞:0  阅读:714
[Python爬虫] 在Windows下安装PIP+Phantomjs+Selenium
最近准备深入学习Python相关的爬虫知识了,如果说在使用Python爬取相对正规的网页使用"urllib2 + BeautifulSoup + 正则表达式"就能搞定的话;那么动态生成的信息页面,如Ajax、JavaScript等就需要通过"Phantomjs + CasperJS + Seleni...
分类:编程语言   时间:2015-12-18 06:51:43    收藏:0  评论:0  赞:0  阅读:801
iOS之UITableView带滑动操作菜单的Cell
制作一个可以滑动操作的 Table View Cell本文翻译自 http://www.raywenderlich.com/62435/make-swipeable-table-view-cell-actions-without-going-nuts-scroll-views原作者:Ellen Sh...
分类:移动平台   时间:2015-12-18 06:51:33    收藏:0  评论:0  赞:0  阅读:558
Python简单实现基于VSM的余弦相似度计算
在知识图谱构建阶段的实体对齐和属性值决策过程中、判断一篇文章是否是你喜欢的文章、比较两篇文章的相似性等,都涉及到了向量空间模型(Vector Space Model,简称VSM)和余弦相似度计算相关知识。这篇文章主要是先叙述VSM和余弦相似度相关理论知识,然后引用阮一峰大神的例子进行解释,最后通过P...
分类:编程语言   时间:2015-12-18 06:51:23    收藏:0  评论:0  赞:0  阅读:302
[lintcode medium]Maximum Subarray II
Maximum Subarray IIGiven an array of integers, find two non-overlapping subarrays which have the largest sum. The number in each subarray should be co...
分类:其他   时间:2015-12-18 06:51:13    收藏:0  评论:0  赞:0  阅读:296
[Python爬虫] Selenium+Phantomjs动态获取CSDN下载资源信息和评论
前面几篇文章介绍了Selenium、PhantomJS的基础知识及安装过程,这篇文章是一篇应用。通过Selenium调用Phantomjs获取CSDN下载资源的信息,最重要的是动态获取资源的评论,它是通过JavaScript动态加载的,故通过Phantomjs模拟浏览器加载获取。 希...
分类:编程语言   时间:2015-12-18 06:51:03    收藏:0  评论:0  赞:0  阅读:292
C---指针篇
指针变量:专门存放内存地址的一种变量 听说C因为指针而强大一段代码来解释 指针 *指针 &指针 &指向变量 的关系 1 /* 2 * 返回指针所指向内存地址中存放的值 它是单目运算符 也称作指针运算符 3 & 返回变量所在的内存地址 它是单目运算符 也称作 取地址符 4 注意:它们的优先...
分类:其他   时间:2015-12-18 06:50:53    收藏:0  评论:0  赞:0  阅读:217
linux 下查看系统资源和负载,以及性能监控
1,查看磁盘df -h2,查看内存大小freefree [-m|g]按MB,GB显示内存vmstat3,查看cpucat /proc/cpuinfo只看cpu数量grep "model name" /proc/cpuinfo | wc -l4,查看系统内存cat /proc/meminfo5,查看每...
分类:系统服务   时间:2015-12-18 06:50:33    收藏:0  评论:0  赞:0  阅读:223
[Python] 中文编码问题:raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题
最近研究搜索引擎、知识图谱和Python爬虫比较多,中文乱码问题再次浮现于眼前。虽然市面上讲述中文编码问题的文章数不胜数,但是此处还是准备简单做下笔记。方便以后查阅和大家学习。主要包括raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题。 纪伯伦曾说过:“你无法同时...
分类:编程语言   时间:2015-12-18 06:50:23    收藏:0  评论:0  赞:0  阅读:418
[python爬虫] Selenium定向爬取虎扑篮球海量精美图片
作为一名从小就看篮球的球迷,会经常逛虎扑篮球及湿乎乎等论坛,在论坛里面会存在很多精美图片,包括NBA球队、CBA明星、花边新闻、球鞋美女等等,如果一张张右键另存为的话真是手都点疼了。作为程序员还是写个程序来进行吧!所以我通过Python+Selenium+正则表达式+urllib2进行海量图片爬取。...
分类:编程语言   时间:2015-12-18 06:50:13    收藏:0  评论:0  赞:0  阅读:369
1337条   上一页 1 ... 59 60 61 62 63 ... 67 下一页
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!