首页 > 其他
七、特征提取和转换
TF-IDF TF-IDF(Term frequency-inverse document frequency ) 是文本挖掘中一种广泛使用的特征向量化方法。TF-IDF反映了语料中单词对文档的重要程度。假设单词用t表示,文档用d表示,语料用D表示,那么文档频度DF(t, D)是包含单词t的文档数。 ...
分类:其他   时间:2017-01-09 17:55:07    收藏:0  评论:0  赞:0  阅读:226
五、聚类
聚类: 聚类是一个无监督学习问题,我们基于相似的特性将数据分组成多个子集。聚类通常用于探索性分析或者作为分层监督学习管道(每个簇训练不同的分类或者回归模型)的组件。 MLlib支持下面的几个模型: K均值(K-means) 高斯混合(Gaussian mixture) 幂迭代聚类(Power ite ...
分类:其他   时间:2017-01-09 17:53:35    收藏:0  评论:0  赞:0  阅读:285
Robot Framework Chrome
1. 下载对应版本的chromedriver, 好像都是windows32位的,不过没关系,可以用即可。 2. 将chromedriver放入到chrome的安装路径下,然后将chromrdriver的路径放入到path环境变量中。 事实上,我是直接放到python home下面,这样不用重复的添加 ...
分类:其他   时间:2017-01-09 17:51:26    收藏:0  评论:0  赞:0  阅读:122
ElasticSearch大数据分布式弹性搜索引擎使用
阅读目录: 1.背景 两年前有机会接触过elasticsearch,但是未做深入学习,只是工作中用到了。越来越发现es是个不错的好东西,所以花了点时间好好学习了下。在学习过程中也发现了一些问题,网上大多资料都很零散,大部分都是实验性的demo,很多问题并没有讲清楚也并没有系统的讲完整一整套方案,所以 ...
分类:其他   时间:2017-01-09 17:50:30    收藏:0  评论:0  赞:0  阅读:457
UVA - 297 Quadtrees (四分树)
题意:求两棵四分树合并之后黑色像素的个数。 分析:边建树边统计。 ...
分类:其他   时间:2017-01-09 17:49:48    收藏:0  评论:0  赞:0  阅读:173
django学习笔记:AdminSite界面配置
(一)重定义字段顺序: 修改对应应用目录下的admin.py class PollAdmin(admin.ModelAdmin): fields = ['pub_date', 'question'] # 调整成实际需求的顺序 admin.site.register(Poll, PollAdmin) ...
分类:其他   时间:2017-01-09 17:49:33    收藏:0  评论:0  赞:0  阅读:254
一些开源搜索引擎实现
A search engine based on Node.js and LevelDB A search engine based on Node.js and LevelDB A persistent, network resilient, full text search library fo ...
分类:其他   时间:2017-01-09 17:48:57    收藏:0  评论:0  赞:0  阅读:262
git的常用命令(一)
Git配置:gitconfig--globaluser.name"TinaGao"gitconfig--globaluser.email"123@qq.com"执行了以上命令后就会在home目录下建立一个.gitconfig的文件,可以查看内容:cat~/.gitconfigClone一个仓库:gitclonehttp:....初始化一个新的仓库:mkdirprojectcdprojectgitinit创建文..
分类:其他   时间:2017-01-09 17:04:59    收藏:0  评论:0  赞:0  阅读:200
Openstack - keystone异常
新安装的openstack节点发现keystone异常 当时查看了openstack的dns-server服务是否正常----查看结果:服务正常运行 尝试使用nslookupkeystone的url发现解析失败 原因:由于DNS的域名还是默认的域名,导致无法解析keystone的url 解决方法:更正DNS域名
分类:其他   时间:2017-01-09 17:03:47    收藏:0  评论:0  赞:0  阅读:232
sshd 相关服务配置与使用
一.ssh概念ssh(secureshell)是一个允许两台电脑之间通过安全的连接进行数据交换的网络协议。加密保证了数据的保密性和完整性。SSH采用公钥加密技术来验证远程主机,以及(必要时)允许远程主机验证用户。二.应用场景SSH通常用于远程访问和执行命令,但是它也支持隧道,转发任意..
分类:其他   时间:2017-01-09 17:02:10    收藏:0  评论:0  赞:0  阅读:225
实现英文注册用户首字母大写
一代码<!DOCTYPEhtmlPUBLIC"-//W3C//DTDXHTML1.0Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><htmlxmlns="http://www.w3.org/1999/xhtml"><head><metahttp-equiv="Content-Type"content="text/html;charset=utf-8"/>..
分类:其他   时间:2017-01-09 17:00:52    收藏:0  评论:0  赞:0  阅读:234
使用TortoiseGit时如何实现SSH免密码登录
最近在学习Git,每次pull/push都要提示输入密码,比较烦。而且由于网络速率比较慢,等好一段时间才能输密码。为了避免输入密码,折腾了好久。原理TortoiseGit基于putty的ssh实现密钥认证。1、git服务器配置1.1切换到git,在git用户下操作,避免后期权限更改su-git1.2生成密钥ss..
分类:其他   时间:2017-01-09 16:59:47    收藏:0  评论:0  赞:0  阅读:251
迁移数据到redis-cluster
旧redis:192.168.1.204192.168.1.205分别存放着不同的keyredis-cluster:Master:192.168.1.200192.168.1.202192.168.1.203Slave:192.168.1.206192.168.1.207192.168.1.208模拟redis离线迁移,即需要先断开所有客户端请求一、准备旧redis:1.修改配置文件,指定AOF文件路径dir/et..
分类:其他   时间:2017-01-09 16:59:35    收藏:0  评论:0  赞:0  阅读:220
Ansible学习笔记(六):Ansible使用时常见问题总结
1、出现Error:ansiblerequiresajsonmodule,nonefound!SSHpassword:192.168.24.15|FAILED>>{"failed":true,"msg":"Error:ansiblerequiresajsonmodule,nonefound!","parsed":false}解决:python版本过低,要不升级python要不就安装python-simplejson2、安装完成后连接客户..
分类:其他   时间:2017-01-09 16:58:02    收藏:0  评论:0  赞:0  阅读:2905
Tomcat部署方式总结
tomcat是一个比较好用的web服务器,下面就总结下web服务的部署方式。1、静态部署1.1、webapps作为tomcat项目的默认目录,可以直接将war包或者目录直接扔进这个目录。webapps这个默认的应用目录也是可以改变。打开Tomcat的conf目录下的server.xml文件,找到下面内容:<Hostna..
分类:其他   时间:2017-01-09 16:57:03    收藏:0  评论:0  赞:0  阅读:281
图文讲解Centos7单用户模式的进入
Centos7在进入单用户的时候和6.x做了很多改变,下面让我们来看看如何进入单用户1、重启服务器,在选择内核界面使用上下箭头移动2、选择内核并按“e”3、找到下面这行4、修改这里要删除掉rhgbquiet,如下图5、使用“ctrl+x”来重启服务器就可以了,重启后就会进入到单用户6、退..
分类:其他   时间:2017-01-09 16:56:50    收藏:0  评论:0  赞:0  阅读:267
CentOS7安装EPEL的两种方式
epel是社区强烈打造的免费开源发行软件包版本库。EPEL,即ExtraPackagesforEnterpriseLinux的简称,是为企业级Linux提供的一组高质量的额外软件包,包括但不限于RedHatEnterpriseLinux(RHEL),CentOSandScientificLinux(SL),OracleEnterpriseLinux(OEL)。(关于:EPEL)方法一:yum..
分类:其他   时间:2017-01-09 16:56:16    收藏:0  评论:0  赞:0  阅读:351
从tar包中删除某个文件
[root@rocketmq-master2zyc]#tar-tfzyc.tarzyc/zyc/example/zyc/example/zyczyc/access_2016-08-13[root@rocketmq-master2zyc]#tar--deletezyc/access_2016-08-13-vfzyc.tar[root@rocketmq-master2zyc]#tar-tfzyc.tarzyc/zyc/example/zyc/example/zyc
分类:其他   时间:2017-01-09 16:55:58    收藏:0  评论:0  赞:0  阅读:986
TNO:CI/CD与微服务架构
Rancher大大减少了TNO用于管理容器和开发代码的时间,从而让TNO可以将更多的时间用在那些造福于社会的研究项目上。关于TNOTNO(荷兰应用科学研究组织)是一个独立组织,它旨在连接人与知识,创造能够以可持续的方式提升社会福祉的创新项目。TNO雇佣了2600多名专家,研究领域涵..
分类:其他   时间:2017-01-09 16:55:39    收藏:0  评论:0  赞:0  阅读:219
remote tools
(1)psexecpsexec是一个远程执行工具,你可以像使用telnet一样使用它。它的使用格式为:psexec\\远程机器ip[-uusername[-ppassword]][-c[-f]][-i][-d]program[arguments]它的参数有:-u后面跟用户名-p后面是跟密码的,如果建立ipc连接后这两个参数则不需要。(如果没有-p参数,则..
分类:其他   时间:2017-01-09 16:54:07    收藏:0  评论:0  赞:0  阅读:250
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!