首页 > 2016年05月18日 > 全部分享
Spark入门实战系列--4.Spark运行架构
1、 Spark运行架构 1.1 术语定义 lApplication:Spark Application的概念和Hadoop MapReduce中的类似,指的是用户编写的Spark应用程序,包含了一个Driver 功能的代码和分布在集群中多个节点上运行的Executor代码; lDriver:Spark中的Driver即运行上述Application的main()函数并且创建SparkCon...
分类:其他   时间:2016-05-18 19:18:30    收藏:0  评论:0  赞:0  阅读:184
Spark的RDD简单操作
0、Spark的wc.note package RddApiimport org.apache.spark.{SparkConf, SparkContext}/** * hadoop * spark * tachyon * hadoop * hbase * spark *//** * Created by Administrator on 2016/4/2...
分类:其他   时间:2016-05-18 19:18:20    收藏:0  评论:0  赞:0  阅读:228
Javascript基础知识盲点总结——函数
一、函数中的arguments对象 每个函数内部都有一个arguments,它能返回函数所接受的所有参数 注意:argumens接收的是实参 如下是利一个利用arguments特性编写的求和函数:   二、关于变量的作用域 在javascript中,不能为变量定义特定的块级作用域,但是可以定义其所属的函数域。 javascript中的全局变量指的是声明在所有函数之外的变量...
分类:编程语言   时间:2016-05-18 19:18:10    收藏:0  评论:0  赞:0  阅读:224
Dirichlet Process
Dirichlet Process标签(空格分隔): LDA DMM DP Dirichlet Dirichlet-Process作者: 王琳(大连理工大学信息检索研究室)写在前头 对于非参数化的机器学习模型,我之前研究的并不多。通过这几天的学习,简单总结一下我所了解到的非参数化的模型。 鉴于非参数化的学习模型涉及大量的概率计算,晦涩难懂,然而在这篇总结材料中,我并不细推每个公式,而是...
分类:其他   时间:2016-05-18 19:18:03    收藏:0  评论:0  赞:0  阅读:298
R语言笔记之数据篇
R语言杂七杂八 与R语言有关的应用工具 探索性数据分析 统计推断 回归分析 机器学习-分类问题 R与Rstudio的获取与安装 包package一种扩展R基本功能的机制集成了众多函数 获取包 导入包libraryname 获取帮助 R语言特点 R语言语法基础之数据篇 R语言中的数据 R语言支持的数据类型 基本数据结构 一维数据类型 向量 vocter 1创建 2提取子集 因子 factor 1创建...
分类:编程语言   时间:2016-05-18 19:17:50    收藏:0  评论:0  赞:0  阅读:245
Servlet学习(三)Servlet编程实例-网站登录(修改版-增加数据库-附源码)
我们为刚才的那个示例添加上数据库,组成一个较为完整的登录功能。 在开始之前我们得首先了解下一些常用的java术语: PO(persistant object) 持久对象 在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了. 通常对应数据模型(数据库),本身还有部分业务逻辑的处理. 可以看成是与数据库中的表相映射的java对象. 最简单的PO就是对应...
分类:数据库技术   时间:2016-05-18 19:17:41    收藏:0  评论:0  赞:0  阅读:233
1.1 爬下12306--爬取信息
fetch_sh-bj.sh脚本curl命令解析...
分类:其他   时间:2016-05-18 19:17:30    收藏:0  评论:0  赞:0  阅读:362
1.3 Tomcat的下载和安装
Tomcat是Java领域最著名的开源web容器,简单、易用,稳定性极好,既可以作为个人学习之用,也可以作为商业产品发布。Tomcat不仅提供了Web容器的基本功能,还支持JAAS和JNDI绑定等。 1.3.1 安装Tomcat服务器 因为Tomcat完个是纯Java实现,因此它是平台无关的,在任何平台上运行完全相同。在Windows和Linux平台上的安装及配置基本相同。我们Windows平...
分类:其他   时间:2016-05-18 19:17:20    收藏:0  评论:0  赞:0  阅读:251
Deep Learning学习 之 卷积神经网络(文字识别系统LeNet-5)
在经典的模式识别中,一般是事先提取特征。提取诸多特征后,要对这些特征进行相关性分析,找到最能代表字符的特征,去掉对分类无关和自相关的特征。然而,这些特征的提取太过依赖人的经验和主观意识,提取到的特征的不同对分类性能影响很大,甚至提取的特征的顺序也会影响最后的分类性能。同时,图像预处理的好坏也会影响到提取的特征。那么,如何把特征提取这一过程作为一个自适应、自学习的过程,通过机器学习找到分类性能最优的特...
分类:Web开发   时间:2016-05-18 19:17:10    收藏:0  评论:0  赞:0  阅读:740
SSH框架
SSH 为 struts+spring+hibernate的一个集成框架,是目前较流行的一种Web应用程序开源框架。        集成SSH框架的系统从职责上分为四层:表示层、业务逻辑层、数据持久层和域模块层,以帮助开发人员在短期内搭建结构清晰、可复用性好、维护方便的Web应用程序。其中使用Struts作为系统的整体基础架构,负责MVC的分离,在Struts框架的模型部分,控制业务跳转,利用H...
分类:其他   时间:2016-05-18 19:16:50    收藏:0  评论:0  赞:0  阅读:167
Celery(二)-----------------使用Celery的第二步
使用Celery的第一步是有意最小化的介绍Celery。本节教程将为你展示Celery提供的更多细节,包括怎样为你的程序和库添加Celery支持。 本节教程不会介绍Celery的所有特性和最佳实践,所以建议你也阅读一下用户指引 User Guide。 在你的程序中使用Celery 我们工程的结构如下: 布局: proj/__init__.py /celery.py...
分类:其他   时间:2016-05-18 19:16:40    收藏:0  评论:0  赞:0  阅读:197
CAN与CANOpen(五)
4.3通讯对象 CANOpen协议共有 6种通讯对象,分别是: PDO、 SDO、 SYNC、 TIME、 EMCY、 NMT。这 6种通讯对象完成了 CANOpen协议的所有通讯功能。其中我们只介绍使用较多的 PDO、 SDO、 NMT( 4.4)。 4.3.1通信对象ID (COB-ID) CANOpen协议的通讯对象主要利用了 CAN协议中的数...
分类:其他   时间:2016-05-18 19:16:30    收藏:0  评论:0  赞:0  阅读:329
K-Means Hadoop MapReduce
聚类与分类聚类(clustering)是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,这样的一组数据对象的集合叫做簇,并且对每一个这样的簇进行描述的过程。 在分类( classification )中,对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪一类标记出来。 聚类分析也称无监督学习, 因为和分类学习相比,聚类的样本没有标记,需要由聚类学习算法来自动确定。...
分类:其他   时间:2016-05-18 19:16:20    收藏:0  评论:0  赞:0  阅读:273
2016"百度之星" - 资格赛(Astar Round1)
Problem A  Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/Others) Problem Description 度熊手上有一本字典存储了大量的单词,有一次,他把所有单词组成了一个很长很长的字符串。现在麻烦来了,他忘记了原来的字符串都是什么,神奇...
分类:其他   时间:2016-05-18 19:16:10    收藏:0  评论:0  赞:0  阅读:280
STL中的map用法详解
STL中map用法详解   说明:如果你具备一定的C++ template知识,即使你没有接触过STL,这个文章你也应该可能较轻易的看懂。本人水平有限,不当之处,望大家辅正。 一.Map概述 Map是STL的一个关联容器,它提供一对一(其中第一个可以称为关键字,每个关键字只能在map中出现一次,第二个可能称为该关键字的值)的数据处理能力,由于这个特性,它完成有可能在我们处理一对一数据的时候...
分类:其他   时间:2016-05-18 19:16:02    收藏:0  评论:0  赞:0  阅读:168
linux常用文本编辑器nano/vi/vim
linux下有很多文本编辑器,其中系统(不管哪个分支)都会自带nano和vi这两个最基本的编辑器。vim相当于vi的升级版。这里我们依次来讲解这几个编辑器的用法。 1.nano 直接在命令行中敲入nano filename即可打开文件或新建文件。 可以看到第一行反白介绍了nano的版本号以及被编辑的文件名称。接下来就是可编辑区域,这里由于nano.txt文件是一个新建文件,内容为空,...
分类:系统服务   时间:2016-05-18 19:15:50    收藏:0  评论:0  赞:0  阅读:294
【Stanford机器学习笔记】12-Dimensionality Reduction
【Stanford机器学习笔记】12-Dimensionality Reduction...
分类:其他   时间:2016-05-18 19:15:41    收藏:0  评论:0  赞:0  阅读:245
CAN与CANOpen(二)
3.3帧 CAN协议的报文传输主要由下面的 4种帧来实现: 数据帧:从发射端携带数据到接收端。 远程帧:总线单元发出远程帧,请求发送具有同一识别符的数据帧。 错误帧:任何单元检测到一总线错误就发出错误帧。 过载帧:过载帧用以在先行的和后续的数据帧(或远程帧)之间提供一附加的延时。 同时帧间空间用来间隔数据帧 /远程帧与其他帧。 3.3.1数据帧...
分类:其他   时间:2016-05-18 19:15:30    收藏:0  评论:0  赞:0  阅读:336
4.STL简单容器(cghVector)的实现
我是照着侯捷老师的《STL源码剖析》做的cghSTL,现在才看到第三章,忽然觉得这本书的编排非常适合自学。 第一章讲解空间配置器,这是STL最基础的部件,没什么好说的。 第二章讲解迭代器,老师举了单向链表的例子,这非常有考究,单向链表不需要连续的存储空间,意味着使用单向链表实现的容器不需要考虑空间溢出等问题,我们可以把注意力集中在容器的迭代器上。 第三章讲解序列式容器,一来说怎么实现vect...
分类:其他   时间:2016-05-18 19:15:20    收藏:0  评论:0  赞:0  阅读:353
机器学习竞赛技巧
Kaggle 是目前最大的 Data Scientist 聚集地。很多公司会拿出自家的数据并提供奖金,在 Kaggle 上组织数据竞赛。我最近完成了第一次比赛,在 2125 个参赛队伍中排名第 98 位(~ 5%)。因为是第一次参赛,所以对这个成绩我已经很满意了。在 Kaggle 上一次比赛的结果除了排名以外,还会显示的就是 Prize Winner,10% 或是 25% 这三档。所以刚刚接触...
分类:其他   时间:2016-05-18 19:15:10    收藏:0  评论:0  赞:0  阅读:748
2152条   上一页 1 ... 32 33 34 35 36 ... 108 下一页
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!