首页 > 其他 > 详细

课程二:统计学基本原理

时间:2014-03-05 02:25:16      阅读:445      评论:0      收藏:0      [点我收藏+]

1.可测量数据和不可测量数据

  从数据的本质上来说,统计学里将其分为可测量数据和不可测量数据,用更通俗的描述也就是数值类数据和分类数据。举个例子,人的身高是可以测量的,也就是有一个具体值的,比如178cm,179cm,是有一个固定的标准可以用工具计算出来的,此类即为可测量数据(数值类),还有一类数据,比如居住的地区,这类数据是主观上用来分类的,并没有一个固定的公式或工具计算,此类即为不可测量数据(分类数据)。

2.分组、组中值、次数和相对次数

  统计学中,会将原始数据按照一定的规则分成几个观测组,比如将人群按照年龄划分,0-10岁一组,10-20岁一组,20-30岁一组,每组作为一个单独的数据实体进行分析。组中值是指位于分组类中间段的数值,一般计算公式为组中最大值与最小值和的一半。次数是指某个分组内观测实体的个数,比如上面10-20岁的组里有10人,那么这个组的次数即为10。相对次数有点类似百分比,指某个分组中观测实体占整个观测实体的百分比,比如上面总人数有100人,10-20岁的组里有10人,那么这个组的相对次数则为0.1或10%。

3.直方图

  直方图用来描述一个观测样本中实体的分布情况,通过分组、组中值、次数或相对次数来图形化展现整体的分布。其中横轴表示组并用组中值标记每个组,纵轴表示次数或相对次数,例如:

bubuko.com,布布扣

4.算数平均/几何平均/调和平均/中位数/标准差/标准化/离差

  算数平均:(X1+X2+....+Xn)/n

  几何平均: bubuko.com,布布扣

  调和平均: bubuko.com,布布扣

  中位数:  如果样本为奇数,那么中位数为按序排列的样本中位于最中间的一个。如果样本为偶数,则为中间两个样本值的一半。

  标准差:  分为总体标准差  bubuko.com,布布扣

                样本标准差             bubuko.com,布布扣

  标准化: 指标准计分,用于对于不同比较标准的数据进行对比,公式如下:

                bubuko.com,布布扣

  离差:  bubuko.com,布布扣

 

  离差与标准计分的对比如下:

  bubuko.com,布布扣

 

 

  同一类标准差或离差之间进行比较时,一定要注意所选取的对象范围要相同,不然比较是无意义的。

 

5.求机率

课程二:统计学基本原理,布布扣,bubuko.com

课程二:统计学基本原理

原文:http://www.cnblogs.com/oracleblog/p/2944468.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!