首页 > 其他 > 详细

统计学基础之数据分布

时间：2019-08-04 22:58:32 阅读：166 评论：0 收藏：0 [点我收藏+]

统计学基础之数据分布

学习几种常用的数据分布

1、正态分布

正态分布（Normal distribution），也称“常态分布”，又名高斯分布。正态曲线呈钟型，两头低，中间高，左右对称因其曲线呈钟形。

定义：若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布，记为N(μ，σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置，其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。

技术分享图片

（1）如果且a与b是实数，那么。

（2）如果与是统计独立的正态随机变量，那么：它们的和也满足正态分布

它们的差也满足正态分布

U与V两者是相互独立的。

（3）如果

和

是独立常态随机变量，那么：它们的积XY服从概率密度函数为p的分布

其中

是修正贝塞尔函数。它们的比符合柯西分布，满足

（4）如果

为独立标准常态随机变量，那么

服从自由度为n的卡方分布。

2、二项分布

二项分布是由伯努利提出的概念，指的是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果，而且两种结果发生与否互相对立，并且相互独立，与其它各次试验结果无关，事件发生与否的概率在每一次独立试验中都保持不变，则这一系列试验总称为n重伯努利实验，当试验次数为1时，二项分布服从0-1分布。

属性：

每个试验都是独立的。
在试验中只有两个可能的结果：成功或失败。
总共进行了n次相同的试验。
所有试验成功和失败的概率是相同的。

重复n次的伯努利试验（Bernoulli Experiment），用ξ表示随机试验的结果。

技术分享图片

二项分布公式

如果事件发生的概率是P,则不发生的概率q=1-p，N次独立重复实验中发生K次的概率是

P(ξ=K)= C(n,k) * p^k * (1-p)^(n-k)，其中C(n, k) =n!/(k!(n-k)!)，注意：第二个等号后面的括号里的是上标，表示的是方幂。

那么就说这个属于二项分布。其中P称为成功概率。记作ξ~B(n,p)

期望：Eξ=np；

方差：Dξ=npq；

其中q=1-p

3、泊松分布

泊松分布的概率函数为：

泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。泊松分布适合于描述单位时间内随机事件发生的次数。

泊松分布的期望和方差均为

特征函数为

泊松分布与二项分布

泊松分布在满足以下条件的情况下是二项式分布的极限情况：

• 试验次数无限大或n → ∞。
• 每个试验成功的概率是相同的，无限小的，或p → 0。
• np = λ，是有限的。

4、均匀分布

均匀分布也叫矩形分布，它是对称概率分布，在相同长度间隔的分布概率是等可能的。均匀分布由两个参数a和b定义，它们是数轴上的最小值和最大值，通常缩写为U（a，b）。

均匀分布的概率密度函数为：

在两个边界a和b处的f（x）的值通常是不重要的，因为它们不改变任何

的积分值。概率密度函数有时为0，有时为

。在傅里叶分析的概念中，可以将f（a）或f（b）的值取为

，因为这种均匀函数的许多积分变换的逆变换都是函数本身。

对于平均值μ和方差

，概率密度可以写为：

若a = 0并且b = 1，所得分布U（0,1）称为标准均匀分布。

标准均匀分布的一个有趣的属性是，如果u1具有标准均匀分布，那么1-u1也是如此。

（1）如果X服从标准均匀分布，则通过逆变换方法，

具有指数分布参数

。

（2）如果X服从标准均匀分布，则Y = Xn具有参数（1 / n，1）的β分布。

（3）如果X服从标准均匀分布，则Y = X也是具有参数（1,1）的β分布的特殊情况。

（4）两个独立的，均匀分布的总和产生对称的三角分布

5、伯努利分布

伯努利分布亦称“零一分布”、“两点分布”。称随机变量X有伯努利分布, 参数为p(0<p<1),如果它分别以概率p和1-p取1和0为值。EX= p,DX=p(1-p)。伯努利试验成功的次数服从伯努利分布,参数p是试验成功的概率。伯努利分布是一个离散型机率分布，是N=1时二项分布的特殊情况

随机变量X服从参数为p的伯努利分布，则X的概率函数：

f (x | p) = p x (1 - p) 1 - x x = 0 或 1

均值与方差：

u = p; v a r = p * (1 - p)

伯努利与二项分布之间的关系： • 伯努利分布是具有单项试验的二项式分布的特殊情况。 • 伯努利分布和二项式分布只有两种可能的结果，即成功与失败。 • 伯努利分布和二项式分布都具有独立的轨迹。 6、卡方分布 若n个相互独立的随机变量ξ?，ξ?，...,ξn ，均服从标准正态分布（也称独立同分布于标准正态分布），则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量，其分布规律称为卡方分布。 若n个相互独立的随机变量ξ?、ξ?、\dots\dots、ξn ，均服从标准正态分布（也称独立同分布于标准正态分布），则这n个服从标准正态分布的随机变量的平方和 构成一新的随机变量，其 卡方分布 分布规律称 分布（chi-square distribution），其中参数 称为自由度，正如正态分布中均数或方差不同就是另一个正态分布一样，自由度不同就是另一个 分布。记为 或者 （其中 ， 为限制条件数）。 卡方分布是由正态分布构造而成的一个新的分布，当自由度 很大时， 分布近似为正态分布。对于任意正整数x， 自由度为 的卡方分布是一个随机变量X的机率分布。 7、beta分布 贝塔分布（Beta Distribution) 是一个作为伯努利分布和二项式分布的共轭先验分布的密度函数，在机器学习和数理统计学中有重要应用。在概率论中，贝塔分布，也称Β分布，是指一组定义在(0,1) 区间的连续概率分布。 在概率论中，贝塔分布，也称B分布，是指一组定义在 区间的连续概率分布，有两个参数 。 1.概率密度函数 Β分布的概率密度函数是： 其中 是 Γ函数 。随机变量X服从参数为 的Β分布通常写作 纯粹笔记。。。。

统计学基础之数据分布

原文：https://www.cnblogs.com/zym-yc/p/11300186.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

最新文章

更多>

教程昨日排行

更多>

友情链接

汇智网 PHP教程插件网

关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com

© 2014 bubuko.com 版权所有

打开技术之扣，分享程序人生！