首页 > 其他 > 详细

统计学基础之数据分布

时间:2019-08-04 22:58:32      阅读:165      评论:0      收藏:0      [点我收藏+]

统计学基础之数据分布

 

学习几种常用的数据分布

 

1、正态分布

正态分布(Normal distribution),也称“常态分布”,又名高斯分布。正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形。

定义:若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。

技术分享图片

(1)如果 技术分享图片 且a与b是实数,那么技术分享图片 。

(2)如果 技术分享图片 与技术分享图片 是统计独立的正态随机变量,那么:它们的和也满足正态分布

 技术分享图片它们的差也满足正态分布
 技术分享图片
U与V两者是相互独立的。
(3)如果 技术分享图片 和
技术分享图片 
是独立常态随机变量,那么:它们的积XY服从概率密度函数为p的分布
技术分享图片 
其中
技术分享图片 
是修正贝塞尔函数。它们的比符合柯西分布,满足
 技术分享图片
(4)如果技术分享图片 为独立标准常态随机变量,那么
技术分享图片 
服从自由度为n的卡方分布。
 
 
2、二项分布
二项分布是由伯努利提出的概念,指的是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布服从0-1分布。

属性:

每个试验都是独立的。
在试验中只有两个可能的结果:成功或失败。
总共进行了n次相同的试验。
所有试验成功和失败的概率是相同的。

重复n次的伯努利试验(Bernoulli Experiment),用ξ表示随机试验的结果。
技术分享图片二项分布公式
如果事件发生的概率是P,则不发生的概率q=1-p,N次独立重复实验中发生K次的概率是
P(ξ=K)= C(n,k) * p^k * (1-p)^(n-k),其中C(n, k) =n!/(k!(n-k)!),注意:第二个等号后面的括号里的是上标,表示的是方幂。
那么就说这个属于二项分布。其中P称为成功概率。记作ξ~B(n,p)
期望:Eξ=np;
方差:Dξ=npq;
其中q=1-p
 
3、泊松分布
泊松分布的概率函数为:
技术分享图片
泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。 泊松分布适合于描述单位时间内随机事件发生的次数。
泊松分布的期望和方差均为 技术分享图片
特征函数为技术分享图片
 
泊松分布与二项分布

泊松分布在满足以下条件的情况下是二项式分布的极限情况:

• 试验次数无限大或n → ∞。
• 每个试验成功的概率是相同的,无限小的,或p → 0。
• np = λ,是有限的。

 

4、均匀分布

均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。 均匀分布由两个参数a和b定义,它们是数轴上的最小值和最大值,通常缩写为U(a,b)。

均匀分布的概率密度函数为
技术分享图片
 
技术分享图片
在两个边界a和b处的f(x)的值通常是不重要的,因为它们不改变任何 技术分享图片 的积分值。 概率密度函数有时为0,有时为
 技术分享图片 
。 在傅里叶分析的概念中,可以将f(a)或f(b)的值取为
 技术分享图片 
,因为这种均匀函数的许多积分变换的逆变换都是函数本身。
 
对于平均值μ和方差 技术分享图片 ,概率密度可以写为:技术分享图片
技术分享图片

 

若a = 0并且b = 1,所得分布U(0,1)称为标准均匀分布。
标准均匀分布的一个有趣的属性是,如果u1具有标准均匀分布,那么1-u1也是如此。
 
(1)如果X服从标准均匀分布,则通过逆变换方法,
 技术分享图片 
具有指数分布参数 技术分享图片 。
(2)如果X服从标准均匀分布,则Y = Xn具有参数(1 / n,1)的β分布。
(3)如果X服从标准均匀分布,则Y = X也是具有参数(1,1)的β分布的特殊情况。
(4)两个独立的,均匀分布的总和产生对称的三角分布
 
 
5、伯努利分布
伯努利分布亦称“零一分布”、“两点分布”。称随机变量X有伯努利分布, 参数为p(0<p<1),如果它分别以概率p和1-p取1和0为值。EX= p,DX=p(1-p)。伯努利试验成功的次数服从伯努利分布,参数p是试验成功的概率。伯努利分布是一个离散型机率分布,是N=1时二项分布的特殊情况
 

随机变量X服从参数为p的伯努利分布,则X的概率函数: 

f(x|p)=px(1p)1xx=01f(x|p)=px(1−p)1−xx=0或1

均值与方差: 
u=p;var=p(1p)
 

伯努利与二项分布之间的关系:

• 伯努利分布是具有单项试验的二项式分布的特殊情况。

• 伯努利分布和二项式分布只有两种可能的结果,即成功与失败。

• 伯努利分布和二项式分布都具有独立的轨迹。

 

6、卡方分布

若n个相互独立的随机变量ξ?,ξ?,...,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布。

若n个相互独立的随机变量ξ?、ξ?、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和 技术分享图片 构成一新的随机变量,其卡方分布分布规律称 技术分享图片 分布(chi-square distribution),其中参数技术分享图片 称为自由度,正如正态分布中均数或方差不同就是另一个正态分布一样,自由度不同就是另一个 技术分享图片 分布。记为 技术分享图片 或者技术分享图片 

(其中
 技术分享图片, 
技术分享图片 
为限制条件数)。
卡方分布是由正态分布构造而成的一个新的分布,当自由度 技术分享图片很大时, 技术分享图片 分布近似为正态分布。对于任意正整数x, 自由度为
 技术分享图片 
的卡方分布是一个随机变量X的机率分布。
 
7、beta分布
 
贝塔分布(Beta Distribution) 是一个作为伯努利分布和二项式分布的共轭先验分布的密度函数,在机器学习和数理统计学中有重要应用。在概率论中,贝塔分布,也称Β分布,是指一组定义在(0,1) 区间的连续概率分布。在概率论中,贝塔分布,也称B分布,是指一组定义在 技术分享图片 区间的连续概率分布,有两个参数
技术分享图片 
1.概率密度函数
Β分布的概率密度函数是:
技术分享图片其中
 技术分享图片 
Γ函数。随机变量X服从参数为 技术分享图片 
的Β分布通常写作
技术分享图片
 
 
 

纯粹笔记。。。。

 

 

 

 

统计学基础之数据分布

原文:https://www.cnblogs.com/zym-yc/p/11300186.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!