首页 > 其他 > 详细

随机过程02:初等概率论(二)

时间:2021-02-04 09:50:09      阅读:28      评论:0      收藏:0      [点我收藏+]

初等概率论(二)

矩母函数和特征函数

矩母函数

矩母函数是研究分布函数的一个有效的工具。假设 \(X\) 是一个随机变量,具有分布函数 \(F(x)\) ,又假设存在 \(t_0>0\) ,使得当 \(|t|\leq t_0\) 时,有 \({\rm E}(e^{tX})<\infty\) ,则定义

\[\psi(t)={\rm E}(e^{tX})=\int_{-\infty}^\infty e^{tx}{\rm d}F(x) \ , \ \ \ \ |t|\leq t_0 \ , \]

\(\psi(t)\)\(X\) 的矩母函数。

当矩母函数存在时,矩母函数唯一地决定其分布函数。理解这一点十分重要,因为这使我们能够用矩母函数刻画随机变量的概率分布。换句话说,如果两个随机变量拥有有限且相同的矩母函数,则这两个随机变量同分布。

对矩母函数 \(\psi(t)\) 逐次求导并计算在 \(t=0\) 点的值能得到 \(X\) 的各阶矩,即

\[\psi‘(t)={\rm E}(Xe^{tX}) \ , \\psi‘‘(t)={\rm E}(X^2e^{tX}) \ , \\vdots \\psi^{(n)}(t)={\rm E}(X^ne^{tX}) \ . \]

计算在 \(t=0\) 点的值有

\[\psi^{(n)}(0)={\rm E}(X^n) \ , \ \ \ \ n\geq 1 \ . \]

但由于矩母函数并不总是存在,因此我们需要引入更一般的工具。

特征函数

特征函数对于研究随机变量的分布函数起着重要的作用,相比于矩母函数,随机变量的特征函数总是存在的。给定随机变量 \(X\) ,分布函数为 \(F(x)\) ,定义 \(X\) 的特征函数为:

\[\phi(t)={\rm E}(e^{{\rm i}tX})=\int_{-\infty}^\infty e^{{\rm i}tx}{\rm d}F(x) \ , \ \ \ \ t\in\mathbb{R} \ . \]

\(e^{{\rm i}tx}=\cos tx+{\rm i}\sin tx\) 知,任何随机变量的特征函数都存在。

特征函数具有下列基本性质:

  • \(\phi(0)=1\)
  • 对任意的 \(t\in\mathbb{R}\)\(|\phi(t)|\leq1\)
  • \(\phi(t)\)\(\mathbb{R}\) 上一致连续;
  • \(\phi(t)\) 是非负定函数,即对任意实数 \(t_1,t_2,\cdots,t_m\) 和复数 \(z_1,z_2,\cdots,z_m\) ,都有

\[\sum_{i=1}^n\sum_{j=1}^nz_i\bar{z}_j\phi(t_i-t_j)\geq0 \ ; \]

  • 如果 \(X\)\(Y\) 相互独立,则

\[\phi_{X+Y}(t)=\phi_X(t)\phi_Y(t) \ . \]

  • 给定两个随机变量 \(X\)\(Y\)\(X\xlongequal{d}Y\) 当且仅当 \(\phi_X(t)\equiv\phi_Y(t)\)
  • 如果 \(\phi(x)\) 关于 \(t\) 绝对可积,则 \(X\) 存在密度函数,且

\[p(x)=\frac{1}{2\pi}\int_{-\infty}^\infty e^{-{\rm i}tx}\phi(x){\rm d}t \ ; \]

指数分布和失效率函数

指数分布的概率密度和概率分布:

一个连续随机变量 \(X\) 的概率密度函数若为

\[f(x)=\left\{ \begin{array}{ll} \lambda e^{-\lambda x} \ \ , &x\geq0 \0 \ \ , & x<0 \end{array} \right. \]

或等价得其分布函数为

\[F(x)=\int_{-\infty}^xf(u){\rm d}u=\left\{ \begin{array}{ll} 1-e^{-\lambda x} \ \ , &x\geq0 \0 \ \ , & x<0 \end{array} \right. \]

则称 \(X\) 服从参数为 \(\lambda \ \ (\lambda>0)\)指数分布

指数分布的矩母函数:

\[\psi(t)={\rm E}(e^{tx})=\int_0^\infty e^{tx}\lambda e^{-\lambda x}{\rm d}x=\frac\lambda{\lambda-t} \ . \]

\(\psi(t)\) 求导可以的得到 \(X\) 的各阶矩,例如:

\[{\rm E}X=\frac{1}{\lambda} \ , \ \ \ \ {\rm E}X^2=\frac{2}{\lambda^2}\ ,\ \ \ \ {\rm Var}(X)=\frac{1}{\lambda^2} \ . \]

服从指数分布的随机变量之所以有很大的用处,是因为它们具有无记忆性。首先我们给出无记忆性的定义:一个随机变量 \(X\) 称为无记忆的,若

\[P(X>s+t|X>t)=P(X>s) \ , \ \ \ \ s,\,t\geq0 \ . \]

指数分布的无记忆性可以由失效率函数进一步阐述:

考虑一个连续随机变量 \(X\) ,有分布函数 \(F(x)\) 和密度函数 \(f(x)\) 。定义失效率函数 \(\lambda(t)\) 为:

\[\lambda(t)=\frac{f(t)}{\bar{F}(t)} \ , \]

其中 \(\bar{F}(x)=P(X>x)=1-F(x)\)

为了解释 \(\lambda(t)\) 的意义,我们把 \(X\) 设想为某种元件的寿命,且假定 \(X\) 已经存活 \(t\) 小时。现在我们想求再过 \({\rm d}t\) 的时间它失效的概率,即有

\[\begin{aligned} P\left(t<X<t+{\rm d}t\big|X>t\right)&=\frac{P\left(t<X<t+{\rm d}t,\, X>t\right)}{P(X>t)} \&=\frac{P\left(t<X<t+{\rm d}t\right)}{P(X>t)} \&\approx\frac{f(t){\rm d}t}{\bar{F}(t)} \&=\lambda(t){\rm d}t \ . \end{aligned} \]

由此可见,\(\lambda(t)\) 可以表示一个存活时间为 \(t\) 的元件的失效概率强度。

现在假设随机变量 \(X\) 是服从指数分布的,由 \(X\) 的无记忆性,一个存活时间为 \(t\) 的元件和一个新元件的剩余寿命应该具有相同的分布。因此,\(\lambda(t)\) 应该是一个与 \(t\) 无关的常数。我们将指数分布的密度函数和分布函数代入 \(\lambda(t)\) 的定义式中,显然有

\[\lambda(t)=\frac{\lambda e^{-\lambda t}}{e^{-\lambda t}}=\lambda \ . \]

所以,服从参数为 \(\lambda\) 的指数分布的失效率函数就是常数 \(\lambda\) ,参数 \(\lambda\) 也被称为指数分布的速率。

还有一个重要的定理:失效率函数和分布函数相互唯一确定。证明这个定理只需要将 \(\lambda(t)\) 定义式中的密度函数写成微分的形式:

\[\lambda(t)=\frac{f(t)}{1-F(t)}=\frac{{\rm d}F(t)/{\rm d}t}{1-F(t)} \ , \]

积分可得:

\[\ln(1-F(x))=-\int_0^x\lambda(t){\rm d}t+k \ , \]

\[F(x)=1-c\cdot\exp\left\{-\int_0^x\lambda(t){\rm d}t\right\} \ , \]

这里的 \(k\)\(c\) 都是积分过程中产生的任意常数。由 \(F(0)=0\) 可以唯一解出 \(c=1\) ,因而

\[F(x)=1-\exp\left\{-\int_0^x\lambda(t){\rm d}t\right\} \ . \]

经典极限定理

依概率收敛

假设 \((\Omega,\,\mathscr{F},\,P)\) 是概率空间,\(X,\,X_n,\,n\geq1\) 是一列随机变量。如果对任意的 \(\varepsilon>0\)

\[\lim_{n\to\infty}P\left(\omega:|X_n(\omega)-X(\omega)|>\varepsilon\right)=0 \ , \]

则称 \(X_n\) 依概率收敛于 \(X\) ,记作 \(X_n\xrightarrow{P} X\)

基本性质:

  1. 如果 \(X_n\xrightarrow{P}X\)\(Y_n\xrightarrow{P}Y\) ,则 \(P(X=Y)=1\) ,即 \(X=Y \ \ {\rm a.s.}\)

  2. 如果 \(X_n\xrightarrow{P}X\)\(X_n-Y_n\xrightarrow{P}0\) ,则 \(Y_n\xrightarrow{P} X\)

  3. \(a_n,\,b_n,\,n\geq1\) 是一常数列,如果 \(a_n\to a\)\(b_n\to b\) ,并且 \(X_n\xrightarrow{P}X\) ,则

\[a_nX_n+b_n\xrightarrow{P}aX+b \ . \]

  1. 如果 \(X_n\xrightarrow{P}X\)\(Y_n\xrightarrow{P}Y\) ,则

\[X_n\pm Y_n\xrightarrow{P}X\pm Y \ , \]

\[X_n\cdot Y_n\xrightarrow{P} X\cdot Y \ . \]

? 如果进一步要求 \(Y\neq0\) ,则

\[\frac{X_n}{Y_n}\xrightarrow{P}\frac{X}{Y} \ . \]

  1. 如果 \(X_n\xrightarrow{P}X\)\(f:\mathbb{R}\to\mathbb{R}\) 是连续函数,则

\[f(X_n)\xrightarrow{P}f(X) \ . \]

依分布收敛

假设 \(F(x),\,F_n(x),\,n\geq1\) 是一列分布函数,如果对每一个 \(F\) 的连续点 \(x\) ,都有

\[\lim_{n\to\infty}F_n(x)=F(x) \ , \]

则称 \(X_n\) 依分布收敛于 \(X\) ,记作 \(X_n\xrightarrow{d}X\)

基本性质:

  1. 如果 \(X_n\xrightarrow{P}X\) ,则 \(X_n\xrightarrow{d}X\) 。这说明依分布收敛弱于依概率收敛。

  2. \(c\) 是常数,则 \(X_n\xrightarrow{P}c\) 当且仅当 \(X_n\xrightarrow{d}c\)

  3. 如果 \(X_n\xrightarrow{d}X\)\(X_n-Y_n\xrightarrow{P}0\) ,则 \(Y_n\xrightarrow{d} X\)

  4. \(a_n,\,b_n,\,n\geq1\) 是一常数列,如果 \(a_n\to a\)\(b_n\to b\) ,并且 \(X_n\xrightarrow{d}X\) ,则

\[a_nX_n+b_n\xrightarrow{d}aX+b \ . \]

  1. \(c\) 是常数,如果 \(Y_n\xrightarrow{P}c\)\(X_n\xrightarrow{d}X\) ,则

\[X_n\cdot Y_n\xrightarrow{d} cX \ . \]

  1. 如果 \(X_n\xrightarrow{d}X\)\(f:\mathbb{R}\to\mathbb{R}\) 是连续函数,则

\[f(X_n)\xrightarrow{d}f(X) \ . \]

Levy 连续性定理

依分布收敛最经典的判别法就是 Levy 连续性定理,将分布函数和特征函数联系起来。

假设 \(X,\,X_n,\,n\geq1\) 是一列随机变量,特征函数分别为 \(\phi(t),\,\phi_n(t)\) ,则 \(X_n\xrightarrow{d}X\) 当且仅当对每个 \(t\) ,都有 \(\displaystyle\lim_{n\to\infty}\phi_n(t)=\phi(t) \ , \ \ t\in\mathbb{R}\)

如果存在一个函数 \(\phi(t)\) 使得对每个 \(t\)\(\displaystyle\lim_{n\to\infty}\phi_n(t)=\phi(t)\) ,并且 \(\phi(t)\)\(t=0\) 处连续,则一定存在一个随机变量 \(X\) 其特征函数为 \(\phi(t)\) ,并且 \(X_n\xrightarrow{d}X\)

几乎处处收敛

假设 \(X,\,X_n,\,n\geq1\) 是一列随机变量,如果存在一个零概率事件 \(\Omega_0\)\(P(\Omega_0)=0\) ,并且对于任意 \(\omega\in\Omega\backslash\Omega_0\) ,当 \(n\to\infty\) 时,有 \(X_n(\omega)\to X(\omega)\) ,则称 \(X_n\) 几乎处处收敛于 \(X\) ,记作 \(X_n\to X \ \ {\rm a.s.}\)

几乎处处收敛是各种收敛性最强的一种。

基本性质:

  1. 如果 \(X_n\to X \ \ {\rm a.s.}\) ,则 \(X_n\xrightarrow{P}X\) 。这也说明依概率收敛弱于几乎处处收敛。

  2. 如果对任意的 \(\varepsilon>0\)

\[\sum_{n=1}^\infty P(w:\left|X_n(\omega)-X(\omega)\right|>\varepsilon)<\infty \ , \]

? 则 \(X_n\to X \ \ {\rm a.s.}\)

均方收敛

假设 \(X,\,X_n,\,n\geq1\) 是一列随机变量,具有有限 \(r\) 阶矩 \((r>0)\) 。如果

\[\lim_{n\to\infty}{\rm E}|X_n-X|^r=0 \ , \]

则称 \(X_n\) \(r\) 阶均方收敛到 \(X\) ,记作 \(X_n\xrightarrow{L^r}X\)

一般地,我们讨论 \(r=2\) 的情况。

基本性质:

  1. 如果 \(X_n\xrightarrow{L^2}X\) ,则 \(X_n\xrightarrow{P}X\) 。这说明均方收敛强于依概率收敛。

  2. 如果 \(X_n\xrightarrow{L^2}X\)\(Y_n\xrightarrow{L^2}Y\) ,则 \(X=Y \ \ {\rm a.s.}\)

  3. 假设存在一个常数 \(M>0\) ,使得 \(|X_n|\leq M \ \ {\rm a.s.}\) ,并且 \(X_n\xrightarrow{P}X\) ,则 \(X_n\xrightarrow{L^2}X\)

  4. 如果 \(X_n\xrightarrow{L^2}X\) ,则 \({\rm E}X_n\to{\rm E}X\)

大数定律

1. Bernoulli 大数定律

假设 \(S_n\sim B(n,\,p)\)\(n\geq1\)\(0<p<1\) ,则 \(\dfrac{S_n}{n}\xrightarrow{P}p\)

2. Chebyschev 大数定律

假设 \(\xi_n,\,n\geq1\) 是一列随机变量,\({\rm E}\xi_n^2<\infty\) 。令 \(S_n=\sum\limits_{k=1}^n\xi_k\) ,如果

\[\lim_{n\to\infty}\frac{{\rm Var}(S_n)}{n^2}=0 \ , \]

\[\frac{S_n-{\rm E}S_n}{n}\xrightarrow{P}0 \ . \]

3. Khinchine 大数定律

假设 \(\xi_n,\,n\geq1\) 是一列独立同分布随机变量,\({\rm E}\xi_1=\mu\) ,令 \(S_n=\sum\limits_{k=1}^n\xi_k\) ,则

\[\frac{S_n}{n}\xrightarrow{P}\mu \ . \]

强大数定律

1. Borel 强大数定律

\(\xi_n,\,n\geq1\) 是一列独立同分布的随机变量,分布为:

\[P(\xi_1=1)=p \ , \ \ \ \ P(\xi_1=0)=1-p \ . \]

定义 \(S_n=\sum\limits_{k=1}^\infty\xi_k\) ,则有

\[\frac{S_n}{n}\to p \ \ {\rm a.s.} \ . \]

2. Kolmogorov 强大数定律

\(\xi_n,\,n\geq1\) 是一列独立同分布的随机变量,\({\rm E}\xi_1=\mu\) 。定义 \(S_n=\sum\limits_{k=1}^\infty\xi_k\) ,则有

\[\frac{S_n}{n}\to\mu \ \ {\rm a.s.} \ . \]

中心极限定理

1. De Moivre-Laplace 中心极限定理

假设 \(S_n\sim B(n,\,p)\)\(n\geq1\)\(0<p<1\) 。则

\[\frac{S_n-np}{\sqrt{np(1-p)}}\xrightarrow{d} N(0,\,1) \ . \]

2. Levy-Feller 中心极限定理

假设 \(\xi_n,\,n\geq1\) 是一列独立同分布随机变量,\({\rm E}\xi_1=\mu\)\({\rm Var}(\xi_1)=\sigma^2<\infty\) ,则

\[\frac{S_n-n\mu}{\sqrt{n}\sigma}\xrightarrow{d}N(0,\,1) \ . \]

数学期望收敛定理

单调收敛定理

\(X_n,\,n\geq1\) 是一列单调不减的非负随机变量,即 \(0\leq X_n\leq X_{n+1} \ \ {\rm a.s.}\) 。如果 \(X_n\to X\ \ {\rm a.s.}\) ,则有

\[\lim_{n\to\infty}{\rm E}X_n={\rm E}X \ . \]

Fatou 引理

\(X_n,\,n\geq1\) 是一列单调非负随机变量,则有

\[\lim_{n\to\infty}{\rm E}X_n\geq {\rm E}\left(\lim_{n\to\infty}X_n\right) \ . \]

在 Fatou 引理中,对 \(X_n\) 的收敛方式没有作任何要求。

控制收敛定理

\(X_n,\,n\geq1\) 是一列随机变量,假设存在一个随机变量 \(Y\) ,使得 \({\rm E}|Y|<\infty\) ,并且 \(|X_n|\leq Y \ \ {\rm a.s.}\) ,如果 \(X_n\to X \ \ {\rm a.s.}\)\(X_n\xrightarrow{P}X\) ,则

\[\lim_{n\to\infty} {\rm E}X_n={\rm E}X \ . \]

Fubini 定理

设对 \(a\leq t\leq b\)\(X_t\) 是随机变量,如果 \(\displaystyle\int_a^b{\rm E}|X_t|{\rm d}t<\infty\) ,或对所有 \(a\leq t\leq b\) 都有 \(X_t\) 非负,则

\[{\rm E}\left(\int_a^bX_t{\rm d}t\right)=\int_a^b{\rm E}\left(X_t\right){\rm d}t \ . \]

Fubini 定理主要为我们提供了期望和积分可以交换顺序的条件。

随机过程02:初等概率论(二)

原文:https://www.cnblogs.com/lixddd/p/14370487.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!