首页 > 其他 > 详细

Estimating Gene Frequencies| method of maximum likelihood|point estimate

时间:2019-07-09 23:09:48      阅读:103      评论:0      收藏:0      [点我收藏+]

I.11 Estimating Gene Frequencies

在小样本上计算基因A的概率PA,举例如下:

 技术分享图片

 

通过加大样本会将通过观察值得到的数趋近于真实数据,所以该问题转化为了统计学上利用大量观察值求真实值的问题,因此通过最大似然估计得到真实值.

 为了理解多项式分布可以先以二项分布为例:

技术分享图片

 

该二项分布来自:

 技术分享图片

 

其实它的完整形式是:

 技术分享图片

 

因为二项分布是当多项式分布的项数为2时的分布:

 技术分享图片

 

所以当有三项(AAAaaa)的时候我们采用多项式分布:于是就有

 技术分享图片

 

其中,p就是PA,就是我们估计的参数,nAAnAanaa是给定值。

由于组合数是一个常数,用C代替,得到:

 技术分享图片

 

此时,采用最大似然估计,(即找到使概率值最大的参数p,即将p的表达式对p求导,然后导数为零时,便有最大函数值(概率值)。)

 

为方便求导两边取对数:

 技术分享图片

 

求导:

 技术分享图片

 

化简后得到:

 技术分享图片

 

Estimating Gene Frequencies| method of maximum likelihood|point estimate

原文:https://www.cnblogs.com/yuanjingnan/p/11161022.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!