1. 基因多样性
Weir BS (1996) Genetic data analysis II, Sunderland, MA: Sinauer Associates, Inc
基因多样性(gene diversity)也常被称为平均杂合性,由基因频率的平方和构成。它对近交群体的变异性是一种比较适当的尺度,因为这类群体很少存在杂合子。
设 \(p_{lu}\) 为第 \(l\) 个基因座第 \(u\) 个等位基因的频率,那么这一基因座多样性为
\[D_l = 1 - \sum_u p_{lu}^2\]
2. 多态信息含量
Botstein D et al. (1980) Am J Hum Genet 32: 314-331
设 \(p_{lu}\) 为第 \(l\) 个标记位点第 \(u\) 个等位变异的频率,那么这一标记位点多态信息含量(polymorphic information content, PIC)为
\[PIC_l = 1 - \sum_u p_{lu}^2 - \sum_u \sum_{v,v>u} 2p_{lu}^2p_{lv}^2\]
3. 计算
先利用 VCFtools 软件计算等位基因频率
vcftools --freq2 --vcf gt.vcf
再根据公式计算即可。
原文:https://www.cnblogs.com/radact/p/12148048.html