Wright-Fisher模型在群体遗传学中的应用：从理论到实践

最新推荐文章于 2026-06-27 14:30:52 发布

原创

最新推荐文章于 2026-06-27 14:30:52 发布 · 415 阅读

1. 从“抽奖”到“演化”：理解Wright-Fisher模型的核心

想象一下，你有一个装满了100个彩色小球的罐子，其中30个是红色的，70个是蓝色的。现在，你要闭上眼睛，从罐子里随机摸出100个小球，每次摸出一个后，你都会把它放回去，再摸下一个。摸完这100次，你就得到了一个新的“世代”的罐子。这个新罐子里红球和蓝球的比例，几乎肯定和原来的30:70不一样了，可能变成25:75，也可能变成35:65，甚至极端情况下，可能全是红球或全是蓝球。这个看似简单的“有放回随机抽样”游戏，就是群体遗传学中Wright-Fisher模型最核心、最精髓的思想。

我第一次接触这个模型时，也觉得它简单得有点“不真实”。一个物种的繁衍，怎么能简化成从上一代基因池里“抽奖”呢？但后来我明白了，正是这种极致的简化，才让它成为了整个学科的基石。它抓住了随机遗传漂变这个演化中最基本、也最不可预测的力量。在现实中，即使没有环境压力、没有天敌、没有配偶选择，仅仅因为运气不好，一个本来有益的基因也可能在几代之内就从群体中彻底消失。WF模型就是用来量化这种“运气”的数学工具。

它的基本设定非常严格，就像实验室里的理想条件：群体大小N是恒定不变的，比如总是1000只个体。世代是离散且非重叠的，这意味着所有父母在同一时间产生后代，然后集体“退场”，由子代完全接管。个体之间完全随机交配，没有任何偏好。在这个框架下，一个等位基因（比如决定豌豆是圆是皱的那个基因）在下一代中的数量，完全服从二项分布。用公式表达就是，如果这一代有i个A等位基因，那么下一代有j个A等位基因的概率是：P(j | i) = C(N, j) * (i/N)^j * (1 - i/N)^(N-j)。这个公式你可能看着眼熟，它描述的就是我们开头那个“摸球”的概率。

正因为每一代的状态只取决于上一代，这个过程就形成了一个完美的马尔可夫链。我们可以把所有可能的基因频率（从0到N）之间的转移概率，写成一个巨大的矩阵。通过分析这个矩阵，我们能回答很多关键问题：一个中性突变（对生存繁殖没影响）最终被固定下来的概率是多少？平均需要多少代它才会被固定或丢失？这些问题的答案，都藏在这个简单的抽样模型里。所以，别看WF模型基础，它可是我们理解群体历史、估算演化时间尺度的起点。很多更复杂的模型，都是在它的骨架上添加血肉。