1. 从“抽奖”到“演化”:理解Wright-Fisher模型的核心
想象一下,你有一个装满了100个彩色小球的罐子,其中30个是红色的,70个是蓝色的。现在,你要闭上眼睛,从罐子里随机摸出100个小球,每次摸出一个后,你都会把它放回去,再摸下一个。摸完这100次,你就得到了一个新的“世代”的罐子。这个新罐子里红球和蓝球的比例,几乎肯定和原来的30:70不一样了,可能变成25:75,也可能变成35:65,甚至极端情况下,可能全是红球或全是蓝球。这个看似简单的“有放回随机抽样”游戏,就是群体遗传学中Wright-Fisher模型最核心、最精髓的思想。
我第一次接触这个模型时,也觉得它简单得有点“不真实”。一个物种的繁衍,怎么能简化成从上一代基因池里“抽奖”呢?但后来我明白了,正是这种极致的简化,才让它成为了整个学科的基石。它抓住了随机遗传漂变这个演化中最基本、也最不可预测的力量。在现实中,即使没有环境压力、没有天敌、没有配偶选择,仅仅因为运气不好,一个本来有益的基因也可能在几代之内就从群体中彻底消失。WF模型就是用来量化这种“运气”的数学工具。
它的基本设定非常严格,就像实验室里的理想条件:群体大小N是恒定不变的,比如总是1000只个体。世代是离散且非重叠的,这意味着所有父母在同一时间产生后代,然后集体“退场”,由子代完全接管。个体之间完全随机交配,没有任何偏好。在这个框架下,一个等位基因(比如决定豌豆是圆是皱的那个基因)在下一代中的数量,完全服从二项分布。用公式表达就是,如果这一代有i个A等位基因,那么下一代有j个A等位基因的概率是:P(j | i) = C(N, j) * (i/N)^j * (1 - i/N)^(N-j)。这个公式你可能看着眼熟,它描述的就是我们开头那个“摸球”的概率。
正因为每一代的状态只取决于上一代,这个过程就形成了一个完美的马尔可夫链。我们可以把所有可能的基因频率(从0到N)之间的转移概率,写成一个巨大的矩阵。通过分析这个矩阵,我们能回答很多关键问题:一个中性突变(对生存繁殖没影响)最终被固定下来的概率是多少?平均需要多少代它才会被固定或丢失?这些问题的答案,都藏在这个简单的抽样模型里。所以,别看WF模型基础,它可是我们理解群体历史、估算演化时间尺度的起点。很多更复杂的模型,都是在它的骨架上添加血肉。
2. 给理想世界加点料:WF模型的三大关键扩展
经典的WF模型是个“无菌实验室”,但真实的自然界充满了混乱和复杂性。幸运的是,这个模型就像乐高积木,我们可以把重组、选择和迁移这些关键因素一个个加上去,让它变得更贴近现实。我在自己早期的模拟项目中,就曾因为忽略了重组,得到了完全偏离预期的结果,那真是一个深刻的教训。
2.1 重组:基因的“洗牌”过程
重组是性繁殖的精髓。它发生在配子(精子和卵子)形成过程中,父母的两条同源染色体交换片段,产生全新的组合。在WF模型里模拟重组,核心是确定重组断点的位置。
我们可以把一条染色体想象成一条有很多标记点的绳子。每两

84

被折叠的 条评论
为什么被折叠?



