毛色和生境的相似性常常归因于自然选择,但很少有分子水平的证据。北美灰狼的种群中,北美西部森林和开放生境毛色频数分析不同,这些生境包括德奈利国家公园(Denali National Park)、阿拉斯加洲的基奈半岛(the Kenai Peninsula)和许多加拿大北极地区。这些差异,尤其是高纬度跟随北美冻原驯鹿迁徙到其繁殖地的苔原狼,和终年居住在邻近北方森林并以不迁徙的猎物为食的狼之间的,最为引人注目。苔原生境中,深色狼非常稀少,而在西南方渐变群到森林地区,频率却逐渐增高(图1A)。深毛色对浅毛色可能的选择包括捕猎时的隐蔽和/或基因多效性的间接效应,但仍有疑团未解开,因为还有未被识别的潜在基因存在。
(A) 这里所使用的加拿大样本的位置和毛色表现型。
(B) 年龄相关的灰化,以及由表现型猜想得出的基因型。每一组照片显示同一个体在不同年龄(10个月和10岁),并在10岁时发现渐增的灰色毛皮,表明在K
B/k
y个体中真黑素被稀释(左边一组图),在k
y/k
y个体中真黑素和色素都被稀释(右边一组图)。(照片由印第安纳州Battle Ground, Wolf Park的Monty Sloan提供。)
(C) 来自黄石公园的Leopold pack的三代纯种狼的K
B和黑毛的共分离。ΔG表示显性K
B等位基因,+表示野生型等位基因k
y。
在许多脊椎动物中,自然的颜色变异受Agouti-黑色素皮质激素受体1(Mc1r)途径控制,双配体受体调节位于皮肤、毛发或羽毛的黑素细胞产生色素——红/黄色素或棕/黑色素——的数量和类型。功能获得性Mc1r突变会导致一些家养和实验动物以及一些鸟类、啮齿类和犬科野生种群的黑变病,这是被广泛认可的。最近,我们发现家犬中的色素类型开关包含了一个黑素肾上腺皮质激素途径的额外组分,即K位点编码的β-防御素蛋白CBD103。
加拿大狼群的毛色基因是复杂的,表现型从白到灰到黑,同时这些表型还被因年龄增大而灰化的独立事件所混淆(图1B)。然而,在小群建群者是被从加拿大引入的黄石国家公园里,灰和黑色毛皮呈孟德尔形质分离。我们调查Agouti基因、Mc1r和CBD103的分子变异,并在北美狼中识别了一些Mc1r和Agouti基因多态性。然而,这些基因功能影响都无法预测,而且也与黑色毛皮没有联系。与此相反,在一个来自黄石、有14个成员、共三代的群体中,我们观察到黑毛和K位点标记【连锁LOD分数的让步比对数(LOD)为4.21,估计最高的可能重组分数(θ)为0(图1C)】之间完全的共分离,这是未知的并且依赖带有Agouti和Mc1r基因的染色体。
在狗中,祖先传下的CBD103等位基因(K
y)令Agouti和Mc1r基因正常作用,而其中3个碱基对(base pair, bp)缺失突变(CBD103Δ
G23或K
B)抑制Agouti基因作用,导致表现型为黑毛的显性遗传。我们在来自黄石的104只黑狼中观察到有102只拥有同样的3个碱基对缺失突变,而此突变在来自加拿大极地的9只黑狼中均存在。相反地,在来自黄石的120只灰狼中均没有CBD103
ΔG23,来自加拿大极地的22只白狼也均无(表1)。我们同样在10只来自加拿大极地的灰狼中发现有6只存在CBD103
ΔG23,表明灰色毛皮可由CBD103
ΔG23改良agouti表现型导致(毛发既含有淡黄色色素,也含有真黑素),也可由次要因素如年长会淡化毛发中的色素沉积(pigmentation)以致只剩下真黑色素导致。【附加黄石狼种群系谱研究和其中少量的Mc1r变异,表明基因型为k
y/k
y的黑色黄石狼可能因在取样时表现型不明确而误分类】 CBD103
ΔG23等位基因频率在苔原和森林的狼总体估计分别为0.02和0.19,相应的黑毛表现型频率为33%和64%(图1A)。
*森林和苔原/针叶林的狼来自加拿大极地地区(图1A)。在森林和苔原/针叶林中全部深色(灰或黑)狼的频率分别为62%和7%,这种基因型分配不代表种群频率。所有森林和苔原/针叶林的狼中,带有K
B的基因型为K
B/k
y;在黄石国家公园的种群中,10只是K
B/K
B、92只是K
B/k
y。
?表现型的绝对的指定,由采集的样品定义,没有完全获得正常毛色的变化范围,如图1B中的文字描述。
?灰色郊狼来自内布拉斯加州(Nebraska)或西弗吉尼亚州(West Virginia);黑色郊狼来自明尼苏达州(Minnesota)或西弗吉尼亚州。
为调查黑化K等位基因的进化历史,我们依序排列分散在CBD103基因大约150K
B的范围内的8个单拷贝非编码DNA片段,这些片段来自32只极地狼和15只没有亲缘关系的黄石狼,以及12只家犬:6只k
y/k
y(秋田犬akita、巴辛吉犬basenji、拳师犬boxer、斗牛犬bulldog、杜宾犬Doberman pinscher和大丹犬great dane)、6只K
B/K
B(卷毛寻回犬curly-coated retriever、大麦町犬Dalmatian、大丹犬、拉布拉多寻回犬Labrador retriever、贵宾犬poodle和葡萄牙水猎犬Portuguese water dog)。我们在所有犬科中识别出52种等位基因多态性(狼有36种),并估计每个单体型结构(图2B)。所有狼的扩增子中,多态性比率是每510 bp一个单核苷酸多态性(single-nucleotide polymorphism, SNP)(Watterson估值,qW = 1.96 × 10?3),这相似于拳师犬和灰狼(580 bp之1)或和郊狼(420 bp之1)的全基因多态性组测量值。然而,根据我们关于K位点基因型的数据进行分类,以及含K
B基因的染色体和CBD103距离很近,表现型与CBD103相似或相同,上升达到或超过那些观察到的含k
y染色体位于横跨位点任一边的75K
B(图2A)。这种模式,以及核苷酸差异的同功性(π,图S1),同样反应在单体型多样性的显著差异,K
B(22之8)和k
y(72之59)染色体(c2 = 14.2, P < 0.001)。再加上毛色和生境的相关性,低多样性和高频率相结合,表明K
B基因在北美的森林狼中被正选择。
K位点的多态性和单体型结构,北美灰狼【(A)到(E),1K
B/K
B,20K
B/k
y和26k
y/k
y】和家犬【(F),6K
B/K
B和6k
y/k
y】。
(A) 根据到CBD103的距离计算的多态性(Θ
W,±SD)。
(B) 在36个SNP上推断的狼的单体型结构;每一行代表一条K
B或k
y染色体;蓝色和黄色方块分别代表主要和次要等位基因;灰色方块代表缺失数据。红色和黑色箭头分别在5’和3’末端指出代表K
B和k
y染色体存在重组历史的例子。
(C) 所有狼染色体的成对的LD值(以D'表示);红色轮廓表示一个没有重组历史的核心区域(同图3)。
(D) K
B或k
y染色体的单体型分歧图,深蓝色圆点代表CBD103,分支代表单体型分歧,分支的线条粗细和染色体数目成比例。
(E和F) 根据到CBD103ΔG23距离计算狼(E)和狗(F)的K
B或k
y染色体的EHH值。
总的说来,K位点周围150 K
B的基因的连锁不平衡(linkage disequilibrium, LD)模式相似于不同品种家犬之间的对比,有相对地小型单倍域,这其中包括历史上没有重组迹象的大约4K
B的CBD103核心序列(图2C)。然而,北极狼K
B和k
y等位基因的不同进化历史很明显,而SNP(图2B)被描绘成单体型分叉图(图2D),这突出显示了狼K
B单体型中心区大约60K
B的多态性缺乏。这个特征以及K
B和k
y染色体相应的差异,显示出扩展单体型纯合度(extended haplotype homozygosity, EHH)统计数值,这两种随机选择的染色体保留了从CBD103逐渐增加距离统一性。正如图2、E和F所示,相比狼的k
y染色体,狼的K
B的EHH的分布相当广,然而在狗之中这两种染色体的EHH分布几乎相同。再加上额外的基因组SNP数据分析,这些选择性扫描观察表明K
B已升至高频率。
正如同黑狗和黑化的狼一样,CBD103
ΔG23也在67只郊狼(6黑61灰,表1)中被证明和毛色相关。这些发现显示出三种可能的进化历史。第一,这种3bp的缺失突变可能相当古老,古老到它是在一百万年前的犬科祖先中发生的,那时郊狼和狼还没有分开。第二,这种3bp的缺失突变可能发生得更近,在其中一个物种中,然后经由趋中杂交传播至其他物种。第三,这种3bp的缺失突变可能是一个突变热点,分别发生在郊狼、狼和狗中。为区分这些可能性,我们查明并将郊狼的单体型(6个K
B和18个k
y)和北美狼、狗相比较。
这三种犬科动物的单体型多样性和在狼中观察到的相似,而且K
B有明显的较低多样性(40之中有15是独特的),相比k
y(102之中有66是独特的)染色体(c2 = 9.7, P = 0.003)。15种独特的K
B单体型中,一个在3只郊狼和6只狗中被观察到,一个在2只郊狼和12只狼中被观察到(图3A)。然而,66种独特的k
y单体型没有一种同时在两种或以上不同物种中被观察到。重建全部150K
B区域的系统发生网络和现存K
B与k
y染色体间的历史重组(图2B中的箭头),但缺少适当的方式用于推断在重组情况下的精确基因系谱。然而,在CBD103的4K
B核心区域(图2C),根据18个核心区单体型建立的简单邻位相连进化树标示出142个(94狼,24狗和24郊狼)染色体(图3B)。在这个进化树上,所有的K
B染色体形成2-单体型簇,反之剩下的16种单体型(这些代表所有的k
y染色体)更加分散。此外,许多k
y染色体按物种形成一簇(狗的12分之9和狼的72分之44),和K
B染色体不同。这具有鲜明对比的系统发生图表明K
B突变是发生在一个物种里,接着再通过种间杂交分散到狗、狼和郊狼之中。【来自郊狼的24个k
y单体型不像来自狼或狗的那样彼此相似(图3B),这与他们和其他犬科动物杂交的历史相吻合。】
(A) 似狼犬科动物的K
B单体型结构,基于52个SNP。每一行代表在郊狼(C),狗(D)和狼(W)中发现的K
B单体型,在右侧列出他们各自的频率,颜色和图2B中的意义相同。
(B) 推断出核心区域(图2C)单体型的系谱关系【来自500拷贝的自展值标示在分支旁】。每条分支代表18种不同单体型之一,每种单体型的染色体数目下标明物种。
(C) TMRCA估计表明依据分子钟计算的染色体子集,表示所有似狼犬科动物的部分分歧时间。函数代表有亲缘关系的TMRCA随与CBD103距离增大而增加,可能由于祖先的杂交和重组。
(D) K位点在狗和狼中演化的时间轴,橙色部分表示祖先的k
y染色体,灰色部分表示衍生的K
B染色体,橙灰相间的图案表示重组染色体。k
y至K
B的突变和驯化时期重叠或在那之前,但令K
B进入北美灰狼基因库的趋中杂交发生在更近的时候。
要深入了解在狗和狼中产生的K位点变异,我们根据来自狼、狗和两者集合的k
y和K
B染色体的CBD103累积距离,估计最近共同祖先(the most recent common ancestor, TMRCA)的合并时间。我们使用了分子钟的方法,排列个别全150K
B区域扩增子的数据(图2),假设突变发生在狼和狗的所有位点有一相同固定比率,混合重组和统计的影响。CBD103附近,TMRCA估计所有K
B子集(图3C)接近0,因为在这个范围内多态性很小或没有(图3A)。然而,无论基因型如何,在离CBD103更远的位点(10到50K
B),狗染色体与狗和狼染色体合集相似。这说明狗中的K
B足够古老到和k
y染色体进行广泛的重组,这个重组历史还包括狗和狼的杂交。但是,在相同的10到50K
B的范围内,TMRCA估计狼的K
B染色体子集不超过狗的K
B染色体子集(或狗和狼K
B染色体合集),这说明K
B是由狗向北美狼引入的,或者反之亦然。
K
B从狗至北美狼引入的论点同样被地理和生态因素支持。K
B广泛分布在家犬中,包括起源在亚洲和非洲的古老品种。然而在狼中,北美之外只有意大利有报道过黑变病,在那里近期存在狼和自由放养的狗之间的杂交,且有分子和/或形态学的证据。实际上,我们同样分析了来自意大利亚平宁山脉的22个样本,在7只黑狼中发现6只有K
B(包括一只狼狗混血),但在15只灰狼中没有一只存在K
B。相比之下,10个K
B/k
y和10个k
y/k
y基因型的北美狼的全基因组SNP分析显示,没有证据表明狗和狼之间近期存在杂交。
狗是在15,000至40,000年前从东亚的灰狼驯化而来,我们估计K
B突变至少已有46,886年的历史(95%置信限度:12,779到121,182年);因此,我们无法区分K
B到底是在驯化之前还是之后出现的。然而,如果K
B出现在旧世界未驯化的狼中,我们的数据表明它一定曾在基因库中遗失,之后又在北美狼中重新获得,可能来自12,000至14,000年前跟随人类度过白令海峡的北美原住狗(图3D)。
美国的狼面临严峻的威胁,有时是捕杀引起,有时来自混种杂交,例如在北美五大湖的情况。然而,北美灰狼中明显的K
B位点选择表明基因多样性——被人类保存在家犬中的——可能在野生狼种群中兴盛。由于可用的苔原生境因开发和/或全球变暖而减少,K
B突变的频率可能在发展到更北的地方。因此,原本在家养动物中发生并选择的突变引入野生种群,这种基因多样性的引入可能、具有讽刺性地提供了一种令野生种群更加适应不断变化的环境的机制。种间杂交也在其他家养动物和植物中被发现。我们的研究结果意味着,家养生物中的突变型可能在野外环境中存活并丰富野生种群的基因遗产。