Nature Genetics | 浙江大学樊龙江/吴东亚团队揭示水稻基因组着丝粒遗传多样性与演化规律

编辑: 时间:2025年10月22日 访问次数:10

20251021日,浙江大学樊龙江/吴东亚团队联合崖州湾国家实验室、中国农业大学等单位在Nature Genetics杂志上在线发表了题为Genetic diversity and evolution of rice centromeres”的研究论文。该研究完成了来自稻属AA70个材料的着丝粒组装和注释,系统探讨了卫星序列组成、阵列组织结构、转座子入侵、功能着丝粒及其表观修饰差异等内容,在物种、亚种、个体和染色体等多个水平进行了比较分析,解析了塑造这些关键基因组复杂区域多样性的遗传因素,提出着丝粒演化新模型RICE

着丝粒centromere为纺锤体纤维的附着点,在细胞分裂过程中确保染色体正确分离,是维持真核生物遗传稳定性的重要区域。大多数物种的着丝粒由高度重复的卫星DNA和反转录转座子序列组成,具有高度重复性和快速进化特征,这限制了对于该区域群体水平多样性和演化规律的精准表征。近年来,随着三代测序技术和组装算法的发展,端粒到端粒(T2T)基因组组装的实现使着丝粒等复杂区域的单碱基精度研究成为可能。水稻不仅是全球最重要的粮食作物之一,也是单子叶模式物种,经历了驯化、改良与去驯化等复杂历史过程,是研究着丝粒遗传多样性与演化规律的理想体系。

为了全面覆盖水稻着丝粒多性,研究纳入70个稻属AA组基因组近T2T组装。样本涵盖亚洲栽培稻粳稻GJ、籼稻XIAUS、普通野生稻、非洲野生稻和非洲栽培稻。整体准确性和连续性均近似或优于已报道的T2T水稻基因组。在70个水稻基因组中,识别出839水稻着丝粒CEN155阵列,其中93.4%完整连续的。比较发现,不同水稻物种、亚种、个体和染色体间的CEN155阵列长度差异显著,平均约占水稻基因组长度1.11%,显著小于人类3%和拟南芥9.6%)比例总体上CEN155阵列长度与染色体长度呈正相关,这一相关性在栽培稻中更为显著。粳稻在6号和11号染色体上的着丝粒序列比其他亚群显著更长,暗示可能是谱系特异性扩张导致的。

1 稻属AA基因组着丝粒多样性

该研究对水稻着丝粒阵列进行了详细注释,发现了超过146万个CEN155卫星重复序列主要长度为155 bp165 bp。为了全面描绘卫星单体的结构并追踪其演化足迹,研究基于系统发育将其聚类成15个家族。有趣的是,该研究在CEN155一致序列中检测到了在人类着丝粒中参与动粒组装的类B-box和类pJα基序。将这些基序与哺乳动物的B-box基序进行比对,发现8个保守位点是共享的。虽然类B-box和类pJα基序在着丝粒区域显著富集,但水稻中该基序是否具有结合着丝粒蛋白的类似功能,未来还需要进一步研究。

2 水稻着丝粒CEN155单体序列变异与染色体组成

  该研究提出了一个不同于拟南芥着丝粒演化KARMA模型(Wlodzimierz et al., 2023, Nature)的新假说,即逆转录转座子插入诱导的着丝粒演化RICERetrotransposon Induced Centromere Evolution。该模型强调,LTR插入可能会触发原始着丝粒卫星阵列的衰退,并促进着丝粒重定位以及新着丝粒的出现。

3 该研究提出着丝粒演化新假说——逆转录转座子诱导着丝粒演化模型RICE

浙江大学农业与生物技术学院博士生谢玲娟博士生黄毓杰、中国农业大学黄伟教授和中国农科院深圳基因组所商连光研究员为论文的共同第一作者,浙江大学农业与生物技术学院/崖州湾国家实验室樊龙江教授及其博士后吴东亚博士为论文的共同通讯作者。崖州湾国家实验室钱前院士、中国农业大学金危危教授等对本研究提供了重要指导。本研究得到了生物育种重大项目、国家自然科学基金、博新计划、博后面上等项目的支持。