农学院李飞教授团队在Nucleic Acids Research报道昆虫综合基因组数据库InsectBase 2.0

发布者:吴旻发布时间:2021-11-19动态浏览次数:432

20211118日,国际权威期刊Nucleic Acids Research(中科院JCR期刊1区,五年影响因子为15.542,)在线发表了农学院李飞教授团队题为“InsectBase 2.0: a comprehensive gene resource for insects”的研究论文。该研究通过广泛收集与分析昆虫基因数据,构建起目前昆虫学领域最为广泛、全面、标准化的数据平台,为昆虫学各领域研究提供了宝贵资源。

 

昆虫作为世界上多样性最为丰富的物种,约占物种总数的85%以上。随着高通量测序技术的迅速发展,产生了大量的昆虫基因组数据。这些数据散乱分布在不同数据库中,缺乏统一格式标准以及深度信息挖掘,极大阻碍了昆虫学基因数据的充分利用与标准化分析。

本研究共搜集了昆虫纲20个目中815种昆虫的基因组、25805个转录组以及1674个小RNA文库数据。基于这些数据,通过标准化流程注释了482个昆虫基因组,最终获得了超过1500万条蛋白编码基因、11万条miRNA以及129万条lncRNA。除此之外,本研究通过进一步分析,预测了miRNA靶标基因、lncRNA partner基因,注释了164个常见昆虫基因家族、419KEGG通路以及预测了21万个潜在的水平转移(HGT)基因,提供了更多数量、更高质量以及更多层次的昆虫基因数据。

通过汇总和整理以上数据,构建起InsectBase 2.0昆虫综合基因数据库,共包含OrganismChromosomeGenomeTranscriptomeGeneGene familyHGT geneKEGG pathwayInsect virusToolsLinksService11个模块。网站提供了物种信息查询、不同类型基因、病毒数据的搜索与下载功能。除此之外,InsectBase 2.0集成了BLASTJBrowse2工具,提供了七百余种物种的基因BLAST与基因组浏览器功能。同时基于MCScanX共线性分析,提供了155个染色体级别基因组之间的共线性可视化分析,为昆虫染色体进化提供了有力的工具。

本论文第一作者为浙江大学昆虫所博士生梅洋,通讯作者为浙江大学李飞教授。浙江大学昆虫所研究生荆冬、汤沈杨与陈曦等参与了本项目的研究。本研究得到了国家自然科学基金、国家高技术研究发展计划、浙江省自然科学基金等项目资助。

数据库网址:http://v2.insect-genome.com/  

文章链接:https://academic.oup.com/nar/advance-article-abstract/doi/10.1093/nar/gkab1090/6430839