moderated mediation近年来,随着高通量测序技术的快速发展以及测序成本的显著降低,动物基因组学数据急剧增长,动物遗传育种和性状改良已全面进入基因组时代。当前,已经有大量研究在多个人类种族中进行了大规Ceralasertib模的群体遗传变异鉴定并研发了相应的数据共享平台。然而,与人类相比,其他动物的基因组学数据挖掘及数据库构建还处于滞后水平,尤其是多物种、大样本综合型遗传变异数据库还非常有限,这极大地限制了动物基因组学和遗传学研究的发展。为促进动物遗传数据挖掘和再利用,本研究系统收集并整理了20种动物5,572个样本的全基因组和基因型数据,系统进行了遗传变异的重鉴定、插补参考面板构建、连锁不平衡分析并构建了多物种遗传变异综合数据库(Animal-SNPAtlas),并在此基础上进行了多核苷酸变异(Multi-nucleotide variants,MNVs)相关的探索性研究。主要结果如下:单核苷酸多态性(Single nucleotide polymorphisms,SNPs)是指基因组水平上单个核苷酸的突变,是遗传变异中最常见的类型,被广泛用于遗传研究中。本研究通过系统文献检索和数据库查找,收集20种动物5,572个样本的全基因组测序(Whole genome sequencing,WGS)数据或基因型数据,通过系统SNP重鉴定和位点过滤,获得了约5.15亿个高质量的动物SNPs,并对这些SNP进行了功能注释。在此基础上,本研究构建了高密度基因型插补参考面板,通过数据模拟分析,表明这些面板可以有效提升SNP密度并保持较高的准确性。另外,连锁不平衡分析也是遗传变异研究中经常使用的方法,但简单易用的公共查询平台还没有,因此,本研究进一步进行了全基因组范围连锁不平衡计算。最后,综合以上数据开发了动物多物种SNP综合数据库(http://gong_lab.hzau.edu.cn/Animal_SNPAtlas/)。该数据库提供SNP功能注释及可视化、群体遗传结构查询、在线基因型插补、连锁不平衡计算及可视化、参考面板下载等功能。多核苷酸变异(MNVs)是指个体中位于同一单倍型上的两个或多个邻近的变异集合。近来研究发现,人类基因组中存在大量MNVs,且其比单INCB018424核苷酸变异(Single nucleotide variants,SNVs)表现出更高的致害性。然而,目前尚未有专门针对动物进行的MNVs系统分析。因此,本研究通过开发流程,在常见经济动物中系统鉴定了全基因组范围内的MNVs,并进行了MNVs功能注释。本研究总共在7种经济动物中鉴定到约2,100万MNVs,研究发现尽管这些MNVs落在基因编码区的比例很低,但仍有14,470个MNVs落在了基因的同一个密码子内。与SNVs注释到的效应不同,这些MNVs可能通过改变氨基酸的编码进而产生新的功能效应。此外,本研究还探索了MNVs的距离分布,发现距离为1的MNVs在所有类型MNVs中占比最高。在此基础上,本研究进一步挖掘了邻近MNVs的突变模式并探索了可能的突变机制。研究发现TG->CA是频率最高的MNVs突变模式,它们可能是由Cp G岛处两个高频率单核苷酸突变事件的组合形成的。相关研究结果为全面理解MNVs的功能和机制提供了一定的理论基础。综上所述,通过系统挖掘和分析动物基因组学数据,本研究为动物基因组学、遗传学和育种学领域提供了重要的数据资源,MNVs分析为动物遗传研究提供了新的思路和方法。