摘要
基因组资源正越来越多地被用于提高水产养殖的生产效率和盈利能力。甲壳动物是一大群无脊椎动物,包括水产养殖业中一些最重要的养殖物种。然而,尽管早在1997年就提出了水产养殖基因组项目,但很少有甲壳类动物基因组发表。下一代和第三代测序技术的突破以及高复杂度序列组装策略的发展推动了越来越多的甲壳类动物基因组的发表,从而为生物和遗传研究以及在水产养殖中的应用铺平了广阔的道路。
在这篇综述中,我们总结了截至2022年6月甲壳类动物基因组研究的最新进展,包括基因组测序和组装、基因组特征以及各种生物表型的遗传机制,如环境适应、生活方式、发育和性别决定。这篇综述还讨论了甲壳类动物基因组在水产养殖中的应用,包括经济性状的遗传解剖和通过全基因组关联研究和基因组选择进行的基于基因组的选择性育种。高质量的基因组不仅对理解生物学和经济上重要性状的遗传基础很重要,而且对水产养殖物种的遗传改良也很重要。然而,甲壳类动物基因组学的利用仍然远远落后于其他动物。因此,需要进行更多的多组学研究和技术开发,以加速基因组学在水产养殖中的应用。
1简介
甲壳类动物是一个占主导地位的多样化水生动物群(一些陆地生物除外),包括具有重要生态意义的成员,如桡足类、水蚤、磷虾和糠虾,以及许多在水产养殖中具有高经济价值的物种,如虾、龙虾、小龙虾和螃蟹。遗传密码是生命的基础,以及通过基因组测序技术解码基因组序列,可以提高水产养殖的生产力、盈利能力和产品质量,从而支持商业部门。最近,全基因组测序和探索越来越多地被应用于对甲壳类动物的生态学、生物学、生理学、进化和选择性育种获得前所未有的见解。
然而,由于基因组测序和组装的困难,在过去几十年中,对甲壳类高质量基因组的描述很少被报道。如今,随着第三代测序技术的发展,自2019年以来,越来越多的甲壳类动物基因组,尤其是养殖物种的基因组被测序。因此,本文综述了甲壳类基因组学的最新进展及其在基础生物学和甲壳类选择性育种中的应用。
2甲壳类动物基因组测序史
由于基因组测序技术在增加吞吐量、测序读取长度和降低成本方面的突破,基因组学领域的最新进展得到了加速。在20世纪70年代,桑格测序方法被开发用于确定DNA分子的核苷酸序列。基于第一代测序平台,人类基因组计划于1990年启动,并于2001年完成,第一个昆虫(黑腹果蝇)基因组于2000年发表。尽管甲壳类动物和昆虫是节肢动物门(动物界最大的门)的两个主要类群,但甲壳类目基因组学研究远远落后于昆虫。
直到2011年,第一个甲壳类动物基因组( pulex)是通过使用下一代测序平台(Roche-454基因组测序仪)报告的,而当时启动了5000个昆虫基因组项目(i5k),到2019年10月,已有1200多个昆虫基因组测序项目在国家生物技术信息中心(NCBI)数据库中注册,第三代测序技术正在引发高质量基因组测序的复兴,然而,甲壳类动物基因组的大规模出版直到2019年才开始(图1)。
考虑到水生生物的经济重要性,1997年举办了第一次水产养殖物种基因组图谱研讨会,对包括对虾、鲑鱼、鲶鱼、罗非鱼和牡蛎在内的五种目标水产养殖动物进行了测序,而得益于第三代测序技术和高复杂性基因组组装策略的发展,第一个对虾基因组(来自南美白对虾)直到2019年才被报道。自那时以来,数十个来自经济相关甲壳类动物物种的基因组已经发表,包括各种虾、对虾、螃蟹、等足类和片脚类的基因组,这加速了甲壳类动物基因组学的发展。
3已发表的甲壳类动物基因组摘要
种类繁多的甲壳类动物与水产养殖业的发展密切相关,不仅包括具有高经济价值的水产养殖物种(如虾和螃蟹),还包括可作为水产养殖食物来源的物种(如水蚤和卤虾),或那些通过寄生对培养生物的健康产生负面影响的生物(如寄生桡足类和等足类)。与养殖甲壳类动物的功能基因组学进展相比,很少有研究探索功能基因组学在致病物种和水产养殖中用作食物来源的物种中的应用。
大多数养殖甲壳类动物属于十足目,绝大多数与经济相关的物种以虾和螃蟹为代表。尽管养虾是一种相对年轻的水产养殖方式,但虾是世界上交易量最大的海鲜物种之一。2然而,普遍缺乏基础研究,制约了虾蟹养殖的发展。此外,很少有研究探索与甲壳类动物生产力相关的自然遗传变异和基因。尽管如此,最近的一些研究表明,基因组学对这些物种的遗传研究和分子育种的发展做出了巨大贡献。
经济性状的全基因组关联研究
遗传学研究的主要目的之一是揭示经济性状的遗传基础。基于基因组参考,已经进行了全基因组关联研究(GWAS),以鉴定与虾的各种经济相关性状相关的基因,包括性别、生长、抗病性和环境适应,基因组重测序和选择特征分析也证实了与生长和抗病性相关的基因确实是在人工育种过程中被选择的,先前的一项研究表明,编码抗脂多糖因子样蛋白(ALF)、a激酶锚定蛋白13()和乳糖神经酰胺4-α-半乳糖基转移酶()的基因的核苷酸多样性在选择性繁殖的种鱼中显著降低。这些发现表明,这些基因是在人工选择过程中选择的,可能与生长和抗病性状有关。然而,这些基因在农艺性状中的作用仍需探索。
如前所述,生物体的性别是一个重要的经济性状,因为雌性和雄性通常表现出不同的生长速度,特别是在虾、小龙虾和小龙虾中。例如,杜贝氏雄性往往比雌性体型更大。类似地,罗氏沼虾( )养殖的一个主要策略是,由于雄性和雌性之间生长速度的显著差异,选择所有雄性种群。数量性状基因座(QTL)和候选性别决定基因已通过GWAS、转录组测序、,和群体分离分析。性别决定基因的鉴定将有助于单性繁殖的发展。参考基因组也有助于鉴定控制生长性状的基因组区域或功能基因。到目前为止,GWAS已经在南美白对虾中鉴定了几个与生长相关的候选基因,包括PKCδ、Rap-2a、SRC、MMD2和NPTK。在中华绒螯蟹、日本对虾和三疣梭子蟹中也鉴定了几个与其生长相关的QTL。
随着疾病和气候变化的发生,许多GWAS研究都集中在抗性基因的鉴定上。TRAF6、Cu/Zn-SOD和是与南美白对虾WSSV抗性相关的候选基因。基于关联分析和转录组比较,PI3K和ALF6已被鉴定与急性肝胰腺坏死性疾病抗性显著相关,和几个抗弧菌的生物标志物基因已在凡纳滨对虾中鉴定。为了评估对环境胁迫的抵抗力,多项研究集中在与盐度和耐温性有关的基因上。许多甲壳类动物对广泛的盐度具有耐受性,因此广泛分布在不同类型的栖息地。GWAS揭示了几个候选基因(如硬壳花青素)在凡纳滨对虾的高盐度适应中发挥关键作用,而铵转运蛋白和DNA错配修复蛋白基因与低盐度抗性有关。这些抗性基因的鉴定将为经济甲壳类动物的进一步分子育种铺平道路。
具有重要经济意义的甲壳类动物的基因组选择
基因组选择(GS)是标记辅助选择的一种扩展形式,全基因组遗传标记用于准确评估经济性状。 GS已广泛用于牲畜和一些水产养殖鱼类。随着几种甲壳类动物基因组的可用性,GS在育种计划中的应用变得更加普遍。 GS已在几个物种中进行了评估和应用,特别是在被认为是最具经济重要性的虾种的南美白对虾中。
高通量单核苷酸多态性(SNP)基因分型方法是GS的基础。在参考基因组可用之前,GS研究主要使用减少代表性测序进行。SLAF-seq和2b RAD方法已用于全基因组SNP基因分型。此外,基于已发表的南美白对虾基因组设计了几个SNP基因型芯片,包括超高600 由中国科学院海洋研究所设计的K SNP芯片(个人通信)和商用50 K SNP芯片基于固体芯片(美国内布拉斯加州),由水产养殖技术中心(CAT)的合作伙伴设计。随着下一代测序技术的发展,靶向测序方法已成为SNP基因分型的有效方法。设计了一个低密度SNP基因分型小组,包括508个序列,并被证明对个体和合并样本进行基因分型是有效的。
GS的应用主要集中在生长、饲料效率和抗病性方面。通过评估预测模型、种群结构、标记密度和优化育种程序,人们已经做出了许多努力来提高GS的效率,因为分子亲缘关系比谱系关系更准确。GS在抗性性状中的应用比其他易于测量的性状更有希望。抗病性特征通常通过细菌或病毒攻击实验进行测试。然而,受到挑战的亲代不能用作候选者,这导致传统选择方法的准确性较低。同时,GS是基于准确的分子遗传关系和候选基因进行的,这使得能够以更高的选择精度精确评估候选种的抗病性。
尽管高密度SNPs可以提高预测精度,但一些报告已经证明,低密度SNP面板可以实现与高密度SNP类似的预测精度。因此,GS可以以低成本应用于养殖甲壳类动物。也有报道称,与随机选择的SNPs相比,使用性状相关的SNPs可以提高预测准确性,这表明GWAS可以为GS分析提供有用的信息。
水产养殖甲壳类动物基因组学的8个观点
甲壳类动物基因组测序和组装的局限性
尽管甲壳类动物是海洋中第二大分类单元,有45000多个物种,但甲壳类生物基因组研究仍处于初级阶段。尽管越来越多的甲壳类动物基因组正在被测序和发表,但它们的测序和组装存在一些局限性。首先,由于DNA分离和测序的困难,除了高基因组复杂性外,甲壳类动物基因组的测序和组装似乎比大多数其他动物更困难。由于第三代测序技术的发展,这些挑战最近得到了克服,目前可获得的大多数甲壳类动物基因组都是在过去三年中发表的(77.78%,表1)。此外,这些基因组通常比基于测序数据组装的基因组质量更高(表1和表2)。
然而,即使有丰富的第三代测序数据,由于其高基因组复杂性和当前组装算法的限制,许多甲壳类动物基因组仍然高度碎片化和低连续性。在第一个对虾基因组发表后,随后发表的大多数虾和蟹基因组都是使用WTDBG工具组装的。这突出表明,迫切需要开发一种更适合甲壳类动物基因组的组装器,因为甲壳类生物基因组通常富含重复区域。此外,由于其在基因组注释方面的优异性能,使用 Iso-seq的全长转录测序已越来越多地应用于注释基因组中的蛋白质编码基因。随着测序平台和组装算法的发展,新升级的基因组将解决染色体构建和基因注释方面的许多问题,从而有助于阐明基因组和生物学特征,并使基于基因组数据的经济相关甲壳类动物物种的选择育种成为可能。
其次,已发表的基因组在不同甲壳类动物群体中分布不均。大多数已测序的基因组报告在经济上(如十足目)和生态上重要的物种(如鳃足目和桡足目)中。然而,甲壳纲的许多纲或亚类没有公布的基因组,其中一些纲或亚纲也具有很高的经济价值(如螳螂虾)和生态价值(如糠虾目、目、类、类),或与进化生物学研究有关(如头甲目和目)。因此,对甲壳类动物基因组进行深入而广泛的研究将使我们能够更好地了解甲壳类生物生物学(包括基因功能和基因调控网络),从而有可能进行特定的基因修饰,以提高甲壳类目动物的商业生产。
第三,由于测序数据的类型和数量、组装方法和基因组复杂性的差异,不同种类的甲壳类动物对基因组质量的描述差异很大。在基因组研究的早期,基因组是基于有限的测序数据组装的,这些数据通常质量较差,例如戴维斯新卡氏菌(N50=400 bp)和卡氏(N50=816 bp).随着测序技术的发展,基于第三代测序和Hi-C数据组装的基因组通常是高质量的,并且可以在染色体水平上组装。然而,与其他动物相比,甲壳类动物的染色体水平基因组的报道仍然较少。在66个已发表的基因组中,一半(33个)的最终基因组组装N50短于100Kb,其中三分之一(22个)具有染色体水平的组装。
尽管已经在染色体水平上组装了许多基因组,但大多数基因组的连续性仍然相对较低(低重叠群N50)。虾、小龙虾和螃蟹是经济上最相关的甲壳类动物。然而,它们的大多数基因组仍然具有短的重叠群N50长度,例如,南美白对虾(57.65 Kb)、斑节对虾(45.08 Kb)和弗吉尼亚原滨对虾(745 bp)、四头大蠊(3.29 Kb)、美洲小蠊(133.31 Kb)和卡氏小蠊 bp)、中华绒螯蟹(26.05Kb)、智齿蜜桃(14.31Kb)、鸭嘴兽(147.47kb)。
尽管N50重叠群长度不能代表基因组的整体质量,但长的重叠群N50不仅表明高连续性,而且表明高的基因组完整性,导致蛋白质编码基因和非编码序列的注释不良。因此,具有长重叠群N50的基因组更适合通过连锁分析或GWAS鉴定关键功能基因和QTL。因此,即使这些基因组是在染色体水平上组装的,在许多情况下,它们的连续性仍然需要升级。
多种新的基因组方法在甲壳类动物研究中的应用
许多基因组方法都是基于高质量的基因组开发的,包括泛基因组学、3D基因组学和表观基因组学。泛基因组代表给定物种内的整套基因,由一个核心基因组和“可有可无”基因组组成,该核心基因组包含该物种所有个体共享的序列。这极大地促进了在核苷酸、基因和基因组结构水平上分析组成基因组的相似性和差异性。采用泛基因组方法增加了仅使用参考基因组进行的基因组分析的深度和完整性,泛基因组研究可以为不同品种或地理种群的遗传特征提供关键见解。反过来,这有助于阐明基因型-表型关联,并为未来的生物学研究和遗传育种奠定坚实的基础。
泛基因组研究已在微生物、植物、和一些动物(如脊椎动物、软体动物和昆虫),但不在甲壳类动物中。 3D基因组学是研究基因组的空间和时间结构的一种方法,它有助于我们了解染色质在细胞核内是如何组织的,以及这种3D结构如何影响基因调控,细胞命运和进化。
188对染色质折叠及其在转录调控中的作用的全面理解可以通过3D基因组学促进分子育种。189与泛基因组研究类似,3D基因组学已被广泛应用于研究植物、哺乳动物和昆虫,189-191甲壳类动物的Hi-C测序通常用于将重叠群或支架锚定在染色体上,但不用于3D基因组学分析。表观遗传学是对DNA或染色质修饰的研究,包括DNA甲基化,以及组织的翻译后修饰。不同品种之间的表观遗传学比较将有助于改进牲畜养殖和疾病管理计划。已经对一些甲壳类动物进行了表观基因组分析,例如大理石纹小龙虾和水蚤。此外,已经在包括虾和螃蟹在内的许多甲壳类动物中发现了DNA甲基化和许多组蛋白修饰。总之,需要做出更多努力来促进泛基因组学、3D基因组学和表观基因组学在甲壳类目研究中的应用。
基于基因组的甲壳类动物选择性繁殖
基因组资源在养殖甲壳类动物遗传育种中的应用主要集中在虾和螃蟹上。最近发布的商业相关甲壳类生物物种的基因组加速了这些物种分子育种研究的发展。尽管已经在虾和螃蟹中进行了几次GWAS分析,并鉴定了许多QTL和候选基因,但致病基因的定位仍需进一步探索。多组学策略构成了一种很有前途的方法来识别致病基因并剖析经济性状表型表现背后的遗传机制。19将经典遗传图谱方法和多组学方法相结合,可以是一种可行的方法来鉴定与生长、抗病性,以及甲壳类动物的其他经济特征。
GWAS是鉴定与经济性状相关的SNPs的一种有用方法。这些SNPs可以通过标记辅助选择或基因辅助选择用于遗传育种。通过选择有益的基因型,可以进一步改善和细化经济性状。同时,这些SNPs也可以用于GS,因为应用更多的性状相关SNPs可以提高基因组预测的准确性。结合GWAS和多组学方法,可以确定控制经济性状发生的致病基因。反过来,致病基因功能的丧失或获得可以显著改变经济性状的发生。
例如,基因sdY已被鉴定为彩虹鳟鱼性别决定的致病基因。200雄性sdY失活诱导卵巢分化,雌性sdY过表达诱导睾丸分化。近年来,/Cas9技术已经能够高效地敲除特定基因,从而成为一种有效的育种和基因增强技术。敲除与疾病易感性相关的基因可以直接改善抗病性状,从而创造新品种。例如,基因组编辑可以在不影响生长的情况下产生对白粉病具有抗性的小麦品种201、202(图5)。该技术在经济相关甲壳类动物的养殖中具有广泛的应用前景。
/Cas9技术已在大型水蚤、夏威夷水蚤、卡氏异囊藻、新卡氏水蚤和印度绒螯蟹中进行了试验。在这些物种中,无眼、pax6、Hox或几丁质酶4被敲除,突变体的外部表型发生了显着变化。然而,/Cas9技术尚未在大多数经济型虾蟹中完全建立起来,如凡纳滨对虾、斑尾对虾和三疣梭子蟹。随着/Cas9技术的发展,可以通过使用/Cas9操纵这些物种的致病基因来直接改善经济相关性状。
如上所述,GS是水产养殖中最有前途的分子育种方法。生长性状和抗病性状的GS选择准确率分别提高了20%-30%和10%-100%,这些性状因表型和物种而异。73随着甲壳类动物基因组的组装,GS将被广泛用于水产养殖。与牛和猪相比,虾和蟹的种群规模要大得多,这意味着在GS项目中需要对更多的个体进行基因分型。同时,虾蟹的个体商品价值远低于牛和猪,因此基因分型的可承受价格相对较低。
因此,GS的大规模基因分型应采用成本效益高的SNP基因分型方法。低成本基因分型主要有两种方法。一种方法涉及使用GS的低密度标记面板,其显示出与一些水产养殖物种的高密度标记相似的预测结果。另一种方法包括低深度基因组重测序,然后将基因型插补到高密度SNP。随着基因组测序成本的降低,基于重测序的方法,包括靶向测序和低深度基因组重测序,将成为甲壳类动物水产养殖更实惠的策略。此外,构建高质量的参考基因组和开发更准确的GS策略以提高预测准确性仍然是GS研究的主要挑战,这继续阻碍经济相关甲壳类动物物种的选择性繁殖。
9个结论
这篇综述讨论了最近发表的甲壳类动物基因组及其基因组特征,包括基因组大小、WGD、重复序列和蛋白质编码基因。还总结了甲壳类动物各种特定生物表型的基因组特征,这有助于我们理解甲壳类生物的基本生物学,并指导遗传改良。尽管甲壳类动物基因组学远远落后于其他动物,但甲壳类生物基因组正逐渐被应用于养殖虾蟹的遗传改良以及优化养殖条件。GWAS、GS和SNP芯片已被用于鉴定与甲壳类动物的各种经济相关性状相关的基因,包括性别、生长、抗病性和环境适应。
鉴于目前测序甲壳类动物基因组的稀缺性,在不久的将来启动一个大规模的基因组项目至关重要。此外,甲壳类生物基因组研究应结合多种新的基因组方法,包括泛基因组学、3D基因组学和表观基因组学。此外,必须加强基因组技术在经济相关甲壳类动物物种的选择性繁殖和水产养殖中的应用。
in and their in