失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 辽东楤木的高质量参考基因组组装和遗传转化体系开发

辽东楤木的高质量参考基因组组装和遗传转化体系开发

时间:2021-08-16 03:10:23

相关推荐

辽东楤木的高质量参考基因组组装和遗传转化体系开发

文章信息

题目:A High-Quality Reference Genome Sequence and Genetic Transformation System of Aralia elata

刊名:Frontiers in Plant Science

作者:Wenxuan Liu, Xiangling You et al.

单位:Northeast Forestry University

日期: Mar 1‍

01

摘要

辽东楤木是五加科楤木属多年生木本植物。它含有丰富的皂苷,因此具有广泛的药理作用。在这里,我们报道了一个高质量的A. elata参考基因组,其基因组大小为 1.21 Gb,contig N50 为 51.34 Mb,由 PacBio HiFi 测序技术生产。这是龙牙属的第一个基因组数据。通过基因组进化分析,我们探索了A. elata基因组中的系统发育和全基因组复制 (WGD) 事件。通过分析A. elata的基因组序列并结合三个组织的转录组数据,我们发现了与三萜皂苷生物合成相关的重要基因。此外,我们以本实验室建立的黄曲霉胚胎愈伤组织诱导系统为基础,建立了该植物的遗传转化系统。本研究获得的基因组资源和遗传转化体系,为深入了解A. elata提供了新思路,为进一步探索A. elata调控机制奠定了基础。

02

技术路线

03

主要结果

3.1基因组测序、组装和注释

为了研究A. elata的基因组特征,进行了 17、21、25和 27的 K -mer 分布分析(图 1A; 补充图 1 ),分别使用 56.89 Gb 的 Illumina reads。基于 1.12 Gb 的基因组大小,Illumina reads代表 50.79 倍的覆盖率。K -mer 分布遵循泊松分布,两个峰分别对应于纯合和杂合序列(补充图 1)。根据K -mer 分布分析,A. elata的基因组大小估计为 1.08-1.14 Gb,基因组的杂合性比率估计为 1.60-1.69%(补充表 2)。结果表明,基因组A. elata具有高度杂合性和重复性。然后,我们使用 HiFi 技术对A. elata基因组进行测序。从两个文库中总共获得了 51.14 Gb 的 HiFi 读数用于基因组组装。这两个库分别产生了总共 25.75 和 25.39 Gb 的数据(补充表 3)。使用 hifiasm 将 HiFi 读取组装成 contigs。最终组装的基因组大小为 1.21 Gb,contig N50 长度为 51.34 Mb。基因组组装包含 1,350 个 contig,最长 contig 为 100.88 Mb,平均 contig 长度为 0.89 Mb。A. elata基因组的GC含量为36.13%(表格1)。

为了评估基因组组装的完整性,为基因组调查生成的短reads映射到基因组。总共有 99.95% 的短reads被映射到基因组,其中 99.48% 被正确配对(补充表 4)。通过BUSCO评估了基因组组装的完整性。结果显示,该基因组至少覆盖了 98.8% 的 BUSCO 基因,其中 87.2% 被归类为“完整和单拷贝”,11.6% 被归类为“完整和重复”,0.6% 被归类为“片段化”和 0.6%作为“缺失”(图 1B; 补充表 5)。所有结果表明A. elata基因组组装的质量很高。

重复序列包括串联重复和散布重复,是基因组的重要组成部分。在这项研究中,使用从头预测和基于同源性鉴定两种策略来注释A. elata基因组中的重复序列。得到的综合结果:基因组中重复序列的比例为71.69%,高于胡萝卜(45.95%)。最丰富的重复元件类型是长末端重复(LTR),占基因组的 49.15%,而 DNA 转座子重复序列仅占基因组的 3.86%(补充表 6)。

为了注释A. elata基因组中的蛋白质编码基因,我们结合了从头预测、基于同源性的搜索和来自 RNA-seq 数据的转录证据。最后,在基因组中注释了总共 37,016 个基因。通过 BUSCO 评估了注释蛋白质组的完整性和质量。结果表明,97.7%的保守基因在基因组中被注释,其中包括93.7%和4.0%的完整BUSCO基因和4.0%片段化的BUSCO基因。BUSCO评估表明基因组注释具有较高的准确性(图 1B; 补充表 7)。

3.2辽东楤木的基因组进化

为了揭示A. elata的进化位置,我们将基因组组装与来自其他 11 种植物的基因组进行了比较。在这些物种中共鉴定出 250 个单拷贝基因家族。这些单拷贝基因用于使用最大似然法构建系统发育树。与被子植物系统发育群相一致,A. elata与P. notoginseng 密切相关,P. notoginseng 是另一个五加科物种,这两个物种被分类为一个进化枝。这个进化枝与 Apiales 家族的物种关系最密切(图 2A)。然后根据系统发育树估计这些物种的分歧时间。我们估计A. elata和P. notoginseng 在大约 8010 万年前从伞形科分化出来。Aralia elata和P. notoginseng随后在 24.2 万年前分化为两个物种。此外,我们对系统发育树中的基因家族进化进行了比较分析。共有 1,925 个基因家族在A. elata谱系中扩张,而 1,832 个基因家族经历了收缩(图 2A)。

全基因组复制广泛存在于开花植物中,并在基因组进化、新物种形成和基因新功能化中发挥重要作用。

先前的结果表明,五加科的两个物种三七和人参最近分别经历了一次和两次WGD事件。为了进一步探索A. elata的进化轨迹,我们研究了其基因组中的 WGD 事件。来自A. elata的蛋白质序列使用 BLASTP (E < 1e-5) 对基因组进行自我搜索以识别同源基因对。我们计算了最佳基因对的 4DTv(第三个密码子的 4 倍简并同义位点)并绘制了 4DTv 值的分布(图 2C)。分别在 0.12 和 0.50 处观察到两个峰。大约 0.50 的右峰揭示了双子叶伽马三倍体事件。大约 0.12 的左峰表明A. elata经历了最近的 WGD 事件。然后,我们使用 McscanX 研究了V. vinifera和A. elata之间的共线性,以进一步确认A. elata中的 WGD 事件,因为V. vinifera没有经历任何最近的 WGD。观察到A. elata和V. vinifera之间的 2:1 共线性关系(图 2D) ,这证实了最近的 WGD 事件发生在A. elata基因组中。

3.3三萜皂苷生物合成关键酶编码基因分析

对植物中萜类化合物的生物合成途径进行了全面的解释,引起了研究人员的广泛兴趣。通过整合序列相似性、保守结构域和系统发育关系结果(图 3; 补充图2;补充表 8),我们鉴定了 22 个候选基因,这些基因编码可能催化A. elata基因组中萜类生物合成过程的酶(图 4)。

我们使用从公共数据库下载的A. elata转录组测序数据来研究这些基因的表达谱。RNA-seq reads与基因组组装比对,并获得它们在根、茎和叶中的表达水平。图 4说明了这些酶编码基因在每个组织中的标准化表达水平。结果表明,许多基因似乎以组织特异性方式表达。例如,编码 CYP450 的基因在茎和根中非常丰富。

以往研究表明,CYP72A和CYP716A亚家族成员是参与五环三萜皂苷生物合成的主要CYP450。因此,我们特别关注在A. elata基因组中鉴定的四个 CYP716a 和三个 CYP72a 编码基因。同时鉴定了12个与萜烯骨架和三萜生物合成途径相关的基因,包括MVA途径和2,3-氧角鲨烯生物合成途径。其中,六种酶(AACT、HMGS、HMGR、MK、PMK 和 MVD)与 MVA 途径相关。

在 MVA 途径中,乙酰辅酶 A 被合成为乙酰乙酰辅酶 A,后者由 AACT 酶(由Arel.002085编码)催化。Arel.002085在叶和根中的表达水平略高于在茎中的表达水平。乙酰乙酰辅酶A被合成为3-羟基-3-甲基戊二酰辅酶A,由HMGS酶(编码为Arel.07)催化。HMGR酶(由Arel.004178编码)随后催化甲羟戊酸的合成,然后使用MK酶(由Arel.022041编码)催化甲羟戊酸-5P的合成。Arel.07、Arel.004178和Arel.022041的表达水平根中的含量高于茎和叶中的含量,表明生物合成反应主要发生在A. elata的根部。然后,在PMK酶(编码为Arel.027136)的催化下,生成甲羟戊酸-5-焦磷酸,然后异戊烯焦磷酸被MVD酶(编码为Arel.003662)催化,再由IPPI酶(编码由Arel.030181)形成焦磷酸二甲基烯丙酯,焦磷酸异戊烯基和焦磷酸二甲基烯丙酯进一步缩合形成各种萜类化合物。除了Arel.003662在叶和根中的表达水平略高于在茎中的表达水平外,Arel.027136的表达水平茎中的Arel.030181略高于叶和根中的 Arel.030181。结果表明,这部分的这些生物合成反应可能发生在茎部。

基于这些基因的表达水平,我们在空间水平上探索了A. elata植物的次生代谢。我们比较了这些基因在不同组织中的表达模式。我们发现参与皂苷生物合成的基因大部分在根中特异性表达,少数在叶和茎中高表达(图 5)。

3.4辽东楤木农杆菌介导转化体系的建立

生物技术是提高植物次级代谢产物含量的有效途径。A. elata基因组的注释将为转基因A. elata植物的产生提供许多候选基因。然而, A. elata的遗传转化仍然很困难。以本实验室建立的A. elata胚胎愈伤组织诱导系统为基础,建立了该植物的遗传转化系统。生长良好的组织培养幼苗的根被用作农杆菌的外植体侵染,对根进行预培养、共培养和选择培养(卡那霉素抗性)以获得抗性愈伤组织。通过PCR检查从抗性愈伤组织中提取的DNA。如图所示图 6,在阳性转基因植物中成功检测到目标片段,发现在感染时间10分钟时转化效果更好。我们将转基因愈伤组织转移到分化培养基中以获得体细胞胚苗。接下来,将体细胞胚苗转移到含有 20 g/L 蔗糖的 WPM 培养基中,在 16 h 光照和 8 h 黑暗条件下培养 4 周,然后将植物移入土壤并在温室中培养 2 个月,如如图所示图 6,转基因植物生长良好,最终我们获得了转基因植物。

04

结论

辽东楤木是五加科中使用最广泛的中药材之一,以其良好的功效享誉中外。三萜皂甙广泛存在于五加科中,是研究最多的活性成分。迄今为止,已从A. elata中分离鉴定出100多种皂苷。然而,A. elata皂苷的完整生物合成途径尚未确定,需要进一步研究。在此,我们简要分析了A. elata的萜类生物合成途径,为后续研究提供参考。通过对参与该途径的候选基因进行基因改造,可以增加A. elata中三萜皂苷的含量。本研究中建立的注释基因组和遗传转化系统将用于该物种的进一步功能基因组分析。

在五加科中,已经报道了一些物种的基因组,包括刺五加(Yang et al., )、人参(Kim et al., )和三七(Jiang et al., )。A. elata的高质量基因组分析将为研究五加科其他物种的进化景观提供有价值的广泛信息。高质量基因组和转录组数据的基因挖掘可以为进一步探索植物生长和次生代谢机制提供资源。受益于HiFi reads的长读长和高精度,本研究获得的A. elata基因组的连续性和完整性处于高水平。我们的结果与已发表的基因组相结合,揭示了五加科的 WGD 轨迹。最近的 WGD 事件发生在五加科物种分化之前。

综上所述,本文所报道的高品质A. elata基因组序列,结合比较基因组分析,对参与皂苷生物合成的推定基因进行鉴定和组织物种表达分析,并且建立了高效的A. elata遗传转化体系,这将有助于A. elata的繁殖和栽培。

05

获取原文

原文链接:

/articles/10.3389/fpls..822942/full

补充材料:

/articles/10.3389/fpls..822942/full#supplementary-material

END

06

广告

向上滑动阅读正文

赛思基因科技(青岛)有限公司致力于开发转基因和基因编辑中的“硬核科技”,突破遗传转化中的基因型限制,辅助基因编辑育种。目前公司拥有国内数量最多的稳定遗传转化体系,包括但不限于花生、藜麦、大白菜、小白菜、辣椒、菜心、油菜、紫菜薹、樱桃萝卜、胡萝卜、甘蓝、抱子甘蓝、宝塔菜、紫/黄/绿花椰菜、青花菜、西瓜、南瓜、甜瓜、茄子、梨树、枣树、大豆、棉花等遗传转化体系。

公司可为广大科研和育种工作者提供稳定的,非嵌合的,多品种的过表达、基因沉默株系和基因编辑突变体。期待与您的深入合作,共同推动中国种业的进步。

赛思基因

专注于遗传转化、转基因技术开发,以及后续的组学分析和生物学验证实验的团队。期待与广大科研工作者和育种公司合作。

141篇原创内容

公众号

收录于合集#文献解读

110个

上一篇【Sci Rep】唇形科植物Lallemantia iberica的体外再生和农杆菌介导的遗传转化体系研究下一篇【Sci Rep】落叶松LoHDZ2的遗传转化及其增强落叶松抗逆性的功能分析

如果觉得《辽东楤木的高质量参考基因组组装和遗传转化体系开发》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。