special

您的位置: 首页 > 院士专题 > 专题列表

共检索到2084条,权限内显示50条;

[学术文献 ] 中国农业大学汪海团队实现转录调控序列的人工智能设计 进入全文

PNAS

2024年6月18日,中国农业大学农学院汪海团队联合美国康奈尔大学、丹麦奥胡斯大学、北京大学现代农业研究院、坦桑尼亚农业科学院等单位,在PNAS在线发表了题为“Modeling 0.6 million genes for the rational design of functional cis-regulatory variants and de novo design of cis-regulatory sequences”的研究论文。该研究利用17个植物物种(拟南芥、毛果杨、大豆、甜菜、蒺藜苜蓿、黄瓜、葡萄、番茄、土豆、谷子、狗尾草、玉米、高粱、二穗短柄草、水稻、小立碗藓、莱茵衣藻)的60万个基因以及6256套转录组数据,开发了一个名为PhytoExpr的深度学习模型。该模型以近端转录调控区DNA序列(5kb启动子和5kb终止子)为输入,预测基因的中位数表达量以及该序列来自哪个物种。为了无偏倚地评估模型的预测准确度,以基因家族为单位划分训练集和测试集,确保模型只在它从未见过的基因家族上进行测试。研究者构建了两种模型结构:CNN+stacking和transformer,并训练随机森林模型对上述两种深度学习模型结构的超参数进行了优化,然后比较它们在四种不同任务中的预测精度。结果显示,采用transformer和多任务学习(multi-task learning)架构时,模型在mRNA丰度预测(图1d)和序列物种来源预测上都有着更高的准确度。为了评估PhytoExpr模型对新物种的泛化能力,研究者使用17个物种中的16个物种训练模型,在模型没有见过的新物种的新基因家族上测试其准确度。结果显示,除莱茵衣藻外,模型可以对从未见过的物种中的从未见过的基因家族作出可靠的预测。这表明PhytoExpr可以有效地拓展到与模型训练集包含的物种有相近进化关系的新物种中。而莱茵衣藻与其他植物分化了约10亿年,其转录调控的语法可能已经大相径庭,因此没有见过莱茵衣藻的深度学习模型无法对该物种触类旁通。作者进一步使用PhytoExpr评估了玉米每个基因的转录调控区每个碱基对基因表达的影响,并将碱基重要性得分与碱基保守性、转录因子结合位点进行了比较。结果显示,高保守碱基、与转录因子结合的碱基都显著富集在PhytoExpr预测的高重要性核苷酸中。这表明虽然PhytoExpr没有使用功能注释数据(例如Conserved Non-coding Sequence、ChIP-Seq等)进行训练,PhytoExpr仍能够识别出调控区序列中的功能元件。接下来作者使用PhytoExpr解决前文中提到的三个应用问题。首先,利用PhytoExpr模型系统评估了1730万个来自玉米HAPMAP3的SNP对基因表达的影响,发现模型预测的大效应SNP中显著富集罕见变异(MAF < 0.01),说明这些变异更可能受到负选择,同时SNP效应评分与SNP到TSS或TTS的距离有很强的相关性。因此研究者猜测PhytoExpr预测的大效应SNP可能与自然群体中基因表达水平的变异存在很强的相关性。利用以前报道的基于282个玉米自交系的7个不同组织转录组eQTL数据,依据cis-eQTL曼哈顿图中的关联强度对SNP进行排序,发现cis-eQTL中排序靠前的SNP在模型预测的大效应SNP中显著富集,证明PhytoExpr在转录调控区功能变异发掘中的有效性。第二,作者开发了两种算法利用PhytoExpr改进自然启动子。第一种策略称为基于重要性分数的半暴力算法,利用该方法对四个玉米调控区序列进行设计,并得到了预期的表达量。第二种策略称为虚拟进化,即在遗传算法中使用PhytoExpr作为选择算子。以植物启动子作为初始序列,通过对特定区域的多轮虚拟进化,该策略成功提高了目标启动子的转录强度。第三,作者利用虚拟进化技术实现了转录调控区DNA序列的从头设计。随机序列在计算机中经过多代虚拟进化,产生了适用于拟南芥的增强子和适用于玉米的增强子,这些增强子虽然和自然序列没有相似性,但是可以分别在拟南芥和玉米中启动报告基因的表达。因此,将PhytoExpr模型嵌入遗传算法,可以实现DNA序列在计算机中的进化,高效地探索DNA序列的无限变异空间,为植物合成生物学提供无限的元件。

[学术文献 ] 西北农林科技大学开发了创新的深度学习模型预测表型 进入全文

Plant Communications

2024年6月13日,西北农林科技大学植物生物信息学与系统生物学研究团队在Plant Communications上发表了题为“Dual-Extraction Modeling: A multimodal deep learning architecture for phenotypic prediction and functional gene mining of complex traits”的研究论文。该研究开发了一种创新的深度学习模型Dual-Extraction Modeling(DEM)。DEM模型能够从多种异质的组学数据集中提取代表性特征,进而预测与复杂性状相关的表型,并识别影响这些性状的功能基因DEM模型架构采用了双重提取的策略,分别在高维和低维特征空间中进行建模。通过多头自注意力网络,DEM能够从个体组学特征矩阵和联合矩阵中提取全局注意力特征向量,进而优化模型权重并输出最终预测结果。这种方法不仅提升了性状表型预测的准确性,还通过事后解释策略提高了模型对性状相关功能基因的识别能力。在随后一系列全面的基准测试实验中,DEM模型在植物的数量性状和质量性状预测方面均展现出了优越的准确性、鲁棒性、泛化能力和灵活性。此外,DEM模型在人类疾病预测中同样表现优异。特别值得一提的是,DEM在预测影响多性状的多效性基因方面表现出了显著的可解释能力。在此基础上,研究团队开发了一款便于使用的软件,使得研究人员能够轻松运用DEM的各项功能进行多组学数据的分析与解读。该项研究成果不仅为复杂性状的研究提供了一个强有力的工具,还通过高效的特征提取、表型预测和事后解释方法,推动了对性状机制和疾病机理的理解。DEM的高性能和易用性将有望加速智能育种和精准医疗研究的进程。,有望在性状改良和疾病预测中发挥重要作用。

[学术文献 ] 农科院蔬菜花卉所利用转录组/代谢组解析番茄风味物质机制 进入全文

Horticultural Plant Journal

2024年6月10日,Horticultural Plant Journal在线发表了中国农业科学院蔬菜花卉研究所崔霞团队题为“Integration of transcriptome and metabolome reveals regulatory mechanisms of volatile flavor formation during tomato fruit ripening”的研究论文。本研究以风味物质含量存在差异显著的野生醋栗番茄和栽培番茄为研究对象,采用固相微萃取-气相色谱-质谱联用技术,共鉴定出35种挥发性风味物质。通过对该35种挥发性风味物质的含量进行分析,野生番茄的总含量远高于栽培番茄,并且果实的挥发性风味物质含量在果实破色时期和红熟时期显著增加。通过转录组和代谢组联合分析,分别构建了影响重要风味物质2-异丁基噻唑的关键结构基因SlTNH1以及己醛和顺式-2-庚烯醛的关键结构基因SlLOX的转录调控网络。本研究鉴定到了bHLH和AP2/ERF家族的转录因子通过结合在SlTNH1的启动子序列上进而激活其转录,影响2-异丁基噻唑的合成。此外,本研究还鉴定了HD-Zip家族中的一个转录因子对脂肪酸通路中的SlLOX起调控作用,进而影响己醛和顺式-2-庚烯醛的合成。本研究对番茄果实在成熟过程中的转录组和挥发性风味物质的代谢组进行联合分析,挖掘调控番茄挥发性风味物质的转录因子并构建了调控网络,为研究番茄果实挥发性风味的形成提供了新的思路,对为进一步培育优良风味的番茄提供了理论基础。

[学术文献 ] 山东农大解析醋栗番茄基因组 进入全文

Scientific Data

2024年6月4日,山东农业大学生命科学学院李传友团队在上发表题为“Chromosome-level genome assembly of Solanum pimpinellifolium”的研究论文,该研究在染色体水平上解析了醋栗番茄LA1589的基因组,为今后研究番茄驯化和基因组育种提供了宝贵的资源。番茄是全球重要的蔬菜作物之一,也是果实发育和抗性研究的经典模式作物。在番茄驯化过程中,持续的选择降低了遗传多样性,导致番茄“丢失”了许多优异的农艺性状。因此,在现代番茄育种中,野生番茄经常被用作重要的种质供体。醋栗番茄(Solanum pimpinellifolium)作为栽培番茄的野生祖先,具有抗病、抗逆等优异性状,使其在培育抗病、耐逆番茄新种质过程中具有巨大潜力。研究人员利用PacBio三代测序、Bionano光学图谱、Hi-C技术和二代测序策略,构建了醋栗番茄LA1589染色体水平的高质量基因组图谱。组装的基因组大小为833 Mb,contig N50长度为31 Mb,大约98.8%的contig序列锚定到12条染色体,重复序列约占整个基因组的74.47%。BUSCO评估结果达到98.3%,同时,LAI得分达到14.49分,说明该基因组的组装质量较高。基因组注释共发掘41,449个蛋白编码基因,其中89.17%具有功能注释信息。

[学术文献 ] 博德研究所与明尼苏达大学实现超大片段基因插入哺乳动物细胞 进入全文

Nature Biomedical Engineering

2024年6月10日,Nature Biomedical Engineering在线发表了博德研究所David R. Liu和明尼苏达大学医学院Mark J. Osborn团队合作的最新研究进展:‘Efficient site-specific integration of large genes in mammalian cells via continuously evolved recombinases and prime editing’,本文通过进化的重组酶结合Prime Editor在哺乳动物细胞中实现大片段基因的高效位点特异性整合。称之为PASSIGE(prime-editing-assisted site-specific integrase gene editing)技术,其可精确整合大于10kb的DNA片段。通过噬菌体辅助连续进化(PACE)和非连续进化(PANCE)方法,研究团队对Bxb1重组酶进行了进化和改造,生成了具有更高整合效率的变体evoBxb1和eeBxb1。它们能够在人类细胞系中显著提高供体DNA的整合效率,高达60%,远高于野生型Bxb1的整合效率。这些变体在预安装了重组酶着陆位点的人类细胞系中表现出显著的整合效率提升。在单次转染实验中,使用eeBxb1的PASSIGE在安全港和治疗相关位点实现了平均23%的靶向基因整合效率,比野生型Bxb1高出4.2倍。在原代人类成纤维细胞中,整合效率在多个位点超过了30%。PASSIGE技术在多种基因整合位点上的表现均优于PASTE(programmable addition via site-specific targeting elements)技术。evoBxb1和eeBxb1变体的PASSIGE分别比PASTE高出9.1倍和16倍。通过连续进化和工程改造,Bxb1重组酶引入了多个突变位点,从而显著提升了其在哺乳动物细胞中进行大基因整合的效率。evoBxb1:引入突变点为V74A,在Bxb1重组酶的N端结构域(NTD)中引入的单一突变。eeBxb1:V74A,同样在NTD中引入的突变;E229K,在C端结构域-a(CTD-a)中引入的突变;V375I,在C端结构域-b(CTD-b)中引入的突变。这些突变的组合(特别是V74A、E229K和V375I)在eeBxb1中共同作用,显著提高了重组酶的整合效率。研究表明,这些突变可能通过优化活性位点构象或提高蛋白质稳定性来增强重组酶的活性。对比评估PASSIGE, evoPASSIGE, eePASSIGE和PASTE介导的定点插入能力。测试的基因位点包括与多种遗传疾病相关的基因,如CFTR(囊性纤维化)、GBA1(高雪氏病和帕金森病)、COL7A1(营养不良性大疱性表皮松解症)等。在HEK293T和N2a细胞中,利用PASSIGE、evoPASSIGE、eePASSIGE和PASTE技术,整合一个5.6 kb的DNA供体到上述治疗相关位点。结果显示,evoPASSIGE和eePASSIGE在所有测试的八个治疗相关位点上均表现出显著的整合效率提升。在这些位点上,eePASSIGE的平均整合效率达到22%,evoPASSIGE达到17%,而传统的PASSIGE仅为7.8%,PASTE为3.8%。在某些位点(如AAVS1、ACTB和FANCA),eePASSIGE的整合效率超过30%。其他位点(如B2M、GBA1、COL7A1、CFTR、Smn1、CCR5和ALB)的整合效率也超过20%。平均而言,evoPASSIGE和eePASSIGE相较于PASSIGE分别提高了2.7倍和4.2倍的整合效率。相较于PASTE,PASSIGE、evoPASSIGE和eePASSIGE分别提高了3.3倍、9.1倍和16.2倍的整合效率。(图2)通过高通量测序(HTS)评估整合后的基因组结果,发现evoPASSIGE和eePASSIGE的重组效率分别为59%和73%,显著高于PASSIGE的19%。这些结果表明,evoPASSIGE和eePASSIGE在多种治疗相关位点上均表现出高效的基因整合能力。这些改进后的PASSIGE变体在治疗相关基因位点上的高效整合,为未来的基因治疗应用提供了强有力的工具。本文通过优化和发展PASSIGE技术,突破了哺乳动物细胞基因组大片段定点整合效率的瓶颈,显著提升了大基因片段在哺乳动物细胞中的整合效率和精确度,为基因编辑、基因治疗和生物技术的应用提供了重要的技术支持和实验依据。

[学术文献 ] 南京农大构建梨T2T基因组和泛基因组图谱 进入全文

Plant Communications

2024年6月10日,Plant Communications在线发表了南京农业大学张绍铃院士团队题为 “Haplotype-resolved T2T genome assemblies and pangenome graph of pear reveal diverse patterns of allele-specific expression and genomic basis of fruit quality traits” 的研究论文。该研究基于亲本的遗传信息组装了两个杂交选育的梨品种‘玉露香梨’(YLX)和‘红香酥’(HXS)的单倍型T2T基因组,并构建了首个梨泛基因组图谱,揭示了等位基因特异性表达对杂种优势和果实品质性状形成的贡献。首先,该研究基于亲本遗传信息将上述两个品种的二倍体基因组准确分型,首次组装出两套与亲本对应的梨单倍型T2T基因组。研究团队基于单倍型基因组鉴定了全基因组水平的等位基因,进一步将不同组织和果实,不同发育阶段的RNA-seq数据进行分型和定量,在两个杂交种中分别鉴定出大约6000个差异表达的等位基因(ASE),这些基因在不同组织和果实发育阶段显示出不同的表达模式,表现为ASE基因的编码区和启动子区序列差异显著高于非ASE基因,ASE基因的启动子区域比非ASE基因富集了更多的转座子序列,这表明转座子可能通过改变基因表达调控网络,影响等位基因的特异性表达。接着,利用新组装的分型基因组和已发表的梨基因组,研究团队构建了梨的泛基因组图。该图谱揭示了在梨种群中的结构变异(SV)热点区域,并为高分辨率的等位基因发现和基于泛基因的全基因组关联分析提供了可能,发现了更多先前研究并未揭示的驯化选择区域。最后,研究团队发现梨Ma1等位基因在群体中的PAV变异与果实有机酸含量变化密切相关。该基因在两个杂交品种(YLX和HXS)的父本单倍体中缺失,导致其表现出单亲表达(SPE)的现象。进一步结合泛基因组图谱和群体信息,发现Ma1等位基因完全缺失的栽培品种有机酸含量显著低于只有一个Ma1等位基因缺失的品种的有机酸含量,而Ma1等位基因部分缺失的品种的有机酸含量显著低于Ma1等位基因全部都存在的品种的有机酸含量。该研究为解析梨杂种优势和优异品质形成机制提供了重要参考。同时,该研究构建的梨泛基因组为结构变异挖掘和全基因组关联分析提供了宝贵数据资源。

热门相关

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充