DNASTAR中文网站 > 最新资讯 > 使用DNASTAR的Nova应用程序简化结构预测
使用DNASTAR的Nova应用程序简化结构预测
发布时间:2024/10/11 15:50:27

DNASTAR Lasergene Protein 软件包中的应用程序支持探索蛋白质结构、运动、功能和相互作用。旗舰应用程序是 Protean 3D,这是一款易于使用的独立软件,还可用于设置预测并查看我们五个单独授权的蛋白质预测应用程序(称为 Nova 应用程序)的结果(图 2)。

图 2. Protean 3D 是一个独立应用程序,也用于设置 Nova 应用程序预测并分析其结果。

 

 

这些应用程序提供了强大的预测算法,例如 I-TASSER、SwarmDock、AlphaFold 2 和 AlphaFold-Multimer。这些工作流程提供了实用且快速的方法来加速药物/抗体的开发,并研究分子间相互作用的结构途径。

 

使用简单的引导式工作流程,只需几分钟即可安装 Lasergene,不到一分钟即可设置并开始运行蛋白质结构预测。您可以在进行预测设置的同一应用程序中查看和分析结果,通常只需几分钟或几小时。

 

设置预测和分析结果均在标准 Windows 或 Mac 计算机上进行,无需专用计算机。这些任务所需的磁盘空间很小,因为整个 2.5 TB 的 AlphaFold 2 库都存储在 NovaCloud 上,使用 SSD 支持的文件共享存储。预测也都在云端进行。NovaCloud 有一个专用的 GPU,这在预测的 AI 推理和能量最小化阶段非常重要。

表 2. 开源 AlphaFold 算法与通过 Nova 应用程序访问相同算法的要求比较。

 

使用 NovaFold AI 预测嵌合 FliC-FliS 融合蛋白的结构

 

为了展示 NovaFold AI 如何使用 AlphaFold 2 简化结构预测并轻松执行下游分析,我们提出了以下用例。

 

融合蛋白是人工构建体,通常用于探索不同蛋白质片段在原子水平上的相互作用。由于它们不是天然存在的蛋白质,因此它们从未包含在本指南第 2 章中描述的公共 AlphaFold 2 结构数据库中。

 

融合蛋白很难用基于模板的结构预测算法建模,因为没有可用的模板来结合两种不同结构的元素。但与其他算法不同,AlphaFold 2 可以识别来自两个不同来源的折叠,并将它们组合成一个距离矩阵,从而预测复合结构。

 

然而,我们已经描述了开源 AlphaFold 2 由于专门的计算机要求而运行起来有多麻烦和昂贵。在这个例子中,我们将展示在标准笔记本电脑上使用 NovaFold AI 使用该算法建模融合蛋白是多么容易。

 

在以下步骤中,我们预测了嵌合 FliC-FliS 融合蛋白 (PDB ID:4IWB) 的结构,该蛋白的特点是两片细菌鞭毛以新的方式融合在一起。该结构通过 X 射线衍射解析,并于 2013 年 1 月 23 日添加到 PDB 数据库中。

 

步骤 1:获取蛋白质序列

 

为了获得这种蛋白质的 FASTA 序列,我们转到 PDB 网站上的 4IWB 条目(图 3),单击蓝色的下载文件按钮并选择 FASTA 序列。

图 3.蛋白质数据库网站上4IWB 条目的一部分。

 

第 2 步:使用 NovaFold AI 设置并运行预测

 

在Protean 3D欢迎屏幕(图 4)中,我们单击“结构预测”,然后单击“使用 NovaFold AI 创建新蛋白质结构”

图 4. Protean 3D 欢迎屏幕显示 NovaFold AI 工作流程的启动点。

 

NovaFold AI向导在序列屏幕上打开。我们使用添加文件按钮上传 FASTA 文件(图 5)。

图 5. 添加 FASTA 文件后的 NovaFold AI 序列屏幕。

 

单击“下一步>”将带我们进入一个可以自定义预测选项的屏幕。

 

为了确保本例的公平性,我们希望确保 4IWB 结构不能被 AlphaFold 2 算法用作模板。因此,我们选定的模板截止日期为2013 年 1 月 22 日,即结构提交给 PDB 的前一天(图 6)。

图 6.NovaFold AI 选项屏幕,其中输入了模板截止日期。

 

最后,我们点击提交开始预测。本次预测设置耗时约 1.5 分钟,完成耗时约 41 分钟。

 

步骤3.分析预测结构

 

一旦预测出结构,预测视图中就会出现一个活动链接(图 7)。

图 7.最新预测的链接出现在 Protean 3D 预测视图的顶部。

 

我们点击此链接在结构视图中打开预测结构(图 8 左上角)。最初,前 5 个模型以叠加方式显示,模型报告(左下角)显示它们的局部距离差异测试* (LDDT) 分数。

图 8.Protean 3D 中叠加的前 5 个预测模型。

 

* LDDT 是一种“无叠加分数,用于评估模型中所有原子的局部距离差异,包括立体化学合理性的验证。”

 

参考文献:Mariani V、Biasini M 等人。LDDT :使用距离差异检验比较蛋白质结构和模型的局部无叠加分数,生物信息学,第 29 卷,第 21 期,2013 年 11 月 1 日,第 2722–2728 页。

 

将预测模型与 PDB 结构进行比较

 

模型 1 结构预测与使用 X 射线晶体学确定的结构相比如何?为了找出答案,我们使用 Protean 3D 通过“结构” > “对齐结构” > “结构对齐”命令将预测与 PDB 结构对齐。我们使用“样式”面板将 NovaFold AI 预测涂成橙色,将 PDB(X 射线衍射)结构涂成蓝色(图 9)。在“结构”视图中旋转结构表明,从任何角度看,预测结构和已知结构几乎难以区分。

图 9. NovaFold AI 做出的预测(橙色)与 PDB 通过 X 射线衍射确定的
结构(蓝色)一致。

 

使用更客观的准确度测量方法,我们可以查看前五个预测模型与已知结构之间的比对的均方根偏差* (RSMD) 值。没有绝对的规则来确定比对蛋白质的匹配,但低于 2.0 Å(埃,10 -10米)的值通常被认为表示非常接近的匹配。在此示例中,五个比对的 RMSD 值均低于 0.7,排名最高的模型的 RMSD 仅为 0.379 Å(参见上一页图 7 中的“详细信息”面板)。

 

* RSMD 是测量叠加蛋白质的原子(通常是主链原子)之间的平均距离。

 

使用 NovaFold AI-Multimer 设置并运行预测

 

与 NovaFold AI 简化 AlphaFold 2 流程的方式类似,NovaFold AI-Multimer 增强了使用 AlphaFold-Multimer 设置和运行预测的便利性。如下所示,设置预测大约需要 1-2 分钟,只需三个步骤。

 

开始之前,请确保多聚体结构预测所涉及的所有序列都包含在 FASTA 格式的单个蛋白质文件中。如果您正在对同源多聚体进行建模,则该文件将包含相同序列的多个条目(例如,如果对同源三聚体进行建模,则包含相同序列的三个副本)。

 

步骤 1:启动 Protean 并选择文件 > 新建 NovaCloud 预测以启动预测视图。然后单击NovaFold AI Multimer(图 10)。

图 10. 单击 NovaFold AI Multimer 启动预测设置向导。

 

步骤 2:第一个向导屏幕是序列屏幕(图 11)。单击添加文件按钮以上传一个或多个 FASTA 格式的蛋白质文件。每个文件代表一个单独的预测作业。

图 11. 在序列屏幕中,您可以使用“添加文件”添加序列文件,或使用“Enter”键入/粘贴序列。

 

步骤 3:如果要指定自定义预测选项,请跳至步骤 4。否则,单击提交开始预测并省略步骤 4

 

步骤 4(可选):要指定自定义预测选项,请单击“下一步”进入“选项”屏幕(图 12)。根据需要设置选项,然后单击“提交”开始预测。

图 12.“选项”屏幕允许您自定义预测设置。

 

当前预测完成后,预测视图顶部会出现一个活动链接(图 13)。

图 13. 预测视图以列表形式显示当前和过去的预测。单击任何已完成的预测即可在 Protean 3D 中打开它。您也可以右键单击预测以下载它。

 

单击链接可在结构视图中打开预测结构(图 14)。

图 14. NovaFold AI-Multimer 预测模型 1。结构视图(左上)包含预测结构的图像,该图像可以完全自定义并导出为出版质量图像。序列视图(中间)显示链 A 和 B 部分中的序列和结构元素。组成报告(左下)包含一个表格,显示预测多聚体的组成,这只是几种可用报告之一。

 

 

结论

 

了解蛋白质的三级结构对于理解蛋白质的功能至关重要,但传统的实验室方法无法满足需求。为了解决这一瓶颈,人们开发了能够根据蛋白质序列预测蛋白质结构的计算机算法,这些算法近年来变得越来越准确。当今最好的算法几乎与 X 射线晶体学和核磁共振光谱等实验室分析一样准确。

 

自 2020 年赢得 CASP14 以来,AlphaFold 2 算法以其前所未有的速度和准确预测复杂分子结构的能力吸引了蛋白质科学家。其多链特异性扩展 AlphaFold-Multimer 也获得了类似的赞誉。但是,虽然这些算法可供公众免费使用,但它们需要昂贵的专用计算资源来安装和运行,还需要一个能够熟练运行复杂命令行脚本的操作员。此外,AlphaFold 2 和 AlphaFold-Multimer 的开源版本不提供查看完成的预测的实用程序,这意味着必须掌握工作流程分析部分的额外应用程序。

 

DNASTAR 通过提供从任何 Windows 或 Mac 笔记本电脑或台式电脑使用 AlphaFold 2 和 AlphaFold-Multimer 的方法消除了这些障碍。NovaFold AI 和 NovaFold AI-Multimer 都使用直观的 Protean 3D 界面,可轻松设置和监控预测状态,以及查看和分析预测模型。预测本身在安全的亚马逊 (AWS) 云中“幕后”进行,从而释放计算资源以用于其他任务。

 

 

 

 

 

 

读者也访问过这里:
135 2431 0251