简介
过去半个世纪以来,生物学和计算机科学领域的革命为改善人类和环境健康创造了巨大的潜力,并有望开启药物工程开发的新时代。
药物通常通过与患者体内的目标蛋白结合来实现治疗目的。这种结合可能导致正常底物结合的破坏和/或蛋白质形状或运动的调节。显然,了解蛋白质的 3D 结构和动力学对设计新药和新疗法大有裨益。但直到最近,药物发现过程和相关研究仍依赖于高通量筛选实验,从数十万个分子库中识别出生物活性化合物。
2013 年,DNASTAR 发布了 NovaFold®,这是一款基于屡获殊荣的 I-TASSER 算法的革命性 3D 蛋白质结构预测应用程序。NovaFold 使用迭代组装模拟,以蛋白质序列为输入,预测 3D 蛋白质结构模型。

NovaFold 是 Protean 3D™ 中单独授权的服务,是 Lasergene 结构生物学套件的一部分。使用 DNASTAR 图形丰富的 Protean 3D 应用程序可视化和分析 NovaFold 预测。每个预测的结果包括最多五个排名模型,并报告所有模型的完整详细信息。NovaFold 预测在 Amazon EC2 网络服务上的高性能云计算集群上进行。(请参阅我们关于 DNASTAR 云安全的白皮书)。或者,NovaFold 也可作为 Linux 操作系统的本地安装。
DNASTAR 对 NovaFold 的目标是:
1) 通过构建高置信度的药物靶标和生物制药结构模型来加速药物发现工作,从而对人类健康产生积极影响。
2) 支持广泛的研究目标,以增强对分子变化如何影响蛋白质结构和功能的理解。
NovaFold 的 I-TASSER 预测算法
NovaFold 背后的引擎是 I-TASSER 算法,由密歇根大学计算医学和生物信息学系的 Yang Zhang 教授开发。
该算法在预测蛋白质结构时结合使用“线程”和“从头折叠”。
• 线程尝试将查询序列的部分与模板序列进行匹配。
模板序列及其通过实验解决的结构是 RCSB 蛋白质数据库 (PDB) 的一部分。
• 从头折叠使用查询序列的生物物理特性和模拟来确定蛋白质的可能结构。
I-TASSER 在盲研究中的表现
二十年来,两年一度的蛋白质结构预测关键评估 (CASP) 竞赛一直赞助盲目研究,全球约有 100 个参与实验室根据未发表的蛋白质结构测试他们的预测工具。 I-TASSER 赢得了蛋白质结构预测中心最近三次蛋白质结构预测关键评估 (CASP) 实验,时间跨度从 2012 年到现在。
表 1 列出了使用 Z 分数对每个组进行排名的前十个自动化服务器。Z 分数衡量与平均结果相比的预测显著性。I-TASSER 在 CASP 中被称为“Zhang-Server”,其表现始终优于所有其他方法。在 CASP 竞赛中取得的这一坚定不移的成功清楚地表明,I-TASSER 是领先的结构预测方法。
注:本文最后提供了与I-TASSER算法相关的参考文献。
表 1. CASP 10-12 中十个最佳自动预测组的Z分数。

您想亲身体验使用 NovaFold 吗?我们的免费试用软件可让您查看NovaFold 样本结果,并在功能齐全的Protean 3D版本中使用其模型结构。只需:
1) 下载并安装 Lasergene 的免费试用版。导航器打开后,单击其Protean 3D 栏以启动应用程序。
2) 按照本书面教程中的分步说明了解如何查看 NovaFold 的样本预测结果。有关更多信息,请参阅描述结果报告和“详细信息面板”的帮助主题。
3) 将其中一个样本预测作为 Protean 3D 结构打开。有关查看模型结构、格式化、进行选择、导出等信息,请参阅在线 Protean3D 帮助或本教程。
参考文献
1) Kabsch W and Sander C (1983). "Dictionary of protein secondary structure - pattern recognition of hydrogen bonded and geometrical features." Biopolymers 22 - 2577-2637.
2) Moult J (2005). “A decade of CASP: progress, bottlenecks and prognosis in protein structure prediction.” Curr Opin Struct Biol 15: 285-289.
3) Roy A, Kucukural A, Zhang Y (2010). "I-TASSER - a unified platform for automated protein structure and function prediction." Nature Protocols Vol 5, 725-738.
4) Roy A, Yang J, Zhang Y (2012). "COFACTOR - An accurate comparative algorithm for structure-based protein function annotation." Nucleic Acids Research 40 - W471-W477.
5) Ye Y and Godzik A. (2003) "Flexible structure alignment by chaining aligned fragment pairs allowing twists." Bioinformatics19 Suppl 2:ii246-55.
6) Zhang Y (2008). "I-TASSER server for protein 3D structure prediction." BMC Bioinformatics Vol 9, 40.