DNASTAR 和 Resonant Therapeutics 近期合作,利用 RNA-Seq Illumina 读取来研究使用 2D 和 3D 培养物培养的卵巢癌细胞 (OVCAR-2 细胞系) 中的基因表达差异。如果您不熟悉这些术语,2D 培养物是指在培养皿中培养细胞,而 3D 培养物则生长在模拟肿瘤微环境的基质上。在本研究中,我们展示了如何快速将大量数据集缩减为三个感兴趣的变体,然后展示了 Genomenon 的 Mastermind 基因组搜索引擎在探索有害变体方面的实用性。
在 SeqMan NGen 中设置并运行组装
使用SeqMan NGen将来自多个重复的 Illumina RNA-Seq 数据与 GRCh38. p2 人类基因组包对齐。除了读取对齐之外,在组装过程中还自动执行以下步骤:
- 使用二倍体模型来调用 SNP 和其他小变异
- 使用变体注释数据库 (VAD) 对变体进行注释
- 使用 DESeq2 计算差异基因表达值
这项研究涉及癌细胞,因此可以理解癌细胞中存在大量突变。在组装过程中,SeqMan NGen 检测到了 965,209 个变异。
ArrayStar 中的筛选变体
在 SeqMan NGen 中组装后,我们使用ArrayStar中的高级过滤功能来识别所有六个实验中发现的符合以下标准的变异(下一页图 6):
- 常规选项卡 – 仅限非同义 SNP
- 统计选项卡 – Pnotref > 90%,SNP% > 15,深度 > 20
- 致病性标签 – 在 ClinVar 数据库中标记为致病性或可能致病性
图 6. ArrayStar 的“高级过滤”对话框中所做的选择。

图 6a.过滤对话框。

图 6b.应用非同义词过滤器的常规过滤选项。

图 6c.统计 SNP 过滤选项。

图 6d.应用 ClinVar 过滤器的致病性过滤选项。
ArrayStar 发现了三种符合所有标准的变体(图 7)。
图 7. ArrayStar 筛选后发现的三种感兴趣的变体。

查看变体表中的这些结果,我们能够看到 SNP 碱基和参考碱基、在 Mastermind 中找到的文章数量、指向该证据的链接、clinvar_trait 和 MutationTaster_pred。为了便于阅读,变体表被分成两半以创建两个图(图 8 和 9)。
图 8. ArrayStar 的变体表最左边的列。

图 9. ArrayStar 变体表最右边的列,以及所选变体的工具提示和详细信息面板的视图。
使用 Mastermind 探索基因组关联
请注意,KRAS 基因中的变异(三个变异中的中间一个)有超过 4,300 次 Mastermind 引用。这个众所周知的变异位于 12 号染色体的 25245350 位置,导致 KRAS 蛋白发生 G12V 变化,是所研究肿瘤背后的关键驱动突变。除了 ClinVar 中该 SNP 的两星状态外,请注意 VAD 中存在的所有三种功能预测方法也将其标记为有害。如工具提示底部附近所示,该 KRAS 基因突变与多种癌症有关。
ArrayStar 包含一个指向 Mastermind 的直接链接,我们可以在那里查看已知 KRAS 突变的条目(图 10)。
图 10.KRAS G12V 变体的 Mastermind Professional Edition 登陆页面。

通过优先排序和过滤优化输出
上一页的图片显示了引用此变体的 4,300 余篇出版物的完整列表。然后可以通过添加表型关键词来集中文献库。在本例中,当应用“卵巢癌”时,参考文献数量减少到 140 篇文章(图 11)。
图 11.应用 Mastermind KRAS G12V 和卵巢癌表型。

可以使用其他过滤器进一步优化此搜索,包括“遗传机制”选项卡中的表达过滤器(图 12)。
图 12.包括表情的 Mastermind Filters。

这将结果集中在65 篇高度相关的文章上(图 13)。
图 13: Mastermind KRAS G12V 按表型、表达和相关性进行过滤。

显示的文章按相关性排序,出版历史窗格中较大的圆圈表示最相关的文章。相关性由几个因素决定,包括但不限于:
- 每篇文章中提到基因(“KRAS”)和变体(“G12V”)名称的次数,这些术语是否出现在标题、摘要和/或全文或补充信息中,以及通过过滤过程应用的与表型和其他关键词的接近度。
通过查看句子片段中突出显示的所有匹配项,您可以在“全文匹配”部分中查看所有这些元素。
揭示与基因组关联的数据联系
由于遗传疾病的性质极其复杂,且导致其致病性的因素多种多样,因此,明确您感兴趣的搜索条件之间的相互关系是非常有益的。Mastermind 中的基因组关联功能可让您探索可能被遗漏或无法识别的重要遗传关联,让您能够发现可能导致新假设、研究发现甚至解决临床病例的关键数据。
进一步举例,假设您有兴趣探索与 KRAS p.G12V 突变相关的卵巢癌治疗方案。点击蓝色的“探索关联”框(图 14)会将您引导至一个灵活的界面,该界面将您的搜索关键字与医学证据中的所有相关遗传因素联系起来。
图 14. Mastermind 页面上的探索关联框。

在本例中,“疗法”选项卡显示了优先考虑的文章,涵盖了 KRAS p.G12V 相关卵巢癌的治疗干预。如图 15所示,就文章数量而言,排名前三的药物疗法是:
- 紫杉醇
- 司美替尼
- 卡铂
图 15。 “疗法”选项卡中,前三种药物疗法以橙色框出。
了解特定基因变异的治疗方法有助于在假设形成和研究设计过程中聚焦重点。然而,最重要的是,这种宝贵的洞察力可以显著影响临床决策,提高患者护理的精准度。
最后,尽管这些面向患者的应用程序引人注目,但它们只代表了这项技术全部潜力的一小部分:正如其他五个关联标签所证明的那样,Lasergene 和 Mastermind 用户还有更多的潜力有待发现。