工作原理
使用Lasergene Genomics和Mastermind ,只需三个应用程序即可获得有意义的变异结果。一旦您确定了感兴趣的变异,您就可以选择在 Lasergene 中进行进一步的下游分析和可视化。

Lasergene Genomics变异分析流程与第 1 章中描述的开源软件或其他商业软件完全不同。有何不同?
Lasergene 无需使用单独的工具,也不需要在每个步骤进行多次手动干预,而是将大部分步骤完全自动化,集成到一个简单的基于向导的应用程序中:SeqMan NGen。阅读以下步骤需要的时间比执行的时间更长,因为通常只需大约 2 分钟即可进行选择并开始组装和变体调用。此后,使用ArrayStar和Mastermind进行变体分析,并可选择在其他完全集成的 Lasergene 应用程序中进行分析和可视化。
入门:SeqMan NGen 中的组装和变异调用
启动SeqMan NGen后,工作流程屏幕(图 1)会提示您选择工作流程。
如果您有原始序列读取数据,请选择变异分析/重新测序工作流程或 RNA-Seq/转录组学工作流程;如果您的数据已经组装好,变异已被检测并保存为 VCF 格式,请选择变异调用格式 (VCF) 文件工作流程。
图 1.SeqMan NGen 的多选项卡工作流程屏幕是该项目的起点。

SeqMan NGen 向导将指导您完成一个或多个样本的设置、自动分组和自动命名 FASTQ 输入文件,以便组装(或 VCF 导入)、变异检测、变异过滤、样本交叉比较和变异注释均可自动运行。SeqMan NGen 支持多种文件类型和读取技术。
您可以选择导入自定义 VCF 文件和/或 BED 文件以将其合并到您的组装中。添加这些文件现在意味着组装的项目将分别包括已知的目标变体和定义的目标区域。这些信息可以用作筛选条件,而无需您在组装后导入其他数据。
选择上传参考序列或使用为常见模型生物提供的精选基因组模板包之一,其中包括人类基因组的许多版本(图 2)。基因组模板包包括带注释的参考染色体和dbSNP数据库。
图 2.SeqMan NGen 可用基因组包的部分列表。

在分析选项屏幕(图 3)中,选择变异调用选项(二倍体、单倍体、体细胞)、性别和初始变异过滤。选中变异注释数据库 (VAD) 框,使用来自多个数据库的数据自动注释任何发现的变异,包括 Mastermind 引用计数和 Mastermind 基因组搜索引擎的超链接。
图3.SeqMan NGen“分析选项”向导屏幕。

您还可以选择检测 CNV 和/或 SV。选择这些选项会生成一个组装项目,其中包括组装数据、过滤后的变体调用、CNV、SV 和大量变体注释。
按照指导步骤在本地或云端启动组装。组装完成后,继续在ArrayStar中打开项目以分析结果。
图 4. ArrayStar 的“实验列表”屏幕。

使用 ArrayStar 查找重要变体
ArrayStar 使用多功能过滤工具和丰富的图形和表格显示来自动执行步骤 5-6,这些图形和表格显示了上下文中的变体结果。首先使用高级过滤工具过滤掉不感兴趣的变体,只留下值得进一步研究的变体。请参阅下一章,了解如何应用变体过滤的示例。
接下来,转到变体表(图 5),该表已准备好进行分析,您可以轻松添加(或删除)包含每个变体信息的数据列。如果您选中了 SeqMan NGen 中的 VAD 框,则有数百列可供选择。其中许多都包含指向数据库中变体的数据库条目的链接,例如 Mastermind 基因组搜索引擎、ClinVar、dbSNP、1000 基因组计划、基因本体论联盟 (GO)、GERP、MutationTaster、PhastCons、dbNSFP 等。
ArrayStar是我们所知的唯一一款可以自动进行跨样本分析的工具。如果在一个样本中检测到变异,该应用程序会交叉检查同一位置的所有其他样本,并将状态(变异、无变异调用、无覆盖)报告为变异表列。
图 5. ArrayStar 的变量表显示可定制的数据列的选择。

使用 Mastermind 进一步探索变体
ArrayStar 还提供了Genomenon 强大的 Mastermind 基因组搜索引擎,这是一个全面的基因组学数据库,旨在成为面临数据不确定性的分析师的必备资源。Mastermind 可让您快速轻松地搜索和交叉引用数百万篇 PubMed 文章中的变异数据。此外,Mastermind 还提供了数百万个未包含在 HGMD 等数据库中的变异条目,并以更高的精度区分它们。
Mastermind 可让您访问数百万篇全文文章,涵盖已发表基因组证据的整个广度和深度。使用专利算法,Mastermind 可让您以高特异性筛选和优先排序相关文章,而不会影响灵敏度。此外,Mastermind 能够绘制关键词(例如基因、变异、疾病、CNV、表型和疗法)之间的遗传关联,并提供针对您的特定案例定制的分段文献输出。
成功使用此工具将为您感兴趣的变体提供非常有用的证据。另一方面,如果您的结果在 Mastermind 中有限,那么您可以放心,数据有限。
Lasergene中的可选分析
在使用 ArrayStar 和 Mastermind 识别重要变异后,您可以使用其他集成的 Lasergene 应用程序来可视化您的组装读取比对和覆盖率和/或蛋白质结构上的模型突变(参见第 2 章中的步骤 7)。
总结本节,我们提供了一个表格,对比了使用 DNASTAR 软件和竞争软件进行变异分析所需的时间和步骤数。在下一章中,我们将向您展示一个示例,说明如何结合 ArrayStar 和 Mastermind 中的过滤功能来定位临床测序数据中感兴趣的变异。
