七桥格拉夫TM

基于工作流
为下一代
测序数据

作为线性单倍体DNA序列的人类参考基因组的表示在试图纳入已知的人类种群遗传多样性时存在局限性. 这导致了基于图的引用的发展, 能够自然地表示所有多态性, 包括插入, 删除, 结构变化.

七座桥伯爵™Suite包括生物信息学工作流程和用于二次分析下一代测序(NGS)数据的工具, 基于一个泛基因组图参考. 这些工具能够在不影响速度或成本的情况下,以更高的精度调用变体. 伯爵™使用标准基因组数据格式(FASTA), VCF, FASTQ, BAM, 补习, 床上), 确保与现有工作流的兼容性. 所有七座桥伯爵™工作流程都在CWL 1中指定.0,确保跨各种计算环境的可移植性. 

七桥伯爵™实现: 

  • 通过使用包含数百万个体的群体特定基因组图进行大规模人群研究
  • 通过使用个性化基因组图和家族基因组图来精确分析个体基因组,从而准确地分析个体基因组 新创 基因突变检测
  • 通过使用包含与疾病相关的突变的策划图表进行罕见疾病研究

 

七桥伯爵™套件包括: 

工作流

  • 伯爵™种系变异检测工作流程-使用包含来自世界各地许多人群遗传信息的泛基因组图谱. 工作流以FASTQ方式接受输入读取, 补习或BAM格式, 以BAM或补习格式生成基于图形的对齐, 并以VCF格式输出变量调用. 在这篇博文中, k8彩乐园官方免费下载讨论了与其他线性或基于图的方法相比,k8彩乐园官方免费下载的泛基因组方法的一些基本优势.
  • 伯爵™扩展种系变异检测工作流程-利用一个谱系感知基因组图(i.e. (特定于人口的参考),以便增加对图表参考所表示的人口的敏感性. 工作流还包含一个下游补充部分,该部分合并和注释所有变体并输出单个多样本VCF文件. 了解祖先的方法是针对目标人口研究的一种量身定制的方法. 在k8彩乐园官方免费下载最近的博客文章和预印本中,可以看到非洲人民从中获益的结果.

图的引用

  • 伯爵™泛基因组参考-包含小变异(snp和indel长达几十个碱基对的长度)以及较大的结构变异, 哪些通常难以从短读测序数据中识别. 因此, 图参考提供了准确检测结构变化的方法,从而减少了虚假的变量调用.
  • 伯爵™混合美国参考-策划从一组8,000个样本来自不同的公共数据库,涵盖了整个基因组. 这张图是通过PacBio HiFi读取得到的人群特异性结构变异进行扩充的.
  • 伯爵™非洲参考-从一组超过20策展,从各种公共数据库中收集的000个样本涵盖了整个基因组. 这张图是通过PacBio HiFi读取得到的人群特异性结构变异进行扩充的.
  • 伯爵™东亚参考-从一组超过3策展,从各种公共数据库中收集的000个样本涵盖了整个基因组. 这张图是通过PacBio HiFi读取得到的人群特异性结构变异进行扩充的.
  • 伯爵™欧洲参考-从一组超过34策展,从各种公共数据库中收集的000个样本涵盖了整个基因组. 这张图是通过PacBio HiFi读取得到的人群特异性结构变异进行扩充的.
  • 伯爵™南亚参考-从一组约3策展,从各种公共数据库中收集的000个样本涵盖了整个基因组. 这张图是通过PacBio HiFi读取得到的人群特异性结构变异进行扩充的.

服务

  • 伯爵™构建服务-由生物信息学方法和服务组成,能够构建具有代表性和准确的基因组图谱参考. 这种定制图形的预期用例可以从泛基因组和人口研究到个性化或疾病相关应用.

工具

  • 伯爵™Aligner -根据基因组图参考绘制样本读数, 隐含地考虑在每个位点上许多交替的单倍型, 从而最小化参考偏差.
  • 伯爵™变体呼叫-使snp和INDELs的集成呼叫, 以及存在于基因组图谱中的结构变异.
  • 伯爵™Stats -计算特定于图形的对齐度量,并测量读取对齐中图形引用的利用率, 除了标准的度量,比如覆盖率, 地图上未标明的, 多映射读取计数和不正确的对齐.
  • 伯爵™基因组查看器-一个基因组查看器,可以可视化图形参考和对齐对图形参考的边缘.

 

基因组图谱是一个功能强大的基因组数据结构

七座桥伯爵™Suite利用先进的数据结构来生成有向无环图,是对基因组变异数据如何表示的根本性反思. 不像标准的线性参考, 这种结构利用来自整个种群的信息,以前所未有的准确性表征遗传变异. 图结构具有从每一个新的个体序列中学习的潜力, 这意味着基于图的参考可以随着每一个额外的基因组而改进. 更好的是, 这种改进只在文件大小上有很小的增加, 允许在种群规模上进行基因组分析.

伯爵™Pan Genome Reference将来自种群的基因组数据组织到基于边缘的序列变异图中. 在这样的图中, 边是主要的数据载体元素,可选的单倍型表示为通过图的不同路径. 线性参考装配构成图形主干, 附加的变量作为新的边被添加到图中. 一个更长的基因组单倍型可以通过沿着图的路径并连接访问边所包含的(子)序列来获得. k8彩乐园官方免费下载称这种结构为基因组图.

图谱基因组参考既可以包含小的变异(snp和索引长度可达几十个碱基对),也可以包含较大的结构变异, 使用短读测序技术通常难以识别哪些. 因此, 图引用提供了一个框架,既可以准确地检测结构变化,又可以减少调用小变量时的错误率.

了解如何构建更好的参考基因组

 

图结构支持精确的变量调用 

七座桥伯爵™Suite实现准确的变体调用-确定样本中存在的基因组变体集的过程. 当前最先进的变体调用器是基于在假定变体周围的区域映射的读取的局部重组. 该方法显著提高了变体调用的准确性,但受到重组区域大小选择的限制, 以及预期装配组的大小. 如果这些值设置得太小,可能会遗漏变量. 如果这些值设置得太大,它可能会在计算上令人望而却步.

使用伯爵™可以缓解这些问题, 当读取部分对齐到已知的变体边时,可以更好地自适应选择必要的重组窗口,因为来自图参考的边包含有关其大小的信息. 此外, 伯爵™在变量调用中支持一种完全不同的范式——对于图中存在的变量, 序列和位置信息是已知的, 因此,可以直接根据图进行基因分型.

伯爵™Aligner采用泛基因组图谱结构, 通过用一组已知的变异增加参考基因组而产生, 显著减少参考偏差的影响. 图谱基因组包含了来自各种来源的变体, 包括1,000基因组计划和西蒙斯基因组多样性计划. 通过保留所有的变量信息, 伯爵™有助于比线性替代品更好的校准, 导致更准确的变体调用.

了解更多关于将读取对齐到参考图的信息

资源

 

 

k8彩乐园官方免费下载

友情链接: 1 2 3 4 5 6 7 8 9 10