Nanopore测序助力癌症结构变异的检

导读研究背景:结构变异(SVs)是导致癌症的基因组不稳定性的标志,包括易位、大的缺失、扩增和突变。SVs通常是驱动因素改变的原因:易位和扩增激活癌基因,缺失和反转使肿瘤抑制基因失活。CDKN2A/p16和SMAD4/DPC4是人类肿瘤中最常见的两种缺失的肿瘤抑制基因(TSGs),在胰腺导管腺癌(PDAC)中,复杂的SVs是这些缺失的一半。敏感地检测循环肿瘤DNA的肿瘤特异性突变,包括小的改变如单碱基替换和大的改变如SVs,对于肿瘤的早期检测,还有癌症病人的治疗监测有重大意义。二代测序的到来为研究小的变异提供了充分的机会,但是由于NGS测序的局限性(测序reads较短),对于大的SV变异研究仍在探索中。因为pair-endreads不仅需要跨越断点,而且考虑到重复区域(包括着丝粒、端粒和其他重复元素)包含了人类基因组的一半以上(56%),这就导致短reads在比对过程中存在较多的错误比对情况发生。纳米孔测序的兴起解决了二代测序reads太短的问题,三代测序可能的长reads(高达2Mb),特别是纳米孔测序。纳米孔测序依赖于与库尔特计数器类似的概念,即从电流变化中读取DNA序列,电流变化是由DNA链穿过嵌入膜中的纳米孔引起的。尽管纳米孔测序目前具有相对较高的错配率,不能进行单碱基突变和小的移码突变检测,但由于其长的读取,其准确性足以用于SV检测。结论:在这篇论文中,作者利用纳米孔测序,检测PDAC癌细胞系中p16和SMAD4TSG失活的结构变异。在PDAC癌细胞系。作者选取10组SV包括大的缺失、易位、倒位以及易位和倒位的复杂组合的样本。这些SVs以前是通过SNP微阵列和全基因组测序(WGS)来定义的,并通过PCR和Sanger测序来确认。作者用含有这些SV的PCR产物稀释到相应的野生型扩增子中,证明了纳米孔测序的原理,并显示了在1:稀释度下检测这些SV的能力。

英文题目:Nanoporesequencingdetectsstructuralvariantsincancer

中文题目:纳米孔测序检测癌症的结构变异

期刊:CancerBiologyTherapy

作者:AlexisL.Norris

材料与方法

材料:胰腺癌细胞的CDKN2A/p16和SMAD4/DPC4基因中选择了10个特征良好的SV细胞系;10例SVs包括间质缺失2例,易位4例,倒位4例,以及1个倒位和易位的组合;野生型(WT)序列(完整基因组序列;没有SV)作为对照,一个SV(SV01)有一个技术重复(SV07)。Keywords:Nanopore测序;

实验结果

一、数据产出

测序共产生了个2Dreads,产生了2.5Mb的测序数据。PCR产物的平均长度为bp,平均PHRED分数为11.50(图1,图2):

图1图2所有样本都比对到hg19的参考基因组上(图3,图4),平均比对率百为98.8%,碱基正确匹配的reads比对率为79%(图2)。图3图4二、Nanopore检测低频SVs的能力

接下来,作者为了确定基于纳米孔的SV检测对低频或罕见事件的敏感性,以模拟临床场景。为此,作者在完整的p16基因组序列背景下对6个SV扩增子进行1:稀释(SV02,图5)。这6个扩增子包括2个简单的间质缺失,2个易位,1个倒位,以及1个倒位和易位的复杂组合。共产生个2Dreads,总产量为2.6Mb,平均读取长度为bp,平均PHRED分数为10.9(图1C-D,图6)。

所有6个SV与hg19的预期比对区域一致(图5)。值得注意的是,即使在SV04中只有个2Dreads,也检测到了SV,个reads中有10个支持9号染色体和10号染色体易位。

图5图6三、SV断点位置检测

为了用这种新的测序方法来确定断点位置检测的准确性,作者首先使用LUMPY软件,这是一种已建立的断点检测工具,用于不一致的成对末端短读测序和长的分割读比对。使用上面BWA生成的比对文件,作者提取reads并将生成的BAM文件输入到LUMPY中。结果见图3和图5。

对于一些样本,LUMPY检测到了正确的断点,并且在WT样本中只检测到一个断点(SV01),或者没有检测到断点(SV02),但是一般来说,它检测到的断点虽然类型正确,但是缺乏精度。在SV01和SV07的重复样本中,检测到相同的正确断点。当简单地检查覆盖率时,没有那么多的证据(由LUMPY决定)支持这个断点,因为LUMPY有严格的映射质量过滤器,可以从考虑中删除一些reads。在许多情况下,LUMPY会在稍微改变的条件下检测到许多断点:在SV03中最多检测到8个断点。

作者更仔细地检查了比对情况,以确定断点位置检测中这些伪影的原因。图4B-G给出了一个问题的提示——仔细检查后发现,reads经常比对超过断点,而大部分错配发生在这些区域内。

讨论

准确及时地检测肿瘤相关改变,包括SVs,对于患者的治疗,从早期发现到监测分子复发,以及确定或预测化疗反应都是重要的。由于污染了正常细胞,肿瘤样本和活检组织中常常出现低肿瘤细胞数,这使得检测变得复杂。肿瘤相关的SVs发生在占人类基因组一半以上的重复区域时更为复杂。纳米孔等第三代测序方法读取重复区域的能力使其成为检测肿瘤相关SVs的理想工具。这项工作作为原理证明,显示了纳米孔测序的能力,以正确和可靠地检测SVs只有数百条reads,而不是数百万次的reads。此外,作者已经证明了纳米孔测序在检测具有良好特征的患者特异性SV重排方面的可行性,该方法使用1:稀释度的野生型序列的体外PCR扩增子混合物。本研究评估的4种SVs包括简单的间质缺失、易位、倒位以及易位和倒位的复杂组合。尽管这项新兴技术的错误率很高(在单碱基水平上),但在检测结构变异上这一点还是可以实现的,因为读取长度相对较长,人类基因组是已知的,而且这种准确度足以正确地映射数百到数千个碱基,即使它们包含多个点突变错误。断点定位的精度仍然有限,但这可以通过生物信息学的方法来解决,方法是优化排列参数或根据纳米孔测序数据的特性进行断点检测。与第二代测序法相比,纳米孔测序法检测SV的主要优势在于:(1)通过重复区域进行测序的能力;(2)速度;(3)成本和可用性低。首先,纳米孔序列的长读取特性(高达2Mb)允许通过重复区域进行读取。即使在深度覆盖的长配对测序中,第二代方法的短读取序列也阻止了重复区域的准确和有效的映射,而重复区域通常包含SV。其次,实时纳米孔测序的速度可以在几分钟内提供结果,允许快速诊断和治疗。第三,纳米孔测序仪的低成本几乎可以在任何环境下进行测试。相比之下,第二代方法的仪器需要大量的前期投资(10万美元)和足够的实验室空间,以满足其巨大的占地面积,这是许多研究和临床实验室所望而却步的。在这里,作者展示了纳米孔测序的能力和可靠性,这是一种第三代测序方法,用于检测特征良好的SVs,并在低水平上模拟临床试验中看到的SVs。重要的是,SV序列在纳米孔测序数据的比对中表现得同样好——从简单的(间质缺失)到复杂的(反转、易位和转移)SV。生物信息学工具需要进一步发展,这些工具可以精确地对准和检测断点位置。这将是至关重要的。

文献下载:



转载请注明:http://www.makingchance.com/jbzl/8616.html

  • 上一篇文章:
  • 下一篇文章: 没有了
  • 网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

    当前时间: