Nanopore测序助力癌症结构变异的检
英文题目:Nanoporesequencingdetectsstructuralvariantsincancer
中文题目:纳米孔测序检测癌症的结构变异
期刊:CancerBiologyTherapy
作者:AlexisL.Norris
材料与方法
材料:胰腺癌细胞的CDKN2A/p16和SMAD4/DPC4基因中选择了10个特征良好的SV细胞系;10例SVs包括间质缺失2例,易位4例,倒位4例,以及1个倒位和易位的组合;野生型(WT)序列(完整基因组序列;没有SV)作为对照,一个SV(SV01)有一个技术重复(SV07)。Keywords:Nanopore测序;实验结果
一、数据产出测序共产生了个2Dreads,产生了2.5Mb的测序数据。PCR产物的平均长度为bp,平均PHRED分数为11.50(图1,图2):
图1图2所有样本都比对到hg19的参考基因组上(图3,图4),平均比对率百为98.8%,碱基正确匹配的reads比对率为79%(图2)。图3图4二、Nanopore检测低频SVs的能力接下来,作者为了确定基于纳米孔的SV检测对低频或罕见事件的敏感性,以模拟临床场景。为此,作者在完整的p16基因组序列背景下对6个SV扩增子进行1:稀释(SV02,图5)。这6个扩增子包括2个简单的间质缺失,2个易位,1个倒位,以及1个倒位和易位的复杂组合。共产生个2Dreads,总产量为2.6Mb,平均读取长度为bp,平均PHRED分数为10.9(图1C-D,图6)。
所有6个SV与hg19的预期比对区域一致(图5)。值得注意的是,即使在SV04中只有个2Dreads,也检测到了SV,个reads中有10个支持9号染色体和10号染色体易位。
图5图6三、SV断点位置检测为了用这种新的测序方法来确定断点位置检测的准确性,作者首先使用LUMPY软件,这是一种已建立的断点检测工具,用于不一致的成对末端短读测序和长的分割读比对。使用上面BWA生成的比对文件,作者提取reads并将生成的BAM文件输入到LUMPY中。结果见图3和图5。
对于一些样本,LUMPY检测到了正确的断点,并且在WT样本中只检测到一个断点(SV01),或者没有检测到断点(SV02),但是一般来说,它检测到的断点虽然类型正确,但是缺乏精度。在SV01和SV07的重复样本中,检测到相同的正确断点。当简单地检查覆盖率时,没有那么多的证据(由LUMPY决定)支持这个断点,因为LUMPY有严格的映射质量过滤器,可以从考虑中删除一些reads。在许多情况下,LUMPY会在稍微改变的条件下检测到许多断点:在SV03中最多检测到8个断点。
作者更仔细地检查了比对情况,以确定断点位置检测中这些伪影的原因。图4B-G给出了一个问题的提示——仔细检查后发现,reads经常比对超过断点,而大部分错配发生在这些区域内。
讨论
准确及时地检测肿瘤相关改变,包括SVs,对于患者的治疗,从早期发现到监测分子复发,以及确定或预测化疗反应都是重要的。由于污染了正常细胞,肿瘤样本和活检组织中常常出现低肿瘤细胞数,这使得检测变得复杂。肿瘤相关的SVs发生在占人类基因组一半以上的重复区域时更为复杂。纳米孔等第三代测序方法读取重复区域的能力使其成为检测肿瘤相关SVs的理想工具。这项工作作为原理证明,显示了纳米孔测序的能力,以正确和可靠地检测SVs只有数百条reads,而不是数百万次的reads。此外,作者已经证明了纳米孔测序在检测具有良好特征的患者特异性SV重排方面的可行性,该方法使用1:稀释度的野生型序列的体外PCR扩增子混合物。本研究评估的4种SVs包括简单的间质缺失、易位、倒位以及易位和倒位的复杂组合。尽管这项新兴技术的错误率很高(在单碱基水平上),但在检测结构变异上这一点还是可以实现的,因为读取长度相对较长,人类基因组是已知的,而且这种准确度足以正确地映射数百到数千个碱基,即使它们包含多个点突变错误。断点定位的精度仍然有限,但这可以通过生物信息学的方法来解决,方法是优化排列参数或根据纳米孔测序数据的特性进行断点检测。与第二代测序法相比,纳米孔测序法检测SV的主要优势在于:(1)通过重复区域进行测序的能力;(2)速度;(3)成本和可用性低。首先,纳米孔序列的长读取特性(高达2Mb)允许通过重复区域进行读取。即使在深度覆盖的长配对测序中,第二代方法的短读取序列也阻止了重复区域的准确和有效的映射,而重复区域通常包含SV。其次,实时纳米孔测序的速度可以在几分钟内提供结果,允许快速诊断和治疗。第三,纳米孔测序仪的低成本几乎可以在任何环境下进行测试。相比之下,第二代方法的仪器需要大量的前期投资(10万美元)和足够的实验室空间,以满足其巨大的占地面积,这是许多研究和临床实验室所望而却步的。在这里,作者展示了纳米孔测序的能力和可靠性,这是一种第三代测序方法,用于检测特征良好的SVs,并在低水平上模拟临床试验中看到的SVs。重要的是,SV序列在纳米孔测序数据的比对中表现得同样好——从简单的(间质缺失)到复杂的(反转、易位和转移)SV。生物信息学工具需要进一步发展,这些工具可以精确地对准和检测断点位置。这将是至关重要的。文献下载:
转载请注明:http://www.makingchance.com/jbzl/8616.html