CancerLocator使用cfDNA

CancerLocator:使用cfDNA的甲基化谱进行非侵入性癌症诊断和原组织预测方法

17年3月24日,加利福尼亚大学洛杉矶分校的XianghongJasmineZhou教授团队在国际学术权威刊物《GenomeBiology》杂志上在线发表了的一篇方法性论文。他们提出了一种概率方法,CancerLocator,它利用了cell-freeDNA的诊断潜力,不仅确定肿瘤的存在而且确定肿瘤的原发位置。CancerLocator通过使用全基因组DNA甲基化数据同时推测血液样品中肿瘤衍生的cfDNA的比例和组织来源。

他们将癌症患者血浆中的cfDNA看作为正常背景DNA和肿瘤释放DNA的混合物。表示为xk=(1-θ)vk+θuk,vk和uk分别代表正常血浆和实体肿瘤组织的甲基化水平。对于每个CpG簇k,将其在类型t的样品中的甲基化水平模拟为Beta分布:正常血浆样品(t=0)为vk?β(αk0,βk0),实体肿瘤样本为uk?β(αkt,βkt),通过整合两个Beta分布(vk和uk),xk可以通过给定ctDNA负担θ和源肿瘤类型t的派生分布来建模。

由于血浆中cfDNA的丰度低,通常通过基于测序的方法测定cfDNA的甲基化谱,CpG簇k的甲基化水平(xk)可以通过read中的甲基化和非甲基化胞嘧啶的数量来表征。令M=(m1,m2,...,mK)和N=(n1,n2,...,nK)为分别映射到所有CpG位点的甲基化胞嘧啶的数量和胞嘧啶的总数。对于每个CpG簇k,mk可以通过二项分布来建模:mk?Binomial(nk,xk)。通过整合方程1的xk的混合模型,对于具有来自模型参数(θ,t,αk0和βk0,αkt和βkt)的输入的每个CpG簇k和血浆样品的序列测量(mk,nk),具有似然函数:

给定患者血浆cfDNA样品的甲基化测序谱,向量M和N,问题就变成如何找到两个模型参数的最大似然估计问题:样本的cfDNA肿瘤负担θ及其源肿瘤类型t。对数似然函数可以写为:

在得到最大化方程式3的解(^θ和^t)之后,使用估计参数来计算一个简单而有效的预测分数,来回答两个问题:“患者有癌症吗?和“如果患者有癌症,是哪种肿瘤类型?”该预测分数定义如下:

CancerLocator在模拟和真实数据应用上都优于两种稳健的多类分类方法,随机森林和支持向量机,即使在cfDNA中肿瘤衍生DNA的比例较低。CancerLocator也在具有低DNA甲基化测序覆盖率的患者血浆样品中也获得了较好的结果。

参考文献

KangS,LiQ,ChenQ,ZhouY,ParkS,LeeG,GrimesB,KrysanK,YuM,WangW,etal:CancerLocator:non-invasivecancerdiagnosisandtissue-of-originpredictionusingmethylationprofilesofcell-freeDNA.GenomeBiol,18:53.

译文:ZhangS.M.

编辑:cepi-3

通讯邮箱:ad.cepi

edbc.org

投稿邮箱:scw.cepi

edbc.org



转载请注明:http://www.makingchance.com/jbzd/7551.html

网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

当前时间: