高通量测序技术的两大挑战
摘要:DTC测序公司的全基因组测序服务往往有着大相径庭的结果,有效反映了目前行业对于测序与数据分析标准的缺失
在生物信息学方面,共有18家实验室向国际癌症基因组联盟提交了体细胞单碱基突变分析,16家实验室提交了插入或缺失结果。虽然国际癌症基因组联盟拥有与之相关的黄金标准,但其标准仍然只能够涵盖所有实验室不到四分之一的体细胞单碱基突变与347个插入或缺失中的1个。
测序结果的分析主要有以下四个特点:
1.染色体上均衡分布的突变绝大多数为真阳性,少数为假阳性;
2.均衡分布的突变中具有许多假阴性位点;
3.假阳性簇临近着丝粒;
4.聚集突变具有较高的假阳性率。
相关的研究结果证明测序工具的选择对突变位点的精确辨析有着巨大的影响。同时,肿瘤细胞的相对含量对于突变位点的精确辨析也有着巨大的影响。即使是对经验丰富的实验室来说,全基因组测序突变筛查仍然是一项容易出错的工作,全基因组和全外显子测序离临床实验室的应用标准还有着一定的距离,相关临床工具的开发工作应该在相关机构的指导下得到有效开展。
为此,Alioto和他的同事们对测序事业的相关工作者提出了以下几点要求:
1.进行全基因组测序前避免对基因组进行PCR扩展,防止扩增引起的错误;
2.肿瘤样本的测序覆盖深度应高于100X;
3.生殖细胞系基因组测序深度应与其他类型肿瘤一致;
4.结合使用多种定位与多样的筛查软件;
5.应用多种突变筛查技术;
6.对重复序列中的突变进行修正;
7.根据序列质量、制图效果以及链偏好性对序列进行过滤处理,同时使用参照基因组对序列质量进行有效控制。
对比显示,DTC测序产品的检测结果往往更加具有挑拨性。Corpas等人将一个西班牙家庭一家四口(爸爸妈妈,儿子女儿)的样本分别送至四家DTC测序公司进行全基因组分析,他们发现这四家公司的测序报告在至少一位家庭成员中存在明显的差异。即使是与样本最匹配的部分,四家公司的测序结果中仍鲜有重叠。四家公司中的三家报道了三位或四位家庭成员存在多个变异,而另一家公司报道仅仅一位家庭成员基因组发生变异。
这项研究说明DTC测序公司的全基因组测序服务往往有着大相径庭的结果,有效反映了目前行业对于测序与数据分析标准的缺失,不同测序机构难以产出一致且有效的报告。“消遣性测序”的准确性应该受到质疑,相关的循证研究对于行业的可持续发展具有积极意义。