在寻找致病基因位点的NGS数据分析中,最重要的一步是筛选候选致病位点。一般的筛选过程是剔除非编码区变异,剔除同义突变,剔除高频突变等,此时结果往往会保留数百个或数千个候选致病位点。而在这些保留的突变位点,大部分是错义突变,氨基酸发生了改变,要判断这种改变是否有危害性,我们往往会借助于一些预测危害性的软件,如SIFT、CADD、PolyPhen-2、MetaLR等等,但是这些软件预测的准确性并不高,且这么多预测软件,到底以哪一个结果为主?这让我们分析人员很为难。今天小编给大家推荐两个效果不错的软件:M-CAP(Mendelian clinically applicable pathogenicity)和REVEL(Rare exome variant ensemble learner),这两个软件都是2016年10月分别发表在《nature genetics》(pmid:27776117)和The American Journal of Human Genetics(PMID:27666373)。

关于两个软件的算法就不多介绍了,直接看这两个软件和其他软件的整体实力对比图。

从两个ROC曲线图可以看出M-CAP和REVEL的AUC值均高于其它软件。在两个软件的文献中,作者还用了多个测试数据对他们的软件进行评估,均表现出较好的预测效果。(关于这两个软件的对比,小编暂时没有做过对比测试)
既然两个软件效果这么好,那我们该怎么用呢?很简单,在Annovar更新的信息中已经将两个软件整合,只需按照Annovar官网上的数据库下载方式获取你所需要的版本即可,具体的注释使用命令如下:

注释的结果是对突变位点危害性的SCORE值,预测值从0到1,越接近1越可能有害。在文章中,推荐的M-CAP阈值为0.025,即作者认为当SCORE值大于0.025时,该突变位点可能为有害变异。而REVEL文章中,作者并没有给出阈值,但文中倾向于将阈值设置为0.5。


本文为生信圈原创,转载请联系授权

扫一扫关注生信圈公众号,微信ID:bioinfor-club。更多生信干货等着您