1480992521566

乳腺癌是一种异质性很高的肿瘤,包括免疫细胞,基质细胞等,不同的肿瘤患者由于其遗传背景等不同,肿瘤组织中各种细胞的组成也不同,因此,获取肿瘤组织中各种细胞的组成将对疾病的评估给予一定的指导作用。传统的实验方法,例如激光捕获显微切割方法和细胞分选等往往需要对肿瘤组织中的细胞先进行分离然后分析,在操作过程中具有一定的复杂性。而随着测序技术的发展,利用计算分析的方法对组织的转录组,甲基化组等不同层次的组学数据进行分析,进而获取组织中细胞组分的信息则可以很好的克服上述方法的不足。

基于此,最近来自贝勒医学院的Aleksandar Milosavljevic等在Cell reports上报道了一种新的计算方法EDec。EDec通过同时利用肿瘤组织的转录组和表观组数据,可以获取该组织中的细胞组分和各种细胞所对应的甲基化和转录组数据。该方法的具体实现上主要由两个步骤组成:

chen1

 

chen2

图一

首先,作者对模型第一步的性能进行了评估(见图二)。通过利用三个层次的甲基化数据(模拟混合数据,多种细胞系混合数据,肿瘤样品)对结果进行了测试比较。首先在模拟数据和多种细胞混合数据中,预测得到的各种细胞的比例和细胞所属的甲基化数据与参考数据一致性很强。而在肿瘤样品中,预测得到的结果与HE染色的实验结果也具有很好的相关性,说明利用甲基化数据对组织细胞组分的预测具有一定的可行性。

chen3

图二

 在对模型的细胞组分预测结果准确性进行确认以后,作者进一步比较了不同的甲基化检测平台来源数据结果的稳定性。通过对TCGA中分别基于芯片和重亚硫酸盐测序两个不同平台的甲基化数据进行计算比较发现,二种平台的结果具有很高的相关性(R=0.88),这也使得我们可以利用EDec在不同的平台进行计算分析。其次,为了进一步评细胞组分预测结果的准确性,作者对TCGA中同时包含表观组数据和HE染色数据的样品进行计算比较,分析发现:计算得到的结果与实验检测结果同样具有很好的相关性(R=0.90)。

而在对TCGA中所有肿瘤样品的计算得到的结果中,肿瘤组织样品主要由各种肿瘤细胞组成,而在正常组织中,则主要由正常的上皮细胞和基质细胞组成。

chen4

图三

在获取得到肿瘤组织中细胞组成后,作者进一步对组织中各种细胞的转录组数据进行了计算,并对其准确性进行了评估。首先,通过检测发现,在计算得到的上皮细胞,基质细胞和免疫细胞的转录组数据中,各种细胞所对应的特异性分子都具有很好的表达,说明通过该模型预测得到的各种细胞的转录组数据能够很好的代表该细胞在组织中的转录水平。然后,利用不同细胞的转录组数据,作者分别比较在肿瘤组织和正常组织中基因表达水平的差异。分别对上调和下调的基因进行富集分析,在基质细胞中,与胞外基质重塑和血管再生相关的通路出现上调,而与氧化磷酸化相关的通路出现下调;在上皮细胞中,氧化磷酸化和细胞增生的通路出现上调,细胞黏连的通路则出现下调;在免疫细胞中与免疫反应和淋巴细胞激活相关的基因出现上调。这与我们已有的知识能够很好的吻合,这也说明通过此模型计算得到转录组数据具有一定的可行性。

chen5

图四

综上,文章通过建立一种新的计算方法,为基于组学数据的组织细胞信号的分析提出了一种新的视野,拓展了我们的研究范围

参考文献:

Epigenomic Deconvolution of Breast Tumors Reveals Metabolic Coupling between Constituent Cell Types. Cell Reports 17, 2075–2086, November 15, 2016

供稿:苏州系统医学研究所  小陈

编辑:生信圈

本文为原创文章,转载请联系微信公众号“生信圈”


更多内容请关注我们的官方微信公众号“生信圈”,微信id:bioinfor-club生信圈二维码

 扫一扫二维码关注