智力障碍疾病(Intellectual disability,ID)是一类在基因和表型层面上具有显著异质性的疾病。病人除了表现出不同程度的智力障碍以外,还会有其他多种形式的表型特征,以及更加复杂多样的基因特征,这种基因与表型的多样性让智力障碍成为了一类疾病的集合,给研究带来了很大的难度,行业中亟需一种将表型与基因型进行整合的系统生物学资源,为推动相关研究而提供帮助。一项由多个实验室共同参与的工作,贡献了一份经过人工校对的智障关联基因(ID-associated gene,ID-AGs)数据资源,并根据患者的表型以及相关的临床特征对这些基因进行了分类。基于这个整合的数据资源,作者发现这些智障关联基因在共表达、蛋白质互作、特定的生物学功能等方面是显著富集的。文章表明,基于表型的分类方式,以及表型与基因功能模块的对应关系,对于相关的研究有着重要意义。

智力障碍所影响的人群数量约占人口总数的2%,主要的特征表现为智力的显著低下以及认知行为的障碍。因为智力障碍具有高发病率,有限的治疗策略,以及需要长期护理等特点,现在已经成为了一项重要的社会经济学问题以及健康管理难点。从相对常见的学习困难到一些复杂的认知障碍,智力障碍在临床特征方面具有高度的异质性。大量的智力障碍病患是由单基因突变引起的,然而对于这些智障关联基因的认识还非常有限,限制了大家对于此类疾病生物学机制的理解,这同时也是对智障进行早期诊断的一个主要障碍。

✤本文中,智障关联基因的列表来源于OMIM(人类孟德尔遗传在线资源)数据库以及一系列的文献调研。作者根据下面的五个原则,将一部分基因排除在外,所排除的基因作为智障关联的备选基因。

  1. 低可信度。例如,关联基因为新发突变且只在1-2个家系中被发现。
  2. 具有单纯的神经退行性特征。相关病患可能在早期具有正常的认知能力并随后退化。
  3. 早期致死的特征。
  4. 可治愈性。例如,通过后天的激素治疗可治愈的病例。
  5. 神经学表型但是缺少认知损伤的明确表征

经过人工校正之后的数据集包含有650个智障关联基因的信息。其中,101 (16%)个基因与不少于两个特定智障疾病相关;400(62%)个基因为常染色体隐性遗传;139(21%)个基因为常染色体显性遗传(以新发突变为主);103个 (16%)突变为X连锁遗传。

✤为了更加精确地描述这些智障基因之间的一致性与关联,作者从基因的功能注释,基因编码的蛋白之间物理相互作用,以及基因共表达程度三个角度进行了系统分析。以网络的分析为例,智力障碍关联基因展示出了显著的网络模块化特征。蛋白质互作网络的构建,主要基于HPRD和BioGRID两个数据库中的物理相互作用数据。在所构建的网络中,有将近一半的智障相关蛋白,会与另外的智障相关蛋白发生直接的物理相互作用。其中的66个蛋白可以形成彼此之间相互连接的子模块(模块中的蛋白数量从2-4不等),242个智障关联蛋白形成了一个涉及到462个相互作用的独立网络。作者使用一个被称作PIE的计算方法,即生成具有相同总连接度的10000个随机网络作为参考背景,发现真实网络中的子节点具有更高的连接度。也就是说智障相关蛋白所构成的真实网络,节点之间有着更加显著的连接倾向。使用一个R语言工具包linkcomm,对整个网络进行非监督的社群聚类(unsupervised community clustering),得到的网络如图1所示。每个圆圈代表一个内部高度链接的网络模块,相似的颜色代表着更加相似的生物学功能。

blob.png

图1

✤对于智障疾病的临床异质性特征,需要一个系统全面,但对于表型信息又可进行一定程度量化的分类体系。作者设计了一个二分的表型分类系统(bipartite phenotype-based classification system),并且对所有的智障疾病和基因进行了注释。在整个体系中,作者首先根据临床表现、严重程度、外显率、智障的综合征类型四个主要方面,定义了十个主要的临床等级(如图2所示)。智障相关基因分布在这十个不同等级中,从分布最少的等级3(包括19个基因)到分布最多的等级5(包括183个基因)。作者同时建立了一个包含有27个智障伴随出现的表型目录,包括多个器官系统的结构畸形,以及行为和功能的异常。

blob.png

图2

✤作者最后研究了基因、表型与功能模块之前的相关性,将智障关联基因与智障伴随的表型进行层次聚类。ID基因的表型相似性由两方面决定:基因的功能相关度; ID伴随表型的相关度(由其共出现频率(co-occurrence)决定)。基于Gene Ontology的基因功能模块在一些相邻的ID表型中显著富集的结果(如图3所示),涉及到纤毛(红色)、染色质(黄色)、神经突触(青色)、线粒体(蓝色)等四大类,每个类中所涉及到的基因在热图下面的矩形框中。这说明了具有功能相近的基因具有引起类似ID伴随表型的倾向。

blob.png

图3

✤智力障碍表型,生物过程和基因功能的特定组合允许识别特定的ID疾病组合,例如染色质相关的ID疾病,纤毛病和DNA修复中的ID相关缺陷。例如染色质关联疾病,以及DNA修复缺陷。表型的分类可以将智障关联基因进一步区分为一些亚组,组中的基因会表现出显著的生物学意义。本篇工作以及所提供的资源,从系统生物学的角度对智障疾病的分子和临床特征进行了解读,为突破当前智障疾病研究的一些局限性做出了贡献。

供稿人:协云基因 张鑫磊 博士    编辑:生信圈

本文章为生信圈原创文章,转载请联系“生信圈”公众号授权


生信圈致力于每天推送生物信息干货,让大家了解生信行业。旨在通过更多的交流促进行业的发展。我们一直在寻找志同道合的伙伴!投稿邮箱:bioinfor_club@163.com

更多内容请关注我们的官方微信公众号“生信圈”,微信ID:bioinfor-club

 
生信圈二维码.jpg扫一扫二维码关注