多组学服务

——

打印本文             

一、多组学分析  

生命现象的发生和调控过程是极其复杂的,在肿瘤、自身免疫疾病、代谢疾病等复杂疾病的发生发展过程中,在干细胞分化、胚胎发育与物种进化等生命现象中,会涉及到基因组、转录组、蛋白质组及表观遗传等多层面的变化及调控。在大数据时代,将多个组学数据结合起来的整合研究——多组学(Multi-omics)研究,是一大趋势。

对于一个复杂的疾病或生命现象的研究,要综合考虑其表型以及生理生化指标以及基因组、转录组、蛋白质组、表观遗传及代谢组等多层面的变化。将上述多组学的数据整合分析,以掌握其全局的变化过程,为研究其调控机制和精准医疗提供综合解决方案。


二、从多组学研究到系统生物学研究解决方案


blob.png



三、多组学项目方案设计策略  技术的选择与实验设计

多组学项目的方案设计要对要研究的疾病与现象深入了解与分析,根据不同的疾病在基因组、转录组和表观层面侧重合理选择适合技术。例如通过对3299份来自于12种实体瘤的样本的研究表明,肿瘤可以分为M class (mutation driven,突变驱动) 和C class (copy number driven,拷贝数变异驱动) 两类,其中C class的肿瘤主要有卵巢癌、乳腺癌、肺(鳞)癌及头颈癌等,此类肿瘤可以把重点放在拷贝数的研究中。所以根据疾病是否涉及基因组层面的变异或变异的侧重点,在基因组层面上选择外显子测序或CNV芯片技术,另外可以根据疾病是否有可能影响到DNA甲基化、组蛋白修饰,以确定是否加入表观层面的分析。


blob.png

:不同类型的疾病在基因组变异、主要突变基因以及甲基化修饰等层面上各有主要的驱动因素。


另外,还要根据疾病发病机制、以及样本取材的不同部位,标本总量等特点,选择合适的技术平台;根据疾病的复杂程度,异质性以及个体差异选择好样本分组、入组数目与分析设计。公司在多年的科研服务中建立了全面的多组学技术平台并积累了丰富的多组学实验设计及分析经验。


blob.png


四、多组学项目方案设计策略  多组学数据的整体展示

多组学的数据分析,不是单独对几个组学数据的罗列和展示,关键是在分析中整合分析项目中涉及到的基因组、转录组或表观遗传等层面的数据,展示出不同层面的相互作用与调控关系,以帮助研究者从全局上把握疾病发展中的内在变化,进而聚焦到关键的通路及基因。


²热图展示

在下图中将甲基化、mRNA与lncRNA三种数据整合成一张热图,图中的每一行不但代表了一个特定的基因的表达以及此基因对应的甲基化修饰,还体现了数据库中有调控关系的lncRNA与mRNA的相互关系。在图中,能够看到甲基化对mRNA与lncRNA的转录前的负调控作用,以及lncRNA对mRNA的转录前及转录后的正调控及负调控作用。同时,在图中还可以看到单个样本在的甲基化和转录上的个性特征。直观的展示了不同层面的差异表达基因和差异修饰位点的相互关系,同时为进一步的数据挖掘提供了指导。


blob.png

图: 热图展示甲基化修饰与转录组的mRNA、lncRNA表达间的调控作用,以及lncRNAmRNA靶基因的相互关系。


²染色体图展示

在多组学的分析分析中,不但可以根据靶基因的相互作用将不同层面的数据整合分析,也可以单纯地通过位置关系将不同组学的数据相结合。如下图中,通过CNV、基因表达与甲基化修饰的位置关系,将三个组学的数据有机的结合起来,分析CNV对于表达的剂量效应,以及甲基化对于基因表达的调控作用。


blob.png

图: 染色体图展示CNV、基因表达与甲基化修饰间的相互关系。


²圈图展示

也可以用Circos plot以圈图从整体上展示全基因组水平上的甲基化水平及基因表达差异,也可以将CNV甚至是SNV也同时展示出来。

blob.png

图:  全基因组水平上展示甲基化修饰、ncRNA以及基因表达水平(圈图展示)。


五、多组学项目方案设计策略  多组学数据的分型及整合分析

多组学的数据分析,会得到多个层面的数据,这些数据都可以分别用非监督聚类的办法对疾病的亚型分型。但分别针对不同分子层面的聚类会得到不同的聚类结果,而且有些样本在不同的聚类中会分配到不同的亚型,所以推荐将多组学的数据整合考虑,得到综合的分型结果。在理想的联合分析中不但要综合考虑到不同层面的分子的变异还要考虑到不同变异间相互关系,进而分析不同层面分子的上调、下调或激活、抑制等相互作用。例如,CNV的增加可能会增加基因的表达,DNA的甲基化可能会抑制基因表达,SNV对AA编码的改变或终止密码子的出现会不同程度地影响蛋白的功能,虽然mRNA水平上没有改变,但功能的失活会影响pathway中的下游基因。不同层面的整合分型以及基因通路激活抑制的联合分析构成了多组学数据挖掘的核心。可以采用的分析方法包括:基于已经发表文献知识数据库的Integrated Pathway Activities(IPA)分析;基于网络分析的PAthway Recognition Algorithm using Data Integration on Genomic Models (PARADIGM) ,PARADIGM可实现不同层次表达以信号通路程度展示;此外常用的方法还有基于序贯分析(sequential analysis)的Consensus clustering以及Integrative clustering等方法。

blob.png


六、多组学项目方案设计策略  多组学数据的进一步挖掘与展示

多组学数据分析中的另一大难点是在错综复杂的数据寻找到最核心的通路与驱动基因。中科普瑞已建立了从基础的GO与pathway富集到共表达网络与ceRNA调控网络,以及GSEA与WGCNA分析,到利用收费数据库的IPA分析,提供了一整套分析方案和思路去挖掘各个组学中的关键基因与通路。同时利用多个层面数据间的相互关系,寻找相互具有调控关系的位点或基因。再通过复杂的网络图,将基因组变异、基因表达差异,甲基化修饰差异以及基因间的相互作用在同一张图上展示出来。


blob.png


图:网络图示例,展示在基因组、转录组以及甲基化修饰等层面有差异的基因间的相互作用关系。


多组学的数据分析中,最后会得到一些关键的基因,如果是以基因组为侧重点的分析,得到的关键基因除了用网络图展示外,还可以变异总览图(compact visualization of genomic alerations),可以将不同层面发生了变异的基因以及在不同样本中的变异情况整体展示。


blob.png

图:网络图示例,展示在基因组、转录组以及甲基化修饰等层面有差异的基因间的相互作用关系。


此外还可以对于关键通路以及基因表达水平、甲基化修饰或基因组水平变异的联合展示。通过热图与网络图相结合等形式,将差异的表达、甲基化修饰或基因组变异与关键的变化通路整合展示。集中展示关键基因、关键通路及其相互关系。


blob.png

图: 对于关键通路以及基因表达水平、甲基化修饰或基因组水平变异的联合展示。


七、中科普瑞多组学科研服务目录


未标题-7.jpg



服务/产品FOCUS ON OMICS BRAND POSITIONING HELP YOU REALIZE THE VALUE OF RESEARCH BRAND

专注组学 精准定位 用心服务 帮您实现科研价值

——