蛋白质组在过去的十年中已取得了长足的进步,为生物过程、细胞信号传导和蛋白质相互作用提供了越来越多的数据。然而,快速增长的数据量对该领域提出了新的挑战。高通量蛋白质组学中一个瓶颈是难以解释定量结果,对生物学或临床假设的验证提出了考验。因此,我们需要一种集成多种数据类型的解决方案,实现同时获取分子及其对应的疾病表型之间的关系。因此,建立一个基于知识的平台,将一系列数据库和科学文献信息与组学数据集成到易于使用的工作流程,将为发现科学和临床实践提供支持。中科普瑞根据国外技术文献和自有数据二次开发,建立了普鲸临床蛋白质组学数据知识图谱 (SINO Clinical Knowledge Graph,简称SINO-CKG,网址:https://ckg.olink-service.com: 28050),目前包含近 2000 万个节点和 2.2 亿个关系,并结合了统计和机器学习算法,可加速蛋白质组学工作流程的分析和知识挖掘。
SINO-CKG V1.0具有四个独立的功能模块,具体包括模块一:SINO-CKG Analytics Core模块、模块二:SINO-CKG Graphdb Builder模块、模块三:SINO-CKG Graphdb Builder模块、模块四:SINO-CKG Report Manager模块。其实现的功能以统计和数据可视化表示为中心,主要步骤包括:数据准备(过滤、规范化、估算和数据格式化)、数据探索(汇总统计、排名和分布)、数据分析(降维、假设检验和相关性)和可视化;此外还整合了除蛋白质组学之外的其他数据类型的分析(如临床数据、多组学、生物背景和文本挖掘等)。
通过这些模块的综合应用可以为使用Olink、LC-MS/MS等蛋白组学技术的用户提供在线知识库工具,以用户友好的方式从蛋白质组学数据中提取高质量信息。
SINO-CKG Analytics Core模块和SINO-CKG Report Manager模块的展示
模块一:SINO-CKG Analytics Core模块
模块四:SINO-CKG Report Manager模块
专注组学 精准定位 用心服务 帮您实现科研价值
——