您现在的位置是:首页 >专题 > 2019-12-12 10:26:00

识别功能性人类磷酸位的机器学习方法

EMBL的欧洲生物信息学研究所(EMBL-EBI)的研究人员创建了迄今为止最大的参考磷酸化蛋白质组,其近120,000个人类磷酸化位点。为了识别最可能危急的人员,他们使用了一种机器学习方法,能够根据功能重要性对其进行排名。

蛋白质是细胞的核心分子机器,可以通过类似于分子开关的蛋白质修饰来调节。蛋白质磷酸化就是这样一种分子开关,它可以改变蛋白质的结构构象,使其活化,失活或改变其功能。尽管进行了数十年的工作,但这些修改的总数以及对生命真正至关重要的修改仍然是一个谜。

这项发表在《自然生物技术》上的研究创造了一种可自由访问的资源,研究人员可以利用该资源更好地了解哪些蛋白质被磷酸化,哪些磷酸位点具有功能相关性。获得这些数据对于加速研究发展为许多不同的生物学过程和疾病具有重大意义。

机器学习和数据共享

EMBL-EBI小组负责人佩德罗·贝尔特拉(Pedro Beltrao)说:“ 如果全世界的科学家不分享他们的研究数据和结果,这种新资源将是不可能的。” “一台机器需要连续500天运行用于创建该数据库的所有质谱实验。通过将机器学习应用于这一庞大的数据集,我们创建了一个评分系统,有望帮助研究人员确定哪些鲜为人知的磷酸位点继续探索。”

EMBL-EBI的研究人员从EMBL-EBI的PRoteomics IDEntifications(PRIDE)数据库中精选了100多个可公开获得的富含磷的人类数据集,其中包含6000多个质谱实验。迄今为止,该大型项目已生成最大的开放获取参考磷酸化蛋白质组数据库。

功能性人类磷酸酯

为了识别对人类细胞最关键的磷酸位点,机器学习被用于整合每个位点的不同注释,例如保守程度。这项研究中产生的磷酸酯功能评分具有巨大的潜力,可以帮助其他科学家发现更多有关他们感兴趣的蛋白质的信息。它可用于对已知的磷酸位点进行排序,以区分与分子过程和疾病在功能上相关的那些位点。

例如,研究人员能够通过鉴定在调节神经元分化中起作用的两个高得分磷酸位点来证明其功能评分模型的实用性。

“通过这项研究创建的功能评分模型可用于发现大量新的,可能在疾病中起关键作用的磷酸位点,” Open Targets项目协调员David Ochoa说。“我们已经知道使用评分模型的几个小组,因此我们希望鼓励各地的研究人员探索资源并加以利用。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

相关文章

点击排行

热门推荐