人工智能开启生物学新领域
加州大学圣地亚哥分校的研究人员介绍了多尺度集成细胞 (MuSIC),这是一种结合显微镜、生物化学和人工智能的技术,揭示了以前未知的细胞成分,可能为人类发育和疾病提供新线索。(艺术家的概念图。)图片来源:加州大学圣地亚哥分校健康科学
基于人工智能的技术揭示了以前未知的细胞成分,可能为人类发育和疾病提供新线索。
大多数人类疾病都可以追溯到细胞的故障部分——例如,肿瘤之所以能够生长是因为基因没有准确地转化为特定的蛋白质,或者是因为线粒体不能正常激发而出现代谢疾病。但要了解细胞的哪些部分会在疾病中出现问题,科学家首先需要有一个完整的部分列表。
通过将显微镜、生物化学技术和人工智能相结合,加州大学圣地亚哥分校医学院的研究人员和合作者已经采取了他们认为可能在理解人体细胞方面取得重大进展的成果。
该技术被称为多尺度集成单元 (MusIC),于 2021 年 11 月 24 日在Nature 杂志上进行了描述。
“如果你想象一个细胞,你可能会在细胞生物学教科书中描绘出彩色的图表,包括线粒体、内质网和细胞核。但这就是故事的全部吗?绝对不是,”加州大学圣地亚哥医学院和摩尔癌症中心教授 Trey Ideker 博士说。“科学家们早就意识到,我们不知道的比我们知道的要多,但现在我们终于有办法更深入地研究了。”
Ideker 与瑞典斯德哥尔摩 KTH 皇家理工学院和斯坦福大学的 Emma Lundberg 博士一起领导了这项研究。
左图:经典的教科书单元图意味着所有部分都清晰可见并已定义。(来源:OpenStax/维基媒体)。右图:由 MuSIC 技术生成的新细胞图揭示了许多新组件。金色节点代表已知单元组件,紫色节点代表新组件。节点的大小反映了该组件中不同蛋白质的数量。学分:加州大学圣地亚哥分校健康科学
在试点研究中,MuSIC 揭示了人类肾细胞系中包含的大约 70 种成分,其中一半以前从未见过。在一个例子中,研究人员发现了一组形成不熟悉结构的蛋白质。他们与加州大学圣地亚哥分校的同事 Gene Yeo 博士合作,最终确定该结构是一种结合RNA的新蛋白质复合物。该复合物可能参与剪接,这是一种重要的细胞事件,可以将基因翻译成蛋白质,并有助于确定哪些基因在何时被激活。
细胞内部——以及在那里发现的许多蛋白质——通常使用以下两种技术之一进行研究:显微镜成像或生物物理关联。通过成像,研究人员将各种颜色的荧光标签添加到感兴趣的蛋白质中,并在显微镜的视野中跟踪它们的运动和关联。为了研究生物物理关联,研究人员可能会使用一种特定于蛋白质的抗体将其从细胞中拉出,看看还有什么附着在它上面。
多年来,该团队一直对绘制细胞内部运作图感兴趣。MuSIC 的不同之处在于使用深度学习直接从细胞显微镜图像中映射细胞。
“这些技术的结合是独特而强大的,因为这是第一次将不同尺度的测量结果结合在一起,”该研究的第一作者、Ideker 实验室的生物信息学和系统生物学研究生 Yu Qin 说。
显微镜可以让科学家看到一个微米的水平,大约是一些细胞器的大小,比如线粒体。较小的元素,例如单个蛋白质和蛋白质复合物,无法通过显微镜看到。从单一蛋白质开始的生物化学技术使科学家能够深入到纳米尺度。(一纳米是一米的十亿分之一,或一微米的 1/1,000。)
“但是你如何弥合从纳米到微米尺度的差距?长期以来,这一直是生物科学的一大障碍,”Ideker 说,他也是加州大学癌细胞图计划和加州大学圣地亚哥计算生物学和生物信息学中心的创始人。“事实证明,你可以使用人工智能来做到这一点——查看来自多个来源的数据,并要求系统将其组装成细胞模型。”
该团队训练了 MuSIC 人工智能平台来查看所有数据并构建细胞模型。该系统尚未将单元格内容映射到特定位置,例如教科书图表,部分原因是它们的位置不一定是固定的。相反,组件位置是流动的,并且会根据细胞类型和情况而变化。
Ideker 指出,这是一项测试 MuSIC 的试点研究。他们只研究了 661 种蛋白质和一种细胞类型。
“明确的下一步是吹过整个人体细胞,”艾德克说,“然后转移到不同的细胞类型、人和物种。最终,通过比较健康细胞和患病细胞之间的差异,我们或许能够更好地了解许多疾病的分子基础。”
参考:
Yue Qin、Edward L. Huttlin、Casper F. Winsnes、Maya L. Gosztyla、Ludivine Wacheul、Marcus R. Kelly、Steven M. Blue、Fan 的“融合蛋白质图像和相互作用的细胞结构多尺度图”郑、Michael Chen、Leah V. Schaffer、Katherine Licon、Anna Bäckström、Laura Pontano Vaites、John J. Lee、Wei Ouyang、Sophie N. Liu、Tian Zhang、Erica Silva、Jisoo Park、Adriana Pitea、Jason F. Kreisberg、 Steven P. Gygi、Jianzhu Ma、J. Wade Harper、Gene W. Yeo、Denis LJ Lafontaine、Emma Lundberg 和 Trey Ideker,2021 年 11 月 24 日,自然。
DOI: 10.1038/s41586-021-04115-9
合著者包括:Maya L. Gosztyla、Marcus R. Kelly、Steven M. Blue、Fan Zheng、Michael Chen、Leah V. Schaffer、Katherine Licon、John J. Lee、Sophie N. Liu、Erica Silva、Jisoo Park、 Adriana Pitea,Jason F. Kreisberg,加州大学圣地亚哥分校;Edward L. Huttlin、Laura Pontano Vaites、Tian Zhang、Steven P. Gygi、J. Wade Harper,哈佛医学院;Casper F. Winsnes, Anna Bäckström, Wei Ouyang,KTH 皇家理工学院;Ludivine Wacheul,Denis LJ Lafontaine,布鲁塞尔自由大学;和北京大学的马建竹。
这项研究的部分资金来自美国国立卫生研究院(赠款 U54CA209891、U01MH115747、F99CA264422、P41GM103504、R01HG009979、U24HG006673、U41HG009889、R01HL137223、R01HL137223、R01HG004659、Google Venturesnut 和爱丽丝-阿丽斯森家族基金会)瓦伦堡基金会(赠款 2016.0204)、瑞典研究委员会(赠款 2017-05327)、比利时科学基金会、布鲁塞尔自由大学、欧洲罕见疾病联合计划、瓦隆地区、国际 Brachet 基金会和 Epitran COST 行动(赠款 CA16120 )。
披露:Trey Ideker 是科学顾问委员会的联合创始人,并拥有 Data4Cure, Inc. 的股权。Ideker 也是科学顾问委员会的成员,拥有 Ideaya BioSciences, Inc. 的股权并获得赞助的研究资金。 Gene Yeo 是科学顾问委员会的联合创始人、董事会成员、Locanabio 和 Eclipse BioInnovations 的股东和付费顾问。Yeo 还是新加坡国立大学的客座教授。这些安排的条款已经过加州大学圣地亚哥分校根据其利益冲突政策进行审查和批准。Emma Lundberg 是 Cartography Biosciences、Nautilus Biotechnology 和 Interline Therapeutics 的科学顾问委员会成员,并拥有股权。J。Wade Harper 是科学顾问委员会的联合创始人,拥有 Caraway Therapeutics 的股权。Harper 还是 Interline Therapeutics 的创始科学顾问。