精确观察细胞内的蛋白质对于许多研究分支来说极其重要,但也是一项重大的技术挑战——尤其是在活细胞中,因为所需的荧光标记必须单独附着在每个蛋白质上。 CeMM Stefan Kubicek 领导的研究小组现已克服了这一障碍:通过一种名为“vpCells”的方法,可以使用五种不同的荧光颜色同时标记许多蛋白质。这种自动化的高通量方法在人工智能辅助图像识别的帮助下,在从基础细胞生物学到药物发现的各个学科中开辟了全新的应用。该研究已发表在《自然细胞生物学》杂志上(DOI:10.1038/s41556-024-01407-w),相关图像可在vpcells.cemm.at获取。
如果没有蛋白质,我们所知的生命将是不可想象的。它们为细胞提供结构框架,充当控制新陈代谢的酶,并使细胞能够作为膜受体、转运蛋白或信号分子与其环境进行通信。只有当蛋白质位于细胞内的正确位置时,所有这些功能才能实现。通常,即使蛋白质的特性在改变其位置时也会发生变化——因此,控制其在细胞中的定位也意味着控制其功能。
为了理解和探索蛋白质的功能,必须精确确定和跟踪它们在细胞内的位置。蛋白质通常在细胞的不同细胞器和区室之间动态穿梭。为了在显微镜下观察它们,它们通常与荧光、明亮的蛋白质成分相连。然而,这种方法面临着技术难题:通常,荧光成分一次只能附着在一种蛋白质上,而要标记多种蛋白质,通常必须杀并固定细胞。
Stefan Kubicek 小组提出的新方法称为“视觉蛋白质组学细胞”(缩写为 vpCells),允许以保留其内源调节机制的方式对蛋白质进行荧光标记。 vpCells 不是一次标记一种蛋白质,而是可以通过所谓的多重方法同时将许多蛋白质与荧光标签融合。 Kubicek 团队已于 2020 年描述了该方法的前体,用于研究代谢酶(Reicher 等人 Genome Res. 2020,DOI:10.1101/gr.261503.120)。现在它在三个方面进行了扩展和改进:
首先,vpCells 可以使用 CRISPR/Cas9 基因编辑工具标记所有理论上可能的蛋白质,以将荧光蛋白基因附着到所研究的蛋白质上。 Kubicek 的团队为此创建了一个全基因组“库”,能够对所有可能的人类蛋白质进行荧光标记和系统功能探索。
其次,vpCell 不仅使用一种荧光颜色,而是总共使用五种互补颜色。在每个细胞中,标记了两种要追踪的不同蛋白质。此外,还使用另一种颜色标记来更好地区分各个克隆。另外两种颜色标记细胞核和细胞膜,以更好地描绘单个细胞。
第三,这种配色方案不仅能够生成视觉上吸引人的图像,而且能够光学识别和区分不同的蛋白质。通常,这需要在成像后进行复杂的 DNA 测序,以确定标记了哪种蛋白质。另一方面,vpCells 方法可以训练人工智能辅助图像识别系统,仅根据荧光显微镜图像来识别哪个细胞中标记了哪个蛋白质。
该方法已经在两个应用中展示了其实用性:一方面,生成了 4,500 多个细胞系作为 1,100 多种蛋白质的报告基因。这些细胞系用于训练人工智能模型并描述蛋白质在基础状态下的定位。各个标记蛋白质的所有图像均可在可公开访问的网络数据库vpcells.cemm.at上获取。
另一方面,活的报告细胞被用于一个特定的研究问题:库比切克的团队检查了1000多种小分子物质对与癌细胞相关的61种蛋白质的影响。研究人员发现,44 种测试物质在 6 小时内改变了单个蛋白质的数量或定位。其中一种物质被证明是细胞核蛋白质转运的抑制剂,与临床批准的治疗多发性骨髓瘤(一种造血系统癌症)的药物具有类似的效果。
“这些结果让我们第一次了解 vpCells 方法的多功能性,”库比切克说。 “我们期望未来有更多的应用,从基础细胞生物学到应用药物发现。”