这实际上是疯狂的 自从AI问世以来,生物学的每个模型都有同样的局限性:在一种疾病上训练,它只对那种疾病有效。对于任何新药、患者或组织都需要重新训练。 生物学的基础模型承诺基本上不存在。零-shot预测是不可能的。 直到现在。 Arc Institute的模型(Stack)从细胞组中学习,而不是一次一个细胞。就像LLMs在句子中看到单词而不是孤立地看待一样,细胞彼此成为上下文。 你可以向它展示用药物处理过的细胞,它可以预测完全不同的细胞对同一药物的反应。即使没有人进行过那个实验。即使那个组织从未被扰动。即使那个组合在训练中从未存在过。 细胞本身成为提示,仅仅通过推理。你现在可以查询生物学。 “如果我给肝细胞这种癌症药物,它们会怎么做?”它会用实际的基因表达预测来回答。虽然还不完美,但足够好,以至于在31个基准中击败了现有方法中的28个(在这个领域,击败60%被认为是好的,几乎是闻所未闻)。 他们用它建立了一个虚拟扰动图谱:28个人体组织,40个细胞类别,201种药物。不需要实验室。纯粹是计算机模拟。当他们与真实的湿实验进行验证时,预测结果相符。 药物发现目前每个实验的成本超过500万美元,且可能需要2年时间,而这些实验可能无效。现在你可以先进行计算筛选。 “哪些组织会有脱靶效应?” “这个患者的细胞会有什么不同的反应?” 曾经需要数百万美元的资助的问题现在只需要一个GPU。 慢慢地,我们正在解决生物学问题。