Het voorspellen van de celtoestand in eerder ongeziene omstandigheden, zoals ziekte of als reactie op een medicijn, vereiste doorgaans hertraining voor elke nieuwe biologische context. Vandaag lanceert Arc Stack, een fundamentaal model dat leert om de celtoestand onder nieuwe omstandigheden direct tijdens de inferentietijd te simuleren, zonder dat er fijn afgesteld hoeft te worden.
Stack legt iets vast dat de meeste modellen missen: cellulaire context. Een T-cel in ontstoken weefsel gedraagt zich anders, niet alleen vanwege zijn eigen genen, maar ook vanwege zijn omgeving. Stack verwerkt cellen samen en leert van die relaties.
Net zoals tekstprompts taalmodellen aansteken, fungeren cellen als prompts in Stack. Het kan drug-behandelde immuuncellen observeren en voorspellen hoe epitheliale cellen op dezelfde drug zouden reageren, een taak waarvoor nooit expliciet is getraind. Het is het eerste single-cell foundation model dat in-context learning mogelijk maakt, of generaliseren naar nieuwe taken tijdens inferentie.
Het team heeft Stack toegepast om Perturb Sapiens te bouwen: Een atlas van ~20.000 voorspelde celreacties over 28 weefsels en 201 verstoringen + een subset gevalideerd met behulp van achtergehouden datasets, waarmee wordt bevestigd dat de voorspellingen de echte biologie vastleggen.
374