Reúna algunas notas sobre el nuevo artículo de DeepMind "Los modelos de video son aprendices y razonadores de disparo cero": presenta un caso muy convincente de que los modelos de video generativos son para los problemas de visión lo que los LLM fueron para los problemas de PNL: modelos individuales que pueden resolver una amplia gama de desafíos
@JustinAngel En ambos casos, puede encontrar casos extremos que expongan sus limitaciones: con los LLM pueden o esas limitaciones se superan a medida que mejoran los modelos, será interesante ver si eso sucede para los modelos de video
24.89K