Junte algumas notas sobre o novo artigo da DeepMind "Os modelos de vídeo são aprendizes e raciocinadores zero-shot" - ele apresenta um caso muito convincente de que os modelos de vídeo generativos são para os problemas de visão o que os LLMs foram para os problemas de PNL: modelos únicos que podem resolver uma ampla gama de desafios
@JustinAngel Em ambos os casos, você pode criar casos extremos que expõem suas limitações - com LLMs podem ou essas limitações são superadas à medida que os modelos melhoram, será interessante ver se isso acontece para modelos de vídeo
24,9K