Kumpulkan beberapa catatan pada makalah DeepMind baru "Model video adalah pembelajar dan penalaran zero-shot" - itu membuat kasus yang sangat meyakinkan bahwa model video generatif adalah untuk masalah penglihatan seperti LLM untuk masalah NLP: model tunggal yang dapat memecahkan beragam tantangan
@JustinAngel Dalam kedua kasus tersebut, Anda dapat membuat kasus tepi yang mengekspos keterbatasannya - dengan LLM mungkin atau keterbatasan tersebut dapat diatasi seiring dengan peningkatan model, akan menarik untuk melihat apakah itu terjadi untuk model video
24,89K