Dejte dohromady několik poznámek k novému dokumentu společnosti DeepMind "Video models are zero-shot learners and reasoners" - je to velmi přesvědčivý důkaz, že generativní video modely jsou pro problémy se zrakem tím, čím byly LLM pro problémy NLP: jednotlivé modely, které mohou řešit širokou škálu výzev
@JustinAngel V obou případech můžete přijít s okrajovými případy, které odhalují jejich omezení - s LLM mohou nebo tato omezení mohou být překonána, jak se modely zlepšují, bude zajímavé sledovat, zda se to stane u video modelů
24,89K