قم بتجميع بعض الملاحظات حول ورقة DeepMind الجديدة "نماذج الفيديو هي متعلمون ومنطقون صفريون" - إنها تقدم حجة مقنعة للغاية مفادها أن نماذج الفيديو التوليدية هي لمشاكل الرؤية مثل LLMs لمشاكل البرمجة اللغوية العصبية: نماذج فردية يمكنها حل مجموعة واسعة من التحديات
@JustinAngel في كلتا الحالتين ، يمكنك الخروج بحالات الحافة التي تكشف عن قيودها - مع LLMs قد تنظر إلى التغلب على النماذج مع تحسن النماذج ، سيكون من المثير للاهتمام معرفة ما إذا كان ذلك يحدث لنماذج الفيديو
‏‎24.88‏K