Sätt ihop några anteckningar om det nya DeepMind-dokumentet "Videomodeller är zero-shot learners and reasoners" - det gör ett mycket övertygande fall att generativa videomodeller är för synproblem vad LLM:er var för NLP-problem: enskilda modeller som kan lösa ett brett spektrum av utmaningar
@JustinAngel I båda fallen kan du komma på kantfall som avslöjar deras begränsningar - med LLM kan eller dessa begränsningar övervinnas när modellerna förbättras, kommer att bli intressant att se om det händer för videomodeller
24,9K