Meta ve işbirlikçilerinden yeni araştırmalar. Bu, doğru dünya modelleriyle nelerin mümkün olduğunu gösteren iyi bir makale. Dünya modelleri sonuçları tahmin etmek için eylemlere ihtiyaç duyar. Bugün varsayılan yaklaşım, elde edilmesi pahalı olan ve video oyunları veya robotik manipülasyon gibi dar alanlarla sınırlı olan etiketli eylem verisini gerektirir. Ancak çevrimiçi video verilerinin büyük çoğunluğunda hiç eylem etiketi yok. Bu yeni araştırma, gizli aksiyon dünyası modellerini doğrudan vahşi videolardan öğrenmeyi ele alıyor ve önceki çalışmaların kontrollü ortamlarının ötesine geçerek gerçek dünya eylemlerinin tam çeşitliliğini yakalıyor. Zorluk önemli. Vahşi videolar, basit gezinme veya manipülasyondan çok daha ötesinde eylemler içerir: insanların karelere girmesi, nesnelerin ortaya çıkıp kaybolması, dansçıların hareket etmesi, parmakların gitar akorları oluşturması. Ayrıca, robotik veri setlerinde aynı kolun tüm bölüm boyunca göründüğü videolar arasında tutarlı bir somutlaşma yok. Peki yazarlar bunu nasıl ele alıyor? Sürekli ama kısıtlı gizli eylemler, seyrek veya gürültülü düzenleme kullanarak, bu eylem karmaşıklığını etkili bir şekilde yakalar. Önceki çalışmalarda yaygın olan ayrık kuantlaşma yaklaşımı uyum sağlamakta zorlanır. Ortak bir somutlaşma olmadan, model mekânsal olarak yerelleştirilmiş, kameraya bağlı dönüşümler öğrenir. Sonuçlar gerçek eylem transferini gösteriyor. Yürüyen bir kişinin hareketi uçan bir topa uygulanabilir. "Biri kareye giriyor" gibi eylemler tamamen farklı videolara aktarılır. Küçük bir kontrolcü, bilinen eylemleri gizli işlemlere eşlemesi için eğitirebilen, tamamen doğal videolar üzerinde eğitilen dünya modeli, robotik manipülasyon ve navigasyon görevlerini, alana özgü, eylem etiketli veriler üzerinde eğitilen modellere yakın performansla çözebilir. Etiketlenmemiş internet videolarından öğrenilen gizli eylem alanları, planlama için evrensel bir arayüz olarak hizmet verebilir ve eylem açıklamasının darboğazını ortadan kaldırabilir. Makale: Akademimizde etkili yapay zeka ajanları oluşturmayı öğrenin: