المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
مدير الروبوتات والعالم المتميز في NVIDIA. قائد مشارك لمختبر GEAR. حل AGI المادي ، محرك واحد في كل مرة. دكتوراه في جامعة ستانفورد المتدرب الأول في OpenAI.
أنا في مهمة واحدة لحل اختبار تورينج الفيزيائي للروبوتات. إنها التحدي الكبير التالي، أو ربما الأخير، في الذكاء الاصطناعي. الذكاء الفائق في سلاسل النص سيفوز بجائزة نوبل قبل أن نحصل على ذكاء الشمبانزي في الرشاقة والمهارة. مفارقة مورافيك هي لعنة يجب كسرها وجدار يجب هدمه. لا شيء يمكن أن يقف بين البشرية والإنتاجية الجسدية المتسارعة على هذا الكوكب، وربما في يوم من الأيام على كواكب أخرى.
بدأنا مختبرا صغيرا في NVIDIA ونما إلى 30 شخصا مؤخرا. الفريق يفوق وزنه بكثير. تشمل بصمتنا البحثية نماذج الأساس، ونماذج العالم، والتفكير المتجسد، والمحاكاة، والتحكم الكامل في الجسم، والعديد من أشكال التعلم المعزز - وهو في الأساس كامل مجموعة التعلم من الروبوتات.
هذا العام، أطلقنا:
- نماذج الأساس GR00T VLA (رؤية-لغة-إجراء): N1 مفتوح المصدر في مارس، N1.5 في يونيو، وN1.6 هذا الشهر؛
- GR00T Dreams: نموذج عالم الفيديو لتوسيع البيانات الاصطناعية؛
- سونيك: نموذج أساس للتحكم الكامل في الجسم البشري؛
- تدريب ما بعد التعلم الواقعي لألعاب الفيديو والتعلم المعزز ل sim2real.
لم تكن هذه الأبحاث لتحدث لولا الفرق المتعاونة العديدة في NVIDIA، والدعم القيادي القوي، والمؤلفين المشاركين من مختبرات الجامعات. شكرا لكم جميعا على إيمانكم بالمهمة.
موضوع في معرض الإنجازات:

127
كان Atari 2600 في السابق المعيار الذهبي لوكلاء الذكاء الاصطناعي خلال فترة الدكتوراه. شبكة عصبية واحدة قادرة على تشغيل 50+ لعبة أتاري تعتبر مذهلة. واجهت النماذج صعوبة في تعيين شاشة بكسلات رمادية بحجم 84x84 إلى بعض الأزرار.
ثم رفعت OpenAI Five (Dota) وAlphaStar من DeepMind مستوى اللعبة، متغلبين على أفضل أبطال العالم في الرياضات الإلكترونية. ومع ذلك، فهي تتناسب بشكل مفرط في بيئة افتراضية واحدة في كل مرة. تغيير أي شيء سيكسر النموذج فورا.
البشر بارعون بشكل استثنائي في التكيف مع الفيزياء والقواعد المختلفة تماما - وهو أمر لا يزال يفلت منه من أكثر نماذج اللغة الكبيرة تقدما التي تتجاوز تريليونات الصور. فكر في 1000 لعبة كأنها 1000 محاكاة. كلما زادت العوالم الافتراضية التي يمكن للوكيل التكيف معها، زاد من تطوير التفكير المتجسد، والإدراك، والتنسيق الحركي بشكل أفضل. كلها قطع حاسمة في اللغز الكبير للروبوتات.
من خلال فتح المصدر لنموذج NitroGen وواجهة برمجة تطبيقات الصالات الرياضية، نخدم نفس الهدف الذي نخدمه AlphaGo وAlphaStar وOpenAI Five، ومؤخرا Google SIMA: ليس لتقليل متعة تلك الألعاب، بل لتسليط الضوء على حدود الذكاء الاصطناعي الحديث، وتوفير أساس قوي، وإنشاء معيار جديد - "Atari 2.0" - لقياس التقدم وفقا لذلك.

Jim Fan20 ديسمبر، 01:15
نقدم لكم NitroGen، نموذج أساس مفتوح المصدر مدرب على لعب 1000+ لعبة: RPG، ألعاب المنصات، الباتل رويال، السباقات، 2D، 3D، وكل شيء! نحن في رحلة بحثية عن وكلاء متجسدين ذوي الأغراض العامة يتقنون ليس فقط فيزياء العالم الحقيقي، بل أيضا كل الفيزياء الممكنة عبر أكوان متعددة من المحاكاة.
وجدنا أن بنية GR00T N1.5 لدينا، التي صممت أصلا للروبوتات، يمكن تكييفها بسهولة للعب العديد من الألعاب بآليات مختلفة تماما. وصفتنا بسيطة ومليئة بالدروس المريرة: (1) مجموعة بيانات عالية الجودة مدتها 40 ألف + ساعة للعب عام في البرية؛ (2) نموذج أساس عالي الكفاءة للتحكم المستمر في الحركة؛ (3) واجهة برمجة تطبيقات صالة الألعاب التي تغلف أي لعبة ثنائية لتشغيل عمليات الطرح.
تنسيقنا للبيانات ممتع للغاية: اتضح أن اللاعبين يحبون استعراض مهاراتهم من خلال وضع التحكم في لوحة التحكم في الوقت الحقيقي على بث الفيديو. لذا نقوم بتدريب نموذج تقسيم لاكتشاف واستخراج شاشات لوحة التحكم وتحويلها إلى إجراءات خبيرة. ثم نقوم بإخفاء تلك المنطقة لمنع النموذج من استغلال الاختصار. خلال التدريب، يتعلم نوع من GR00T N1.5 تحويل البكسل من 40 ألف ساعة إلى الأفعال عبر محولات الانتشار.
NitroGen هو مجرد البداية، ولا يزال هناك طريق طويل لتسلق التلال في هذه القدرة. نحن نركز عمدا فقط على جانب System 1: "غريزة اللاعب" في التحكم السريع في الحركة. نحن نفتح المصدر *كل شيء* لتتمكن من تعديله: أوزان النماذج المدربة مسبقا، مجموعة بيانات الإجراءات بالكامل، الكود، وورقة بيضاء بتفاصيل قوية.
اليوم، أصبحت الروبوتات مجموعة كبيرة من مشاكل الذكاء الاصطناعي الصعبة.
غدا، قد يصبح جزءا فرعيا، نقطة في الفضاء الكامن الأكبر بكثير للذكاء الاصطناعي العام المتجسد.
ثم تطلب فقط جهاز تحكم روبوتي.
قد يكون هذا هو نهاية اللعبة (مقصود التورية).
NitroGen يقودها عقولنا اللامعة: لويك ماغني، أنس عوادلا، غوانجي وانغ. إنه تعاون متعدد المؤسسات. اطلع على موضوع الغوص التقني العميق وروابط المستودعات أدناه!
485
نقدم لكم NitroGen، نموذج أساس مفتوح المصدر مدرب على لعب 1000+ لعبة: RPG، ألعاب المنصات، الباتل رويال، السباقات، 2D، 3D، وكل شيء! نحن في رحلة بحثية عن وكلاء متجسدين ذوي الأغراض العامة يتقنون ليس فقط فيزياء العالم الحقيقي، بل أيضا كل الفيزياء الممكنة عبر أكوان متعددة من المحاكاة.
وجدنا أن بنية GR00T N1.5 لدينا، التي صممت أصلا للروبوتات، يمكن تكييفها بسهولة للعب العديد من الألعاب بآليات مختلفة تماما. وصفتنا بسيطة ومليئة بالدروس المريرة: (1) مجموعة بيانات عالية الجودة مدتها 40 ألف + ساعة للعب عام في البرية؛ (2) نموذج أساس عالي الكفاءة للتحكم المستمر في الحركة؛ (3) واجهة برمجة تطبيقات صالة الألعاب التي تغلف أي لعبة ثنائية لتشغيل عمليات الطرح.
تنسيقنا للبيانات ممتع للغاية: اتضح أن اللاعبين يحبون استعراض مهاراتهم من خلال وضع التحكم في لوحة التحكم في الوقت الحقيقي على بث الفيديو. لذا نقوم بتدريب نموذج تقسيم لاكتشاف واستخراج شاشات لوحة التحكم وتحويلها إلى إجراءات خبيرة. ثم نقوم بإخفاء تلك المنطقة لمنع النموذج من استغلال الاختصار. خلال التدريب، يتعلم نوع من GR00T N1.5 تحويل البكسل من 40 ألف ساعة إلى الأفعال عبر محولات الانتشار.
NitroGen هو مجرد البداية، ولا يزال هناك طريق طويل لتسلق التلال في هذه القدرة. نحن نركز عمدا فقط على جانب System 1: "غريزة اللاعب" في التحكم السريع في الحركة. نحن نفتح المصدر *كل شيء* لتتمكن من تعديله: أوزان النماذج المدربة مسبقا، مجموعة بيانات الإجراءات بالكامل، الكود، وورقة بيضاء بتفاصيل قوية.
اليوم، أصبحت الروبوتات مجموعة كبيرة من مشاكل الذكاء الاصطناعي الصعبة.
غدا، قد يصبح جزءا فرعيا، نقطة في الفضاء الكامن الأكبر بكثير للذكاء الاصطناعي العام المتجسد.
ثم تطلب فقط جهاز تحكم روبوتي.
قد يكون هذا هو نهاية اللعبة (مقصود التورية).
NitroGen يقودها عقولنا اللامعة: لويك ماغني، أنس عوادلا، غوانجي وانغ. إنه تعاون متعدد المؤسسات. اطلع على موضوع الغوص التقني العميق وروابط المستودعات أدناه!
442
الأفضل
المُتصدِّرة
التطبيقات المفضلة