الأشخاص الموهوبون يرقون إلى الإدارة. وكذلك العارضون الموهوبون. كلود يدير تنفيذ الكود. تقوم Gemini بتوجيه الطلبات عبر CRM والدردشة. يمكن ل GPT-5 تنسيق أبحاث الأسهم العامة. لماذا الآن؟ تجاوزت دقة استدعاء الأدوات عتبة. قبل عامين، نجح GPT-4 في أقل من 50٪ من مهام استدعاء الوظائف. النماذج هلوست المعلمات، وتسمى نقاط نهاية خاطئة، ونسى السياق أثناء المحادثة. اليوم، تتجاوز نماذج SOTA دقة 90٪ في معايير استدعاء الوظائف. أداء أحدث الطرازات، مثل Gemini 3، أفضل بشكل كبير في الواقع مما تشير إليه المعايير المرجعية.
هل كنا بحاجة إلى نماذج ذات تريليون معامل فقط لإجراء استدعاءات الدوال؟ بشكل مفاجئ، نعم. تفشل التجارب مع نماذج الحركة الصغيرة، وهي شبكات خفيفة الوزن المدربة فقط على اختيار الأدوات، في الإنتاج. يفتقرون إلى المعرفة العالمية. اتضح أن الإدارة تتطلب سياقا. اليوم، غالبا ما يظهر الموزع كوكيل فرعي (كلود كود يدير كود كود آخر). هذا التماثل لن يدوم. الدرس المرير يصر على أن النماذج الأكبر تدريجيا يجب أن تتولى كل شيء. لكن الاقتصاد يدافع: التعديل الدقيق بالتقطير والتعزيز ينتج نماذج أصغر بنسبة 40٪ وأسرع بنسبة 60٪ مع الحفاظ على 97٪ من الأداء. وكلاء متخصصون من موردين مختلفين يظهرون. يصبح نموذج الحدود هو التنفيذي، حيث يوجه الطلبات عبر المتخصصين. هؤلاء المتخصصون يمكن أن يكونوا موردين من طرف ثالث، جميعهم يسعون ليكونوا الأفضل في مجالهم.
‏‎39‏