Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Oamenii talentați sunt promovați în management. La fel și modelele talentate. Claude gestionează execuția codului. Gemini direcționează cererile prin CRM și chat. GPT-5 poate coordona cercetarea publică a acțiunilor.
De ce acum? Acuratețea apelării uneltelor a depășit un prag. Acum doi ani, GPT-4 a reușit la mai puțin de 50% din sarcinile de apelare a funcțiilor. Modelele au halucinat parametri, au numit endpoint-uri greșite, au uitat contextul în timpul conversației. Astăzi, modelele SOTA depășesc o acuratețe de 90% la benchmark-urile de apelare a funcțiilor. Performanța celor mai recente modele, precum Gemini 3, este semnificativ mai bună în practică decât sugerează benchmark-urile.

Aveam nevoie de modele cu trilioane de parametri doar pentru a face apeluri de funcție? Surprinzător, da.
Experimentele cu modele de acțiune mică, rețele ușoare antrenate doar pentru selecția uneltelor, eșuează în producție. Le lipsește cunoașterea lumii. Managementul, se pare, necesită context.
Astăzi, orchestratorul se generează adesea ca subagent (Claude Code pornește un alt Claude Code). Această simetrie nu va dura.
Lecția amară insistă că modelele tot mai mari ar trebui să gestioneze totul. Dar economia se opune: distilarea și reglarea fină produc modelele cu 40% mai mici și cu 60% mai rapide, păstrând totodată 97% din performanță.
Apar agenți specializați de la diferiți furnizori. Modelul de frontieră devine executivul, redirecționând cererile între specialiști. Acești specialiști pot fi furnizori terți, toți concurând să fie cei mai buni în domeniul lor.

32
Limită superioară
Clasament
Favorite
