Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Las personas con talento son ascendidas a gestión. También los modelos talentosos. Claude gestiona la ejecución del código. Gemini enruta las solicitudes a través de CRM y chat. GPT-5 puede coordinar la investigación de acciones públicas.
¿Por qué ahora? La precisión de la llamada de herramientas superó un umbral. Hace dos años, GPT-4 lograba menos del 50% de las tareas de llamada de funciones. Los modelos alucinaban parámetros, llamaban puntos finales incorrectos, olvidaban el contexto en medio de una conversación. Hoy en día, los modelos SOTA superan el 90% de precisión en benchmarks de llamada de funciones. El rendimiento de los modelos más recientes, como Gemini 3, es sustancialmente mejor en la práctica de lo que sugieren los benchmarks.

¿Necesitábamos modelos de un billón de parámetros solo para hacer llamadas a funciones? Sorprendentemente, sí.
Los experimentos con modelos de acción pequeña, redes ligeras entrenadas solo para la selección de herramientas, fracasan en producción. Les falta conocimiento del mundo. La gestión, resulta, requiere contexto.
Hoy en día, el orquestador suele generarse a sí mismo como subagente (Claude Code genera otro Claude Code). Esta simetría no durará.
La amarga lección insiste en que los modelos cada vez más grandes deben encargarse de todo. Pero la economía se resiste: la destilación y el ajuste fino hacen que los modelos sean un 40% más pequeños y un 60% más rápidos, manteniendo el 97% del rendimiento.
Están surgiendo agentes especializados de diferentes proveedores. El modelo de frontera se convierte en el ejecutivo, encaminando las solicitudes entre especialistas. Estos especialistas pueden ser proveedores externos, todos compitiendo por ser los mejores en su ámbito.

72
Populares
Ranking
Favoritas
