Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Pessoas talentosas são promovidas a cargos de gestão. Assim como modelos talentosos. Claude gerencia a execução de código. Gemini roteia solicitações através do CRM e do chat. O GPT-5 pode coordenar pesquisas de ações públicas.
Por que agora? A precisão da chamada de ferramentas ultrapassou um limite. Há dois anos, o GPT-4 teve sucesso em menos de 50% das tarefas de chamada de função. Os modelos alucinaram parâmetros, chamaram endpoints errados, esqueceram o contexto no meio da conversa. Hoje, os modelos SOTA superam 90% de precisão em benchmarks de chamada de função. O desempenho dos modelos mais recentes, como o Gemini 3, é materialmente melhor na prática do que os benchmarks sugerem.

Precisávamos de modelos com trilhões de parâmetros apenas para fazer chamadas de função? Surpreendentemente, sim.
Experimentos com pequenos modelos de ação, redes leves treinadas apenas para seleção de ferramentas, falham em produção. Eles carecem de conhecimento do mundo. A gestão, ao que parece, requer contexto.
Hoje, o orquestrador muitas vezes se gera como um subagente (Claude Code inicia outro Claude Code). Essa simetria não vai durar.
A amarga lição insiste que modelos cada vez maiores devem lidar com tudo. Mas a economia se opõe: a destilação e o ajuste fino por reforço produzem modelos 40% menores e 60% mais rápidos, mantendo 97% do desempenho.
Agentes especializados de diferentes fornecedores estão surgindo. O modelo de fronteira se torna o executivo, roteando solicitações entre especialistas. Esses especialistas podem ser fornecedores de terceiros, todos competindo para serem os melhores em seu domínio.

38
Top
Classificação
Favoritos
