Lahjakkaat ihmiset ylennetään johtotehtäviin. Samoin lahjakkaat mallit. Claude hallinnoi koodin suoritusta. Gemini ohjaa pyynnöt CRM:n ja chatin välillä. GPT-5 voi koordinoida julkisen kannan tutkimusta. Miksi juuri nyt? Työkalukutsujen tarkkuus ylitti rajan. Kaksi vuotta sitten GPT-4 onnistui alle 50 %:ssa funktioiden kutsumistehtävistä. Mallit hallusinoivat parametreja, joita kutsuttiin vääriksi päätepisteiksi, ja jotka unohtivat kontekstin kesken keskustelun. Nykyään SOTA-mallit ylittävät 90 %:n tarkkuuden funktiokutsuvertailuissa. Uusimpien mallien, kuten Gemini 3:n, suorituskyky on käytännössä merkittävästi parempi kuin vertailutulokset antavat ymmärtää.
Tarvitsimmeko biljoonien parametrien malleja pelkästään funktiokutsujen tekemiseen? Yllättävää kyllä. Kokeet pienillä toimintamalleilla, kevyillä verkoilla, jotka on koulutettu vain työkalujen valintaan, epäonnistuvat tuotannossa. Heiltä puuttuu maailmantuntemus. Johtaminen vaatii kontekstia. Nykyään orkestroija syntyy usein aliagenttina (Claude Code käynnistää toisen Claude Coden). Tämä symmetria ei kestä. Karvas opetus vaatii, että yhä suurempien mallien pitäisi hoitaa kaikki. Mutta taloudellinen mielipide vastustaa: tislaus ja vahvistushienosäätö tuottavat malleja 40 % pienempinä ja 60 % nopeampina säilyttäen 97 % suorituskyvystä. Erikoistuneita agentteja eri toimittajilta on nousemassa esiin. Frontier-malli toimii toimeenpanevaksi, joka ohjaa pyynnöt asiantuntijoiden välillä. Nämä asiantuntijat voivat olla kolmannen osapuolen toimittajia, jotka kaikki pyrkivät olemaan parhaita alallaan.
35