DApp Store | Centrum Web3 pro události a hry

Populární témata

Talentovaní lidé jsou povýšeni na manažera. Stejně tak talentované modelky. Claude řídí provádění kódu. Gemini směruje požadavky přes CRM a chat. GPT-5 může koordinovat výzkum veřejných zásob. Proč právě teď? Přesnost volání nástrojů překročila určitou hranici. Před dvěma lety GPT-4 uspěl v méně než 50 % úkolů vyvolávání funkcí. Modely halucinovaly parametry, nazývaly se špatnými koncovými body, zapomněly kontext uprostřed konverzace. Dnes SOTA modely překračují přesnost 90 % na benchmarkových testech volání funkcí. Výkon nejnovějších modelů, jako je Gemini 3, je v praxi výrazně lepší, než naznačují benchmarky.

Potřebovali jsme bilionové modely jen k volání funkcí? Překvapivě ano. Experimenty s modely s malými mechanismy, lehkými sítěmi trénovanými pouze pro výběr nástrojů selžou ve výrobě. Chybí jim znalosti o světě. Ukazuje se, že management vyžaduje kontext. Dnes se orchestrátor často spawnuje jako subagent (Claude Code spustí další Claude Code). Tato symetrie dlouho nevydrží. Hořká lekce trvá na tom, že stále větší modely by měly zvládnout vše. Ale ekonomika se brání: jemné ladění destilací a posilováním způsobí, že modely jsou o 40 % menší a o 60 % rychlejší, přičemž si zachovávají 97 % výkonu. Objevují se specializovaní agenti od různých dodavatelů. Frontier model se stává výkonným modelem, který směruje požadavky mezi specialisty. Tito specialisté mohou být třetí stranami jako dodavatelé, kteří se snaží být nejlepší ve svém oboru.

51

Top

Hodnocení

Oblíbené