Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Anekdotisch gezien heeft Claude gisteren mijn verzekeringsclaimsdata verzameld en in een tabel gezet. Het duurde ongeveer 30 minuten zonder enige tussenkomst.
Vervolgens heeft Claude/Gemini dit vergeleken met mijn voordelen. Er zijn 2 plekken gevonden waar ik blijkbaar te veel ben aangerekend.
De eerste keer buiten SWE dat agenten een verschil voor mij hebben gemaakt.

20 dec 2025
We schatten dat, voor onze taken, Claude Opus 4.5 een 50%-tijdshorizon heeft van ongeveer 4 uur en 49 minuten (95% betrouwbaarheidsinterval van 1 uur en 49 minuten tot 20 uur en 25 minuten). Terwijl we nog bezig zijn met evaluaties voor andere recente modellen, is dit onze hoogste gepubliceerde tijdshorizon tot nu toe.

Het is eigenlijk een geweldig gebruik van een agent omdat de gegevens allemaal relatief gemakkelijk te vinden zijn op een webpagina. Maar het is vervelend en tijdrovend om het in een verwerkbare indeling te krijgen.
En het controleren van uw voordelen is krachtig omdat er een grote informatie-asymmetrie is tussen u, een aanbieder, en een verzekeringsmaatschappij. Het hebben van een LLM als pleitbezorger is een geweldige manier om het speelveld gelijk te trekken.
861
Boven
Positie
Favorieten
