Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Anecdóticamente, ayer hice que Claude recopilara mis datos de reclamaciones de seguros y los pusiera en una tabla. Tomó ~30 minutos sin intervención
Luego, Claude/Gemini comparó con mis beneficios. Encontró 2 lugares donde parece que me han cobrado de más.
Es la primera vez fuera de SWE que los agentes han hecho una diferencia para mí

20 dic 2025
Estimamos que, en nuestras tareas, Claude Opus 4.5 tiene un horizonte de tiempo del 50% de alrededor de 4 horas y 49 minutos (intervalo de confianza del 95% de 1 hora y 49 minutos a 20 horas y 25 minutos). Aunque todavía estamos trabajando en las evaluaciones de otros modelos recientes, este es nuestro horizonte de tiempo publicado más alto hasta la fecha.

En realidad, es un gran uso de un agente porque los datos están todos ahí, relativamente fáciles de encontrar en una página web. Pero es molesto y consume tiempo convertirlo en un formato que sea consumible.
Y comprobar tus beneficios es poderoso porque hay una gran cantidad de asimetría de información entre tú, un proveedor, y una compañía de seguros. Tener un LLM que actúe como defensor es una excelente manera de igualar las condiciones.
877
Parte superior
Clasificación
Favoritos
