Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Nous Research prezintă Hermes 4, cea mai recentă linie de modele de raționament hibrid.
Hermes 4 se bazează pe moștenirea noastră de modele aliniate la utilizator cu capacități extinse de calcul în timpul testelor.
O atenție deosebită a fost acordată pentru a face modelele creative și interesante de interacționat, neîmpovărate de cenzură și aliniate neutru, menținând în același timp performanța de ultimă generație a matematicii, codării și raționamentului pentru modelele de greutate deschisă.

10,75K
Nous Research a repostat
1/10🧵 @nousresearch publicat recent un studiu interesant care arată că modelele deschise folosesc de 2-3 ori mai multe jetoane decât modelele închise pentru sarcini de raționament.
Am testat dacă alocarea dinamică a tokenurilor ar putea ajuta la rezolvarea acestui decalaj de eficiență. Iată ce am învățat 👇
8,03K
Măsurarea eficienței gândirii în modelele de raționament: punctul de referință lipsă
Am măsurat utilizarea jetoanelor în toate modelele de raționament: modelele deschise produc de 1,5-4 ori mai multe jetoane decât modelele închise pe sarcini identice, dar cu o variație uriașă în funcție de tipul de sarcină (până la 10 ori la întrebări simple).
Acest cost ascuns anulează adesea avantajele prețurilor per token. Eficiența token-urilor ar trebui să devină o țintă principală alături de benchmark-urile de precizie, în special având în vedere cazurile de utilizare fără raționament.
Citiți revizuirea amănunțită a eficienței raționamentului în peisajul modelelor deschise și închise în cea mai recentă postare pe blog în colaborare cu cercetătorul nostru rezident, Tim.
Vedeți mai multe despre munca lor aici:

48,72K
Nous Research a repostat
Mediul de evaluare Arena-Hard este acum fuzionat cu Atropos - bucurați-vă de o evaluare scalabilă, flexibilă și modernă cu benchmark-ul Arena-Hard de la @lmsysorg, care este foarte bun la determinarea unei game largi de capabilități în modele.
Gata să fie un mediu RL dacă îți aduci și propriul tren :)
Aflați mai multe la

6,96K
Cercetătorul nostru rezident @yaboilyrical va discuta despre munca sa privind conducerea SMC la UC Berkeley pe 3 august.
Consultați blogul despre această lucrare aici:
Detalii mai jos!

nightwing25 iul. 2025
Sunt încântat să anunț că voi fi vorbitor la @BerkeleyRDI DeAI Summit, prezentându-mi cercetarea cu @NousResearch despre decodarea limbajului constrâns!
Dacă participați la summit sau doriți să veniți să vedeți discursul meu, vă rog să mă contactați!

10,98K
Limită superioară
Clasament
Favorite
La modă pe lanț
La modă pe X
Principalele finanțări recente
Cele mai importante