Elon Musk : Chez Tesla, nous avions essentiellement deux programmes de puces différents : un Dojo et un autre. Dojo du côté de l'entraînement, et ensuite ce que nous appelons AI4, c'est juste notre puce d'inférence.
L'AI4 est ce qui est actuellement expédié dans tous les véhicules, et nous finalisons la conception de l'AI5, qui sera un saut immense par rapport à l'AI4. Selon certains critères, l'amélioration de l'AI5 sera 40 fois meilleure que l'AI4. Donc pas 40 %, 40 fois.
C'est parce que nous travaillons si étroitement à un niveau très détaillé sur le logiciel d'IA et le matériel d'IA. Donc nous savons exactement où se trouvent les facteurs limitants. Et donc, en effet, les équipes de matériel et de logiciel d'IA co-conçoivent la puce.
Comparé à la pire limitation de l'AI4, qui est l'exécution de l'opération SoftMax, nous devons actuellement exécuter SoftMax en environ 40 étapes en mode émulation, alors que cela sera fait en quelques étapes nativement dans l'AI5.
L'AI5 sera également capable de gérer facilement des modèles à précision mixte, donc vous n'avez pas à vous en soucier, il gérera dynamiquement la précision mixte. Il y a un tas de choses techniques que l'AI5 fera beaucoup mieux.
En termes de calcul brut nominal, c'est huit fois plus de calcul, environ neuf fois plus de mémoire, et environ cinq fois plus de bande passante mémoire.
Mais parce que nous abordons certaines limitations fondamentales de l'AI4, vous multipliez cette amélioration de 8x en calcul par une autre amélioration de 5x grâce à l'optimisation à un niveau de silicium très détaillé des choses qui sont actuellement sous-optimales dans l'AI4, c'est là que vous obtenez l'amélioration de 40x.