Elon Musk: Bei Tesla hatten wir im Grunde zwei verschiedene Chip-Programme: eines Dojo und eines. Dojo auf der Trainingsseite und dann das, was wir AI4 nennen, es ist einfach unser Inferenzchip.
Der AI4 wird derzeit in allen Fahrzeugen ausgeliefert, und wir finalisieren das Design von AI5, das ein enormer Sprung von AI4 sein wird. Nach einigen Metriken wird die Verbesserung in AI5 40-mal besser sein als AI4. Also nicht 40%, sondern 40-mal.
Das liegt daran, dass wir so eng auf einer sehr feinen Ebene an der KI-Software und der KI-Hardware arbeiten. Wir wissen also genau, wo die Begrenzungsfaktoren liegen. Und so entwerfen die KI-Hardware- und Software-Teams effektiv den Chip gemeinsam.
Im Vergleich zur schlimmsten Einschränkung von AI4, die die Ausführung der SoftMax-Operation ist, müssen wir derzeit SoftMax in etwa 40 Schritten im Emulationsmodus ausführen, während das in AI5 einfach in wenigen Schritten nativ erledigt wird.
AI5 wird auch in der Lage sein, gemischte Präzisionsmodelle problemlos zu verarbeiten, sodass Sie es nicht haben müssen, es wird dynamisch gemischte Präzision handhaben. Es gibt eine Menge technischer Dinge, die AI5 viel besser machen wird.
In Bezug auf die nominale rohe Rechenleistung sind es achtmal mehr Rechenleistung, etwa neunmal mehr Speicher und ungefähr fünfmal mehr Speicherbandbreite.
Aber da wir einige grundlegende Einschränkungen in AI4 angehen, multiplizieren Sie diese 8-fache Rechenverbesserung mit einer weiteren 5-fachen Verbesserung aufgrund der Optimierung auf einer sehr feinen Siliziumebene von Dingen, die derzeit suboptimal in AI4 sind, dorther kommt die 40-fache Verbesserung.