Elon Musk: W Tesli mieliśmy zasadniczo dwa różne programy chipowe: jeden Dojo i jeden. Dojo po stronie treningowej, a potem to, co nazywamy AI4, to nasz chip do wnioskowania.
AI4 to ten, który obecnie jest dostarczany we wszystkich pojazdach, a my finalizujemy projekt AI5, który będzie ogromnym skokiem w porównaniu do AI4. Według niektórych wskaźników, poprawa w AI5 będzie 40 razy lepsza niż w AI4. Więc nie 40%, 40 razy.
To dlatego, że pracujemy tak blisko na bardzo szczegółowym poziomie nad oprogramowaniem AI i sprzętem AI. Wiemy dokładnie, gdzie są ograniczenia. I tak efektywnie zespoły sprzętowe i programowe AI współprojektują chip.
W porównaniu do najgorszego ograniczenia w AI4, którym jest wykonywanie operacji SoftMax, obecnie musimy uruchamiać SoftMax w około 40 krokach w trybie emulacji, podczas gdy w AI5 będzie to zrobione w kilku krokach natywnie.
AI5 będzie również w stanie łatwo obsługiwać modele o mieszanej precyzji, więc nie musisz się tym martwić, będzie dynamicznie obsługiwał mieszane precyzje. Jest wiele technicznych rzeczy, które AI5 zrobi znacznie lepiej.
Jeśli chodzi o nominalną surową moc obliczeniową, to osiem razy więcej mocy obliczeniowej, około dziewięć razy więcej pamięci i mniej więcej pięć razy większa przepustowość pamięci.
Ale ponieważ zajmujemy się niektórymi podstawowymi ograniczeniami w AI4, mnożysz tę poprawę 8x mocy obliczeniowej przez kolejne 5x poprawy dzięki optymalizacji na bardzo szczegółowym poziomie krzemu rzeczy, które są obecnie suboptymalne w AI4, to tam uzyskujesz 40x poprawę.