Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Elon Musk: Na Tesla, basicamente tínhamos dois programas de chip diferentes: um Dojo e outro. Dojo no lado do treinamento, e depois o que chamamos de AI4, que é apenas o nosso chip de inferência.
O AI4 é o que está atualmente sendo enviado em todos os veículos, e estamos finalizando o design do AI5, que será um salto imenso em relação ao AI4. Por algumas métricas, a melhoria no AI5 será 40 vezes melhor do que no AI4. Então, não 40%, 40 vezes.
Isto porque trabalhamos tão de perto em um nível muito detalhado no software de IA e no hardware de IA. Assim, sabemos exatamente onde estão os fatores limitantes. E, portanto, efetivamente as equipes de hardware e software de IA estão co-desenhando o chip.
Comparado à pior limitação no AI4, que é executar a operação SoftMax, atualmente temos que executar o SoftMax em cerca de 40 etapas em modo de emulação, enquanto isso será feito em apenas algumas etapas nativamente no AI5.
O AI5 também será capaz de lidar facilmente com modelos de precisão mista, então você não terá isso, ele lidará dinamicamente com precisão mista. Há uma série de coisas técnicas que o AI5 fará muito melhor.
Em termos de computação bruta nominal, é oito vezes mais computação, cerca de nove vezes mais memória e aproximadamente cinco vezes mais largura de banda de memória.
Mas, porque estamos abordando algumas limitações centrais no AI4, você multiplica essa melhoria de computação de 8x por outra melhoria de 5x devido à otimização em um nível de silício muito detalhado de coisas que atualmente são subótimas no AI4, é aí que você obtém a melhoria de 40x.
Top
Classificação
Favoritos

