Qual é a verdadeira escala de um superpod TPU? A verdadeira escala de um supercomputador não é definida por quantos processadores você pode colocar em uma sala; É definido por quantos processadores conseguem pensar efetivamente como um só. Essa distinção é a força motriz por trás da Ironwood, nossa Unidade de Processamento de Tensor (TPU) de sétima geração, e da arquitetura do superpod TPU. No papel, a escala de um superpod Ironwood é impressionante: ele escala até 9.216 chips em um único domínio interconectado. Mas a verdadeira escala está no tecido que os une. Em um superpod Ironwood, usamos uma tecnologia inovadora de rede Inter-Chip Interconnect (ICI) rodando a 9,6 terabits por segundo. Isso permite que esses 9.216 chips se comuniquem com latência quase instantânea, acessando uma enorme quantidade de 1,77 Petabytes de Memória de Alta Largura de Banda (HBM) compartilhada. Então, como conectar quase 10.000 chips sem criar um pesadelo de cabos? A resposta está no Interruptor de Circuito Óptico (OCS). ◾ Agrupamentos de madeira de ferro são construídos a partir de blocos de construção chamados "cubos" (64 cavacos cada). ◾ Para escalar além de um único cubo, múltiplos cubos são conectados usando uma rede de Interruptor de Circuito Óptico (OCS). Trata-se de uma rede óptica dinâmica e reconfigurável que conecta cubos inteiros, permitindo que o sistema escale de um pequeno "pod" (por exemplo, um pod Ironwood com 256 chips e quatro cubos) para um enorme "superpod" (por exemplo, um sistema com 9.216 chips e 144 cubos). ◾ Essa topologia baseada em OCS é fundamental para a tolerância a falhas. Se um cubo ou link falhar, o gerenciador de tecido do OCS instrui o OCS a contornar opticamente essa unidade e estabelecer novos circuitos ópticos completos, trocando um reserva designado. → Hardware é só metade da equação. A verdadeira escala de um superpod TPU é desbloqueada por uma pilha de software co-projetada para resultados mais rápidos e eficientes. Graças a integrações profundas em toda a pilha — desde otimizações de hardware em todo o data center até softwares abertos e serviços gerenciados — as TPUs Ironwood são nossas TPUs mais poderosas e energeticamente eficientes até hoje.