¿Cuál es la verdadera escala de un superpod TPU? La verdadera escala de una supercomputadora no se define por cuántos procesadores puedes colocar en una habitación; se define por cuántos procesadores pueden pensar efectivamente como uno solo. Esta distinción es la fuerza impulsora detrás de Ironwood, nuestra séptima generación de Unidad de Procesamiento Tensorial (TPU), y la arquitectura del superpod TPU. Sobre el papel, la escala de un superpod Ironwood es impresionante: se escala hasta 9,216 chips en un único dominio interconectado. Pero la verdadera escala radica en la tela que los une. En un superpod Ironwood, utilizamos una tecnología de red de Interconexión Inter-Chip (ICI) innovadora que funciona a 9.6 terabits por segundo. Esto permite que esos 9,216 chips se comuniquen con una latencia casi instantánea, accediendo a un masivo 1.77 Petabytes de Memoria de Alto Ancho de Banda (HBM) compartida. Entonces, ¿cómo conectas casi 10,000 chips sin crear una pesadilla de cableado? La respuesta radica en el Interruptor de Circuito Óptico (OCS). ◾ Los clústeres Ironwood están construidos a partir de bloques de construcción llamados "cubos" (64 chips cada uno). ◾ Para escalar más allá de un solo cubo, múltiples cubos se conectan utilizando una red de Interruptor de Circuito Óptico (OCS). Esta es una red óptica dinámica y reconfigurable que conecta cubos enteros, permitiendo que el sistema escale desde un pequeño "pod" (por ejemplo, un pod Ironwood de 256 chips con cuatro cubos) hasta un masivo "superpod" (por ejemplo, un sistema de 9,216 chips con 144 cubos). ◾ Esta topología basada en OCS es clave para la tolerancia a fallos. Si un cubo o enlace falla, el administrador de la tela OCS instruye al OCS para que omita ópticamente esa unidad y establezca nuevos circuitos ópticos completos intercambiando un repuesto designado. → El hardware es solo la mitad de la ecuación. La verdadera escala de un superpod TPU se desbloquea mediante una pila de software co-diseñada para resultados más rápidos y eficientes. Gracias a profundas integraciones a lo largo de la pila—desde optimizaciones de hardware a nivel de centro de datos hasta software abierto y servicios gestionados—los TPUs Ironwood son nuestros TPUs más potentes y eficientes en energía hasta la fecha.