Jaký je skutečný rozsah TPU superpodu? Skutečná velikost superpočítače není definována tím, kolik procesorů se vejde do místnosti; Je definována tím, kolik procesorů dokáže efektivně myslet jako jeden. Tato odlišnost je hnací silou Ironwoodu, naší sedmé generace Tensor Processing Unit (TPU), a architektury TPU superpodu. Na papíře je měřítko Ironwood superpodu působivé: dokáže škálovat až 9 216 čipů v jedné propojené doméně. Ale skutečný rozsah spočívá v látce, která je spojuje. V superpodu Ironwood používáme průlomovou síťovací technologii Inter-Chip Interconnect (ICI) běžící rychlostí 9,6 terabitů za sekundu. To umožňuje těmto 9 216 čipům komunikovat téměř okamžitě s latencí a přistupovat k obrovským 1,77 petabajtům sdílené paměti s vysokou šířkou pásma (HBM). Jak tedy připojit téměř 10 000 čipů, aniž byste vytvořili noční můru s kabelážemi? Odpověď spočívá v optickém spínači (OCS). ◾ Shluky železného dřeva se staví ze stavebních bloků nazývaných "kostky" (každá 64 štěpků). ◾ Pro škálování nad rámec jedné kostky je více krychlí propojeno pomocí sítě optického obvodového spínače (OCS). Jedná se o dynamickou, rekonfigurovatelnou optickou síť, která spojuje celé krychle, což umožňuje systému škálovat od malého "kapsle" (např. 256-čipový Ironwood pod se čtyřmi kostkami) až po masivní "superpod" (např. systém o 9 216 čipech a 144 kostklí). ◾ Tato topologie založená na OCS je klíčová pro odolnost vůči chybám. Pokud selže krychle nebo spoj, správce OCS fabric instruuje OCS, aby opticky obešel tuto jednotku a vytvořil nové, kompletní optické obvody výměnou určené náhradní obvody. → Hardware je jen polovina rovnice. Skutečný rozsah TPU superpodu odhaluje společně navržený softwarový stack pro rychlejší a efektivnější výsledky. Díky hlubokým integracím napříč stackem – od optimalizací hardwaru v datových centrech až po otevřený software a spravované služby – jsou Ironwood TPU našimi dosud nejvýkonnějšími a energeticky nejúspornějšími TPU.