Luminalはモデル全体を自動的に単一のGPUカーネルに融合させます。 なぜこれが光速での推論に重要なのかについて話しましょう。