Luminal 将整个模型自动融合为一个 GPU 内核。 让我们来谈谈这对光速推理的重要性: