O Luminal funde modelos inteiros em um único kernel de GPU, automaticamente. Vamos falar sobre por que isso é importante para a inferência à velocidade da luz: