Luminal menggabungkan seluruh model menjadi satu kernel GPU, secara otomatis. Mari kita bicara tentang mengapa ini penting untuk inferensi pada kecepatan cahaya: