Alguém tem uma boa fonte de inferência local de ponta em LLM que não seja apenas lixo ou pobre tentando economizar?