所以我尝试了这个拐点 Opus 4.5,即使在 ultrathink 上,它仍然能够产生如此多的谎言和虚假行为,同时创建单元测试。 请务必审查你的代码,并最终学习什么是好的。