"真正的"程序员会在这件事上抨击我,但我无所谓。 简而言之,我现在让Claude使用简单英语和Playwright运行一整套E2E测试。 传统的E2E测试维护起来非常麻烦。它们极其脆弱,根本不适合任何快速变化/扩展的代码库。 但在AI辅助编程的世界中,它们确实具有巨大的影响力,因为它们允许AI以用户使用你的应用程序的方式来验证其工作。 你可以让AI编写/维护你的传统E2E测试,但我保证它们很快会错过CSS选择器和功能变化,你会感到非常愤怒。 相反,你可以使用Markdown,让Claude为你运行所有主要场景! 我通常每天手动运行几次,以使用自定义的/e2e Claude命令对整个应用程序进行 sanity check。 这只是为了增强其余传统测试套件,作为最后一项证明,表明这些功能确实对用户有效。