在没有更好术语的情况下,Claude 是我测试过的最觉醒的模型。他们不仅低估了白人/男性/ICE 特工/美国人,还在其他类别之间有很大的差异,按照他们在进步堆栈中的等级粗略排序。