全球知名大模型竞技榜单 lmarena 统计了 2023 年中之后所有登顶过大模型榜单的模型 从 GPT-4 开始算起,模型平均在 NO.1 的位置只能待 35 天左右。 不是半年,也不是一年,一个多月就会被新模型超过。 更夸张的是,很多模型在登顶后 5 个月左右就会掉出 Top 5,7 个月连 Top 10 都很难保住。 看看具体例子会更有冲击力: 曾经风光无限的 o1,现在排到 #56; 当年被认为“最强推理模型”的 Claude 3 Opus,已经掉到 #139 它们都曾经是: 顶级模型讨论度极高被认为“领先一代”的产品 没有谁能长期站在榜首,优势窗口正在被压缩到以“月”为单位。 当模型平均 35 天就能被下一代超越,甚至超过了某些AI产品的迭代周期...😄 这就可能意味着一件关键的事: 模型基础能力的提升速度,甚至快过绝大多数产品的迭代周期。 而产品层反而被模型能力“反向压扁”。