全球知名大模型競技榜單 lmarena 統計了 2023 年中之後所有登頂過大模型榜單的模型 從 GPT-4 開始算起,模型平均在 NO.1 的位置只能待 35 天左右。 不是半年,也不是一年,一個多月就會被新模型超過。 更誇張的是,很多模型在登頂後 5 個月左右就會掉出 Top 5,7 個月連 Top 10 都很難保住。 看看具體例子會更有衝擊力: 曾經風光無限的 o1,現在排到 #56; 當年被認為“最強推理模型”的 Claude 3 Opus,已經掉到 #139 它們都曾經是: 頂級模型討論度極高被認為“領先一代”的產品 沒有誰能長期站在榜首,優勢窗口正在被壓縮到以“月”為單位。 當模型平均 35 天就能被下一代超越,甚至超過了某些AI產品的迭代週期...😄 這就可能意味著一件關鍵的事: 模型基礎能力的提升速度,甚至快過絕大多數產品的迭代週期。 而產品層反而被模型能力“反向壓扁”。