首席執(zhí)行官奧特曼罕見“認錯”,考慮OpenAI開源策略!啥情況?
專題:DeepSeek為何能震動全球AI圈
每經(jīng)編輯 杜宇
當所有人還在驚嘆DeepSeek的驚人實力時,OpenAI終于坐不住了。當?shù)貢r間1月31日,OpenAI正式推出了全新推理模型o3-mini,并首次向免費用戶開放推理模型。這是OpenAI推理系列中最新、成本效益最高的模型,現(xiàn)在已經(jīng)在ChatGPT和API中上線。
OpenAI可能考慮開源、公開完整思維鏈。在o3mini正式推出之時,OpenAI的首席執(zhí)行官??Sam Altman(奧特曼)攜一眾高管在reddit回答網(wǎng)友問題,其間罕見承認OpenAI過去在開源方面一直站在“歷史錯誤的一邊”。Altman表示:“需要想出一個不同的開源策略”。
在談及DeepSeek時,Altman表示它是“一個很好的模型”,并表示“我們將生產(chǎn)更好的模型,但與往年相比,領(lǐng)先優(yōu)勢更少”。
Altman還進一步表示,得益于DeepSeek,OpenAI可能更多地揭示其所謂的推理模型(如O3-Mini)如何展示其“思考過程”。目前,OpenAI的模型隱藏了它們的推理過程,防止競爭對手為自己的模型獲取訓(xùn)練數(shù)據(jù)。相比之下,DeepSeek的R1模型則對用戶開放思維鏈輸出。
OpenAI首席產(chǎn)品官Kevin Weil也補充表示:
“我們正在努力展示比今天更多的內(nèi)容,這將很快實現(xiàn)。待定,展示所有的思維鏈(CoT)的確會導(dǎo)致競爭性蒸餾,但我們也知道人們(至少是高級用戶)想要它,所以我們會找到合適的方法來平衡它?!?/p>
在當?shù)貢r間1月31日的新聞稿中,OpenAI披露,在2024年美國數(shù)學(xué)邀請賽(AIME 2024)的測試中,低推理努力的o3-mini準確率(60%)與o1-mini差不多,但速率更快;而在中等努力下,o3-mini準確率能夠提升到79.6%,與o1模型相當。在最高努力水平時,o3-mini的準確率則能進一步提升至87.3%。
橫向?qū)Ρ?,DeepSeek-R1模型在AIME 2024測試中的準確率為79.8%,而在GPQA Diamond測試中的準確率為71.5%。
有專家在社交媒體表示:受DeepSeek影響,OpenAl現(xiàn)在也顯示推理模型的思維過程了。
此外,對于付費用戶,o3-mini將在模型選擇器中替代o1-mini。作為升級的一部分,每月花費20美元左右的ChatGPT Plus和Team用戶,速率限制也從o1-mini的每天50條,提升到o3-mini的150條。每月支付200美元的ChatGPT Pro用戶,能無限制地訪問o3-mini。
獲嘉網(wǎng)站搭建技巧,打造高效、專業(yè)的網(wǎng)站平臺,高效專業(yè)網(wǎng)站搭建攻略,獲嘉網(wǎng)站建設(shè)技巧揭秘
下一篇歡迎使用Z-BlogPHP!
相關(guān)文章
最新評論