OpenAI上架推理模型o3-mini 首次向免費(fèi)用戶開放推理功能

快訊 2025年02月01日 13:30 1 admin

　　財(cái)聯(lián)社2月1日訊（編輯史正丞）面對(duì)“東方AI力量”的壓力，美國(guó)OpenAI公司周五正式上線競(jìng)品推理模型o3-mini，并首次向免費(fèi)用戶開放推理模型。

　　輕量級(jí)推理大模型o3-mini最早于去年12月的直播活動(dòng)中亮相，一同亮相的還有“滿血版”的o3模型。公司宣稱，o3具備更先進(jìn)、近似人類的推理能力，在解決編程、數(shù)學(xué)、科學(xué)等理工科問(wèn)題方面均超越現(xiàn)役的o1模型。公司曾表示，o3-mini會(huì)在1月底先上架，o3則“會(huì)在不久之后推出”。

　　OpenAI介紹稱，o3-mini支持開發(fā)者調(diào)整“AI推理努力程度”的選項(xiàng)——分為低、中、高三個(gè)級(jí)別。這種靈活性使得o3-mini可以在面對(duì)難題時(shí)“更努力思考”，而需要效率時(shí)優(yōu)先考慮回應(yīng)速度。

　　在周五的新聞稿中，OpenAI披露，在2024年美國(guó)數(shù)學(xué)邀請(qǐng)賽（AIME 2024）的測(cè)試中，低推理努力的o3-mini準(zhǔn)確率（60%）與o1-mini差不多，但速率更快；而在中等努力下，o3-mini準(zhǔn)確率能夠提升到79.6%，與o1模型相當(dāng)。在最高努力水平時(shí)，o3-mini的準(zhǔn)確率則能進(jìn)一步提升至87.3%。

OpenAI上架推理模型o3-mini 首次向免費(fèi)用戶開放推理功能

　　在博士級(jí)科學(xué)問(wèn)題（GPQA Diamond）方面，三種努力程度模型的準(zhǔn)確率分別為70.6%、76.8%和79.7%。

OpenAI上架推理模型o3-mini 首次向免費(fèi)用戶開放推理功能

　　橫向?qū)Ρ?，DeepSeek-R1模型在AIME 2024測(cè)試中的準(zhǔn)確率為79.8%，而在GPQA Diamond測(cè)試中的準(zhǔn)確率為71.5%。

　　當(dāng)然，DeepSeek的一大功勞，就是讓OpenAI突然之間變大方了。

　　OpenAI宣布，從周五開始，免費(fèi)ChatGPT用戶也能通過(guò)在編輯器中選擇“推理”來(lái)嘗試o3-mini模型，這也是公司的推理模型首次向免費(fèi)用戶開放。

　　對(duì)于付費(fèi)用戶，o3-mini將在模型選擇器中替代o1-mini。作為升級(jí)的一部分，每月花費(fèi)20美元左右的ChatGPT Plus和Team用戶，速率限制也從o1-mini的每天50條，提升到o3-mini的150條。每月支付200美元的ChatGPT Pro用戶，能無(wú)限制地訪問(wèn)o3-mini。

標(biāo)簽：推理上架模型