每日經(jīng)濟(jì)新聞 2025-02-01 11:58:58
當(dāng)?shù)貢r(shí)間1月31日,OpenAI正式推出全新推理模型o3-mini,并首次向免費(fèi)用戶開(kāi)放。這一成本效益最高的模型現(xiàn)已在ChatGPT和API中上線。OpenAI首席執(zhí)行官Sam Altman攜高管在Reddit上回應(yīng)網(wǎng)友問(wèn)題,承認(rèn)過(guò)去在開(kāi)源方面存在不足,并表示將考慮新的開(kāi)源策略。
每經(jīng)編輯 杜宇
當(dāng)所有人還在驚嘆DeepSeek的驚人實(shí)力時(shí),OpenAI終于坐不住了。當(dāng)?shù)貢r(shí)間1月31日,OpenAI正式推出了全新推理模型o3-mini,并首次向免費(fèi)用戶開(kāi)放推理模型。這是OpenAI推理系列中最新、成本效益最高的模型,現(xiàn)在已經(jīng)在ChatGPT和API中上線。
圖片來(lái)源:OpenAI
OpenAI可能考慮開(kāi)源、公開(kāi)完整思維鏈。在o3mini正式推出之時(shí),OpenAI的首席執(zhí)行官Sam Altman(奧特曼)攜一眾高管在reddit回答網(wǎng)友問(wèn)題,其間罕見(jiàn)承認(rèn)OpenAI過(guò)去在開(kāi)源方面一直站在“歷史錯(cuò)誤的一邊”。Altman表示:“需要想出一個(gè)不同的開(kāi)源策略”。
在談及DeepSeek時(shí),Altman表示它是“一個(gè)很好的模型”,并表示“我們將生產(chǎn)更好的模型,但與往年相比,領(lǐng)先優(yōu)勢(shì)更少”。
Altman還進(jìn)一步表示,得益于DeepSeek,OpenAI可能更多地揭示其所謂的推理模型(如O3-Mini)如何展示其“思考過(guò)程”。目前,OpenAI的模型隱藏了它們的推理過(guò)程,防止競(jìng)爭(zhēng)對(duì)手為自己的模型獲取訓(xùn)練數(shù)據(jù)。相比之下,DeepSeek的R1模型則對(duì)用戶開(kāi)放思維鏈輸出。
OpenAI首席產(chǎn)品官Kevin Weil也補(bǔ)充表示:
“我們正在努力展示比今天更多的內(nèi)容,這將很快實(shí)現(xiàn)。待定,展示所有的思維鏈(CoT)的確會(huì)導(dǎo)致競(jìng)爭(zhēng)性蒸餾,但我們也知道人們(至少是高級(jí)用戶)想要它,所以我們會(huì)找到合適的方法來(lái)平衡它。”
在當(dāng)?shù)貢r(shí)間1月31日的新聞稿中,OpenAI披露,在2024年美國(guó)數(shù)學(xué)邀請(qǐng)賽(AIME 2024)的測(cè)試中,低推理努力的o3-mini準(zhǔn)確率(60%)與o1-mini差不多,但速率更快;而在中等努力下,o3-mini準(zhǔn)確率能夠提升到79.6%,與o1模型相當(dāng)。在最高努力水平時(shí),o3-mini的準(zhǔn)確率則能進(jìn)一步提升至87.3%。
橫向?qū)Ρ龋珼eepSeek-R1模型在AIME 2024測(cè)試中的準(zhǔn)確率為79.8%,而在GPQA Diamond測(cè)試中的準(zhǔn)確率為71.5%。
有專家在社交媒體表示:受DeepSeek影響,OpenAl現(xiàn)在也顯示推理模型的思維過(guò)程了。
此外,對(duì)于付費(fèi)用戶,o3-mini將在模型選擇器中替代o1-mini。作為升級(jí)的一部分,每月花費(fèi)20美元左右的ChatGPT Plus和Team用戶,速率限制也從o1-mini的每天50條,提升到o3-mini的150條。每月支付200美元的ChatGPT Pro用戶,能無(wú)限制地訪問(wèn)o3-mini。
每日經(jīng)濟(jì)新聞綜合公開(kāi)資料
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP