每日經(jīng)濟(jì)新聞 2025-04-30 22:19:26
4月30日,DeepSeek在AI開源社區(qū)Hugging Face上發(fā)布了新模型DeepSeek-Prover-V2-671B。該模型采用DeepSeek-V3架構(gòu),參數(shù)規(guī)模高達(dá)6710億,使用MoE模式,并具備61層Transformer層和7168維隱藏層。同日,美股開盤后,英偉達(dá)股價(jià)下跌3.9%,市值蒸發(fā)1037億美元(約合人民幣7541億元)。此次DeepSeek新模型的發(fā)布,展示了其在AI領(lǐng)域的持續(xù)創(chuàng)新,而英偉達(dá)股價(jià)的變動(dòng)也引起了市場(chǎng)的廣泛關(guān)注。
每經(jīng)編輯 張錦河
4月30日,DeepSeek今日于AI開源社區(qū)Hugging Face上發(fā)布了一個(gè)名為DeepSeek-Prover-V2-671B的新模型。新模型是專注于數(shù)學(xué)定理證明的大語(yǔ)言模型,專門針對(duì)形式化數(shù)學(xué)證明任務(wù)進(jìn)行優(yōu)化。
DeepSeek-Prover-V2-671B使用了DeepSeek-V3架構(gòu),參數(shù)高達(dá)6710億,采用MoE(混合專家)模式,具有61層Transformer層,7168維隱藏層。更令人驚嘆的是,其最大位置嵌入達(dá)到了16.38萬(wàn),這意味著它能夠處理極其復(fù)雜的數(shù)學(xué)證明問(wèn)題。
值得注意的是,3月發(fā)布的V3-0324版本已被業(yè)內(nèi)視為未來(lái)R2的基礎(chǔ)模型。這一版本通過(guò)6850億參數(shù)的MoE架構(gòu)升級(jí),代碼能力獲得顯著增強(qiáng)。
值得注意的是,4月30日晚美股開盤,英偉達(dá)股價(jià)下跌3.9%,市值蒸發(fā)1037億美元(約合人民幣7541億元)。
每日經(jīng)濟(jì)新聞綜合自公開信息
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP