每日經濟新聞 2025-04-30 22:19:26
4月30日,DeepSeek在AI開源社區Hugging Face上發布了新模型DeepSeek-Prover-V2-671B。該模型采用DeepSeek-V3架構,參數規模高達6710億,使用MoE模式,并具備61層Transformer層和7168維隱藏層。同日,美股開盤后,英偉達股價下跌3.9%,市值蒸發1037億美元(約合人民幣7541億元)。此次DeepSeek新模型的發布,展示了其在AI領域的持續創新,而英偉達股價的變動也引起了市場的廣泛關注。
每經編輯|張錦河
4月30日,DeepSeek今日于AI開源社區Hugging Face上發布了一個名為DeepSeek-Prover-V2-671B的新模型。新模型是專注于數學定理證明的大語言模型,專門針對形式化數學證明任務進行優化。
DeepSeek-Prover-V2-671B使用了DeepSeek-V3架構,參數高達6710億,采用MoE(混合專家)模式,具有61層Transformer層和7168維隱藏層。更令人驚嘆的是,其最大位置嵌入達到了16.38萬,這意味著它能夠處理極其復雜的數學證明問題。
值得注意的是,3月發布的V3-0324版本已被業內視為未來R2的基礎模型。這一版本通過6850億參數的MoE架構升級,代碼能力獲得顯著增強。
值得注意的是,4月30日晚美股開盤,英偉達股價下跌3.9%,市值蒸發1037億美元(約合人民幣7541億元)。
每日經濟新聞綜合自公開信息
免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP