每日經濟新聞 2025-05-29 07:45:07
每經編輯|何小桃
5月28日晚,DeepSeek再次傳來大消息。
當天,DeepSeek官方宣布DeepSeek R1模型已完成小版本試升級,歡迎前往官方網頁、APP、小程序測試(打開深度思考),API 接口和使用方式保持不變。
不過,DeepSeek官方此次并沒有公布版本更新的具體內容。今年3月,DeepSeek曾對V3模型進行小版本升級,同樣是通過官方交流群率先宣布,隨后公布了具體更新內容。此前,也有許多關于R2大模型的傳聞出現,比如“參數規模被曝達到驚人的1.2萬億,相比前代R1的6710億參數幾乎翻倍等”。但截至目前,并未獲得官方證實。
DeepSeek的本次升級是在英偉達發布最新財報前數小時宣布的。作為全球領先的AI芯片制造商,英偉達的股價在1月因R1的發布而遭遇重挫。
據中國基金報報道,據用戶反饋,DeepSeek升級后的模型,思維鏈 (CoT) 的行為似乎發生了顯著變化。
也有用戶總結了更新后的幾個亮點,其中包括:現在像Google模型一樣進行深度推理;改進寫作任務——更自然、格式更好;獨特的推理風格——不僅快速,而且深思熟慮;長時間思考——每個任務最多30~60分鐘。
另外,據財聯社援引AIGC開放社區的信息,已經有網友迫不及待的對新版R1進行測試,在著名代碼測試平臺Live CodeBench中顯示,其性能可以媲美OpenAI最新的o3模型高版本。也有網友對新版R1的風格進行了測試,幾乎和OpenAI的o3差不多。
據券商中國報道,這是自3月底以來,DeepSeek的一次最新動作。3月25日晚,DeepSeek公司在官方賬號上正式宣布V3模型完成小版本升級的消息,并介紹了新版本DeepSeek-V3-0324模型的提升細節,包括推理、前端開發、中文寫作、中文搜索幾個方面的能力優化。彼時,據海外專業AI模型評測機構最新排名,新版V3模型是得分最高的非推理模型,超過xAI的Grok3和OpenAI的GPT-4.5(preview)。
然而,自那之后,DeepSeek的熱度就開始下降,使用率也有所回落,并且引發了一些質疑。當前,市場最關注的依然是其R2模型的發布。4月底,有傳聞稱,其R2大模型的參數規模被曝達到驚人的1.2萬億,相比前代R1的6710億參數幾乎翻倍。這一數字接近國際頂尖模型如GPT-4Turbo和谷歌Gemini2.0Pro的水平。R2的動態激活參數為780億,實際消耗的計算量僅為總參數的6.5%。這種設計讓模型在保持高性能的同時,顯著降低了運行成本。然而,種種跡象表明,這些似乎只是市場人士的臆測,截至目前也未獲得官方證實,R2模型亦未推出。反觀Open AI的動作卻相對較多,人工智能大模型的競爭依然在持續。
編輯|何小桃??杜恒峰
校對|趙慶
封面圖片來源:每經記者 蘭素英 攝
每日經濟新聞綜合中國基金報、券商中國、財聯社
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP