每日經濟新聞
      要聞

      每經網首頁 > 要聞 > 正文

      Deepseek、Kimi爭相對標“o1”,初創公司能打破“技術”和“用戶”二選一魔咒嗎?

      每日經濟新聞 2025-01-22 11:04:30

      1月20日,Deepseek和Kimi相繼發布新模型DeepSeek-R1與k1.5多模態思考模型,二者均在技術性能上對標OpenAI o1正式版。這些動作反映了大模型領域內的激烈競爭態勢和技術競賽的升級。面對互聯網大廠的競爭壓力,大模型創業公司正探索不同的戰略路徑,試圖在技術和市場間找到平衡點。

      每經記者|楊昕怡    每經編輯|文多    

      春節將至,國內大模型創業公司集體“湊熱鬧”,發布了多個對標OpenAI o1的新模型。

      發布密集程度從1月20日Deepseek和Kimi的“前腳后腳”中可見一斑,在Deepseek發布新模型DeepSeek-R1后的兩小時內,Kimi推出了k1.5多模態思考模型。


      圖片來源:微信截圖

      據Kimi官方介紹,新模型在數學、代碼、多模態推理能力等方面全面對標“Open AI滿血版o1”,這也是Open AI之外的公司首次達到o1正式版水準的多模態推理性能。

      “Kimi探索的是C端場景,它探索了一個不同于Deepseek V3的基座模型方案,通過進行長模型和短模型的權重合并,以及短模型的特化RL(意為強化學習),最大化保留了類o1模型的能力。”一位國內頭部大模型的算法工程師在20日接受《每日經濟新聞》記者采訪時表示。

      大模型是需要“重倉”投入人才、資金甚至耐心的領域,因此相對于互聯網大廠而言,以“AI六小龍”為代表的大模型創業公司面臨著更多艱難的選擇題。

      “創業公司就得做取舍。”在近期的一次采訪中,MiniMax創始人閆俊杰認為用戶數等指標并非AI競爭的核心,他把技術迭代作為最重要的目標。而Kimi創始人楊植麟在2024年11月接受《每日經濟新聞》記者采訪時表示,將提升用戶留存視為Kimi眼下最核心的任務。

      或許正因如此,2024年下半年公眾討論Kimi時多談及其C端用戶體量優勢,而Deepseek卻以鯰魚之姿成為了國內大模型的技術焦點。如今,Kimi推出了k1.5,Deepseek也在本月上線了自有App,大模型初創公司在技術和用戶上能做好兩手抓嗎?

      集體對標o1,Deepseek、Kimi相繼推出新模型

      1月20日晚,Deepseek發布了DeepSeek-R1,并同步開源模型權重。據官方介紹,DeepSeek-R1在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1正式版。

      官方披露,DeepSeek-R1 API(應用程序編程接口)服務定價為每百萬輸入Tokens1元(緩存命中)/4元(緩存未命中),每百萬輸出Tokens16元。(注:Tokens指文本被分割成的基本單位)

      隨后,Kimi也在當晚推出了全新的k1.5多模態思考模型。官方介紹稱,從基準測試成績看,k1.5多模態思考模型實現了SOTA(意為特定時間背景下的最高水平)級別的多模態推理和通用推理能力。

      一位國內頭部大模型的算法工程師向《每日經濟新聞》記者表示:“Kimi探索了一條不同于Deepseek V3的基座模型方案,通過進行長模型和短模型的權重合并,以及短模型的特化RL,最大化保留了類o1模型的能力。”

      從表現數據來看,在短鏈思考(short-CoT)模式下,Kimi k1.5的數學、代碼、視覺多模態和通用能力,均超越了全球范圍內短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平;在長鏈思考(long-CoT)模式下,Kimi k1.5的數學、代碼、多模態推理能力,也達到長思考SOTA模型OpenAI o1正式版的水平。

      此外,字節跳動旗下的豆包于1月20日推出了實時語音大模型;“AI六小龍”之一的階躍星辰也在同天上線了Step-2系列語言模型的兩款新品,即參數量小、性價比更高的Step-2 mini以及針對內容創作領域推出的“Step文學大師版”。不難看出,作為當下最為炙手可熱的行業,大模型領域的技術競賽日趨激烈。

      技術和用戶,初創公司必須取舍嗎?

      玩家們仍在同一田徑場內競爭,但起跑線和賽道已經不同。2025年剛剛開始,國內“AI六小龍”和互聯網大廠等有代表性的大模型選手就在戰略方向、側重點上出現了分野。

      1月7日,大模型創業公司零一萬物CEO李開復回應媒體稱,只有大廠能夠“燒”(指投入巨資研發)超大模型,零一萬物2024年以來的目標,是做小參數、適中的行業模型。 “(零一萬物團隊中)愿意繼續訓練超大參數模型的成員,加入了零一萬物和阿里云成立的‘產業大模型聯合實驗室’。”他介紹。

      李開復還表示,除了模型訓練策略的調整,零一萬物還考慮將游戲、金融等方向的AI業務拆分,進行獨立運營和融資。

      “我們是一家商業公司,而非單純的技術實驗室。”李開復似乎已經用零一萬物的轉型回答了,大模型初創公司難以兼得“月亮”和“六便士”。

      “‘六小龍’的估值增長得非常快,但整體業務的落地收入、用戶規模等情況都不太理想。所以投了大模型的投資人在2024年實際上是比較焦慮的。”一位AI領域的投資人在接受《每日經濟新聞》記者采訪時表示,大模型的商業化路徑難題也影響到了投資人的投資心態。

      “在產品上,豆包(的用戶體量)現在超出了;在技術上,Deepseek、阿里的通義做得也比‘小龍們’好。”在該投資人看來,面臨大廠的挑戰時,以“AI六小龍”為代表的大模型創業公司需要一定的“生存戰略”,這些創業公司要么有產品上的差異化定位,要么有一個足夠的時間窗口“往前跑”。

      在相對有限的資源、時間之下,“取舍”“聚焦”成為了國內多家大模型創業公司在2024年的戰略關鍵詞。

      “(2024年)最大的痛苦是不知道要做取舍。當知道了,就不痛苦了。我現在把技術迭代作為我們最重要的目標。”閆俊杰在近期接受媒體采訪時表示,如果面對“產品驅動”和“技術驅動”二選一的局面,他會選擇后者。

      他舉例解釋,如果要上線一個算法變化,而這可能會影響用戶數據,那他會根據算法趨勢來決策,“2023年時還會糾結,2024年基本不糾結了”。

      而這大概率不是Kimi的想法。楊植麟在2024年11月接受《每日經濟新聞》記者采訪時表示,將提升用戶留存視為Kimi眼下最核心的任務,這一點也能從Kimi在C端用戶的爭奪力度、既有規模體量上看出。

      商業智能數據服務商QuestMobile發布的數據顯示,截至2024年12月份,豆包、Kimi、文小言在AI原生App領域的“三強格局”已經形成,月活躍用戶規模分別為7523萬、2101萬和1224萬。然而,12月份,豆包與Kimi、文小言的重合用戶已分別達到754.1萬、409.8萬,相比6月份分別上升了5.5%、0.6%。

      從以上數據來看,豆包的持續擴張給Kimi帶去了不言而喻的壓力。

      “希望更多技術人才可以通過這份技術報告,了解到Kimi在模型訓練方面所做的部分工作。如果感興趣的話,歡迎加入我們,一起登月。”在官方對k1.5的介紹文章中,Kimi把對人才的招攬也放在了顯眼的位置。對于技術迭代和用戶規模,Kimi似乎不想做選擇題,但如果公司打算兼得二者,則要看Kimi在人力物力上的儲備還有多少了。

      封面圖片來源:視覺中國

      如需轉載請與《每日經濟新聞》報社聯系。
      未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

      讀者熱線:4008890008

      特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

      春節將至,國內大模型創業公司集體“湊熱鬧”,發布了多個對標OpenAI o1的新模型。 發布密集程度從1月20日Deepseek和Kimi的“前腳后腳”中可見一斑,在Deepseek發布新模型DeepSeek-R1后的兩小時內,Kimi推出了k1.5多模態思考模型。 圖片來源:微信截圖 據Kimi官方介紹,新模型在數學、代碼、多模態推理能力等方面全面對標“Open AI滿血版o1”,這也是Open AI之外的公司首次達到o1正式版水準的多模態推理性能。 “Kimi探索的是C端場景,它探索了一個不同于Deepseek V3的基座模型方案,通過進行長模型和短模型的權重合并,以及短模型的特化RL(意為強化學習),最大化保留了類o1模型的能力。”一位國內頭部大模型的算法工程師在20日接受《每日經濟新聞》記者采訪時表示。 大模型是需要“重倉”投入人才、資金甚至耐心的領域,因此相對于互聯網大廠而言,以“AI六小龍”為代表的大模型創業公司面臨著更多艱難的選擇題。 “創業公司就得做取舍。”在近期的一次采訪中,MiniMax創始人閆俊杰認為用戶數等指標并非AI競爭的核心,他把技術迭代作為最重要的目標。而Kimi創始人楊植麟在2024年11月接受《每日經濟新聞》記者采訪時表示,將提升用戶留存視為Kimi眼下最核心的任務。 或許正因如此,2024年下半年公眾討論Kimi時多談及其C端用戶體量優勢,而Deepseek卻以鯰魚之姿成為了國內大模型的技術焦點。如今,Kimi推出了k1.5,Deepseek也在本月上線了自有App,大模型初創公司在技術和用戶上能做好兩手抓嗎? 集體對標o1,Deepseek、Kimi相繼推出新模型 1月20日晚,Deepseek發布了DeepSeek-R1,并同步開源模型權重。據官方介紹,DeepSeek-R1在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1正式版。 官方披露,DeepSeek-R1 API(應用程序編程接口)服務定價為每百萬輸入Tokens1元(緩存命中)/4元(緩存未命中),每百萬輸出Tokens16元。(注:Tokens指文本被分割成的基本單位) 隨后,Kimi也在當晚推出了全新的k1.5多模態思考模型。官方介紹稱,從基準測試成績看,k1.5多模態思考模型實現了SOTA(意為特定時間背景下的最高水平)級別的多模態推理和通用推理能力。 一位國內頭部大模型的算法工程師向《每日經濟新聞》記者表示:“Kimi探索了一條不同于Deepseek V3的基座模型方案,通過進行長模型和短模型的權重合并,以及短模型的特化RL,最大化保留了類o1模型的能力。” 從表現數據來看,在短鏈思考(short-CoT)模式下,Kimi k1.5的數學、代碼、視覺多模態和通用能力,均超越了全球范圍內短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平;在長鏈思考(long-CoT)模式下,Kimi k1.5的數學、代碼、多模態推理能力,也達到長思考SOTA模型OpenAI o1正式版的水平。 此外,字節跳動旗下的豆包于1月20日推出了實時語音大模型;“AI六小龍”之一的階躍星辰也在同天上線了Step-2系列語言模型的兩款新品,即參數量小、性價比更高的Step-2 mini以及針對內容創作領域推出的“Step文學大師版”。不難看出,作為當下最為炙手可熱的行業,大模型領域的技術競賽日趨激烈。 技術和用戶,初創公司必須取舍嗎? 玩家們仍在同一田徑場內競爭,但起跑線和賽道已經不同。2025年剛剛開始,國內“AI六小龍”和互聯網大廠等有代表性的大模型選手就在戰略方向、側重點上出現了分野。 1月7日,大模型創業公司零一萬物CEO李開復回應媒體稱,只有大廠能夠“燒”(指投入巨資研發)超大模型,零一萬物2024年以來的目標,是做小參數、適中的行業模型。 “(零一萬物團隊中)愿意繼續訓練超大參數模型的成員,加入了零一萬物和阿里云成立的‘產業大模型聯合實驗室’。”他介紹。 李開復還表示,除了模型訓練策略的調整,零一萬物還考慮將游戲、金融等方向的AI業務拆分,進行獨立運營和融資。 “我們是一家商業公司,而非單純的技術實驗室。”李開復似乎已經用零一萬物的轉型回答了,大模型初創公司難以兼得“月亮”和“六便士”。 “‘六小龍’的估值增長得非常快,但整體業務的落地收入、用戶規模等情況都不太理想。所以投了大模型的投資人在2024年實際上是比較焦慮的。”一位AI領域的投資人在接受《每日經濟新聞》記者采訪時表示,大模型的商業化路徑難題也影響到了投資人的投資心態。 “在產品上,豆包(的用戶體量)現在超出了;在技術上,Deepseek、阿里的通義做得也比‘小龍們’好。”在該投資人看來,面臨大廠的挑戰時,以“AI六小龍”為代表的大模型創業公司需要一定的“生存戰略”,這些創業公司要么有產品上的差異化定位,要么有一個足夠的時間窗口“往前跑”。 在相對有限的資源、時間之下,“取舍”“聚焦”成為了國內多家大模型創業公司在2024年的戰略關鍵詞。 “(2024年)最大的痛苦是不知道要做取舍。當知道了,就不痛苦了。我現在把技術迭代作為我們最重要的目標。”閆俊杰在近期接受媒體采訪時表示,如果面對“產品驅動”和“技術驅動”二選一的局面,他會選擇后者。 他舉例解釋,如果要上線一個算法變化,而這可能會影響用戶數據,那他會根據算法趨勢來決策,“2023年時還會糾結,2024年基本不糾結了”。 而這大概率不是Kimi的想法。楊植麟在2024年11月接受《每日經濟新聞》記者采訪時表示,將提升用戶留存視為Kimi眼下最核心的任務,這一點也能從Kimi在C端用戶的爭奪力度、既有規模體量上看出。 商業智能數據服務商QuestMobile發布的數據顯示,截至2024年12月份,豆包、Kimi、文小言在AI原生App領域的“三強格局”已經形成,月活躍用戶規模分別為7523萬、2101萬和1224萬。然而,12月份,豆包與Kimi、文小言的重合用戶已分別達到754.1萬、409.8萬,相比6月份分別上升了5.5%、0.6%。 從以上數據來看,豆包的持續擴張給Kimi帶去了不言而喻的壓力。 “希望更多技術人才可以通過這份技術報告,了解到Kimi在模型訓練方面所做的部分工作。如果感興趣的話,歡迎加入我們,一起登月。”在官方對k1.5的介紹文章中,Kimi把對人才的招攬也放在了顯眼的位置。對于技術迭代和用戶規模,Kimi似乎不想做選擇題,但如果公司打算兼得二者,則要看Kimi在人力物力上的儲備還有多少了。
      模型 Kimi Kimi

      歡迎關注每日經濟新聞APP

      每經經濟新聞官方APP

      0

      0

      中文字幕亚洲乱码熟女一区二区| 亚洲欧洲日本精品| 亚洲国产综合无码一区| 亚洲午夜福利精品久久| 亚洲Aⅴ无码一区二区二三区软件| 亚洲国产精品无码久久| 亚洲中文字幕乱码AV波多JI| 亚洲啪啪免费视频| 亚洲一区二区久久| 亚洲一区欧洲一区| 一本色道久久88—综合亚洲精品| 亚洲日本乱码卡2卡3卡新区| 亚洲中文字幕久久久一区| 亚洲中文字幕久久精品蜜桃| 亚洲精品无AMM毛片| 亚洲AV成人无码久久WWW| 国产天堂亚洲国产碰碰| 亚洲?V无码乱码国产精品| 亚洲精品NV久久久久久久久久| 亚洲裸男gv网站| 亚洲中文字幕日产乱码高清app| 亚洲午夜福利在线观看| 亚洲精品夜夜夜妓女网| 久久精品亚洲综合专区| 久久亚洲国产精品成人AV秋霞 | 亚洲视频在线不卡| 亚洲成a人片在线观看中文!!!| 亚洲国产精品久久久久秋霞影院| 亚洲一区中文字幕在线电影网| 成人区精品一区二区不卡亚洲| 亚洲hairy多毛pics大全| 九九精品国产亚洲AV日韩| 亚洲精品成人片在线观看| 亚洲日韩小电影在线观看| 亚洲AV福利天堂一区二区三| 亚洲第一页在线视频| 亚洲综合成人婷婷五月网址| 久久亚洲精品11p| 亚洲综合另类小说色区| 亚洲AV无码专区在线播放中文| 97亚洲熟妇自偷自拍另类图片|