每日經濟新聞
      要聞

      每經網首頁 > 要聞 > 正文

      華為,正式發布!計劃于9月開源

      2025-08-12 17:42:16

      每經編輯|張錦河    

      8月12日,華為正式發布AI推理創新技術UCM(推理記憶數據管理器)。據了解,作為一款以KV Cache為中心的推理加速套件,UCM融合了多類型緩存加速算法工具,分級管理推理過程中產生的KV Cache記憶數據,可擴大推理上下文窗口,實現高吞吐、低時延的推理體驗,降低每Token推理成本。該技術已率先在中國銀聯“客戶之聲”“營銷策劃”“辦公助手”三大業務場景中,開展智慧金融AI推理加速應用試點,并已取得成果。

      華為計劃于2025年9月正式開源UCM,屆時將在魔擎社區首發,后續逐步貢獻給業界主流推理引擎社區,并共享給業內所有Share Everything(共享架構)存儲廠商和生態伙伴。

      圖片來源:每日經濟新聞 資料圖

      據悉,UCM可根據記憶熱度在HBM、DRAM、SSD等存儲介質中實現按需流動,同時融合多種稀疏注意力算法實現存算深度協同,使長序列場景下TPS(每秒處理token數)提升2至22倍,從而降低每個Token的推理成本。

      Token是AI模型中的基本數據單位。在訓練過程中,AI大模型會學習標記Token之間的關系,從而執行推理并生成準確、相關的輸出。

      數據顯示,國外主流AI大模型的單用戶輸出速度已進入200 Tokens/s區間(時延5ms),而我國主流AI大模型的單用戶輸出速度普遍小于60 Tokens/s(時延50至100ms)。

      每日經濟新聞綜合自公開信


      如需轉載請與《每日經濟新聞》報社聯系。
      未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

      讀者熱線:4008890008

      特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

      歡迎關注每日經濟新聞APP

      每經經濟新聞官方APP

      0

      0

      亚洲AV综合色区无码一二三区| 丁香五月亚洲综合深深爱| 亚洲精品NV久久久久久久久久| 亚洲中文无码亚洲人成影院| 亚洲制服丝袜在线播放| 亚洲福利电影在线观看| 亚洲精品电影在线| 亚洲嫩草影院在线观看| 亚洲精品在线播放| 亚洲国产av一区二区三区丶| 亚洲欧洲春色校园另类小说| 亚洲美女大bbbbbbbbb| 亚洲欧洲另类春色校园小说| 亚洲成人免费电影| 33333在线亚洲| 在线观看亚洲AV日韩AV| 亚洲精品中文字幕| 国产成人精品亚洲| 亚洲日韩在线观看免费视频| 国产亚洲精久久久久久无码AV| 337p日本欧洲亚洲大胆裸体艺术| 亚洲人成人无码网www电影首页| 亚洲日韩中文无码久久| 久久精品国产亚洲AV网站| 亚洲成a人片77777kkkk| 亚洲图片一区二区| 亚洲国产日韩在线成人蜜芽| 亚洲日韩国产精品乱-久| 亚洲另类无码专区首页| 亚洲?V无码乱码国产精品| 亚洲国产日韩在线观频| 综合久久久久久中文字幕亚洲国产国产综合一区首 | 亚洲AV无码成人网站在线观看| 亚洲国产欧洲综合997久久| 综合一区自拍亚洲综合图区| 亚洲精品无码成人片在线观看 | 91大神亚洲影视在线| 亚洲伊人久久大香线蕉影院| 亚洲色少妇熟女11p| 亚洲国产激情一区二区三区| 亚洲乱色熟女一区二区三区丝袜|