华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本

音符科技网

  新浪科技讯 8月12日下午消息,在2025金融AI推理应用落地与发展论坛上,华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),实现高吞吐、低时延的推理体验。

  在当今数字化时代,AI发展日新月异。大模型训练的热潮尚未消退,AI推理体验却已悄然成为AI应用的关键。在2025WAIC期间发布的白皮书指出,AI正从训练向推理的结构性转变而快速增长。在这样的大背景下,AI推理体验的重要性愈发凸显。

  推理体验直接关系到用户与AI交互时的感受,包括回答问题的时延、答*度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。

  据介绍,华为此次发布的AI推理创新技术UCM(推理记忆数据管理器),作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 范雪:从家族开始,挖掘历史中金贵之物的故事|获奖者谈
  • 秦洪看盘|持续堆量,A股重心稳步上移
  • 莲花控股今日大宗交易平价成交1774.72万股,成交额1.09亿元
  • 应对台风“杨柳”,福建海事局启动防台风Ⅱ级应急响应
  • 贸易谈判延长后,大豆期货价格下跌
  • 受贿6533万被判15年,国家烟草专卖局原副局长获刑
  • 160小时! 一边超时加班,一边通报表扬! 违法加班很普遍?
  • 不用沃尔玛、亚马逊,印度右翼组织和企业家呼吁抵制美国货
  • 【专家视点】持之以恒推动生态保护修复
  • 市场监管总局拟出新规:网络食品交易第三方平台和入网食品销售企业主体责任更明确
  • 微信“分付”灰度上线“借款”功能,与微信支付交易记录挂钩
  • 猪肉加工商史密斯菲尔德Q2实现销售额和利润双增长
  • 事关这些贷款!财政部等九部门联合印发→
  • 日本两名职业拳击手因比赛受重伤不治身亡日本拳击委员会拟更改赛制
  • 俄海军部署首个无人机指挥中心
  • 海岛游带动消费新需求(大数据观察·海洋经济活力足)
  • 月薪两万吃不起“水果刺客”百果园!董事长“教育消费者”言论引争议
  • 图说|极端高温影响全球大量人口,野火和空气污染风险持续
  • 被判十五年 国家烟草专卖局原副局长受贿案一审宣判
  • 向洛杉矶派兵是否违法,加州诉特朗普案开审
  • 个人消费贷款财政贴息政策来了:哪些消费适用?能补贴多少?
  • 【调研】浙江聚酯产业链调研报告
  • 太平鸟男装被指“旧款当新款卖”续:澎湃介入后商家退一赔三
  • 重磅!财政部等三部门官宣:对符合条件的个人消费贷款给予财政贴息!年贴息比例为1个百分点 涉及这18家银行
  • 臻镭科技:上半年归母净利润6231.97万元,同比增长1006.99%
  • 新城控股:前7月商业运营总收入81.44亿元,10月将偿还2.5亿美元外债
  • 【社论】奔赴上海书展不需要理由
  • 瑞银上调快手目标价至95.37港元
  • 为刺激偏远地区经济,尼泊尔将免除97座山峰登山许可费
  • “杨柳”加强为台风级,广东海事局启动防热带气旋三级应急响应
  • 一名旅客腰间绑藏265枚银元进境被查,自述用于出售牟利
  • 大摩:金蝶国际上半年业绩基本符合预期 目标价14.2港元
  • 夜宵,正在成为中国人第二正餐
  • 从撬动作用到链式效应:江苏两月来三次部署借力“苏超”促消费
  • 中银国际:升丘钛科技目标价至16.4港元 维持“买入”评级
  • 外卖大战的补贴,都被瑞幸赚走了
  • 东莞征集存量商品房作保障房:优先考虑债务将到期且无力偿还房企库存
  • A股罕见!IPO公司谋控上市公司,安车检测能否终结连亏?
  • 8月12日,港股三大指数涨跌不一,炒港股用什么APP?新浪财经APP五大优势透视
  • 连板股追踪丨A股今日共60只个股涨停 吉视传媒收获4连板
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码