拉霸LaBa360

中文 English
一路昇腾,共赢行业智能化 ——2026 昇腾人为智能同伴峰会主题分享
2026.04.03

起源:鲲鹏昇腾开发者社区

2026 年 3 月 20 日,华为中国合作同伴大会 2026 期间,以 “与时期,共昇腾” 为主题的昇腾人为智能同伴峰会在丽江成功进行 ;獣N腾推算业务总裁张迪煊颁发《一路昇腾,共赢行业智能化》主题演讲,指出 AI 正从天生式 AI 迈向 Agentic AI,2026 年将成为强化进建及 Agent 利用规模落地元年,昇腾将打造大、钟注幼三大主题算力场景,携手同伴共探行业智能化落地加快蹊径 。

7fc366769d1941809bb6898d75a6ea38

华为昇腾推算业务总裁  张迪煊



一、开源盛开筑生态,昇腾与同伴携手共赢

2025 年是昇腾沉淀技术、拥抱开源的关键一年,同年 8 月昇腾正式颁发 CANN 和 Mind 系列软件全面开源盛开、架构解耦,并积极向业界贡献关键个性 。其中,结合科大讯飞落地的大 EP 技术贡献至 vLLM 社区,添补了业界多机推理加快能力的空缺 。
目前昇腾已向三方社区累计贡献超 11 万行代码,在毕昇编译器层构建 AscendNPU IR 滑润对接 Triton,兼容 FSDP2、vLLM 等 50 多个主流开源社区和项目,实现开源模型 0day 支持,让开发者可急剧落地训练与推理创新 。同时,多多 SOTA 开源模型基于昇腾原生孵化,如智谱基于昇腾仅三个月实现的多模态大模型 GLM-Image,开源 24 幼时即登顶 Hugging Face Trending 榜第一 。
在一体机产品领域,昇腾在 DeepSeek 颁布后急剧推出参考配置,使能 80 多家同伴 2 周内颁布自研产品 。一年功夫里,已有 350 多家同伴打造 400 多款行业场景一体机,服务 2700 多家客户,占据国内一体机市场 80% 以上份额,加快大模型行业落地 。

二、AI 迈入 Agentic 时期,2026 成强化进建 + Agent 利用落地元年

从前三年 AI 行业实现逾越式发展:2023 年 “大模型元年” 让模型从感知理解走向天生创造;2024 年 “大模型推理元年” 确立 Tokens 为 AI 时期新量纲;2025 年国产大模型开源发作,Tokens 使用量席卷千行万业 。
当前 AI 正式迈入 Agentic AI 时期,实现从 “座谈天” 到 “能处事” 的升级 。To C 端,OpenClaw 成为景象级开源利用,短功夫内收成超 32 万 star、百万新增用户,国内头部互联网纷纷布局智能体入口;To B 端,AI 深度渗入出产决策环节,强化进建成为基座模型落地行业主题场景的必选之路,而海量 Tokens 成为主题支持,其推算效能直接决定企业主题收益 。

三、大中幼系列化算力盛开,适配全场景差距化需要

结合 AI 发展趋向与客户需要,昇腾打造三大主题算力场景,全方位满足行业差距化需要,助力同伴深耕行业智能化:
  1. 大算力场景:聚焦大模型预训练、强化进建后训练及大规模推理服务,昇腾将打造当先超节点架构及产品,盛开灵衢和谈、部件嘉拷寮架构,赋能企业沉塑主题业务;
  2. 中算力场景:覆盖辅助医疗、智慧讲授等主盛行业利用,萦绕 “开箱即用” 打造 “急剧部署 + 成本可控” 的平衡,盛开中心模组 / 刀片,支持同伴打造大模型利用一体机、高密服务器;
  3. 幼算力场景:聚焦工业质检、具身智能、科研讲授等智能边端领域,针对客户 “矫捷高效、成本可控” 的诉求,盛开尺度模组和板卡,使能同伴打造多样化边缘算力设备,挖掘海量市场潜力 。

四、主题技术创新,打造全场景最佳解决规划

1. 超节点 + 大 EP,破解大规模推理服务痛点

AI Agent 的遍及带来百倍级 Tokens 需要和 10ms 级时延要求,传统服务器堆叠模式存在内存独立编址、跨节点交互机能开销大的问题 。昇腾 384 超节点实现 48TB 内存统一编址、全局内存共享,共享内存容量较传统方式提升 96 倍,NPU 间通过内存语义直接交互,数据交互效能提升 3 倍,可实现更高 KVCache,满足 Agent 超长高低文需要,成为大规模推理的最优选择 。
同时昇腾为同伴提供三条矫捷实现蹊径:复用 MindIE 成熟大 EP 规划急剧部署、合入 vLLM/SGLang 开源推理引擎降低迁徙成本、基于 CANN 深度定造极致机能推理引擎 。目前硅基流动、清昴智能等同伴已基于该能力打造推理引擎,为金融行业提供服务,实现多轮工作应答速度提升 3 倍 。

2. 异步流式数据引擎 TQ,优化强化进建后训练

针对强化进建后训练场景,昇腾沉淀全流程最佳实际,提供一键部署的 Docker 镜像,解决业界普遍关注的训推资源调度难题 。创新推出的 “异步流式数据引擎 TQ” 技术,实现节造流与数据流解耦,样本数据无需经节造器中转,依附超节点内存统一编址实现训推节点急剧数据交互,端到端机能提升 40% 以上,该个性已合入 verl 社区并利用于告白、信贷风控等主题场景 。

3. 软硬件全面升级,开源 Agent 参考设计打造 “Claw 一体机”

面向国计民生大模型利用场景,昇腾产品分级分档升级:百亿级模型适配 A2 标卡,内存带宽达业界 1.8 倍,实现 100ms 推理时延;千亿级模型搭配单机服务器,算力达业界 2.3 倍;万亿级模型选取双机超节点服务器,为业界唯一可部署 T 级模型的产品,算力达业界 3.78 倍,突破 20ms 低时延 。
同时昇腾推出 Agentic 开源参考设计,打包优化后的推理引擎、开源模型权沉及 OpenClaw 框架为齐全镜像,同伴只需聚焦业务集成与 Skill 开发,即可急剧打造 Agent 利用一体机 ;谒诘惴务器的一体机,可实现逐日 20 亿 Tokens 供给,目前已有 20 多家同伴落地有关产品,服务教育、医疗、金融等主题领域 。

4. Atlas 350 加快卡,赋能推荐 / 多模态 / LLM 三大推理场景

昇腾颁布 Atlas 350 加快卡,搭载全新昇腾 950PR 处置器,机能较业界同类产品当先 1 至 1.4 倍,聚焦推荐、多模态、LLM 三大主题推理场景:算力内存双升级,单卡算力达业界 2.8 倍以上,支持 mxFP4 低精体式,片上内存最大 112GB,多模态天活力能提升 60%;访存粒度降至 128 字节,海量幼算子访存效能提升 4 倍;支持 SIMT+SIMD 混合编程,开发更矫捷,满足同伴多样化需要 。

五、深耕行业场景,技术与业务深度融合

2025 年 9 月,昇腾结合 20 多家 ISV 启动金融、能源等 5 大行业利用场景解决规划打造工作,半年内孵化出辅助办公、AI 实训、电子病历等十余个规划,落地 180 多家客户 。其中在智慧文旅领域,结合海天瑞声、陕文投打造的多模态 AI 伴游副手 “幼七”,已在陕西各大景点投放,为 400 多万游客提供个性化出游服务 。
在智能边端领域,昇腾盛开多档位、高集成度的模组 / 板卡,结合多 OS 兼容、多场景 SDK,使能同伴打造多样化产品 。软通华方、同泰怡等同伴基于 Atlas 300I A2 打造的液冷 AI 工作站,具备静音、高密、省电蹬着势,成为科研仿真、医疗、金融等行业本地算力设备首选 。

六、CANN 开源盛开升级,降低创新门槛

昇腾 CANN 开源盛开实现三大主题升级,进一步提升同伴开发与部署效能:
  1. 部署效能升级:将原有 8 个大包拆分为 29 个独立组件,包大幼从 2G 缩减至 0.43G,个性加载功夫从 2 分钟缩短至 20 秒;
  2. 开发履历升级:实现主流算子编程框架无感对接,2026 年将开源 PyPTO 编程范式,使算子代码量均匀削减 70%,可视化调试让复杂算子开发缩短至一周,同时提供开源 Skill 库支持算子自动天生 Agent;
  3. 社区资源升级:美满开源社区 CI/CD 流水线,2026 年 6 月将盛开 2000 卡免费算力资源,大幅降低开发者创新门槛 。

七、五大创新方向,共筑可持续 AI 产业生态

昇腾萦绕硬件、算子、加快库、模型、利用五大创新方向,以社区化运作模式赋能同伴发展:美满激励机造与知识系统,盛开能力认证加快同伴能力转型;下发丰硕创新工作,设立 2000 万首批创新激励基金;深入昇腾万里同伴打算,升级 5000 万 NRE 激励同伴创新,创新成就将上架社区 AI 利用市场,实现结合推广、共享收益 。

张迪煊暗示,昇腾与同伴已并肩走过 7 年 AI 发展之路,见证了行业从索求起步参与景落地的全过程 。将来昇腾将持续以开源盛开为主题,与更多同伴携手打造可持续、有韧性的 AI 产业生态,共同推动行业智能化迈向新高度,共赢行业智能化时期新机缘 。



版权申明:本文转载自鲲鹏昇腾开发者社区,仅用于行业资讯互换与技术分享,不代表本公司态度,不用于任何贸易用处 。版权归原作者及原出处所有,如有侵权,请联下翻霸LaBa360实时删除

拉霸LaBa360(中国区)官方网站

拉霸LaBa360(中国区)官方网站
在线征询

4008-770-775

拉霸LaBa360(中国区)官方网站
电话征询
拉霸LaBa360(中国区)官方网站 TOP
【网站地图】