基于国产昇腾AI云服务训练,华为云发布盘古大模型5.5

创新场景
盘古大模型基于昇腾云的全栈软硬件训练,标志着基于昇腾可以打造出世界一流大模型。

6月20日消息,在华为开发者大会2025(HDC 2025)上,华为常务董事、华为云计算CEO张平安宣布基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线,同时宣布盘古大模型5.5正式发布,自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型全面升级。

CloudMatrix 384超节点,新一代昇腾AI云服务 

随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。华为云相关专家表示,传统的分布式系统本质上是一个松耦合系统,服务器之间一般用 25Gbps或100Gbps 以太网带宽就可以满足绝大多数应用的需求。而 AI 时代的应用负载与传统业务有很大不同,当前服务器集群的以太网互联带宽已经越来越难满足前面提到的 AI 时代的训练、推理等场景的需求。

云平台必须通过新型的超高性能网络把大量 GPU、CPU等多元算力连接在一起,并且用“对等架构”替换掉传统的“主从架构”,让多元算力可以直接通信,不需要通过 CPU,这样才能满足需求,这个能力是 AI 原生云基础设施最重要的能力。

华为云新一代昇腾AI云服务基于CloudMatrix 384超节点,首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,单卡推理吞吐量跃升到2300 Tokens/s,与非超节点相比提升近4倍。

据悉,超节点架构能更好地支持混合多专家MoE大模型的推理,可以实现“一卡一专家”,一个超节点可以支持384个专家并行推理,极大提升效率;同时,超节点还可以支持“一卡一算子任务”,灵活分配资源,提升任务并行处理,减少等待,将算力有效使用率(MFU)提升50%以上。

对于万亿、十万亿参数的大模型训练任务,在云数据中心,还能将432个超节点级联成最高16万卡的超大集群;同时,超节点还可以支持训推算力一体部署,如“日推夜训”,训推算力可灵活分配,帮助客户资源使用最优。

昇腾AI云服务已为科大讯飞、新浪、硅基流动、面壁智能、中科院、360等超过1300家客户提供澎湃的AI算力。

基于国产算力,盘古大模型5.5全面升级

与其他大模型厂商,华为在大模型领域的战略是聚焦行业,通用大模型也是为了更好深入行业AI,盘古大模型的使命是让各个行业不必重复“造轮子”,不必从零打造自己的企业大模型。基于此,华为云本次发布盘古大模型5.5,五大基础模型全面升级。

首先是盘古自然语言处理NLP大模型,全新的718B 深度思考模型是一个由256个专家组成的MoE大模型,在知识推理、工具调用、数学等领域大幅增强,处于业界第一梯队。盘古大模型基于昇腾云的全栈软硬件训练,标志着基于昇腾可以打造出世界一流大模型。

同时,盘古大模型5.5在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行升级,例如,盘古提出了自适应快慢思考合一的技术,通过构建难度感知的快慢思考数据和两阶段渐进训练,实现模型根据问题难易程度自适应地切换快慢思考,简单问题敏捷回复,复杂问题深度思考,整体模型推理效率提升8倍。

盘古深度研究DeepDiver通过长链难题合成、渐进式奖励等关键技术,可以在网页搜索、常识性问答等应用上获得很高的执行效率,如可以在5分钟内完成超过10跳的复杂问答、生成万字以上的专业调研报告等,大幅提升工作效率。

面向行业企业客户,华为云提供了盘古基础及行业大模型、预训练和后训练语料、数据工程工具集、模型训练工具集、行业裁判模型、行业评测平台六大核心能力,通过华为云ModelArts完备的工具链和工程化的方法,将企业自己沉淀的数据资产,进行高质量的增训、微调和强化学习,让行业客户能够快速打造自己的专业大模型。

中国农业科学院在盘古大模型基础上,增训海量专业文献与跨物种多组学数据,构建了面向育种领域的农业科学发现大模型,实现精准农业专业知识问答、高效基因分析和定向位点设计,缩短了早期研发周期,提升了目标性状改良精准性。当前,农科院团队已基于该农业科研智能系统成功地对一种水稻材料进行了株型改良,株高较常规品种降低约25%,抗倒伏能力显著提升,同时产量不受影响。

会上,张平安还发布盘古医学、金融、政务、工业、汽车五个具备深度思考能力的行业自然语言大模型,加速行业智能化,并将在6月底正式上线。

基于盘古多模态大模型的世界模型,可以为智能驾驶、具身智能机器人的训练,构建所需要的数字物理空间,实现持续优化迭代;基于盘古大模型的多模态能力及思维能力,华为云正式发布CloudRobo具身智能平台;盘古预测大模型采用业界首创的triplet transformer统一预训练架构,极大地提升预测大模型的精度,并大幅提升跨行业、跨场景的泛化性。盘古科学计算大模型和盘古计算机视觉CV大模型也同步更新。

过去一年,盘古大模型已在30多个行业、500多个场景中落地,在政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等领域发挥价值。

加码AI云,发布企业级Agent平台

除了帮助客户更好地拥抱AI,华为云也在不断通过AI技术重塑云服务,打造AI Native的云。华为云CTO张宇昕发布企业Agent平台ModelArts Versatile,内置了各类业务场景的经验模板,支持自助式的智能体开发,Versatile还提供了智能化工具链,实现Agent分钟级工作输出,达成传统人工天级工作成果,有效降低Agent开发的复杂度与专业性。

CodeArts Doer构建了业界最全的6大开发领域专业Agent,覆盖项目经理、产品管理、开发、构建、测试和部署全流程,将软件研发端到端提效40%以上;GaussDB Doer在精准查询方面,基于盘古大模型,利用全球上万个GaussDB运维案例的百亿Tokens数据微调,构建专业运维基模型;MetaStudio通过个性化TTS语音合成,数字人的音色相似度、读音准确率都达到业界领先。

此外,华为云提供包含语料数据安全、模型安全、推理安全、应用安全在内的端到端大模型安全方案。大模型防火墙通过提示词攻击防范和敏感内容实时检测,保障大模型推理安全。一方面识别越狱、角色扮演、恶意指令等主流提示词攻击手段;另一方面预置了百万级规则库,针对提示词攻击的检出率大于95%,整体能够帮助模型综合安全评测得分提升20%以上。

华为云是华为公司面向开发者的统一底座,目标打造昇腾、鸿蒙、鲲鹏、GaussDB、欧拉等各项根技术的生态,目前华为云开发者已超过800万,支持鲲鹏、昇腾、鸿蒙等生态的开发者总计达到1300万。(本文首发于钛媒体APP,作者 | 张帅,编辑 | 盖虹达)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

19:33

渤海租赁:控股子公司出售24架附带租约的飞机租赁资产,市场价格约为15.89亿美元

19:26

四川出台20条“投资于人”新政,支持新兴领域拓展就业岗位

19:26

中国核建:股东中国信达2025年11月19日至2026年2月18日减持803.54万股

19:18

马斯克设想从月球电磁弹射AI卫星

19:12

李强主持召开国务院常务会议,讨论《中华人民共和国水法(修订草案)》

19:10

李强主持召开国务院常务会议,审议通过《关于加强基层消防工作的意见》

19:10

李强主持召开国务院常务会议,研究推进银发经济和养老服务发展有关工作

19:10

李强主持召开国务院常务会议,对抓紧做好春节假期后政府工作作出部署

19:09

苹果:预计Mac mini将于今年晚些时候在其位于休斯顿的新工厂实现本地化生产

19:08

猫眼娱乐:预计2025财年净利同比增长约196.9%-224.4%

19:04

春节假期国内出游5.96亿人次

19:03

天奇股份:董事沈保卫2025年12月30日-2026年2月13日减持25.38万股

19:01

ST金鸿:启动庭外重组债权申报,多项风险需关注

19:01

智信精密:公司董事拟减持不超过1.8562%公司股份

19:00

熊猫金控:股票异常波动,提示退市及立案等风险

18:49

美国联邦快递公司起诉美政府要求全额退还关税

18:49

红宝丽:副总经理陶梅娟拟减持不超过31万股

18:48

幸福蓝海:来源于两部影片《飞驰人生3》《熊出没:年年有熊》的营业收入共计约为79万元-102万元

18:48

嘉欣丝绸:控股股东一致行动人质押1.79%股份

18:47

嘉泽新能:持股5%以上股东减持计划期限届满,减持1.5232%股份

扫描下载App

Baidu
map