更适合Agent元年的大模型,火山引擎开卷应用生态

大模型厂商又踏入了同一条河流。

图片系AI生成

图片系AI生成

不知有意还是无意,今年,火山引擎 Force Link AI 创新巡展的首站选在了杭州。这里既有新锐大模型独角兽DeepSeek,也有老牌云计算巨头阿里云,除了秀一秀肌肉之外,火山引擎还有更重要的讯息传递。

火山引擎总裁谭待表示,“如果说2024年是中国AI应用的元年,那么2025年,则极有可能是AI Agent应用的元年。”这不仅是火山引擎的洞察,也是全行业的共识,上一次大模型行业如此统一,可能还要追溯到“百模大战”。

技术和商业层面的共识有好有坏,好处是产业方向不再分散,所有资源投入到一个大方向,促进新技术的繁荣和新商业模式的构建;坏处是竞争快速从蓝海到红海,留给参与者的时间窗口越发紧张。

火山引擎是习惯于生长在产业共识之上的,最近IDC发布的《中国公有云大模型服务市场格局分析,1Q25》报告显示,2024年中国公有云大模型调用量,火山引擎以 46.4% 的市场份额位居中国市场第一。

该数据不计入海外用户模型调用量及产生在C端应用上的模型调用量,纯粹代表了火山引擎在B端客户的受欢迎程度,也可以理解为火山引擎在上一次产业共识中取得的成绩。

在当下Agent元年共识的大背景下,4月17日,火山引擎面向企业市场发布豆包1.5·深度思考模型,同步升级文生图模型 3.0、视觉理解模型,并推出 OS Agent 解决方案及AI云原生推理套件,帮助企业更快、更省地构建和部署Agent应用。

有意思的是,同一天OpenAI也发布了OpenAI 系列里能力最强的推理模型,o3 模型和 o4-mini 模型,o3 是第一代能够在思维链中使用图像进行推理的模型,还能自主调用工具,还表示未来将推出一系列编程工具。

大模型都在朝着适合Agent化的方向演进,新的共识竞争更深刻说明了一个道理,未来AI的竞争既在大模型,也在与之紧密相关的云平台。大模型厂商又踏入了同一条河流,火山引擎想继续争在上游。

“AI能够解决更复杂,更完整的问题,不再仅仅是对信息的感知、处理和生成,而是能端到端的处理任务,才能称之为一个合格的Agent。”谭待表示,要做好Agent,技术上需要做好三个准备。

首要核心是更强的模型,需要有能力做好思考、计划和反思,而且一定要支持多模态。因为真实世界的任务需要耳朵、嘴巴和眼睛来共同完成。

其次是要有更好的架构和工具,支持大模型操作数字和物理世界,构建好OS agent。

最后是通过AI云原生,不断降低模型推理的成本和延迟,让应用普及。

豆包深度思考模型,更适合Agent的大模型

模型本身是重中之重,此前大模型行业掀起的价格战,没能推动大模型广泛落地,本质上还是因为模型的能力有限。

深度思考模型向前走了一步,通过强化逻辑推理和思维链能力,能够更好地满足复杂场景需求,也证明了模型性能仍有潜力可挖,如推理速度、多模态能力、逻辑深度等。

当所有厂商都在“卷”深度思考模型时,深度思考模型的核心竞争力就是“效价比”,使用成本、技术门槛的降低以及性能的提高,在专业场景的可靠性和实用性等,为企业客户提供更多商业闭环的可能,这也是本次豆包大模型的更新方向。

本次豆包1.5·深度思考模型突出体现在效果好、低延迟和多模态,包括两个版本,一个版本是大语言模型Doubao-1.5-thinking-pro,一个是多模态版本Doubao-1.5-thinking-pro|m。前者推理能力更强,后者支持视觉推理,开发者可以按需使用。

豆包1.5·深度思考大语言模型采用了MoE架构,总参数为200B,激活参数仅20B,能够以较小参数实现媲美顶尖模型的效果。同时基于高效算法,豆包1.5·深度思考大语言模型能在提供行业极高并发承载能力的同时,实现20毫秒的极低延迟,在很多延迟敏感的场景,也能使用深度思考模型。

根据现场公布的数据来看,豆包1.5·深度思考模型在专业领域的推理任务中表现出色,数学推理AIME 2024 测试得分追平OpenAI o3-mini-high,编程竞赛和科学推理测试成绩也接近o1。在创意写作、人文知识问答等通用任务上,模型也展示出优秀的泛化能力。

为了提升模型的通用能力,豆包1.5·深度思考大语言模型优化了数据处理策略,把可验证数据与创意性数据进行了融合处理,满足各类任务的需求。此外,大规模强化学习是训练推理模型的关键技术,通过采用创新的双轨奖励机制,兼顾“对错分明”和“见仁见智”的任务,豆包1.5·深度思考大语言模型有效实现了算法的可靠优化。

推理和多模态,是目前公认的大模型两大方向,豆包1.5·深度思考模型多模态版本也具备了视觉推理能力,能像人类一样对看到的事物进行联想和思考,极大拓展了智能推理的应用边界。

谭待举例说明,“模型可以看懂复杂的企业项目管理流程图表,快速定位到关键信息,并以强大的指令遵循能力,严格按照流程图,回答客户的问题;分析航拍图时,能结合地貌特征判断区域开发可行性。有多模态能力的加持,豆包1.5·深度思考模型可以助力企业在更多场景实现智能化升级。”

此外,豆包·文生图模型升级为3.0版本正式向企业开放,已在即梦AI、豆包产品上线,支持2K分辨率直出,生图结构准确性、小字生成与排版、美感、真实度等方面具有优势,在近期登上了权威竞技场Artificial Analysis文生图榜单第一梯队。

Agent元年,意味着用户对模型的要求更高,在深度思考能力、多模态、推理成本、延迟存在短板的模型,将承受来自客户端的较大压力,这也是大模型落地过程中的确定趋势。

DeepSeek之后,为什么模型厂商呈两极分化

行业内一个广泛关注的现象是,DeepSeek之后,有的模型厂商已经转向垂类场景或应用领域,云厂商反而以更快的速度迭代。

这是因为,DeepSeek成功不只是模型算法的更新,更是AI infra的全链路优化,而目前做AI infra做得好的,以云厂商为最。

国内国外云巨头成为基础模型的主要参与者,AI独角兽也大多有云厂的直接投资,其中的显性逻辑是,大模型一定会高度消耗用云量。

谭待也提到,传统的云是伴随着互联网发展起来的,当时的云原生很多是互联网应用(如 web、APP)在实践中涉及的中间件、数据库、容器等方面。现在范式发生了变化,以前是人通过编写软件规则、中间件等来实现对业务的抽象,现在则是利用数据加上模型自动去解决更多的问题。

这种情况下,上层业务对云的要求越来越多,也催生出新的产品,火山引擎把这类产品叫做 AI 云原生。原来的云原生是为了适应互联网发展,现在的 AI 云原生是为了满足 AI 和 Agent发展的需求。

大模型要实现更好的效果,就要做底层大量创新算法和架构优化,基于新模型再做底层基础设施的优化,更好的模型呼唤更佳的底层基础设施,更具性价比的底层基础设施推动模型的广泛普及,这也是AI与云的飞轮效应。

起初很多人低估了云在AI的作用,从百模大战到六小龙,再到DeepSeek掀起的热潮,大模型发展至今,本质上是一个技术和资源的棋局,与其说DeepSeek对所有云厂商是一个带动算力消耗的利好,不如说是一个警醒,让所有人认识到,只有更好的AI infra,才能创造出效果更佳的大模型。

一个未经验证,却被广泛认可的事实是,开发者此前在火山引擎上调用豆包大模型,延迟低、成本低、效果也不错,大家不确定豆包大模型本身好还是火山引擎的云服务好,现在有了DeepSeek开源模型做对比,当所有云厂商接入DeepSeek,火山引擎也是其中更稳定、更快的厂商,验证了火山引擎的云服务能力。

回到模型本身,豆包大模型的迭代与火山引擎紧密相关,从数据、强化学习到AI Infra进行了更深入的探索,让模型在较小参数下,获得出色推理能力。AI和云是一体两面。

以云计算基本的三大件为例, AI 时代更多的计算变成以 GPU 为核心,旧有架构难以充分发挥 GPU 高算力、高带宽优势,同时 GPU 训练和推理场景,也对高速互联、在线存储和隐私安全提出了更高的要求。

AI 云原生,将以模型为中心重新定义云计算的技术架构与业务流程,通过云原生技术栈与AI能力的深度融合,模型的开发、部署、迭代等能力和效果,将成为基础设施比拼的核心维度。

为此,火山引擎一直在以AI云原生为理念推陈出新,譬如本次大会新发布的AI云原生推理套件ServingKit,整合了 AI 容器编排、AI 网关、推理全链路观测和 AI 加速套件的能力,支持在大规模 GPU 集群上运行推理工作负载,表现出更强的推理性能、更优的推理成本、更广泛的生态增强。

有意思的是,火山引擎可能比所有云厂商更早看清AI云原生趋势,字节跳动主营业务大量的搜索、广告、推荐,就是基于人工智能技术来实现的,火山引擎对技术预判的感知有天然优势。在大模型之前,外界多少有些看不清字节跳动为何要卷入云计算行业,结果火山引擎“等”到了大模型,新技术发展的脉络自有“巧合”。

火山引擎此前就表示,下一个十年,计算范式应该进入 AI 云原生的新时代。这在如今已经成为一个显学,而当通算时代的云生态被拆解,智算时代的云生态应当如何?

大模型,如何重塑云生态

如果说上一代通用算力体系培育了现在的应用生态,那么以云计算为代表的智算体系,理应孕育出AI应用生态。所有云厂商都在朝着这个方向演进,只是速度有快有慢,能力有好有坏。

云计算的能力决定大模型的天花板,大模型的能力上限决定应用的天花板,大模型的交付成本决定应用创新的加速度。

云厂商应该起到承上启下的作用,如前所述,对下,更强的大模型需要更强的AI infra能力,更强的AI infra能力进一步推进大模型的普及,火山引擎打造了以 AI 负载为中心的基础架构新范式。

对上,比大模型技术本身更重要的是,如何让大模型落地,这就离不开一个完整的应用生态,云厂商是为开发者提供大模型应用平台的最佳角色。

谭待也表示,云厂商需要有更好的模型、更低的成本,多模态也是更好模型的一种体现。但这还不够,从 AI 应用从聊天、信息处理到 Agent 的发展过程中,需要更多的解决方案,需要 Agent 操作电脑、手机,这就需要电脑和手机的相关组件,以及能够操作界面的模型。

此外,还包括强化学习框架、安全保障以及底层数据处理等方面。未来,火山引擎将围绕 AI 云原生,在存储、计算、数据、安全以及新的中间件等方面推出一系列的产品。

在本次大会上,火山引擎推出了OS Agent解决方案,并演示了由Agent操作浏览器,搜索商品页,实现iPhone比价的任务,甚至由Agent在远程计算机上用剪映进行视频编辑、配乐。

具体来看,OS Agent解决方案包含豆包1.5·UI-TARS 模型,以及veFaaS函数服务、云服务器、云手机等产品,可实现对代码、浏览器、电脑、手机以及其他Agent的操作。

其中,豆包1.5·UI-TARS 模型将屏幕视觉理解、逻辑推理、界面元素定位和操作整合在一起,突破传统自动化工具依赖预设规则的局限性,为Agent的智能交互提供了更接近人类操作的模型基础。

好的模型和工具能够加速Agent的落地,但Agent也会带来更大量的模型推理消耗。面对大规模推理需求,火山引擎打造的AI云原生·ServingKit推理套件,让模型部署更快、推理成本更低,GPU 消耗相比传统方案大幅下降。

在实际业务场景中,基于AI云原生·ServingKit推理套件,通过算子优化,DeepSeek R1满血版 TPS 提升超2.4倍;智能路由提供负载感知路由和 KVCache 感知路由,使 TTFT 降低60%;EIC 在多轮次对话中,TTFT 从3s 降低到1s,长文本推理 KVCache 命中率提升了10倍以上。

去年12月,豆包大模型的日均tokens调用量是4万亿。而截至今年3月底,这个数字已经超过了 12.7 万亿,自发布以来不到一年的时间里,实现了超过106倍的高速增长。金山办公、梅赛德斯-奔驰、浙江大学、杭州银行等不同行业的众多客户,都在火山引擎上使用豆包大模型,打造自己的AI业务生态。

AI时代云竞争的终局,是能够在底层大模型到上层应用生态的极致优化,这种价值才是难以复现的护城河。沉淀数年的火山引擎,终于在大模型时代露出了峥嵘,不是在通算时代内卷,而是在智算时代,用AI价值反向补全自己的能力版图。

当大模型厂商又踏入了同一条河流,关键的胜负手就不是一两次技术灵感的偶然,而是围绕全栈AI深度能力的多维竞争,火山引擎没有理由不争在上游。(本文首发于钛媒体APP)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

2025-04-21 23:02

*ST中利:申请撤销退市风险警示及部分其他风险警示

2025-04-21 23:01

智飞生物:一季度净亏损3.05亿元

2025-04-21 23:00

新能源发电能力年度预测:2025年全球风电和光伏发电能力将提高

2025-04-21 22:55

领湃科技:2024年净亏损3.94亿元

2025-04-21 22:51

道琼斯工业平均指数最新报38299.26,日内跌2.15%

2025-04-21 22:50

传智教育:公司股票被实施退市风险警示,股票简称变更为“*ST传智”

2025-04-21 22:47

汉得信息:2024年净利润约1.88亿元,同比扭亏

2025-04-21 22:45

消息称马斯克可能会周二宣布退出“政府效率部”的日期

2025-04-21 22:41

致尚科技:拟发行股份及支付现金购买资产,股票复牌

2025-04-21 22:41

美国天然气期货跌幅扩大,价格下跌5%

2025-04-21 22:39

人身险产品预定利率年内下调概率加大,业内预测:最快9月下调

2025-04-21 22:33

美国股市延续跌势,标准普尔500指数下跌2.16%

2025-04-21 22:32

红相股份:2024年净亏损3.53亿元

2025-04-21 22:24

比特币向上触及88000美元/枚,日内涨3.31%

2025-04-21 22:23

特斯拉盘中一度跌超7%

2025-04-21 22:19

标普500指数跌幅扩大至2%,纳斯达克100指数下跌2.4%

2025-04-21 22:15

新晨科技:拟收购天一恩华96.96%股权,股票明起复牌

2025-04-21 22:15

现货黄金上破3430美元/盎司关口,日内拉升逾100美元

2025-04-21 22:11

南京银行:2025年第一季度净利润61.08亿元,同比增长7.06%

2025-04-21 22:10

海南华铁:一季度净利润1.91亿元,同比增长21.72%

扫描下载App

Baidu
map