文章详情页顶部通栏

从“老场景”的“新解法”下手,突破Agent落地难题| 2025 ITValue Summit前瞻WAIC现场版:AI落地指南系列

创新场景
Agent的引入,从根本上改变了技术需求的界定方式和产品设计逻辑。Agent出现之前做产品,识别需求很重要,尤其是要识别出小需求和伪需求。

人工智能的产业化进程,早已超越概念探索,正以 “老场景,新解法”的范式,静默却深刻地重构各行各业。在钛媒体2025 ITValue Summit前瞻WAIC现场版:AI落地指南系列的直播中,科锐国际CTO刘之与钛媒体联合创始人刘湘明聚焦人力资源服务领域,深入探讨了Agent(智能体)的实际落地路径。

当前人力资源领域,招聘相关的AI新应用层出不穷。面对尚未收敛的技术环境,科锐国际CTO刘之强调务实策略:回归核心业务流程(“老场景”),寻找颠覆性解决方案(“新解法”),通过小范围验证成功后再规模化复制。

从"老场景"出发,寻找AI单点突破

“AI仍处早期,技术变革仍在进行,新场景和新商业模式或需两三年才能成型。现阶段,我们更关注如何用AI革命性地解决既有痛点。” 刘之在对话明确表示。同时,他提出了通用 Agent 工作记忆的三难困境:长上下文窗口、有效注意力和高信息密度的三者不可能同时实现,并且认为Agent落地可以从问题清晰度和费力度两个维度出发进行选择。

 AI应用三阶段:从信息检索到智能决策

刘之将生成式AI在业务中的应用演进划分为清晰的三阶段:第一个阶段是 ChatGPT阶段:重塑知识获取方式。科锐国际利用其庞大人才库与大模型结合,显著提升了猎头这种知识密集型业务的效率。 

第二个阶段是多模态阶段:随着多模态模型成熟,科锐国际聚焦语音与文本模态的融合,尤其用于优化招聘中的语音沟通环节。 

第三个阶段是Agent阶段:随着 Agent的推理、长程规划和工具调用能力的提升,重构短流程业务,实现从辅助决策到自主执行的跨越,成为科锐国际主攻的方向。

Agent时代:需求管理与产品设计的范式转变

Agent的引入,从根本上改变了技术需求的界定方式和产品设计逻辑。Agent出现之前做产品,识别需求很重要,尤其是要识别出小需求和伪需求。如果某个小需求同时具备高频出现的特点,往往这个需求是一个非常好的抓手,能够帮助实现单点突破。但大部分情况下,这类小需求难以寻找,往往更多的是无法被规模化的小需求。

这两类需求产生的原因主要有三点:1,对技术上限不了解,容易陷入宏大叙事;2,没有真正理解需求的本质;3,没考虑适用范围和频次。

针对这些问题,科锐国际提出了“问题方案链“的需求管理方法。其核心是明确需求涉及的对象、具体问题以及对应方案。设计出方案Before和After的对比,并针对方案本身分析可能存在的问题和进一步优化的方向,此外还要判断实施后是否能带来显著改善,进而进入决策环节。 

Agent 出现后,产品设计与需求管理发生巨变。Agent核心是自主性,强调自主完成任务—— 不同于以往系统聚焦流程节点(交付物)并固化到线上,Agent 时代更需观察优秀顾问的感知与决策过程,因此需要更多顾问参与产研环节。

刘之认为,刚落地Agent时应当优先解决基础能力,再落地场景需求。例如先构建好沙箱、工作记忆与长期记忆、感知系统、工具等等。当基础能力完善后,再去看场景需求。落地场景需求时往往会要求基础能力提出一些新的要求。这种迭代螺旋上升的方式可以既不失去Agent的自主性,又能更好的贴近场景。展望未来,刘之表示,2025年科锐国际的核心目标是将MatchSystem持续改进以增强其从语义级匹配往应用级匹配过渡的能力,并与招聘场景进行结合,最终形成SearchAgent。他透露科锐国际已经开始内测更强大的Agent产品,自动化与自助化标签定义、CRN 图模型等场景化应用也在同步推进。

附上本期直播时间轴,帮你快速跳转感兴趣的部分

03:03  Agent应用现状

04:17 科锐AI应用布局

06:43 大模型发展的三个阶段

11:20  Agent应用痛点

17:40 如何选出“真”AI需求

27:45 两个指标,筛选Agent优先落地场景

33:54  AI正在重塑各行各业

38:17  AI如何重构人力资源行业

以下为对话实录,经钛媒体APP整理:

 

招聘还没有诞生“新场景”

刘湘明:首先,请您简单介绍一下科锐国际。

刘之:科锐国际是一家技术驱动型的人力资源解决方案公司,是国内第一家在A股上市的人力资源公司。目前在全球有160多个分支机构,主要提供猎头、招聘流程外包以及灵活用工等人力资源服务,核心优势是技术+平台+服务的商业模式。

刘湘明:此次参加WAIC大会, 您的感受如何?

刘之:我看到了具身智能和很多硬件厂商的展台。AI当然仍然还是更多是围绕着基础设施,应用厂商还比较少。不过我相信明年、后年,WAIC上会出现更多的应用公司。另外,我觉得技术氛围十分不错,能在会上看见一些不错的技术展示。

刘湘明:AI 落地是目前热议的话题,现在 AI 在招聘业务的应用和改造,已经到什么程度了?

刘之:目前国内外在招聘方面的AI应用有很多进展。整体上看,我觉得人力资源公司和SaaS公司发展是最快的,而企业侧相对来说慢一点。虽然AI仍处于完善基础设施的阶段,但我相信过一段时间之后,在招聘场景中会有更多的应用,甚至新的商业模式出现。

刘湘明:目前科锐国际在 AI 应用做了哪些尝试?

刘之:科锐在 ChatGPT 刚问世的时候就开始了 AI 应用的尝试。我觉得这个过程中大概经历了三次技术突破。

第一次是 ChatGPT 问世。ChatGPT 改变了知识获取的方式。在这个阶段,科锐主要针对猎头业务展开 AI 化。因为科锐所服务的部分细分市场是围绕着技术岗位的招聘业务展开的。所以猎头业务需要对岗位的专业知识有深度理解。

获取企业内部数据有三种方法:微调、上下文学习与 RAG。我在两年多前判断微调垂直大模型并没有什么实际意义:参数小的模型容易微调,但是智能化水平低;参数大的模型难以微调。科锐的数据量太大,没法放在上下文中。所以我们主攻的方向是 RAG。而 RAG 的核心就是 Embedding 模型,过去两年,科锐一直在训练招聘与技能的垂直 Embedding 模型和研发MatchSystem匹配系统。

第二次是多模态大模型。但我认为,视觉 - 语言的多模态大模型缺乏 ScalingLaw。这可能和语言是由人类创造的一种压缩格式,所以容易出现 ScalingLaw有关。而语音 - 语言的多模态都属于人类创造的数据形式,是具备 ScalingLaw 的。在这个阶段我们核心关注 AI 电话这个场景。因为在招聘过程中,很多都需要进行电话沟通。

第三次是 Agent。这个阶段是从 DeepSeek R1 通过强化学习将推理能力提升到了一个新高度开始的。这个阶段我认为最佳的发展方向是:轻微重复的短流程业务。

刚才讲的是技术,再讲讲产品。我们很多年前就判断未来的招聘行业的市场变化速度会越来越快。原因有两个:第一个是国内产业链越来越细分,细分岗位也就越来越多,比如工程师岗位,原先用五个类别划分就够了,现在可能要九类,甚至十类进行划分。第二个是技术呈现出指数型的发展。

我们在三年前开始构建大数据平台,所以积累了非常多的数据。我们希望利用研发的 MatchSystem 匹配系统和 CRE Embedding 模型的能力,将线上线下,增量存量、区域行业的客户、职位、人才和顾问进行实时 AI 匹配,进而可以更快的响应市场的快速变化。这些技术已经应用在科锐内部系统和平台产品禾蛙上。

刘湘明:您可否分享一些具体的细节和经验?

刘之:Embedding 模型相当于将简历和招聘需求能够编码成一个计算机能读懂的语言,从而让大模型在访问企业内部数据的时候,可以快速在一个庞大的数据库中找到想要的信息。

在今年 4 月份以前,Embedding 模型还处在语义阶段。语义即代表了一段文本的潜在意义。当来到了 Agent 时代,这种技术就存在问题了。比如我问 Agent:" 我想知道科锐数据库中,有哪些产品经理是有从 0 到 1 经验的?" 这就需要我看完这个人的简历后,进行一些推理。比如这个曾经从 0 到 1 创业过,这个人曾经在小公司待过,而这个公司曾经发展很快,那么他就会有从 0 到 1 的经验。推理是指通过多个证据,并得出结论。还有些情况下,Agent 还需要做一些多跳检索。比如我想查询 " 某家公司内,有一个人选,这个人曾经在哪些地方工作过 "。

多跳检索和推理任务在 Agent 时代里,如果用传统基于语义的 Embedding 模型的话,Agent 需要与系统进行反复交互。这样消耗的 Token 量非常的大,速度很慢,而且还不一定准确。

我们在两年多 Embedding 的实践中,一直有一个疑惑:" 为什么像 BERT 这样的 Encoder 架构,它的 Scaling Law 不明显?" 后来我们从强化学习、语言学和认知心理学的角度进行了深入研究,才有了一些顿悟。我们过去总以为语言的本质是为了传递信息和知识,也就是我们所说的 " 语义 "。但其实,语言与思维有着更深层的关系。比如人在思考的时候,脑海里会出现很多词汇或句子。这种语言形式,我们称之为 " 内语(Inner Speech)"。内语有两个关键作用:第一个是帮助人保持注意力集中,第二个是引导和组织人的思维过程。

既然我们认为语言与显性思维有关,那么我们为什么不能在 Embedding 模型中把这种 " 思维链" 激发出来呢?基于这个认识,科锐正在研发两个创新性的技术:第一个叫 RT(Refine Thought)推理技术,它通过多次前向传播,快速激发出 Embedding 模型在预训练阶段学习到的推理能力。RT 与Embedding 模型结合,已经在多个公开数据集上刷新了 SOTA(State of the Art,业界最优)。第二个是 正在训练的CRE-T1 模型。它引入了基于强化学习的训练框架,并采用token级别的信用分配机制,从而摆脱传统对比学习的约束,使 Embedding 模型在推理状态空间中实现更加有效的跳跃与泛化。

刘湘明:招聘看起来是一个人力资源的环节,但其实这里面个性化差异非常大,面向不同的岗位、人才,分类庞杂,在进行 AI应用之前,你们怎么梳理这些需求的?

刘之:首先先谈谈对行业的理解。我认为服务跟产品是两回事,管理学上讲,服务管理与产品管理本质上存在区别。服务管理比较强调激发顾问的自主性,需要充分授权。所以在服务行业里,过分强调标准化违背了行业特点。但是我们要做系统,即使有自定义能力,也必须具备一定的标准化能力。这就产生了冲突。

在这种个性化较多的情况下,最核心的是进行识别需求。在需求识别上,我们可以分为两个阶段:一是 Agent 出现之前;二是 Agent 出现之后。

Agent 出现之前做产品,最核心的是要识别出小需求和伪需求。如果小需求,同时高频出现,往往这个需求是一个非常好的抓手,能够实现单点突破。这两类需求产生的原因:1,对技术上限不了解,过于宏大叙事;2,对需求背后的真相不理解;3,没考虑需求的应用范围和频次。

针对此,科锐提出了 " 问题 - 方案链 " 的需求管理方法。要明确 " 谁 "" 问题 " 和 " 方案 "。需要明确具体且有代表性的用户角色。问题需要精准定义待解决的痛点。对比 " 现有方案 "(Before) 与 " 新方案 "(After),关键是新方案能否带来十倍级体验提升,同时预判新方案可能带来的衍生问题。

另一方面,在 AI 早期,我们认为应该尽量做 " 老场景 " 的 " 新解法 "。因为技术还在变革,可能再过两三年才会出现新场景。

Agent 之后,产品设计和需求管理的方法又发生了巨大的改变。Agent 更强调自主性,自主完成任务。原先做系统的时候,需要特别关注流程节点,我们称为交付物。产研负责将线下的交付物固化到线上。但 Agent 时代,交付物的固化已经不重要了,更多要观察的是优秀顾问的感知和决策的过程。所以,Agent 需要更多优秀顾问参与到产研开发环节中。

这个阶段,要先解决基础能力再解决场景需求。例如,以科锐正在内测的 Agent 系统。举个例子,基础能力包括模型、沙箱(沙箱就是一台电脑,需要一个代码执行环境,同时还需要访问外部网站)、工作记忆与长期记忆、工具等等。解决了基础能力之后,才开始优化具体的场景。在场景开发时候,还对基础能力提出一些特别的需求。

Agent 与人一样,都需要在一个巨大的问题空间中,搜索解决问题的路径。这个问题空间我们可以用一个叫问题清晰度的指标来进行衡量。问题清晰度用专业的术语可以称为 " 问题空间结构良好性 "。问题清晰度包含三个方面:第一是当前状态清不清晰;第二个是目标状态清不清晰;第三个是搜索空间是否巨大。当问题清晰度很低的情况下,搜索是非常复杂的。

第二个指标叫费力度。认知心理学的术语可以称为 " 认知负荷 "。它说明在这个任务当中需要耗费多少心智资源。

用费力度和问题清晰度两个指标并结合频次去进行判断。比如有些高问题清晰度、低费力度的问题,如果这类问题是反复出现的,那么企业应用优先解决;而低问题清晰度、高费力度的问题,这类问题价值极大(例如 AI 编码、Coding)。通常使用长程规划(甚至是逐步规划),并结合更多的工作记忆才能解决。

使用这两个指标对企业的业务或任务进行分层,找出要重点解决的场景。找到场景后,还需要进一步去思考让 Agent 先模仿人类,再如何超越人类。

刘湘明:我再追问一下,科锐国际 AI 应用与员工协作关系是什么样的?如何用 AI?

刘之:先谈产研内部的协作关系。我觉得这一波 AI 是高度学科融合的,正在对所有职能的分工进行重塑。最早大模型关心的是工程与深度学习算法的融合,到了具身智能之后开始出现了强化学习,再到 Agent 时代,更多讨论的是认知心理学。

过去我们一直在强调分工和协作,但这一轮 AI 浪潮的到来,正在加速消灭分工和协作。

所以在过去的几年时间内,无论是产品、数据、工程师,还是测试、前端、后端等部门的员工,科锐都做了很多融合工作,比如,我们要求后端会写算法;产品经理会写代码....这样的融合才能拉齐大家的认知。

再从业务与产研的协作关系来看。我认为业务与产研的协作关系,应该从原来的产品帮助业务梳理流程,到实现业务自己梳理,自己实现应用的过程。产研提供的更多是可以根据业务人员的需求进行定制的通用产品。业务人员可以自己创建一个独立的 Agent,并通过对话的方式训练它。但核心在于业务人员能不能把自己的感知和决策过程抽象提炼出来。

刘湘明:所以说,真正的技术革命是对组织文化、传统管理提出了巨大的挑战。

刘之:对,管理革命的确经过了很多阶段。从早年的科学管理,到行为管理,到目标管理,再到过去几年大厂所推行的网格化管理。其实早在中台出现之后,尤其在产研部门,更多出现的是反分工,消灭分工。

原先,在一些诸如打车、外卖等轻服务的行业,已经利用数字化的手段实现了一定程度上的标准化。而产品管理,比如服装行业,他们其实是用数字化的方法,实现了一定程度的个性化。

这一轮的 AI 变革对于服务行业而言,最大的改变是:能够让服务行业的标准化程度再高点,或者说是将其自动化程度再提高一点,这就会带来一个全新的管理革命。

此外,我问过一些大模型一个问题:当 Agent 在一家企业里面的应用数量超过人类会怎样?超过 100 倍会怎样?大多数模型给我的答案是:中层干部会消失。中层原来特别强调协调,他们的职能可能就是上传下达,协调所有人。

刘湘明:以招聘为例,原来写简历是为了要考虑搜索优化,未来是不是要考虑 AI 优化的问题?

刘之:这个问题我们前段时间还真考虑过。我们现在很多时候是基于人类语言进行交互和处理,那么我们有没有可能为 AI 创造一个全新的语言,它的压缩率更高(因为中文压缩率是比英文压缩率要高的)。后来我试着用 AI 创造出了一个高度压缩的语言,说实话连我自己都没看懂。 

刘湘明:相比上一个技术时代,哪些新的突破性技术在推动产品智能化进程中,起到了关键作用?

刘之:对科锐而言,第一是预训练语言模型和合成数据对我们的帮助极大。在此之前,企业做匹配系统更多的是靠标签以及知识图谱之类的方式。这需要大量的人工标注。但有了预训练语言模型的话,标注量就少了很多。

合成数据方面,毕竟原有的数据十分有限,通过合成的方式,我们可以将原先有限的数据扩展出特别多的数据,这些数据再通过对比学习等方法进行训练。

第二点我认为最大的变化是推理。我们过去理解匹配是语义的匹配,后来我们认为匹配不仅是语义,可能还包含了组织结构、个人偏好等方面的匹配,现在,我们认为匹配就是推理。

推理呈现更多的是人类思维,我认为推理是一个意义重大的事情。而 DeepSeek-R1问世之后,反响之所以这么大,也是因为他对推理,尤其是结合强化学习这方面的突破,让人们明白了原来推理可以通过强化学习,仅需要少量数据(比预训练少),就能达到原先预训练阶段的推理能力。

刘湘明:AI+ 人力资源招聘场景的上限取决于什么?

刘之:我先讲一下对 Agent 上限的理解。

我认为通用 Agent 最大的难点在于工作记忆有限。Agent 可以通过增大步数或提升计算总时长来提升任务执行的效果。但这会产生巨大的上下文(工作记忆)。而很多大模型虽然名义上的上下文窗口很大,但实际有效的注意力有限。

我个人认为在 Transformer 架构下有一个 " 三难困境 ",即 " 上下文窗口大小 "、" 有效的注意力 " 和 " 高信息密度 ",这三者无法同时实现。

比如长文章的检索任务,大部分模型的有效注意力能到 90% 左右,但如果是推理任务,比如需要从里面根据某极端内容推理得到一个结果,大部分模型的有效上下文,有效注意力长度就会变成上下文窗口大小的 60% 左右。

而招聘 Agent 的上限取决于感知能力。感知层面与具身智能一样,都是最难解决的问题。在招聘当中,有一些肢体语言、表情等等。这些感知决定了招聘 Agent 的上限。

刘湘明:从客户角度出发,客户对于 AI 技术的接受度与付费意愿如何?

刘之:科锐国际的客户群可以分为三类,一类是甲方/雇主方;一类是候选人;还有一类是生态伙伴。目前在候选人与甲方/雇主方这两个群体中,科锐尚未对外提供 AI 产品。我觉得从今年年初开始 AI 接受度开始大幅度上升,已经有很多甲方客户会找我们了解 AI 落地。不过在禾蛙平台上,我们提供了一些AI工具,用于帮助生态伙伴提升工作效率。

刘湘明:AI 在落地过程中,最重要、最值得重视的问题是什么?

刘之:第一个是一定要预判方向,至少要做到预判 3 个月以内的技术方向。在方向预判过程中,要避免走到通用大模型的主航道上,时时刻刻要思考国内外科技巨头们会怎样做。

第二个是对技术要有敬畏之心。有了敬畏之心,就会选择在一个技术或场景上反复打磨,而不是到处开花。这个技术一定是在整个系统中解决问题的核心技术。因为具体到落地过程中,哪怕一个小功能的落地上线,都有可能遇见很多坑。在单点上的投入,把一个点打磨的特别好,一旦这个点突破了,也许整体就突破了。

刘湘明:对您来说,这个点是什么?

刘之:以科锐为例,我认为我们过去几年很重要的关键点是:行业变化速度很快,我们需要更快的响应行业变化速度。所以围绕这个判断,我们做了很多工作。同时,我认为我们需要在某些业务上实现规模化 —— 比如在某个岗位或某个赛道上达成规模化效应。在这个过程中,我觉得最重要的是解决两个问题:一是如何获取更多数据,二是如何在单点业务中结合技术应用。此外,技术讨论必须与业务实际紧密结合。

本文系作者 张申宇、数字价值观察室 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 招聘 AI 分三阶段,现在总算到 Agent 能自己干活了。

    回复 8月1日 · via pc
  • 语音和文本多模态结合,在招聘电话里应该好用。

    回复 8月1日 · via h5
  • 先磨基础能力再搞场景,Agent 落地得这么稳着来。

    回复 8月1日 · via h5
  • 以前靠人工标注,现在有预训练模型省事多了。

    回复 8月1日 · via android
  • 中层干部可能消失?AI 对管理的影响真不小。

    回复 8月1日 · via h5
  • 科锐从老场景找新解法,这思路在 AI 落地时挺实用的。

    回复 8月1日 · via iphone
  • 问题清晰度和费力度,用这俩选场景挺靠谱的。

    回复 8月1日 · via h5
  • Agent 工作记忆有三难,看来通用型还得再琢磨琢磨。

    回复 8月1日 · via iphone
  • 推理能力成关键,看来匹配不只是看简历文字了。

    回复 8月1日 · via android
  • 客户对 AI 接受度上来了,就看实际效果能不能留住人

    回复 8月1日 · via h5

文章详情

快报

更多

2025-08-02 22:37

海康威视披露海康机器人IPO进程:目前还在深交所创业板排队

2025-08-02 22:32

伯克希尔对卡夫亨氏投资计提37.6亿美元减值损失

2025-08-02 22:30

360宣布纳米AI升级为“多智能体蜂群”,可一句话生成大片

2025-08-02 22:09

中国电子学会:中国人形机器人整体水平处全球第一方阵

2025-08-02 22:01

比亚迪王朝7月销售133783辆

2025-08-02 21:21

伯克希尔Q2现金储备三年来首降,股市投资更趋谨慎

2025-08-02 20:59

《南京照相馆》单日票房破2亿

2025-08-02 20:34

伯克希尔哈撒韦:截至二季度末,公司前五大持仓的公允价值合计占比达67%

2025-08-02 20:27

首关规模1.8亿元,上海临床转化种子投资基金成立

2025-08-02 20:14

伯克希尔哈撒韦二季度营收925.15亿美元,高于预期

2025-08-02 20:10

浙江大学发布全球规模最大的神经拟态类脑计算机

2025-08-02 19:52

长城魏牌7月销量10045辆,同比增长263.29%

2025-08-02 19:50

8月2日新闻联播速览21条

2025-08-02 19:23

港股上市公司7月回购超100亿港元

2025-08-02 19:19

2025年底北斗产业规模将超6000亿元

2025-08-02 19:16

杭州7月降水量创下有连续观测记录以来新高

2025-08-02 19:07

宇树科技CEO王兴兴获聘杭州具身智能应用中试基地首席科学家

2025-08-02 18:26

上海银行回应被央行罚款:问题发生在2020年至2021年期间,已按要求全部整改

2025-08-02 18:25

新疆开行首趟棉花班列

2025-08-02 18:04

美载人“龙”飞船与国际空间站对接

10

扫描下载App

Baidu
map