大数据文摘授权转载自AI科技评论
作者丨梁丙鉴自 2024 年底 Anthropic 发布 MCP,将 AI 与 API 连接,人造大脑从此便有了“手脚”。从 AutoGPT、Manus 到各类垂直的新Agent产品,短短月余间智能体百花齐放,诸多创业公司走完了从技术突破到产品落地的长路。昨日还是科幻故事中的幻影,今天便已触手可及。
产品与生态碰撞,期望与信心交织,2025年终被冠以“Agent 元年”之称。2025年6月14日,雷峰网、AI科技评论 GAIR Live 品牌举办了一场主题为“Agent 元年已至,我们会有自己的智能助理吗”的线上圆桌沙龙。圆桌主持人为明势创投合伙人夏令,并了 AutoAgents.ai 创始人兼 CEO 杨劲松、Pokee.ai 创始人朱哲清、ANP 开源技术社区发起人常高伟、艾语智能创始人张天乐,一起进行了一场深度讨论。Agent 产品成为创业公司新宠,百花齐放之际,如何真正落地?从不同市场对 Agent 的需求出发,主持人夏令与四位嘉宾探讨了 Agent 的前沿技术、模型效用提升与评估方案,以及 SaaS 生态之下 Agent 产品战略方向。创业总伴随着创新,四位嘉宾在对谈中还分享了各自从 day one 便开始坚持的非共识。事易时移,其中有些今天仍在经受行业的审视,也有些慢慢变成了共识,Agent 技术的脉络就藏于其中。Agent 商业化问题成为本次圆桌的关注焦点,几位嘉宾分别提出了独到见解。朱哲清指出,Agent 在很大程度上是让 SaaS 生态更加集成化,在软件工具高度标准化的海外市场,Agent 产品与 SaaS 相辅相成。“我们畅想的未来,是任何 business 和专业用户的 workflow 都可以被 Pokee.ai 完全取代,最终不管是生成还是执行,都真正做到在没有human in the loop 的情况下,也可以端到端地完成任务。”AutoAgents.ai 的商业化思路另辟蹊径,“卖铲子”、“定场景”两步走。杨劲松认为,新技术出现的早期总会出现对相应基础设施的需求,当头部企业将技术应用于具体业务,就可以一窥潜在价值更大的场景。循着这一思路,AutoAgents.ai 在寻找那些 Agent 能够提效五至十倍的场景。“这些场景一定可以做出不一样的东西。”张天乐则表示,Agent 商业化最核心的问题是交付结果,艾语智能追求让客户在传统作业方式和他们的方案之间无缝切换。“甲方需要的是你帮他解决问题,而不是你用 AI 帮他解决问题。”Agent 协作同为今年热门话题,MCP、A2A 始于海外,先后掀起 Agent 协议热潮。作为 ANP 开源技术社区发起人,常高伟看法冷静:“协议受制于基模能力,没有非常好用的智能体,智能体间的连接需求也就不会特别多。”虽然落地为时尚早,但探索技术和构建影响力已经可以提上日程。ANP 正与标准化组织和开源社区合作构建 Agent 协议生态,积极在各个开源框架中寻找一席之地。以下是此次圆桌讨论的精彩分享,AI 科技评论进行了不改原意的编辑整理:
01
百花齐放之后,Agent 如何落地
夏令:非常高兴这次沙龙有机会与大家一起探讨 Agent 这个当前最热的话题之一。我们今天请到了四位非常重量级的嘉宾,虽然大家同在 Agent 赛道,但是深耕于不同的市场,做着不同的业务。所以相信这样的一次对话,不管是对于听众还是我自己理解整个 Agent 赛道及其后续的发展,都会有非常大的帮助。请大家先做一个自我介绍吧,作为主持人我先开个头。我是明势创投的合伙人夏令,我们基金成立于 2014 年,是一支专注在科技赛道的早期 VC。在过去的十年里,我们很有幸地成为了国内一批技术驱动的头部公司的早期投资人。比如我们是理想汽车最早的机构投资人,一路陪伴它从成立到上市。在汽车电动化、智能化的趋势中,我们投资了二三十家公司,有四五家都是天使轮,后续包括裕太微、知行科技等企业成功在国内的科创板和港股上市。也是因为对汽车智能化的密切跟进,我们在 21 年就比较早地关注到了 Transformer 和端到端数据驱动这波 AI 变化的新趋势,所以在 21 年底 22 年初的时候,我们就投资了 AI 六小龙之一 MiniMax。
我们是比较早地进入 AI 投资赛道的基金,23 年国内 AI 应用逐步起量之后,我们也积极布局了一批国内的 AI 应用公司。其中有一些大家可能已经比较熟悉了,比如文生图领域的 LiblibAI,秘塔和造梦次元。此外还有今天的嘉宾之一,做法律垂直行业的艾语智能,这些都是我们早期投资的代表性项目。我们明势会非常认真、积极地推动 AI Agent 相关赛道的投资,很高兴今天能够跟各位一起交流。下面请各位嘉宾逐次来做一下介绍,我们先从杨总这边开始。杨总是 AutoAgents.ai 的创始人和 CEO。杨劲松:谢谢夏总。直播间的各位听众们好,我是 AutoAgents.ai 创始人杨劲松,我们是一家 23 年 6 月份成立的 Agent Native 公司,三位创始成员都来自阿里巴巴达摩院,之前是通义团队的同事。我们希望解决大语言模型在企业落地应用的挑战,目前定位在企业级 Agent 这样一个应用基础设施赛道。虽然现在有很多开源的 Agent 工具,但我们认为既然大语言模型是用来降低技术门槛的,那我们希望 Agent 构建和使用的门槛也可以更低,而不需要用户再去学习一整套相关技术。我们目前的用户主要以大型企业为主,比如国家电网、三桶油,或者是一些比较头部的企业。对我们来说,对产品最大的要求是 Agent 要真正做到落地、可用,而非仅仅作为一个玩具。这对 Agent 执行长链条任务时的精准度,以及数据安全、权限控制提出了更高的要求,这也是我们的主业。同时我们基于自己的 Agent 技术,也会和行业头部玩家合作,以合营的方式切入垂直场景,这会是我们接下来落地 Agent 的思路。目前我们通过技术驱动工程造价审计,用 Agent 直接交付审计项目结果,在这个赛道取得了比较好的效果。夏令:好的。前段时间看了好几篇对朱总的采访,能看出您对于目前要做的事情非常有野心,能不能为我们介绍一下 Pokee.ai?朱哲清:大家好,我叫 Bill。我们 Pokee.ai 是去年 10 月份刚刚成立的公司,主要目标是希望通过强化学习把 Agent 可以使用的工具拓展到整个互联网的范围,最终不再需要额外训练或者是集成的 overhead。我们目前已经有一个单一 Agent 可以集成上万个不同工具,并且在各种不同的垂直场景里执行任务,未来一个月左右就会开始真正的公测。Pokee.ai 团队的大多数成员都来自 Meta,我创业之前也在 Meta 负责应用强化学习团队,带了很多 Meta 内部的大型项目,比如 RL 在广告、推荐系统的落地,以及 Meta 的 RL 平台开源项目。我从本科就开始做 RL 的理论和落地,在这个方向已经研究了快十年,我认为这一波 Agent 对 RL 的依赖性会持续提升。未来 Pokee.ai 也会在这个方向上有更深入的继承和发展。夏令:我去年也跟 Bill 总深入探讨过 RL。现在大家都在讲,AI 进入了下半场,RL 也会变得越来越重要。常总是 ANP 开源社区的负责人,现在做的事情也非常有意思,请您也为听众们介绍一下。常高伟:好的。大家好,我是 ANP 开源技术社区的发起人。我们并不是一家商业化的公司,而是一个开放、中立、非营利性的技术社区。我们的目标是成为智能体互联网时代的 HTTP,而 ANP 是我们开发的一个智能体通信协议,和 MCP、A2A 比较类似。但是我们做得比较早,大概在去年三四月份就开启了 ANP 项目,比 MCP 早了大概半年时间,比 A2A 早大概一年时间。我们的愿景是定义智能体的联系方式。我们一直认为,协议是智能体连接最高效的方式,也是 AI 原生的连接方式。ANP 社区现在有 200 左右开发者,大部分来自于国内的大厂,还有一线的 AI 从业者。另外我们社群现在大概有1100多人,在 W3C 成立了一个社区组,这是 W3C 中唯一面向智能体协议的社区组,华为、谷歌、字节、蚂蚁、微软、中国移动,还有北大、上交大、MIT 等好几个大学都是我们社区组的成员。我们最终的目标,是构建一个更加开放的互联网,我们认为只有开放的互联网才是最适合释放 AI 的生产力的。夏令:好的,谢谢。在 Agent Infra 这一层,智能体与工具之间的通信也是构建 Agent 必不可少的环节,一会可以请常总和我们重点分享一下。最后请艾语智能的创始人、CEO,张天乐总为我们介绍一下艾语的情况。张天乐:谢谢夏总又投我们,又我们参加这次的活动。首先我们的定位是做法律 Agent,这个场景下中美的情况有很大差异。我们认为法律 Agent 在中国市场的落地,应该更多地聚焦在细分市场以及复杂场景里,直接交付结果。我们现在选择了两个落地的应用场景,一是针对网贷逾期客户提起 AI 立案之后的调解服务,目前这块业务已经与 40 多家金融机构进行了合作。二是知识产权侵权行为的发现和追索。我自己的 background 是在复旦读计算机,算是已经做了三代 AI。我最早在 MSRA 做图像识别,16 年我们做了神经网络,就开始应用在信贷的风控上,现在又开始做法律 Agent。这一轮 AI 兴起的时候我特别激动,因为我看到了它和前两代 AI 之间的巨大差异,并且 AI 真的走向了智能。另外我们一直在创业,一家公司做到了 Pre IPO,还有两家卖掉了,算是 AI 老兵和持续的创业者。再次感谢夏令总的,很高兴能跟大家做深入的交流。夏令:感谢四位嘉宾对自己和公司业务情况的介绍。我们可以看到大家聚焦于 Agent 赛道不同的业务和环节,每一家都很有代表性。比如说 Bill 总这边,Pokee.ai 的定位是什么?您对于 toC 的通用 Agent 有什么看法,可能的机会在哪?以及大家最关心的问题,和 Manus 相比我们的特色是什么?这些问题希望可以听到您进一步的分享。 朱哲清:好的。首先我们不是一家单纯 toC 的公司,而且大多数的 use case 都不是 toC。我们目前公开发布的 demo 更侧重于 to professional 的能力,同时有一些 enterprise 客户现在已经开始通过我们背后的 API 和 SDK 和我们做集成了。我们畅想的未来,是任何 business 和专业用户的 workflow 都可以被 Pokee.ai 的 API call 或者 SDK 的集成完全取代。比如对于企业来说,原来从 market research(市场调研)到 reporting(报告生成),到 slide sheet(PPT 和 Excel)的集成和制作,再到 marketing content(营销内容),甚至于最后发布到各种社交媒体网站上的这一整套工作流,都可以由一个 prompt 加一个 API call 完成。不一定要用前端来完成整个操作,我们的目标是提供一个基础的 Agent 平台,使任何开发者或者 professionals 可以在不需要自己手动集成工具和 promoting 的情况下,就能够完成一个非常复杂的工作流的构建以及执行。最终不管是生成还是执行,都真正做到在没有 human-in-the-loop 的情况下,也可以端到端地完成任务。相比之下,Manus 的定位更多地偏向一款 consumer facing 的产品。而我们的目标并非完全 toC,而是希望取代互联网上所有冗长的、人的工作流,构建一个完全自动化的互联网世界。夏令:对于 Manus 这种 to C 的产品来讲,完成任务的过程中其实是 Agent 自己做 plan。而 Pokee.ai 希望能够解决更多个性化的任务,而不仅仅聚焦在某一个场景、某一类客户,所以考虑到场景和客户的差异性,我们选择提供一个平台,支持企业用户构建适合自己的 workflow,然后让 Agent 具备任务规划和完成任务的能力。不知道这种理解是不是正确。朱哲清:是的。Pokee.ai 和 Manus 有一个很大的区分点,那就是我们所集成的能力应该远超现在市面上的大多数Agent。我们集成的工具几乎包括了海外的所有社交媒体、文档工具和 chat 工具,比如 WhatsApp、Messenger、Slack 等等,所以我们所能够执行的场景是非常多的,而且这些执行场景就是目前企业和商业用户最需要的工作流中的瓶颈。比如说你是一个个人用户或者商业用户,即使你有了 ChatGPT、Manus 和各种各样的生成式 Agent,在你完成所有生成任务后,把内容 deploy 到相应平台上这个环节还是需要人来做。这是目前几乎所有 Agent 闭环当中缺失的一部分,而我们可以替人做到这一点。夏令:明白。我们知道北美有非常多的创业公司会选择特定的垂直场景耕耘,比如 SDR 是销售的一个小环节,都有非常多的 AI 创业公司在深入,提供相应的 AI 产品。现在和过去的区别,不过是从 SaaS 变成了 toB 的 Agent。您觉得 Pokee.ai 做的事情和这些产品之间是什么样的关系?朱哲清:首先是 SDR(销售开发代表)场景下,比如 Artisan、ElevenX 或者 Hyperbound 这些公司,它们非常聚焦于一个垂类,而且几乎不需要任何的工具集成。它们只需要能发 Email,有 video chat 这种功能就可以了,有些甚至不能读取Email。大多数这类 Agent 公司还没有完全用 MCP 来 build up,很多时候都是手动完成 integration 以后,再用LLM 处理,去看这个进来的 text 是什么样的 intention,然后去找对应的 function,手动 construct function call,然后再去 call 那个 function。不需要 authentication(认证)的集成还好一点,如果你需要 authentication 集成,比如 Google Workspace、Microsoft ecosystem,这些东西对于所有企业来说都是特别头疼的事情。我们的不同就在于,任何 Developer 或者 Business 都可以把那层最复杂的 integration 和工具调用全部 shield 掉,不再需要操心这一部分。你只需要知道自己想干什么,把这个 prompt 输进来,Pokee.ai 都可以帮你解决。之前一个时代,是各种 language model 或者 vision model 通过 API prompting 去完成生成,而我们现在希望通过prompt 完成从生成到执行的整个闭环。您刚才提到的 AI marketing 这种垂类 Agent,未来如果要做得更复杂、真正打通端到端的话,他们可以 build on top of us。我举个例子。AI SDR 现在可以收发邮件、看 calendar,但如果用户想写进 CRM 怎么办?如果要构建一个 database 怎么办?要做 analysis 怎么办?不可能每一家 AiSDR 都手动去构建自己的 database和 analysis system,这些系统都有现有的解决方案,他们只需要 call Pokee.ai,说我已经完成了 inbound,得到了这些信息,你帮我写入 database,做个分析,最后写一个 report 给到某一个 employee。这些东西完全可以通过一个 prompt 来完成,所以从 ecosystem 的角度来说,我们给这些公司提供了一个 unify 的、to usage 的 solution。夏令:好的。Bill 总这边主要从美国市场的角度来看,构想一个 Agent 产品如何在企业里落地,再逐步走向面向企业的定制化 Agent 平台。不同创业公司的切入视角不一样,所在国家的需求场景也不一样。杨总做的是面向国内市场的 Agent,也是要在不同行业、不同岗位落地。您能不能来讲一讲,同样是做 toB 的 Agent 平台,相较于 Pokee.ai 或者 Glean,咱们的思路是什么样的?从落地的情况来看,中国企业更需要什么样的 Agent 产品或者 Agent 平台?杨劲松:好嘞。首先澄清一下,我们其实也是面向全球的,也有一批海外客户。我们作为创业者都是技术背景,但从用户视角来看,他们并不关注产品底层到底是 MCP 还是什么,关键还是能解决什么问题。目前 Agent 产品在国内有比较明确的扩散路径,掏钱的以国央企业、大企业为主,小企业更多还是尝鲜,真正投入生产的相对还比较少。我们最开始就选择这个方向切入,原因就是大企业能够投入比较大的资金预算把事情跑通,然后建立自己的竞争力。未来每个企业都会围绕自己的核心生产业务去打造一系列大模型或者 Agent,我们的定位就是企业级 Agent 构建平台。其实产品具体叫什么名字,只是技术上的定位,从企业的角度来说,他们想要的是自身生产价值链上的每一个环节都可以更高效,或者以更低的成本实现。我们的逻辑就是解决这些核心诉求,客户会比较关心我们具体集成哪些工具、什么方案最高效或者成本最低。我想先讲一下我们和 Glean 这类产品的区别。Glean 最开始是做企业内搜,我们认为内搜确实很重要,但是对于企业更重要的是业务的精准执行,也就是如何基于企业内部已有的上下文,把业务流程完整地执行下来,这是我们比较强调的功能。我们判断未来 Agent 要在企业内部做到相对可用的话,需要先完成端到端的优化,就是从底层的模型到中间层的工具,以及上层的业务和数据,都要实现比较好的整合,最终才会有比较好的效果。比如刚才说到,我们在和一些行业头部公司做垂直场景。对于底层的模型,我们就会基于特定领域进行微调,让它能够在这个领域里做更好的任务规划和场景应用。然后在工具这一层,每个行业都有一些典型的工具,仅仅把工具和模型进行简单的连接是不够的。这里有很多的挑战要解决,有一些是通过接口,还有一些可能要添加数据,对模型做上下文嵌入式的辅助,让它能够更好地应用工具。朱总那个方案,我们觉得也是一个思路。但是对接企业的时候,如果按照 OpenAI 那套 RFT 的思路,企业每增加一个工具,训练成本都会增加一个量级,所以我认为这对于大部分行业都不会特别适用。我们现在针对供应链通过上下文嵌入进行工具整合,做到了完全可用,再往上就到了数据和业务场景。对于这个部分,我反倒觉得垂直行业里的价值会更大。因为在工具层面大家会慢慢趋同,你的技术能领先半年可能就已经很不错了,更大的差距源于在供应层面能不能基于客户的业务或者用户使用 Agent 的结果,产生一些可以建立飞轮的数据。因此我们比较关心的是尽量让 Agent 投入生产,然后基于用户使用过程中的反馈,尤其是对于规划层面的反馈数据优化底层模型。这种端到端的优化会和拿脚手架搓出来的东西有非常明显的区别。我们最终的目标是可以在若干个垂直场景里构建这个领域的最强 Agent,现在我们在特别细分的小场景下已经可以直接交付结果,但是对于天花板更高的垂直场景,这其实需要一个渐进的过程。我们会基于工具和数据不断迭代,逼近这个目标。一旦我们在一个垂直场景里构建了垂类最强 Agent,让它拥有超过人类专家的水平,同时又达到了比较好的规模的话,基本上就可以把这个垂直场景比较大的价值吃掉了。这是我们的思路。夏令:好的。我们来到天乐总这边。同样是做 toB 的 Agent,天乐总又和前面两家显著不同,我们艾语智能并不是服务于更细分的一个行业或若干场景,而是变成了新型的律所。您能不能也为我们介绍一下,跟海外做法律服务的 Agent 公司相比,特别是大家比较熟悉的 Harvey,艾语智能有什么不同? 张天乐:我觉得在整个行业里,Harvey 是一家特别值得我们学习和了解的公司。他们是 OpenAI 在 22 年投资的,到现在也就两年多时间,但是最新估值可能已经到 50 亿了。Harvey 从 day one 就特别强调用 LLM 而非上一代 AI 技术解决法律问题,而且完成的效果非常好。它早期的切入点就是为律所和律师提供法律服务工具,比如诉状的生成、法律文书的识别等等。我们看过 Harvey 很多视频的 demo,从结果角度来说,生成质量确实非常好。但是客观来讲,我认为生成效果好的根源在于 LLM 技术和法律行业的匹配程度高,在复杂文本场景下 LLM 的生成效果天然地就会更好。所以今天我也会建议大家,选择大于努力,这是我在公司说得最多的一句话。而且大家要尽量快速地看到效果再落地,所以可以多尝试一些法律+AI 的方向。去年整个美国市场,法律 AI 的投资总额是 21 亿美金。从单个公司的估值最高,以及投资数量和规模来说,可以证明法律或者复杂文本和 LLM 技术的匹配程度确实非常高。但是中国和美国市场的情况差异非常大。比如美国律师的收入大概是每年 10 万到 15 万美金,而中国律师可能只有两三万美金,付费能力和付费意愿有很大差异。所以我们在落地一个商业模式的时候,一定要客观地考虑到中国的国情。另外两个市场对 AI 的认知和付费能力不一样,那一样的东西是什么?是对法律服务的需求。所以我们选择直接针对律师或者律所的甲方,比如我们现在面向金融机构,交付法律服务的结果。我们认为这样更触及法律服务的本质,而且长期来看模型能力会越来越强,交付结果是有可能实现的,所以选择这样一条切入路径。我们创业 13 年了,每次创业都会选择一个新的市场,或者传统服务没有服务好的市场切入。这种选择背后的逻辑是,我们认为一个行业更紧迫、更缺乏好的服务的需求,更应该被 AI 解决。所以我们这次切入市场,就选择了一个传统律师服务不了的事情,就是线上的无抵押网络信贷。这些客户的单笔金额都太小了,律师做 50 万、 100 万的案子都觉得麻烦,而我们做的都是一两万的。我们的客户可以完全通过 AI 线上提起立案、跟进流程、制定更长的分期还款计划,然后用机器跟进分期结果。大家总说国内的市场卷,我们觉得避免卷最好的方式,就是去做一件新的事情。快速地切进去,没有人竞争,也就不卷了。另外我们在公司经常讨论一个问题,就是技术平权。AI 的发展速度很快,技术透明度也很高,在这个过程中对我们来说更本质的问题是什么?我觉得应该更关注商业模式本身。用户最本质的需求是一个更好的结果,所以我们在选择切入路径的时候,选择直接交付结果。站在整个创业的角度来看,首先我非常反对不关注海外。我认为美国的 AI 落地是有先进性的,应该去关注他们在技术上面到底解决了什么样的问题。但是中美的商业环境差异又是极大的,一定要选择适合中国的商业落地方法。大家总说卷,我能给大家最贴心的建议就是创新,做一件不一样的事情,然后去交付结果。我想分享一个 Harvey CEO 今年 3 月份的访谈。他们是一个非常典型的 by license 或者 by SaaS 的商业模式,但是他们 CEO 在今年 3 月份的访谈中提到,未来他们会开拓更复杂的一些场景,比如并购投资,并且按照效果来 take rate。很多时候我们看到的其它机构的商业模式,大部分是昨天的商业模式。Harvey 是 23 年开始落地的,你 23 年让我去交付结果,我觉得我也做不到,因为 LLM 本身的能力就不够。但是长期来看,随着模型的能力变强,Agent 的能力变强,更重要的还是从商业的角度看客户需要什么,以及选择一个传统方案没有服务好的市场。所以我想说,大家不要做存量市场,要尽量做新增的市场,并且伴随着技术能力的提升,往交付结果的方向调整。我们从 day one 就逼着公司必须交付结果,用这样的方式往前推进。这在中国可能是更好、更适合的落地方式。夏令:天乐总讲得还是很详细的。艾语这家公司服务的不是律所,它自己就是一个新型律所,所以它交付的是结果。下面这个问题想请常总谈一谈。我觉得从 3 月份开始,MCP 在国内外就非常火,后来 Google 也推出了自己的 A2A。咱们的 ANP 解决的也是智能体之间的交互问题,从切入方向和特点上,大家有什么区别,您能不能简要地说一下。常高伟:好的。A2A 是今年 4 月初发布的一个协议,因为谷歌的体量和影响力是非常大的,所以它发布之后,把整个行业又在智能体协议上带火了一把。我们和 A2A 其实有很多相似点。首先我们解决的问题是一样的,都是为了解决智能体的协作问题。除此之外,我们和谷歌有一个共同的认知,那就是 MCP 可能并不太适合用于智能体之间的连接和协作。智能体的连接协作,应该是个 P2P 架构,但 MCP 可能是 CS 架构。我们和 A2A 还有一个相同点,就是我们在很多技术上也是相似的。比如在智能体的发现和描述上,我们用的是类似的技术,不过我们做得比谷歌更早。我们和 A2A 在不同点上也蛮多的,最大的不同点就是出发点不一样。我们希望解决的问题是,智能体在一个不可信的互联网环境中怎么进行协作。而谷歌虽然并没有在官网中明说,但是从技术、生态以及谷歌 CEO 的访谈中都可以看出,A2A 的出发点是解决智能体在企业之间以及企业内部的协作。谷歌 CEO 前段时间有个访谈,他认为智能体最早应该会在企业内部落地。另外从生态来说,谷歌有 50 家公司,这 50 家公司全部是做 B 端业务的。最后我们回到技术本身,A2A 这种交互模式并不太适合在互联网上协作,因为它是一个任务分包的模式。什么叫任务分包呢?就相当于我把一个大任务分成了若干小任务,然后让远端的智能体来处理。在互联网中,这种模式天然地具有很高的个人隐私泄露风险。比如说我要订个酒店,我必须告诉远端智能体我喜欢什么、不喜欢什么,那我的隐私就通过任务的上下文被泄露了。在这一点上,我们的交互方式和 MCP 有点类似。我们把远端信息拉到本地进行处理和决策,这样就不需要把隐私信息交给其他人。除此之外,我们和 A2A 还有一个最大的不同点,就是身份。刚才朱总介绍过,一个智能体要连接到谷歌、Meta 是非常非常难的。这涉及到智能体协议非常非常核心的问题,那就是智能体的身份。智能体之间要进行通信,首先要解决的问题就是我是谁和你是谁。我们在研究过程中发现,MCP 和 A2A 并没有完全解决这个问题。比如 A2A ,他们用了一个带外的方案,所谓带外是指用其它途径、协议来解决身份问题。比如我有个身份中心,智能体每次和另外一个智能体交互的时候,就去身份中心拿一个令牌,然后通过 A2A 协议把令牌传过去。这个方案非常有意思,我认为用在在企业内部是非常不错的,但是在互联网当中可能不太适用。因为互联网中没有一个大的身份中心可以解决身份问题,而且用在互联网中,这个方案的成本还是有点高。可以说身份就是我们在技术上区别于 MCP 和 A2A 最大的地方。MCP 用的其实是一个中心化的身份,而我们用的是 DID 身份,类似于去中心化身份的技术。不过和区块链还不一样,我们使用的是 Web 技术,类似于 Email,一个邮箱可以和互联网中所有的邮箱进行互通。比如说你有 163 的邮箱,那你不需要再去申请 QQ 账号或者 Gmail 账号,就能和 QQ 邮箱或者 Gmail 邮箱互通。这是我们做的最大的创新。张总刚才的话我非常认可,要想不卷就得做创新的东西。
02
Agent 创业,从非共识出发
夏令:创业是必须要创新的,同时作为创业者,也必须要有自己坚持的非共识。下面一个问题,我想请大家谈谈,如果说我们现在有一个坚持的非共识,那会是什么。我们这次的顺序反过来,请常总先讲。常高伟:在去年三四月份的时候,我们就坚定了一个非共识,那就是智能体之间要协作,协议肯定是最高效、最原生的方式。智能体最擅长处理的就是直接的、底层的数据,而承载这些数据最好的方式就是协议,这是我们坚持的第一个非共识。这一点目前也在慢慢变成行业的准共识。另外一个非共识就是智能体互联网。我们认为 Agentic web 就是智能体化的 Web,这是互联网的未来。当未来的互联网中有越来越多的智能体,现在的互联网结构会发生一些非常大的改变。现在有很多互联网平台,比如微信、淘宝、拼多多,未来是否真的有必要存在?如果我有一个个人助手,企业也有一个智能体,那么我的个人助手是否可以通过协议直接连接到企业的智能体,帮我完成预订酒店、点外卖、买衣服这些操作?我认为未来,互联网的连接方式会从以平台为中心的封闭的生态,回归到以协议为中心的开放连接,这是我们现在坚持的另一个非共识。可以说这是我们现在坚持的一个最大的非共识。现在整个行业中,看到这个非共识的人可能并不是特别多,认可的人也不是特别多。但是前段时间,微软的一场发布会就提到了一个叫 Agentic web 的概念,他们也认为未来的互联网应该是一个开放的互联网。张天乐:我想谈两个非共识。去年 o1 出来之后我想了很多,我觉得 o1 出来代表着 AI 进入了下一个阶段,当时整个行业觉得 AI 能做的事情已经很多了,创业的机会也变多了。但是我个人觉得,o1 对于人类整体来说是一件受益的事情,但是对于创业公司来说,其实机会减少了,未来有很多场景可能会直接通过大模型或者更通用的 Agent 实现。所以我觉得从 o1 出来之后,大家应该更多地思考一些商业上面的事情,比如什么场景是适合的、要如何切入。我会觉得这个场景是复杂文书和复杂流程,另外一定要选择更难的场景,深入地做,这样才会更有价值。这是在商业上,我们坚持的第一个非共识。另外我最近找了很多论文的一作,和他们讨论了一个问题。对于 AI,很多时候我们盯着怎么让大模型变得越来越聪明这个问题,特别是 DeepSeek 出现以后,大家通过 RL 让模型的推理能力和逻辑性持续地变强。但是现实世界的任务需要两件事,第一件是聪明,第二件是有经验,这两件事本质上并不一样。聪明更像是从一个高中生变成爱因斯坦,但是有经验,更像是在作业过程中有非常详细的标准,在遇到 corner case 的时候有指导我们应该如何去做的百科全书。我觉得在技术路径上,未来的趋势是让模型的推理能力变得越来越强,但是我们在实际应用过程中会想,我们真的需要一个爱因斯坦来帮我们完成律师的所有工作吗?其实是不需要的。我们需要的是一个受过非常良好教育的法律专业智能体,它在日常工作过程中会变得越来越有经验,能够总结出如何把工作变得高效的方案,在遇到 corner case 的时候能找到更好的方法。所以我们现在会觉得,还是要找到一些方法让模型变得更有经验,而不是单纯地变得更聪明,并且在有经验这条路径上可以做到自学习和自优化。而且我们认为让模型变得有经验和变聪明是 totally different,变聪明可能是在参数层面上要做很多优化,但是变得有经验,严格意义上来说不应该改变模型本身,而是有一个非常 detail 的百科全书外挂式的经验,然后让模型充分地使用。这是我想说的第二个非共识,就是我认为在 AI 应用落地之后,可能有经验会比更聪明更有价值。夏令:天乐总这个观点跟 OpenAI 的姚顺雨的观点比较像,就是说我们已经把模型训练得可以在奥赛拿金牌了,但是它却还记不好账。那杨总,接下来想听您谈谈。杨劲松:我想分享一个我们自己也踩过的坑,也是目前行业里比较非共识的一点。我们最开始追求 Agent 在底层技术和理论上的创新,比如说所谓的多智能体协作。但我们在实践的过程中会发现,对于一项之前由人类完成的工作,比如说写一个软件,按照我们人类的分工把 Agent 也分成产品经理、UI 设计师或者开发者这么几个角色,这种做法在模型能力达到一定水平之后,效果可能并没有那么明显了,反而可能限制 Agent 的发挥。我们有另外一个思路提升模型的工作效果,就是想办法让模型更多次地动用智力。人在完成一项任务的时候,大脑会工作非常多次,可能我说这一句话大脑会转三四次,做一个工作大脑会运作几百上千次。对于模型,我们现在也通过提高工作密度和不同维度的对抗来提升它的效果,说白了就是让模型从不同角度反复地对同一个工作内容进行加工,来提升输出结果的质量,这样效果反而会比角色分工更好。由这个思路延伸,这里还有一个效率问题。主流 Agent 系统是串行结构,消耗时间是要乘上去的,同时有些任务的幻觉和错误会被放大。用我们现在的思路,如果有一个共享的 working memory,然后多路地、对抗地去完成任务,最后的质量就会比较好。这算是一个小小的非共识。朱哲清:其实我去年年底的时候跟很多投资人聊,大家都觉得 Pokee.ai 这个方向根本不能做,但它现在已经慢慢变成了共识,所以非共识这件事很难说。我想沿着天乐总刚刚说的,从产品逻辑来讲,聪明跟经验从理论上来说就是 generality vs adapt to like a specific field(通用性vs特定性),也就是说只是训练方式的区别。它们可能是完全一模一样的模型,当这个模型的 generalization capability(通用能力) 非常强的情况下,它可能是一个完全通用的模型,当你需要将它 adapt 到法律这个领域,你可能需要顺序 overfit 到只有法律方面的知识,把剩下的知识屏蔽掉。我觉得大多数的套壳应用,或者说大多数 vertical(垂直领域)的公司,其实都需要走这么一步。通用 Agent 本身的核心训练数据是让它对于语言、数学和逻辑具有基本概念,也就是形成 A 和 B 是不能能够推到 C 这么一个简单的逻辑链,然后通过 autoregressive 加 RL 的方式来帮助它构建这样一个逻辑链。要把这种逻辑链转化到一些特有的领域里,其实是需要做一些 fine tuning 的,这就是天乐总所说的有经验。但是我觉得单纯让模型本身有经验可能是不够的。因为有大量的法律文献,你不可能指望一个模型把它完全记下来,还保证不出现任何幻觉。国内的法律体系全都是条例,可能会相对好记,但海外的判例法体系会导致 retrieval(检索)能力变得非常非常重要。未来的经验可能在很大程度上来自于 retrieval 能力,而 retrieval 单靠 RAG 可能还解决不了。RAG 的核心问题在于,我需要通过 similarity metric(相似性度量)这种固定关系,从 retrieval 的 seed 或者 prompt 里找到一个巨大的 groups 里相关的文字或者图片。这个寻找的过程可能不是一个固定的 a 对 b 的关系,而可能是一个非常复杂的,甚至于是推理的关系。我之前给很多投资人举过一个例子。大家都在问,为什么不能直接用 RAG 来解决最简单的推荐系统的问题?假设一个人想去夏威夷旅游,那他需要购买的东西是非常多样化的,他可能需要简单的泳衣、泳裤,也有可能想去登山、想去潜水、想去坐直升机。每一样东西都会跟夏威夷有关,但是你没有办法通过一个单一的 distance metric(距离度量)来找到所有内容。当你只有一个单一的 distance metric 的时候,你找到的东西都是类似的,所以这当中就要有一个推理的过程。我觉得特别是在企业环境和特有领域下,未来的 Agent 要在这个方面花大功夫。也就是它的 retrieval 过程不只是简单地找相似性,而是要带着推理去做 retrieval,这是很难的。张天乐:之前我也跟夏总讨论过这个问题。我从 day one 就觉得 RAG 这个方式局限性极高,是一个非常过渡的方案。我想分享一下我们觉得什么是经验。首先基于法律这个场景,条款内容其实是很少的一部分,美国的判例还多一些,国内的条款我们的模型已经可以解决得非常好了。但是在作业过程中,我们觉得还有大量业务经验性的信息需要挖掘出来。什么叫业务上的经验?我给您举个例子。比如我们会涉及到开庭,中国的法院是有些有线上开庭设备,有些没有,那我们有一条经验就是,遇到没有线上开庭设备的法院,我们的成本就高,所以我们可能会少接这个法院的案件。还有些案件,法院是上午开会,下午打电话,那我们就会等下午再跟法院联系。所以你会发现,其实我们在去年做对了一件事情,就是做垂直细分领域应该从 day one 就开始做 evaluation。实际上我们每天要对所有的结果做 evaluation,而且我们现在在 evaluation 这件事情上是 freely 的,更多地交给模型,它们会自己挖掘出来更多的信息。在一个细分的场景里,整个组织在作业过程中提高的就是这些小细节。实际上我们每天产生的经验是极多、极零散的,而且比人类组织的效率高很多。我一天能开多少会,模型能开多少会?模型一天能总结 700 条经验,但是想要让这 700 条经验通过 RL 或者 post train 的方式再训练进模型,我觉得这是不 work 的。所以我们觉得,可能通过一些更松散的结构,一定
大数据文摘授权转载自AI科技评论
作者丨梁丙鉴自 2024 年底 Anthropic 发布 MCP,将 AI 与 API 连接,人造大脑从此便有了“手脚”。从 AutoGPT、Manus 到各类垂直的新Agent产品,短短月余间智能体百花齐放,诸多创业公司走完了从技术突破到产品落地的长路。昨日还是科幻故事中的幻影,今天便已触手可及。
产品与生态碰撞,期望与信心交织,2025年终被冠以“Agent 元年”之称。2025年6月14日,雷峰网、AI科技评论 GAIR Live 品牌举办了一场主题为“Agent 元年已至,我们会有自己的智能助理吗”的线上圆桌沙龙。圆桌主持人为明势创投合伙人夏令,并了 AutoAgents.ai 创始人兼 CEO 杨劲松、Pokee.ai 创始人朱哲清、ANP 开源技术社区发起人常高伟、艾语智能创始人张天乐,一起进行了一场深度讨论。Agent 产品成为创业公司新宠,百花齐放之际,如何真正落地?从不同市场对 Agent 的需求出发,主持人夏令与四位嘉宾探讨了 Agent 的前沿技术、模型效用提升与评估方案,以及 SaaS 生态之下 Agent 产品战略方向。创业总伴随着创新,四位嘉宾在对谈中还分享了各自从 day one 便开始坚持的非共识。事易时移,其中有些今天仍在经受行业的审视,也有些慢慢变成了共识,Agent 技术的脉络就藏于其中。Agent 商业化问题成为本次圆桌的关注焦点,几位嘉宾分别提出了独到见解。朱哲清指出,Agent 在很大程度上是让 SaaS 生态更加集成化,在软件工具高度标准化的海外市场,Agent 产品与 SaaS 相辅相成。“我们畅想的未来,是任何 business 和专业用户的 workflow 都可以被 Pokee.ai 完全取代,最终不管是生成还是执行,都真正做到在没有human in the loop 的情况下,也可以端到端地完成任务。”AutoAgents.ai 的商业化思路另辟蹊径,“卖铲子”、“定场景”两步走。杨劲松认为,新技术出现的早期总会出现对相应基础设施的需求,当头部企业将技术应用于具体业务,就可以一窥潜在价值更大的场景。循着这一思路,AutoAgents.ai 在寻找那些 Agent 能够提效五至十倍的场景。“这些场景一定可以做出不一样的东西。”张天乐则表示,Agent 商业化最核心的问题是交付结果,艾语智能追求让客户在传统作业方式和他们的方案之间无缝切换。“甲方需要的是你帮他解决问题,而不是你用 AI 帮他解决问题。”Agent 协作同为今年热门话题,MCP、A2A 始于海外,先后掀起 Agent 协议热潮。作为 ANP 开源技术社区发起人,常高伟看法冷静:“协议受制于基模能力,没有非常好用的智能体,智能体间的连接需求也就不会特别多。”虽然落地为时尚早,但探索技术和构建影响力已经可以提上日程。ANP 正与标准化组织和开源社区合作构建 Agent 协议生态,积极在各个开源框架中寻找一席之地。以下是此次圆桌讨论的精彩分享,AI 科技评论进行了不改原意的编辑整理:01
百花齐放之后,Agent 如何落地
请大家先做一个自我介绍吧,作为主持人我先开个头。我是明势创投的合伙人夏令,我们基金成立于 2014 年,是一支专注在科技赛道的早期 VC。在过去的十年里,我们很有幸地成为了国内一批技术驱动的头部公司的早期投资人。比如我们是理想汽车最早的机构投资人,一路陪伴它从成立到上市。在汽车电动化、智能化的趋势中,我们投资了二三十家公司,有四五家都是天使轮,后续包括裕太微、知行科技等企业成功在国内的科创板和港股上市。也是因为对汽车智能化的密切跟进,我们在 21 年就比较早地关注到了 Transformer 和端到端数据驱动这波 AI 变化的新趋势,所以在 21 年底 22 年初的时候,我们就投资了 AI 六小龙之一 MiniMax。
我们是比较早地进入 AI 投资赛道的基金,23 年国内 AI 应用逐步起量之后,我们也积极布局了一批国内的 AI 应用公司。其中有一些大家可能已经比较熟悉了,比如文生图领域的 LiblibAI,秘塔和造梦次元。此外还有今天的嘉宾之一,做法律垂直行业的艾语智能,这些都是我们早期投资的代表性项目。我们明势会非常认真、积极地推动 AI Agent 相关赛道的投资,很高兴今天能够跟各位一起交流。下面请各位嘉宾逐次来做一下介绍,我们先从杨总这边开始。杨总是 AutoAgents.ai 的创始人和 CEO。杨劲松:谢谢夏总。直播间的各位听众们好,我是 AutoAgents.ai 创始人杨劲松,我们是一家 23 年 6 月份成立的 Agent Native 公司,三位创始成员都来自阿里巴巴达摩院,之前是通义团队的同事。我们希望解决大语言模型在企业落地应用的挑战,目前定位在企业级 Agent 这样一个应用基础设施赛道。虽然现在有很多开源的 Agent 工具,但我们认为既然大语言模型是用来降低技术门槛的,那我们希望 Agent 构建和使用的门槛也可以更低,而不需要用户再去学习一整套相关技术。我们目前的用户主要以大型企业为主,比如国家电网、三桶油,或者是一些比较头部的企业。对我们来说,对产品最大的要求是 Agent 要真正做到落地、可用,而非仅仅作为一个玩具。这对 Agent 执行长链条任务时的精准度,以及数据安全、权限控制提出了更高的要求,这也是我们的主业。同时我们基于自己的 Agent 技术,也会和行业头部玩家合作,以合营的方式切入垂直场景,这会是我们接下来落地 Agent 的思路。目前我们通过技术驱动工程造价审计,用 Agent 直接交付审计项目结果,在这个赛道取得了比较好的效果。夏令:好的。前段时间看了好几篇对朱总的采访,能看出您对于目前要做的事情非常有野心,能不能为我们介绍一下 Pokee.ai?朱哲清:大家好,我叫 Bill。我们 Pokee.ai 是去年 10 月份刚刚成立的公司,主要目标是希望通过强化学习把 Agent 可以使用的工具拓展到整个互联网的范围,最终不再需要额外训练或者是集成的 overhead。我们目前已经有一个单一 Agent 可以集成上万个不同工具,并且在各种不同的垂直场景里执行任务,未来一个月左右就会开始真正的公测。Pokee.ai 团队的大多数成员都来自 Meta,我创业之前也在 Meta 负责应用强化学习团队,带了很多 Meta 内部的大型项目,比如 RL 在广告、推荐系统的落地,以及 Meta 的 RL 平台开源项目。我从本科就开始做 RL 的理论和落地,在这个方向已经研究了快十年,我认为这一波 Agent 对 RL 的依赖性会持续提升。未来 Pokee.ai 也会在这个方向上有更深入的继承和发展。夏令:我去年也跟 Bill 总深入探讨过 RL。现在大家都在讲,AI 进入了下半场,RL 也会变得越来越重要。常总是 ANP 开源社区的负责人,现在做的事情也非常有意思,请您也为听众们介绍一下。常高伟:好的。大家好,我是 ANP 开源技术社区的发起人。我们并不是一家商业化的公司,而是一个开放、中立、非营利性的技术社区。我们的目标是成为智能体互联网时代的 HTTP,而 ANP 是我们开发的一个智能体通信协议,和 MCP、A2A 比较类似。但是我们做得比较早,大概在去年三四月份就开启了 ANP 项目,比 MCP 早了大概半年时间,比 A2A 早大概一年时间。我们的愿景是定义智能体的联系方式。我们一直认为,协议是智能体连接最高效的方式,也是 AI 原生的连接方式。ANP 社区现在有 200 左右开发者,大部分来自于国内的大厂,还有一线的 AI 从业者。另外我们社群现在大概有1100多人,在 W3C 成立了一个社区组,这是 W3C 中唯一面向智能体协议的社区组,华为、谷歌、字节、蚂蚁、微软、中国移动,还有北大、上交大、MIT 等好几个大学都是我们社区组的成员。我们最终的目标,是构建一个更加开放的互联网,我们认为只有开放的互联网才是最适合释放 AI 的生产力的。夏令:好的,谢谢。在 Agent Infra 这一层,智能体与工具之间的通信也是构建 Agent 必不可少的环节,一会可以请常总和我们重点分享一下。最后请艾语智能的创始人、CEO,张天乐总为我们介绍一下艾语的情况。张天乐:谢谢夏总又投我们,又我们参加这次的活动。首先我们的定位是做法律 Agent,这个场景下中美的情况有很大差异。我们认为法律 Agent 在中国市场的落地,应该更多地聚焦在细分市场以及复杂场景里,直接交付结果。我们现在选择了两个落地的应用场景,一是针对网贷逾期客户提起 AI 立案之后的调解服务,目前这块业务已经与 40 多家金融机构进行了合作。二是知识产权侵权行为的发现和追索。我自己的 background 是在复旦读计算机,算是已经做了三代 AI。我最早在 MSRA 做图像识别,16 年我们做了神经网络,就开始应用在信贷的风控上,现在又开始做法律 Agent。这一轮 AI 兴起的时候我特别激动,因为我看到了它和前两代 AI 之间的巨大差异,并且 AI 真的走向了智能。另外我们一直在创业,一家公司做到了 Pre IPO,还有两家卖掉了,算是 AI 老兵和持续的创业者。再次感谢夏令总的,很高兴能跟大家做深入的交流。夏令:感谢四位嘉宾对自己和公司业务情况的介绍。我们可以看到大家聚焦于 Agent 赛道不同的业务和环节,每一家都很有代表性。比如说 Bill 总这边,Pokee.ai 的定位是什么?您对于 toC 的通用 Agent 有什么看法,可能的机会在哪?以及大家最关心的问题,和 Manus 相比我们的特色是什么?这些问题希望可以听到您进一步的分享。02
Agent 创业,从非共识出发