无尘阁日记

无尘阁日记

038Agent 就是访问传统 it 系统的中介
2025-06-17


一、Agent 本质上是“接口解释器”,不是系统创造者

在当前技术阶段,Agent 并不创造系统,它的“能力上限”取决于两个核心因素:

  1. 大模型(LLM)推理与语言理解能力

  2. 所能调用的工具(API、数据库、脚本、搜索接口)能力集

所以它的主要职责不是原始系统的构建,而是在语言层理解你要做什么,然后“翻译”成 IT 系统可接受的行为调用。它是语言 → 调用的桥梁,是“想法 → 指令”的中介器。

比如你说:“帮我下载这个会议的录音,转成文字整理成纪要发给 A 和 B。”

你并没有说出:

  • 哪个录音地址;

  • 用哪个语音识别 API;

  • 怎么格式化文本;

  • 如何生成邮件并附带内容。

Agent 在做的,就是把这句自然语言翻译成:

  • 从 Notion API 拉出会议链接;

  • 用 Whipser 接口转录音;

  • 用 LLM 总结内容;

  • 调用企业微信 API 发邮件。

这正是一个“中介”的工作。

二、传统 IT 系统多为“被动式接口”,Agent 激活了它们的“主动式使用能力”

传统 IT 系统就像一个个仓库、工具箱、处理引擎,它们都定义好了入口和出口,等着你来调用。但大部分人都不会直接编程去对接这些系统,因为:

  • 接口文档晦涩;

  • 交互方式复杂;

  • 调用边界不清晰。

而 Agent 在这里,成为了这个“冰冷系统”的语义引擎——它能用“你听得懂的语言”去调动“它听得懂的接口”。

这背后就是 MCP/RAG 等机制的实质:Agent 不拥有系统,它只是知道怎么“说话”让系统配合。

三、Agent 是“通用语境调用层”,帮助用户跨系统操作而无需跨界学习

更进一步地看,Agent 不只是对某个 IT 系统的“语言包装器”,它更像是多个系统之间的“语境桥梁”。

在没有 Agent 的年代,如果你想:

  • 从 ERP 系统导出销售数据;

  • 在 CRM 系统里筛选客户行为;

  • 然后在飞书里生成日报推送…

你得切换界面、手动点击、编写报表、甚至写脚本。

但在 Agent 的逻辑中,你可以说一句:

“请每天下午 5 点汇总昨天新增客户和销售额,按人群发送个性化报告。”

Agent 会跨系统调用多个接口、跨平台整合数据,然后将结果回传。你无需关心哪个系统、哪个字段、哪种格式。这就是中介的威力——隐藏复杂性,提供统一语义入口

四、Agent 的中介角色注定它“必须适配旧系统”,而非幻想一切新构建

当前 Agent 最大的实际应用壁垒,不在模型,而在“系统环境异质性”上。

企业的系统从 SAP、Oracle,到定制后台、Python 脚本、Excel 宏……根本没法强制统一技术栈。因此真正落地的 Agent,一定要做的不是重构,而是:

  • 适配老系统

  • 理解已有接口结构

  • 自动生成调用脚本

  • 为旧世界配一张“新语言地图”

所以当前 Agent 生态的繁荣方向,也都不是重造系统,而是围绕已有工具做中介框架,典型如:

  • LangChain 的 Tool 接口封装;

  • CrewAI 的角色协同分工;

  • OpenDevin/AutoDev 的 IDE 脚本适配;

  • OpenAgents/Manus 的 GUI 操作代理……

这就是技术上的 现实主义路线:Agent 是当代系统的连接器,而不是重塑者。

五、但它也在逐步成为“系统构建的引导者”——下一阶段可能具备“重构中介”

虽然现在 Agent 主要是“访问旧世界”,但随着语言表达、工具调用和流程学习能力的增强,它也逐步具备以下潜能:

  • 定义系统架构(自动生成表结构、功能图);

  • 生成脚本、API 接口代码

  • 调试系统运行状态、发出优化建议

  • 配合用户自建 agent 工厂,演化新生态系统

也就是说,它最终会从“中介”过渡为“中介+设想者”甚至“中介+设计者”。

就像中世纪的翻译家最初是翻译经典,但最后也发展成了哲学家和科学家那样的角色。

总结:Agent 当前是“旧系统的语义接口”,未来可能成为“人类愿景的流程构建者”

这句“Agent 就是访问传统 IT 系统的中介”点得非常准。

它道出了:

  • Agent 目前并不重构系统,而是“帮人说系统能听懂的话”;

  • 它并不拥有系统能力,而是调配已有能力;

  • 它的价值,不在重造,而在连接;

  • 但这种连接最终会反向影响系统形态本身。

未来不是没有系统,未来是系统听懂你话的那一刻,Agent 便不再是中介,而是新平台本身。

如夜话,至此。