无尘阁日记

无尘阁日记

智能体有哪几种搭建方案
2026-03-24

不止一种,而且并不是都必须连接 AI 大模型 API

你可以把“智能体”先理解成一句人话:

能感知输入、按规则或能力做判断、再去执行动作的系统。

所以,智能体的核心不只是“大模型”,而是这三件事:

1. 输入

用户说话、表单、文件、邮件、图片、数据库数据、系统事件。

2. 判断

决定下一步做什么。
这个判断可以来自:

  • 固定规则

  • 工作流分支

  • 传统机器学习

  • 大语言模型

  • 多者混合

3. 执行

发消息、查库、生成文档、调用接口、审批、下单、写代码、整理报表。


一、按能力底层来分:常见 5 种方案

1. 纯规则型智能体

这类最简单,本质上不是“会思考”,而是“按条件办事”。

典型做法

  • if else

  • 关键词触发

  • 表单条件判断

  • 固定流程分支

  • RPA 自动化

  • BPM 审批流

例子

  • 用户提交请假单,天数大于 3 天就走主管审批

  • 收到“开发票”关键词,自动回复模板

  • 订单超 24 小时未支付,自动取消

优点

  • 稳定

  • 可控

  • 成本低

  • 适合企业正式流程

缺点

  • 不灵活

  • 变化一多就很难维护

  • 不会“理解语义”

是否必须接大模型 API

不必须。完全可以不接。


2. 工作流型智能体

这类比纯规则更进一步,是把多个节点串起来。

典型做法

  • 开始节点

  • 条件判断

  • 调接口

  • 查数据库

  • 发通知

  • 循环处理

  • 人工确认

  • 结束节点

常见平台

  • Coze

  • Dify

  • n8n

  • Make

  • Zapier

  • 飞书多维表格自动化

  • 企业内部工作流平台

例子

“筛简历智能体”:

  1. 收到简历

  2. 提取姓名、学历、年限

  3. 对照岗位要求

  4. 给出初筛结果

  5. 发到 HR 群

  6. 记录到表格

优点

  • 容易看懂

  • 容易排错

  • 适合业务流程落地

缺点

  • 一旦流程特别复杂,会很长很乱

  • 灵活性还是有限

是否必须接大模型 API

不必须。
如果只是规则判断、字段映射、系统搬运,完全可以不接。
但如果要“理解简历内容”“总结邮件”“改写话术”,通常就要接大模型。


3. 大模型驱动型智能体

这才是大家最常说的“AI 智能体”。

核心思路

把用户的问题交给大模型,让它:

  • 理解意图

  • 拆解任务

  • 生成步骤

  • 选择工具

  • 执行动作

  • 汇总结果

例子

用户说:
“帮我把这 30 份简历按岗位匹配度打分,并总结每个人的优势和风险。”

如果没有大模型,规则会写得很痛苦。
但有大模型,它可以直接理解自然语言,再调用工具完成。

优点

  • 灵活

  • 自然语言交互体验好

  • 处理非结构化信息很强

  • 适合复杂任务

缺点

  • 成本更高

  • 结果可能不稳定

  • 有幻觉风险

  • 对提示词、上下文、工具设计要求高

是否必须接大模型 API

这种方案本身就依赖大模型,所以通常必须接。

但这里有一个细分:

方案 A:接云端 API

比如:

  • OpenAI

  • Anthropic

  • Gemini

  • 通义千问

  • DeepSeek

  • 豆包

  • Kimi 等

方案 B:本地部署模型

比如:

  • Qwen 本地版

  • Llama 本地版

  • DeepSeek 开源版

  • 其他开源模型

这种情况下,不一定是外部 API,也可以是你自己本地或公司内部部署的模型服务。

所以更准确地说,不是必须接“外部 API”,但通常需要接“某种模型能力接口”。


4. 检索增强型智能体(RAG)

这类是现在企业里非常常见的一类。

核心逻辑

不是让模型直接“凭空回答”,而是:

  1. 先去知识库找资料

  2. 再把找到的资料喂给模型

  3. 最后让模型基于资料回答

例子

  • 企业制度问答

  • 售后知识库客服

  • 合同条款检索

  • 设备维修问答

  • 项目文档助手

优点

  • 更贴近企业真实资料

  • 幻觉更少

  • 可追溯

  • 更适合私有知识场景

缺点

  • 知识库质量很关键

  • 检索不准时,回答也会歪

  • 架构比单纯聊天复杂

是否必须接大模型 API

检索本身不一定需要。
但如果要把检索内容整理成人话回答,通常还是需要大模型。

不过也有一种弱化版:

  • 只做“文档搜索 + 原文返回”

  • 不让模型总结

这种就可以不接大模型,只做搜索系统。


5. 混合型智能体

这是企业最实用的一种,也是最推荐的一种。

核心思想

不是把一切都交给大模型,而是:

  • 确定性的部分交给规则和流程

  • 需要理解和生成的部分交给大模型

  • 高风险决策交给人

例子:合同审核助手

  1. 上传合同

  2. 规则引擎先检查必填项

  3. 知识库查标准条款

  4. 大模型总结风险点

  5. 人工最终确认

优点

  • 成本更合理

  • 风险更低

  • 企业更敢用

  • 落地效果通常最好

是否必须接大模型 API

不一定。
看你混合里有没有“语义理解/生成”这一步。
有,就要接。
没有,就不需要。


二、按部署方式来分:又可以分成 4 种

1. 零代码/低代码平台搭建

适合业务人员、产品经理、运营、初学者。

常见特点

  • 拖拉拽

  • 配置节点

  • 接插件

  • 接知识库

  • 接审批流

适合谁

  • 想快速验证

  • 想先跑通 MVP

  • 不想一上来就写代码

是否必须接大模型 API

看场景。
很多平台本身就要你配置模型,尤其是 AI 节点。
但如果只是自动化流程,也可能不用。


2. 代码开发型

开发人员自己搭。

常见技术栈

  • Python

  • Node.js

  • Java

  • PHP

  • Go

常见框架

  • LangChain

  • LangGraph

  • AutoGen

  • CrewAI

  • Semantic Kernel

  • 自研 Agent 框架

优点

  • 自由度高

  • 可深度定制

  • 适合复杂系统集成

缺点

  • 开发门槛高

  • 维护成本高

是否必须接大模型 API

仍然不一定。
你也可以写一个“规则+接口编排”的智能体,不接大模型。
只是如果你要自然语言能力,基本就会接。


3. 本地私有化部署型

适合对数据安全要求很高的企业。

特点

  • 模型部署在内网

  • 数据不出企业

  • 可接内部系统

  • 可控性高

场景

  • 政企

  • 金融

  • 医疗

  • 法务

  • 涉密研发

是否必须接大模型 API

不必须接外部 API。
但大多还是会有“内部模型服务接口”。


4. 人机协同型

这类最符合现实。

思路

智能体不是完全替人,而是先干 80%,最后 20% 交给人。

例子

  • AI 先写邮件草稿,人来确认发送

  • AI 先筛简历,人来决定是否面试

  • AI 先做经营分析,人来拍板

是否必须接大模型 API

不一定。
如果只是流程辅助,不需要。
如果涉及理解、总结、写作,通常需要。


三、是不是所有智能体都必须连接 AI 大模型 API?

结论

不是。

更准确地说:

1. 纯自动化智能体,不需要

比如:

  • 审批流

  • 定时任务

  • 规则分发

  • 数据同步

  • 表单流转

  • 条件触发通知

这些都可以完全不接大模型。

2. 要“理解人话”的,通常需要

比如:

  • 自然语言问答

  • 总结文档

  • 写邮件

  • 分析简历

  • 改写话术

  • 从模糊描述中提取需求

这些一般需要大模型。

3. 不一定要外部 API,也可以本地模型

所以关键不是“API”这三个字,而是:

你是否需要模型能力。

如果需要,可以有三条路:

  • 接外部大模型 API

  • 接第三方平台代理模型

  • 接你自己本地部署的模型服务


四、你可以这样理解:智能体 ≠ 大模型

很多人把这两个东西混了。

大模型是什么

像一个很聪明的“大脑”。

它擅长:

  • 理解语言

  • 生成文字

  • 推理

  • 总结

  • 改写

  • 分类

但它自己不天然会:

  • 登录你公司系统

  • 调内部接口

  • 审批流程

  • 操作 ERP

  • 发 OA 消息

智能体是什么

像“会调度大脑、工具、流程、记忆、执行器”的系统。

所以:

大模型是能力部件,智能体是调度系统。

有的智能体里有大模型。
有的智能体里没有大模型。
有的智能体里既有规则,又有模型,又有人审批。


五、企业里最常见的 6 类落地方案

1. 客服问答智能体

常见配置:

  • 知识库

  • 检索

  • 大模型

  • 人工转接

通常需要模型。

2. 办公自动化智能体

常见配置:

  • 表单

  • 审批

  • 通知

  • 数据同步

不一定需要模型。

3. 报表分析智能体

常见配置:

  • 数据库

  • SQL

  • 图表

  • 模型总结

纯报表拉数不一定要模型;
但要“用人话解释经营数据”,通常要模型。

4. 内容生成智能体

常见配置:

  • 提示词模板

  • 素材库

  • 大模型

  • 审核发布

这类通常需要模型。

5. 研发助手智能体

常见配置:

  • 代码仓库

  • 文档

  • Issue

  • 模型

  • 工具调用

通常需要模型。

6. 决策辅助智能体

常见配置:

  • 数据源

  • 规则校验

  • 模型分析

  • 人工终审

多数是混合型。


六、如果你是普通企业,最实用的选择是什么

我给你一个非常接地气的建议:

第一阶段:先别追求“全自动智能体”

先做:

  • 固定流程自动化

  • 报表自动整理

  • 文档自动汇总

  • 知识库问答

  • 简单审批辅助

这是最容易见效的。

第二阶段:再引入大模型

把最耗脑子的环节接进去,比如:

  • 总结

  • 分类

  • 写作

  • 解释

  • 归纳

  • 初步分析

第三阶段:最后再做真正的多步骤 Agent

比如:

  • 自动接任务

  • 自动拆解

  • 自动调用多个工具

  • 自动回写结果

  • 自动通知相关人

这样风险最低,ROI 通常也最高。


七、给你一个一句话判断公式

你只要问自己一句:

这个场景,难点到底是“执行流程”,还是“理解内容”?

如果难点是执行流程

优先:

  • 规则

  • 工作流

  • RPA

  • 接口编排

不一定要大模型。

如果难点是理解内容

优先:

  • 大模型

  • 知识库

  • 检索增强

  • 模型+流程混合

大概率要接模型能力。


八、最后给你一个最短答案

搭智能体至少有这几种:规则型、工作流型、大模型驱动型、知识库检索型、混合型。

并不是都必须连接 AI 大模型 API。
只有当你需要它具备“理解自然语言、总结、生成、推理”这些能力时,才通常需要接模型。
而且也不一定非得接外部 API,也可以接本地部署模型。