无尘阁日记

无尘阁日记

智能体的潜规则:从FIPA到ReAct,AI世界的“沟通协议”与思考逻辑
2025-10-17

你提到的「智能体的流程协议」,其实是一个跨领域的概念:它取决于你指的“智能体(Agent)”是在 哪一层语义上
不同层面的“智能体”确实都有对应的“协议”(Protocol),只是这些协议的形式和目的差别很大。

我们可以把“智能体流程协议”分为三大类理解:

  1. 计算机科学 / 多智能体系统(MAS)层面的通信协议

  2. AI Agent / LLM-based Agent(如 ChatGPT、AutoGPT)层面的协作协议

  3. 哲学或认知科学意义上的 Agent 行为规范模型

我来逐层展开讲,让你清楚每一类“流程协议”具体叫什么、解决什么问题、典型代表有哪些。

🧩 一、在「多智能体系统(MAS)」中的流程协议

在传统的人工智能(尤其是分布式AI自治系统研究领域),
Agent 的流程协议(Agent Communication Protocol) 通常指的是
→ 不同智能体之间如何交流、协调、协作的标准流程。

🧠 核心概念:ACL(Agent Communication Language)

这是最典型的「智能体流程协议」的名称。
它由 FIPA(Foundation for Intelligent Physical Agents)组织制定,是国际标准。

📘 FIPA ACL(Agent Communication Language)

📍主要组成:

  • Performative:指令意图(如 inform, request, agree, refuse 等)

  • Content:传递的消息内容

  • Sender/Receiver:发送者和接收者

  • Conversation ID:会话标识(用于追踪一次交互的完整流程)

  • Protocol:消息对应的协作协议类型

🧱 示例(伪代码形式):

(communicative-act 
    :performative REQUEST
    :sender agentA
    :receiver agentB
    :content (action agentB (deliver package))
    :conversation-id "delivery-001"
    :protocol fipa-request
)

🔄 常见的智能体交互协议(FIPA 标准):

协议名功能说明
FIPA-Request一个智能体请求另一个执行动作
FIPA-Query查询信息、知识
FIPA-Contract-Net一种任务分配协议(主从竞标模式)
FIPA-Propose提出、协商方案
FIPA-Subscribe订阅特定信息变化
FIPA-Iterated-Contract-Net多轮任务协商协议

这些协议定义了「一个智能体对另一个智能体发出请求、如何应答、如何确认」的完整流程状态机(State Machine)

📚 推荐阅读:

  • FIPA Specification(FIPA00061, FIPA00069)

  • 《Multiagent Systems: A Modern Approach to Distributed Artificial Intelligence》
    Gerhard Weiss, MIT Press

🤖 二、在「大模型 / AI 智能体(LLM Agent)」语境下

现代的“智能体”(如 ChatGPT、AutoGPT、LangChain Agent、OpenDevin 等)
虽然没有正式的“FIPA协议”,
但它们内部运行的流程 本质上是“协议驱动的自我调用链”

这里常见的协议/流程名称有:

协议 / 框架名说明
ReAct ProtocolReason + Act:先思考再执行,形成可解释决策流
MRKL(Modular Reasoning, Knowledge and Language)模块化智能体协议(思考-调用工具-整合结果)
LangChain Agent Protocol定义工具调用、思考(thought)与行动(action)序列
OpenAI “Tool Use” Schema / JSON SchemaLLM 与外部工具交互的标准结构(即 OpenAI 的 function calling 协议)
AutoGPT Loop目标评估 → 任务分解 → 执行动作 → 反馈总结
SMP(Structured Messaging Protocol)一种新兴的多Agent协作消息结构协议

🔧 示例:ReAct 流程协议

Thought: 我需要知道用户的地理位置
Action: call_tool("GetLocation")
Observation: {"city": "Shanghai"}
Thought: 用户在上海,我可以推荐附近的活动
Action: reply("推荐上海周末活动")

这就是 LLM 智能体的一种“流程协议”:

Reason(思考) → Act(行动) → Observe(观察) → 再 Reason。

🧭 小结(AI 智能体领域)

层面协议/框架定义内容
语言模型 + 工具OpenAI Function Calling Schema输入输出格式标准
思考 + 行动逻辑ReAct / MRKL / AutoGPT Loop行为循环协议
多Agent协作SMP / AutoGen Conversation Protocol交互规范与状态流转
理论继承FIPA ACL(早期标准)语义通信模型

🧬 三、在认知或社会学层面:Agent 的「行为协议」

在更抽象层面(哲学/心理学/社会系统模拟),
“智能体的流程协议”指的是决策循环(Cognitive Protocol)

最经典的模型有:

模型全称核心循环
BDI 模型Belief–Desire–Intention感知 → 信念 → 目标 → 意图 → 行动
OODA LoopObserve–Orient–Decide–Act军事与策略智能体常用流程
Sense–Think–Act感知 → 推理 → 执行机器人与强化学习的通用协议

这些其实就是「智能体行为协议(Behavior Protocol)」。

🧠 总结全景图

层级协议名称代表框架 / 应用功能
系统级 / 分布式AIFIPA ACL / FIPA-Contract-NetJADE、SPADE智能体通信协议
LLM智能体层ReAct / MRKL / OpenAI Function ProtocolLangChain、AutoGPT、OpenDevin智能体思考与工具交互协议
认知决策层BDI / OODA / Sense-Think-ActCognitive Agents、机器人系统智能体内部行为模型

📚 推荐延伸阅读

类型名称说明
标准FIPA ACL Specification智能体通信的正式协议
理论Multiagent Systems: A Modern Approach (Weiss)分布式智能体的经典教材
框架LangChain Agent Protocol(LangChain 文档)现代LLM智能体的协议化执行流程
模型ReAct: Synergizing Reasoning and Acting in Language Models (Google, 2022)当前最主流的LLM Agent协议思想
认知模型BDI Model of Agency (Michael Bratman, 1987)Agent决策理论基础