无尘阁日记

037拆解一个智能体的内在运行机制:从任务触发到动态反馈的全链条剖析

当我们谈论一个“智能体”(Agent)时,很多人想象的是一个可以自主理解指令、自动完成复杂任务的AI助理。但这个“自动”背后究竟运转了哪些精细的结构?它如何一步步从“我想要…”走到“任务完成”?本文将根据一张典型的智能体任务流图,逐层拆解其运行原理。01. 感知层:从“输入”开始,智能体如何理解你要什么?一切始于你输入的一句自然语言指令,比如:“帮我找一份适...

036“单一智能体 + MCP(Model Context Protocol)”与“多智能体系统(MAS,Multi-Agent System)”

一、MCP 与单一智能体架构MCP 是什么?MCP(Model Context Protocol)由 Anthropic 提出,是一个开放标准协议,作用相当于 AI 智能体的“万能 USB 接口”。它统一了智能体与外部工具、数据库、搜索引擎等的交互方式,使得模型可以灵活调用这些资源。单一智能体 + MCP 的特点:集成简单:MCP协议大大降低了工具调用门槛;...

035Prompt本质上,是新一代的编程语言

Prompt本质上,正在成为新一代的“通用编程语言”。它不像传统编程语言那样基于严格的语法和命令结构,而是依托自然语言——这种最古老的人类“接口”,激活大语言模型(LLM)这个前所未有的“通用智能运行时”。我将以一个顶级Agent研究者与AI操作系统架构师的视角,为你深度拆解这个命题,从语言史、操作机制、设计哲学、工程演化四个层面展开。一、语言的回归:从代码...

034RAG(Retrieval-Augmented Generation)与Fine-tuning(微调)

我们来把这两个在大模型时代广泛使用的核心技术——RAG(Retrieval-Augmented Generation)与Fine-tuning(微调),彻底讲清楚。用最通俗的语言帮你掌握它们的底层原理、适用场景、优缺点与彼此的关系。你可以把它们理解为两种扩展大语言模型能力的“外挂”机制,只是工作方式不同。一、什么是 RAG(检索增强生成)?🧠 本质上:RAG...

033AI 领域正悄然发生的一次范式跃迁

后训练时代的全自主 Agent 流派——以强化学习为指路灯,以工程压榨模型与硬件性能为利器,探索 AI 系统自组织、自演化的极限边界。我将从以下五个部分,深入介绍这个流派的核心逻辑、代表实践与未来前景:01|背景:从“Prompt 编程”到“系统训练”的认知跃迁2023 年至 2024 年,主流大模型生态仍以「Prompt 编程 + Tool 调用 + 记忆...

032Prompt就是大模型的机器语言,Agent就是基于大模型的软件

这句话背后其实隐含了我们正在经历的一个范式转移:从传统代码驱动的软件系统,走向以语言驱动的智能系统。我将从三个层层递进的层面来解读这个观点,分别是:01|Prompt:机器语言的新形态,不再是 0 和 1,而是人类语言过去我们和机器对话的方式,是代码、命令、API。人必须“学会”机器语言。而在大模型诞生之后,机器开始“学会”人类语言。Prompt 就像是这门...

031学习AI Prompt|www.learnprompt.pro

https://www.learnprompt.pro/docs/intro Learn Prompt(官网为 LearnPrompt.pro)是一个面向广泛用户的完全开源、免费学习平台,定位于“AI 聊天与创作的活用圣经”。它由 AI 沃茨等社区共同维护,目标是帮助从小白到进阶者掌握 AI 提示工程、Agent、RAG、图像与音频生成、数字人制作等多项技能...

029manus项目结构解读

https://kirigaya.cn/blog/article?seq=300## Manus 项目结构从朋友爬取的 Manus 项目内部结构来看,Manus 的大致结构似乎和 OpenManus 类似,这或许会慢慢成为未来 Agent 项目的构建方式。```mermaidflowchart LR    root["Root&...

028Toolformer是否已迈出通向通用智能体的第一步?——一次“目标即行动”能力的真实检验

🧠 一、你的设想回顾:目标驱动、自主规划、自主调用、自主完成你设想的 AGI Agent 应该具备这样的能力:你只下一个自然语言目标指令(如“帮我抢一张火车票”)Agent 自动理解这个目标、分解任务决定是否需要用工具,比如搜索、API、数据库、函数知道在哪一步调用哪个工具自己构造合适的调用语法和参数调用完得到结果后,能自动判断结果有无用、是否继续往下走最后...