039AI系统技术栈三层结构图
2025-06-17
这张图是一个典型的AI系统技术栈三层结构图,展示了从底层数据到顶层应用,整个大模型系统是如何架构、协作和部署的。我们可以将其拆解为三层,分别为:
一、基础数据层:原材料层
这是整个系统的“地基”,也是支撑模型认知、推理、生成的“语料矿”。其中包含:
✅ 医学指南、文章内容等:
结构化或半结构化的专业文本语料,是领域知识的“标准答案”,例如《梅奥诊疗手册》《中华医学会指南》。
✅ 会话数据、用户信息、用药信息:
对话数据帮助模型理解“人说话的方式”;而用户信息和用药信息用于个性化推荐和问答。
✅ 数据清洗、标注:
这是数据工程最关键环节之一,原始数据往往存在错误、不规范、冗余等问题,必须经过清洗、去噪、分词、标注等步骤,才可用于训练或嵌入。
🔍 图示含义:
这一层用绿色标识,说明是“已部署/可用”状态。这些是现实可采集、可加工的数据资产,构建好之后便可向上传递价值。
二、AI基础模型层:推理大脑层
这一层是整个AI系统的“核心处理器”。它不产生知识,而是加工已有知识,提取模式,生成语言。主要构成包括:
🟥 大语言模型(LLM):
这是整张图中唯一用红色标记的模块,说明它是整个系统里最重要、最中心、也是难以完全替代或掌控的黑盒组件。比如 GPT-4、Claude、文心一言等。
⚪ 模型微调、蒸馏、压缩、强化学习:
这些是为了让大模型更好适配特定任务或落地应用所做的“本地调教”。它们虽然技术性强,但不改变模型底层结构,只是“训出你想要的性格和行为”。
🔍 图示含义:
这层中的大语言模型是“高投入、高风险、高回报”的核心;而微调等则是围绕它构建“适应层”的常见手段。
三、AI应用层:智能体表现层
这层是用户可交互可感知的产品接口,也是整个技术栈最贴近实际业务落地的地方。关键组件包括:
✅ 智能体(Agent):
用自然语言完成多步骤任务,调度工具、执行逻辑、调用内存,逐步成为应用的核心形式。
✅ 向量库:
用于 RAG 检索问答系统,把长文档“嵌入”为向量,实现“文档类知识随用随查”。
✅ 工具(Tool):
Agent 的外部动作能力,如:调用搜索、表格分析、天气查询等。
✅ RAG、ReRank 排序:
这些是结合上下文增强模型记忆力、判断力的系统组件。RAG是知识接入,ReRank是排序优化。
🟥 提示词工程(Prompt Engineering):
虽然在这层仍然重要,但此处标红,意味着它是目前最大的瓶颈和不确定性。因为纯靠 prompt 很难构建稳健系统,一旦输入略变就可能崩盘。
🔍 图示含义:
此层以绿色为主,表明绝大部分已可落地;但提示词工程仍需大量人工调试,难以标准化,阻碍规模化复制。
四、图整体结构解读
从下至上:
数据是根:没有数据,模型是空架子;
模型是核:没有强大的 LLM,整个系统无法智能;
应用是果:只有将模型转化为 Agent、RAG 等能力,才会产生真正的用户价值。
从左至右:
从知识→能力→产品的演化轨迹;
每一层都承接下一层的可能性;
绿色代表可用,红色代表挑战,灰色代表调优。
五、为何“提示词工程”和“大语言模型”是红色
提示词工程红色:
因为它依赖人的经验调参;
不具备稳定性、标准性、可迁移性;
一旦应用场景改变,就得重写或调整 Prompt;
属于“非结构化调试”,难自动化。
大语言模型红色:
因为训练成本极高(时间、算力、资金);
对安全性、幻觉、准确率等难控制;
本身仍是“闭源黑盒”,用户只能围绕它“打补丁”;
是整个技术堆栈中最核心也最不可控的部分。
六、未来优化方向
让 Prompt 工程转向 Workflow 架构,由 Prompt 转向动态流程结构(如 CrewAI、LangGraph);
Agent 化持续推进,让 LLM 成为“内核”,工具和任务逻辑可自由堆叠;
数据驱动更智能的微调,通过语义反馈/强化学习等机制改善 LLM 行为;
RAG + 多模态融合,让模型理解文图表并跨模态推理;
Agent 和系统打通接口,与 ERP/CRM 等业务系统深度融合,走向真正 AI 工具人。
总结
这张图不是简单的三层架构图,而是一份AI系统的落地路线图与挑战地图:
最上层是“你看到的界面”;
中间层是“你看不到的大脑”;
底层是“你忘记的数据基础”。
它提醒我们:
真正的 AI 系统不是“调个模型就能用”,而是一个从数据采集到知识注入、模型调用、任务执行的全流程系统工程。
如夜话,至此。
发表评论: