
AI相关
《动手学深度学习》:https://zh.d2l.ai/
各大AI云平台
| 云平台 | 公司 | 地址 |
|---|---|---|
| 阿里百炼 | 阿里巴巴 | https://bailian.console.aliyun.com |
| 腾讯T平台 | 腾讯 | https://cloud.tencent.com/product/ti |
| 干帆平台 | 百度 | https://console.bce.baidu.com/qianfan/overview |
| SiliconCloud | 硅基流动 | https://siliconflow.cn/zh-cn/siliconcloud |
| 火山方舟-火山引擎 | 字节跳动 | https://www.volcengine.com/product/ark |
相关术语
| 技术 | 大致时间 | 提出者/推动者 | 核心要解决的问题 |
|---|---|---|---|
| LLM | 2017年起 | Google (Transformer) | 让机器具备强大的语言理解和生成能力,成为“能说会道”的大脑。 |
| RAG | 2020年 | Facebook AI Research | 解决 LLM 知识过时、容易产生“幻觉”(胡说八道)的问题,为它配上“精准知识库”。 |
| Agent | 2022年起 | 学术界与工业界共同演进 | 让 LLM 不仅能“说”,还能“做”。通过规划和使用工具,实现复杂任务的自动化。 |
| MCP | 2024年底 | Anthropic | 解决 Agent 调用各种工具时接口混乱、开发成本高、安全性差的问题,统一工具的“插头标准”。 |
一句话总结演进关系:
LLM 是基础大脑 → RAG 给它配上知识库,让它更聪明 → Agent 给它配上手脚,让它能干活 → MCP 统一了手脚的接口,让它干活更标准、更高效。
🧠LLM大语言模型:助手的“大脑”
通俗解释:LLM (Large Language Model) 是这个助手的“大脑”,负责思考、理解和生成语言。它能和你流畅对话,但它有一个“致命弱点”:它的知识只来源于训练时的数据,有个明确的截止日期,并且没有“记忆”。
举个例子:如果你问它“如何写一封商务邮件?”,它能立刻给你一份漂亮的模板。但如果你问“我们公司上个季度的销售额是多少?”,它就不知道了,因为它没学过你们公司的内部数据,甚至可能会“瞎编”一个数字(这就是 AI 的“幻觉”问题)。
📚 RAG (检索增强生成):助手的“专属知识库”
通俗解释:RAG (Retrieval-Augmented Generation) 就是为了解决 LLM 的“失忆”和“幻觉”问题。它相当于给助手配备了一个可以随时查阅的“专属知识库”或“参考书”。当助手需要回答专业问题时,会先去知识库里查找资料,再结合资料给出精准答案。
举个例子:还是“上个季度销售额”的问题。有了 RAG,助手会先去连接着你公司内部数据库的“知识库”里检索相关信息,找到“上季度销售额为500万”这个确切数据,然后再告诉你。这样,回答就变得准确、可靠了。
🛠️ Skills (技能):助手的“工具箱”
通俗解释:Skills 是助手可以使用的各种“工具”或“能力”。LLM 这个“大脑”只能动嘴皮子(生成文本),但 Skills 能让它“动手做事”。
举个例子:每一个具体的工具都是一个 Skill,比如:
- 查询数据库:一个能执行 SQL 语句的技能。
- 生成图表:一个能把数据变成柱状图或饼图的技能。
- 发送邮件:一个能调用邮件 API 的技能。
没有 Skills,助手就只能陪你聊天;有了 Skills,它才能真正帮你完成任务。
📖 MCP (模型上下文协议):助手的“工作流程手册”
通俗解释:MCP (Model Context Protocol) 是一本标准化的“工作流程手册”或“通用接口”。它规定了助手在接到任务后,应该按什么顺序、在什么情况下调用哪个技能,避免手忙脚乱。你可以把它想象成 AI 领域的 USB-C 接口,它统一了各种工具的连接标准,让助手能轻松“插上即用”,而无需为每个工具单独开发适配器。
举个例子:当你下达“分析数据并做图”的指令时,MCP 这本“手册”会告诉助手:“第一步,先调用‘查询数据库’技能获取数据;第二步,拿到数据后,再调用‘生成图表’技能。” 如果没有 MCP,助手可能会先尝试调用“生成图表”技能,结果因为没有数据而报错。
🎬 完整场景串联
让我们回到最初的复杂任务,看看这五个概念是如何协同工作的:
你的指令:“分析一下上个季度的销售数据,做个图表,然后发邮件给团队。”
- Agent (助手本人) 接收到你的指令。
- LLM (大脑) 开始思考,理解这个任务需要分三步:查数据、做图表、发邮件。
- MCP (流程手册) 提供了标准流程:先查数据 → 再做图 → 最后发邮件。
- Agent 遵循流程,首先调用 Skills (工具箱) 里的
查询数据库技能。 - 为了获取准确数据,这个技能会通过 RAG (知识库) 从公司内部数据库中检索到“上季度销售额为500万”。
- Agent 拿到数据后,接着调用
生成图表技能,做出一个漂亮的柱状图。 - 最后,Agent 调用
发送邮件技能,将图表和分析结果发送给团队。
- 完整的技术流程:
- 用户 给 Agent 指令。
- Agent 里的 LLM 进行思考(推理)。
- LLM 发现需要工具,于是发出一个符合 MCP 标准 的请求(比如:“我要调用
query_db工具”)。 - Agent(作为 MCP 客户端)接收到请求,通过 MCP 协议 找到对应的 Skill 并执行。
- Skill 返回结果。
- Agent 把结果再次喂给 LLM 生成最终回复。

