LLM与Prompt、Agent、Skill、MCP、Claude Code的架构解析与实战指南

1次阅读

共计 1472 个字符，预计需要花费 4 分钟才能阅读完成。

LLM（Large Language Model）：作为基础模型，提供文本生成和理解能力，是智能应用的 ” 大脑 ”。例如 GPT-3、Claude 等模型。
Prompt：用户输入给 LLM 的指令或问题，是模型交互的起点。好的 prompt 设计直接影响输出质量。
Agent：封装了决策逻辑的模块，负责接收输入、调用 LLM、处理输出。相当于应用的 ” 控制器 ”。
Skill：特定领域的能力单元，如天气查询、代码生成等。一个 Agent 可以组合多个 Skill。
MCP（Multi-Component Pipeline）：将多个处理步骤（如预处理、模型调用、后处理）串联的流水线架构。
Claude Code：Anthropic 提供的 API 和工具集，用于与 Claude 模型交互和扩展功能。

Prompt 设计困难 ：模糊的 prompt 导致模型输出不稳定，需要反复调试
Agent 逻辑复杂 ：状态管理和错误处理容易失控
Skill 集成成本高 ：新功能开发周期长
性能瓶颈 ：串行调用 LLM 导致延迟高
维护困难 ：组件间耦合度高，修改影响范围大

接入层 ：处理原始输入（HTTP API、消息队列等）
路由层 ：根据输入类型分发给对应 Agent
Agent 层 ：管理对话状态和上下文
Skill 层 ：实现具体业务能力
LLM 适配层 ：统一不同模型的调用接口

装饰器模式 ：为 Skill 添加日志、缓存等能力
策略模式 ：动态切换不同的 LLM 提供商
观察者模式 ：实现 Skill 间的数据共享

# Agent 基础实现
class Agent:
    def __init__(self, skills: List[Skill]):
        self.skills = {s.name: s for s in skills}
        self.context = {}

    async def handle(self, user_input: str) -> str:
        # 1. 选择最匹配的 Skill
        skill = self._select_skill(user_input)

        # 2. 准备 prompt
        prompt = skill.prepare_prompt(user_input, self.context)

        # 3. 调用 LLM
        response = await self._call_llm(prompt)

        # 4. 后处理
        output = skill.post_process(response)

        # 5. 更新上下文
        self._update_context(user_input, output)

        return output