Agent与Skill架构设计：构建高效智能系统的核心模式

33次阅读

共计 3013 个字符，预计需要花费 8 分钟才能阅读完成。

在开发智能系统时，我们常常会遇到功能耦合严重、扩展性差的问题。传统做法往往将所有逻辑写在一个庞大的类或模块中，导致系统难以维护和扩展。今天我们就来聊聊如何用 Agent-Skill 架构解决这些问题。

先来看一个典型场景：假设我们正在开发一个智能客服系统，需要处理用户咨询、订单查询、投诉等多个功能。传统实现方式可能会把这些功能全部塞进一个大类里：

class CustomerService:
    def handle_query(self, query):
        if "订单" in query:
            return self._handle_order(query)
        elif "投诉" in query:
            return self._handle_complaint(query)
        # ...

这种做法有几个明显问题：

每次新增功能都要修改主类代码
不同功能的代码耦合在一起
难以单独测试某个功能
无法动态加载新功能

Agent-Skill 架构通过职责分离来解决这些问题。让我们看看它的核心组成：

任务分发 ：根据输入决定调用哪个 Skill
状态管理 ：维护系统运行时的上下文状态
生命周期控制 ：管理 Skill 的加载和卸载

单一职责 ：每个 Skill 只做一件事
接口标准化 ：所有 Skill 遵循相同调用规范
松耦合 ：Skill 之间不直接依赖

Agent 和 Skill 通过明确定义的接口交互。Agent 负责接收输入，选择适当的 Skill，传递上下文，最后返回结果。整个过程就像项目经理（Agent）和专业人士（Skill）的协作。

让我们用 Python 实现一个基础版本。首先定义 Agent 基类：

from typing import Dict, Any, Callable

class BaseAgent:
    def __init__(self):
        self._skills: Dict[str, Callable] = {}
        self._context: Dict[str, Any] = {}

    def register_skill(self, name: str, skill_func: Callable):
        """注册一个新的 Skill"""
        self._skills[name] = skill_func

    def execute(self, skill_name: str, **kwargs) -> Any:
        """执行指定的 Skill"""
        if skill_name not in self._skills:
            raise ValueError(f"未知 Skill: {skill_name}")

        # 合并上下文和传入参数
        full_context = {**self._context, **kwargs}
        return self._skills[skill_name](**full_context)

    def update_context(self, **kwargs):
        """更新上下文信息"""
        self._context.update(kwargs)

然后实现一个简单的计算 Skill：

# 计算器 Skill
def calculate(operation: str, a: float, b: float) -> float:
    """
    执行基本数学运算
    :param operation: 支持 add/sub/mul/div
    :param a: 第一个操作数
    :param b: 第二个操作数
    :return: 计算结果
    """ops = {'add': lambda x, y: x + y,'sub': lambda x, y: x - y,'mul': lambda x, y: x * y,'div': lambda x, y: x / y}

    if operation not in ops:
        raise ValueError(f"不支持的操作: {operation}")

    return ops[operation](a, b)

使用示例：

agent = BaseAgent()
agent.register_skill('calc', calculate)

# 设置初始上下文
agent.update_context(a=10, b=5)

# 执行计算
result = agent.execute('calc', operation='add')
print(f"10 + 5 = {result}")  # 输出: 10 + 5 = 15

在实际应用中，我们还需要考虑更多复杂场景：

如果多个线程同时调用 Agent，需要加锁保护共享状态：

from threading import Lock

class ThreadSafeAgent(BaseAgent):
    def __init__(self):
        super().__init__()
        self._lock = Lock()

    def execute(self, skill_name: str, **kwargs):
        with self._lock:
            return super().execute(skill_name, **kwargs)

当 Skill 接口变更时，可以通过适配器模式保持兼容：

def legacy_calc_adapter(operation, num1, num2):
    """将旧版参数名适配到新版"""
    return calculate(operation=operation, a=num1, b=num2)

可以使用装饰器记录每个 Skill 的执行时间：

import time
from functools import wraps

def monitor_performance(func):
    @wraps(func)
    def wrapper(*args, **kwargs):
        start = time.time()
        result = func(*args, **kwargs)
        elapsed = time.time() - start
        print(f"{func.__name__} 执行时间: {elapsed:.3f}s")
        return result
    return wrapper

# 使用时装饰 Skill 函数
@monitor_performance
def monitored_calculate(operation, a, b):
    return calculate(operation, a, b)

经过多个项目实践，我总结了一些经验：

太细：管理成本高，调用链路过长
太粗：失去解耦意义
建议：一个 Skill 对应一个业务用例

每个 Skill 应该有独立的异常处理
关键 Skill 可以实现熔断机制

利用 Python 的 importlib 实现动态加载：

import importlib

def hot_reload_skill(agent, skill_module):
    """动态重新加载 Skill 模块"""
    module = importlib.reload(skill_module)
    agent.register_skill(module.SKILL_NAME, module.skill_func)

相比插件架构，Agent-Skill 模式更强调：