大模型中的skill机制解析：从概念到实现

8次阅读

没有评论

共计 1946 个字符，预计需要花费 5 分钟才能阅读完成。

在大模型技术栈中，skill指模型通过特定方式获得的可复用、模块化的能力单元。与 prompt 工程（即时指令调优）和 fine-tuning（全参数微调）相比，skill 具有三个显著特征：

原子性：完成单一明确任务（如时间转换、地址解析）
可组合性：多个 skill 可串联形成复杂工作流
低侵入性：通常无需修改模型底层参数

典型实现方式包括：
1. 外部工具集成（API 调用）
2. 知识库检索增强
3. 小规模适配器（Adapter）训练

通过 RAG（检索增强生成）架构，将结构化知识（如产品手册、法规条文）向量化存储，在推理时动态检索相关片段作为上下文。关键技术点：

分块策略：512-1024token 的语义连贯文本块
检索器优化：HyDE（假设性文档嵌入）提升查询改写效果
衰减系数：旧知识自动降权机制

采用 DSPy 等声明式编程框架定义 skill 流水线，例如：

class CustomerServiceSkill(dspy.Module):
    def __init__(self):
        self.query_analyzer = dspy.Predict('question -> intent')
        self.db_lookup = dspy.Retrieve(k=3)

    def forward(self, question):
        intent = self.query_analyzer(question).intent
        context = self.db_lookup(intent)
        return dspy.Predict('question,context -> answer')(question, context)

金融合规审核
Skill 组成：法规检索 + 实体识别 + 风险评分
效果：将人工审查时间从 4 小时缩短至 15 分钟
电商智能客服
退货政策查询（结构化数据）
物流预测（API 调用）
情感安抚（prompt 模板）
医疗问诊辅助
药品相互作用检查（知识图谱）
症状 - 科室映射（决策树）
医学术语解释（微调适配器）

基于 LangChain 的天气查询 skill 实现（需安装 langchain-openai 包）：

from langchain_core.tools import tool
from langchain_openai import ChatOpenAI
from langchain.agents import AgentExecutor, create_tool_calling_agent

@tool
def get_current_weather(location: str):
    """查询指定地点的实时天气"""
    # 实际项目应替换为真实天气 API
    return f"{location}当前天气：晴，25℃"

# 构建 agent 流程
llm = ChatOpenAI(model="gpt-3.5-turbo")
tools = [get_current_weather]
agent = create_tool_calling_agent(llm, tools)
agent_executor = AgentExecutor(agent=agent, tools=tools)

# 执行示例
result = agent_executor.invoke({"input": "上海和北京的天气对比"})
print(result["output"])

关键实现细节：
– 使用 @tool 装饰器标准化接口
– 工具描述需清晰明确（用于 LLM 判断调用条件）
– 错误处理建议封装在 tool 内部

通过实验测得不同规模 skill 对 Llama2-7B 的影响：