Skill Prompt 入门指南：从零构建高效 AI 交互逻辑

7次阅读

共计 1896 个字符，预计需要花费 5 分钟才能阅读完成。

在实际开发中，设计不良的 prompt 会导致 AI 交互系统出现各种问题。以下是两个常见案例：

歧义理解导致误操作：某电商客服机器人收到用户输入 ” 我想取消 ”，由于缺乏上下文约束，系统错误地取消了最近订单而非用户实际想退订的会员服务。
多轮对话崩溃：旅游助手在询问 ” 需要几点叫醒服务？” 时，用户回答 ” 不用了谢谢 ”，但系统仍继续追问 ” 请问需要 Morning Call 吗？”，导致对话陷入死循环。

对比维度	硬编码规则	Skill Prompt
响应准确率	60-70%（依赖规则覆盖度）	85-95%（动态理解意图）
维护成本	高（需人工维护大量规则）	低（自动适配新场景）
开发周期	2- 4 周（需预判所有场景）	3- 5 天（快速迭代）
泛化能力	仅支持预设句式	支持语义相似表达

（测试环境：GPT-3.5 模型，1000 条用户 query 测试集）

意图声明（Intent Declaration）
明确告知 AI 需要完成的具体任务
示例：” 你是一个专业的餐饮推荐助手，需要根据用户口味偏好推荐合适餐厅 ”
上下文约束（Context Constraints）
限制响应范围和条件
示例：” 仅推荐人均消费 100-300 元的中餐馆，避免提及西餐 ”
输出格式（Output Formatting）
规定响应数据结构
示例：” 以 JSON 格式返回，包含 name, address, signature_dish 三个字段 ”

def build_restaurant_prompt(cuisine: str, price_range: tuple):
    """
    动态构建餐厅推荐 prompt
    :param cuisine: 菜品类型（中餐 / 日料等）:param price_range: 价格区间元组（min,max）:return: 完整 prompt 字符串
    """
    try:
        # 核心 prompt 模板
        base_prompt = """
        你是一个 {cuisine} 美食专家，请根据以下要求推荐餐厅：1. 人均消费 {min_price}-{max_price} 元
        2. 突出特色菜品信息
        3. 用 Markdown 表格返回结果
        """

        # 参数安全校验
        if not isinstance(price_range, tuple) or len(price_range) != 2:
            raise ValueError("价格区间格式错误")

        return base_prompt.format(
            cuisine=cuisine,
            min_price=price_range[0],
            max_price=price_range[1]
        )
    except Exception as e:
        print(f"Prompt 构建失败: {str(e)}")
        return ""

使用 pytest 进行 prompt 鲁棒性测试：

准备测试数据集
极端输入：空字符串 / 特殊字符 / 超长文本
语义干扰：错别字 / 方言表达 / 中英文混杂

测试用例示例

import pytest

@pytest.mark.parametrize("input,expected", [(("中餐", (100,300)), "中餐美食专家"),  # 正常输入
    (("", (0,0)),""),                      # 空类型检测
    (("西餐", "100-300"), "")              # 错误价格格式
])
def test_prompt_building(input, expected):
    result = build_restaurant_prompt(*input)
    assert expected in result

敏感词过滤
实现多级过滤机制：
- 基础词表过滤（政治 / 色情等）
- 语义识别过滤（变体表达）
- 上下文关联检测（组合敏感）

对话状态机设计

stateDiagram
    [*] --> Idle
    Idle --> Processing: 收到用户输入
    Processing --> Validating: 检查输入合规
    Validating --> Responding: 生成回答
    Responding --> Idle: 完成响应
    Validating --> Error: 发现敏感词
    Error --> Idle: 重置对话