从零构建高效提示词工程：Skill开发实战指南

3次阅读

共计 2674 个字符，预计需要花费 7 分钟才能阅读完成。

AI 技能开发中，提示词设计常面临三大挑战：

效果不稳定 ：细微的表述差异可能导致输出质量波动
维护成本高 ：业务逻辑变更时需要全量修改提示词模板
难以规模化 ：复杂技能需要管理大量相互依赖的提示词片段

# 典型问题示例
def build_prompt(user_input):
    return f""" 请回答以下问题：{user_input}。\n 要求：1. 答案不超过 50 字
2. 包含具体案例 """

优点：实现简单，适合快速验证
缺点：
缺乏上下文隔离
难以复用组件
存在 SQL 注入式风险

from typing import List, Dict

class PromptComponent:
    def __init__(self, template: str, variables: Dict[str, str]):
        self.template = template
        self.variables = variables
        self._validate()

    def _validate(self):
        # 安全校验逻辑
        for var in self.variables.values():
            if "<script>" in var:
                raise ValueError("XSS injection detected")

    def render(self) -> str:
        return self.template.format(**self.variables)

优点：
组件化开发
自动变量校验
支持单元测试

输入处理层 ：用户指令解析、意图识别
逻辑控制层 ：流程判断、条件分支
输出生成层 ：结果格式化、风格控制

class ContextManager:
    def __init__(self):
        self._context_stack = []

    def push(self, context: str):
        self._context_stack.append(context)

    def pop(self) -> str:
        return self._context_stack.pop()

    def current_context(self) -> str:
        return "\n".join(self._context_stack)

# 使用示例
ctx = ContextManager()
ctx.push("当前对话主题：天气预报")
ctx.push("用户偏好：简洁回答")
print(ctx.current_context())

from pydantic import BaseModel, validator

class PromptVariables(BaseModel):
    query: str
    style: str = "professional"

    @validator('query')
    def check_query_length(cls, v):
        if len(v) > 200:
            raise ValueError('Query too long')
        return v

# test_prompts.py
import pytest

@pytest.mark.parametrize("input,expected", [({"query":"Python 优点", "style":"简洁"}, 
     "Python 优点包括语法简洁"),
    ({"query":""},"empty query")
])
def test_prompt_generation(input, expected):
    prompt = build_prompt(input)
    assert expected in prompt

中文平均 1 字≈1.5 token
建议单个提示词不超过 2048 tokens

优化工具：

import tiktoken
enc = tiktoken.get_encoding("cl100k_base")
print(len(enc.encode("测试 token 长度")))  # 输出 6

# 批量请求示例
import asyncio

async def batch_query(queries: List[str]):
    semaphore = asyncio.Semaphore(10)  # 并发控制
    async with semaphore:
        tasks = [call_api(q) for q in queries]
        return await asyncio.gather(*tasks)

from diskcache import Cache

cache = Cache("./prompt_cache")

@cache.memoize()
def get_cached_response(prompt: str):
    return model.generate(prompt)

with open("sensitive_words.txt") as f:
    banned_words = set(line.strip() for line in f)

def sanitize(text: str) -> str:
    for word in banned_words:
        text = text.replace(word, "***")
    return text

采用语义化版本： 技能名_v1.2.3

存储方案：

prompts/
├── v1/
│   ├── main_prompt.txt
│   └── config.yaml
└── v2/
    ├── main_prompt.md
    └── tests/

关键指标：
平均响应 token 数
错误率
缓存命中率

Prometheus 示例：

from prometheus_client import Counter

PROMPT_ERRORS = Counter('prompt_errors', 'Error count by type', ['error_type'])
PROMPT_ERRORS.labels('timeout').inc()

跨模型提示词中间层设计需考虑：

参数映射表（如：temperature → top_p）
输入输出标准化协议
模型能力探测机制
自动降级策略

实际案例可参考：

class Adapter:
    def __init__(self, model_type):
        self.mappings = {"openai": {"max_tokens": "length"},
            "claude": {"temperature": "diversity"}
        }

正文完