ChatGPT Prompt Engineering实战指南：从基础到高级优化技巧

10次阅读

共计 4086 个字符，预计需要花费 11 分钟才能阅读完成。

为什么 Prompt Engineering 如此重要？
开发者常见的三大痛点
长对话上下文丢失问题
输出结果随机性控制
复杂任务的多步交互设计
系统化解决方案
结构化 prompt 模板设计
角色设定与上下文锚定技巧
temperature 和 top_p 参数的实验数据对比
Python 代码示例
基础版：实现稳定问答的 prompt 封装类
高级版：带记忆管理的多轮对话实现
生产环境注意事项
API 调用频率限制与错误处理
敏感内容过滤方案
成本优化策略
进阶思考题

Prompt engineering 是开发者与 ChatGPT 等大语言模型交互的核心技能。好的 prompt 设计能显著提升模型输出的准确性和一致性，而不当的 prompt 可能导致结果偏离预期。在实际应用中，prompt engineering 的价值主要体现在：

提升模型输出的相关性和准确性
降低 API 调用成本（减少无效交互）
实现更复杂的任务自动化
增强用户体验（减少用户需要提供的上下文）

在长对话场景中，ChatGPT 的上下文窗口有限（目前 GPT-3.5 是 4096 tokens），当对话超过这个长度时，模型会 ” 忘记 ” 早期的对话内容。这导致在多轮对话中，用户需要不断重复之前的上下文，体验很差。

ChatGPT 的默认行为具有一定随机性，这在创意场景中是有益的，但在需要确定性输出的生产环境中会造成困扰。开发者经常遇到同样 prompt 得到不同结果的情况，难以保证服务的一致性。

对于需要多步交互的复杂任务（如数据收集、决策流程等），如何设计 prompt 引导用户逐步提供信息，同时保持对话的自然流畅，是一个常见挑战。

好的 prompt 应该像编程一样结构化。一个有效的模板通常包含：

角色定义：明确模型应该扮演的角色
任务说明：清晰描述需要完成的任务
格式要求：指定输出的结构和格式
示例：提供少量示例帮助模型理解

你是一位专业的 Python 编程助手。你的任务是帮助用户解决 Python 相关问题，并提供可运行的代码示例。要求：1. 首先用一句话总结问题
2. 然后提供解决方案代码
3. 最后解释关键代码逻辑

示例：用户：如何用 Python 反转字符串？回答：反转字符串可以通过切片实现。代码：```python
def reverse_string(s):
    return s[::-1]

解释：[::-1]是 Python 的切片语法，表示从后向前以步长 - 1 取所有字符。


### 角色设定与上下文锚定技巧

为模型设定明确的角色可以有效控制输出风格。同时，在长对话中使用 "锚定" 技巧（定期重述关键信息）可以缓解上下文丢失问题。

你是一位专业的医疗信息助手。你只能提供一般性健康建议，不能替代专业医疗意见。

用户：我的膝盖最近很疼
助手：作为医疗信息助手，我建议您 …（记住：您之前提到膝盖疼痛持续 2 周）


### temperature 和 top_p 参数的实验数据对比

通过控制 temperature 和 top_p 参数可以调节输出的随机性。我们的实验数据显示：| 参数组合 | 适用场景 | 特点 |
|---------|---------|------|
| temperature=0.2, top_p=0.9 | 技术支持、代码生成 | 输出稳定，创意性低 |
| temperature=0.7, top_p=0.9 | 内容创作、头脑风暴 | 平衡稳定性和创意 |
| temperature=1.0, top_p=1.0 | 创意写作 | 高随机性，多样性好 |

## Python 代码示例

### 基础版：实现稳定问答的 prompt 封装类

```python
import openai

class StableQA:
    """稳定问答 Prompt 封装类"""

    def __init__(self, api_key, role="助手", temperature=0.3):
        """
        初始化
        :param api_key: OpenAI API 密钥
        :param role: 设定助手的角色
        :param temperature: 控制输出随机性
        """
        openai.api_key = api_key
        self.role = role
        self.temperature = temperature
        self.base_prompt = f"你是一位{role}。请清晰、准确地回答问题。如果不知道答案，请诚实说明。"

    def ask(self, question):
        """
        提问方法
        :param question: 用户问题
        :return: 助手回答
        """
        try:
            response = openai.ChatCompletion.create(
                model="gpt-3.5-turbo",
                messages=[{"role": "system", "content": self.base_prompt},
                    {"role": "user", "content": question}
                ],
                temperature=self.temperature
            )
            return response.choices[0].message.content
        except Exception as e:
            return f"请求出错: {str(e)}"

# 使用示例
qa = StableQA(api_key="your_api_key", role="Python 编程助手")
print(qa.ask("如何在 Python 中读取 JSON 文件?"))

import openai
from collections import deque

class DialogAgent:
    """带记忆管理的多轮对话实现"""

    def __init__(self, api_key, role="助手", max_memory=3, temperature=0.5):
        """
        初始化
        :param api_key: OpenAI API 密钥
        :param role: 助手角色
        :param max_memory: 记忆的对话轮数
        :param temperature: 控制输出随机性
        """
        openai.api_key = api_key
        self.role = role
        self.temperature = temperature
        self.memory = deque(maxlen=max_memory)
        self.base_prompt = f"你是一位{role}。请根据对话历史提供有帮助的回答。"

    def add_to_memory(self, role, content):
        """添加对话到记忆"""
        self.memory.append({"role": role, "content": content})

    def respond(self, user_input):
        """
        生成回复
        :param user_input: 用户输入
        :return: 助手回复
        """self.add_to_memory("user", user_input)

        messages = [{"role": "system", "content": self.base_prompt}]
        messages.extend(list(self.memory))

        try:
            response = openai.ChatCompletion.create(
                model="gpt-3.5-turbo",
                messages=messages,
                temperature=self.temperature
            )
            assistant_reply = response.choices[0].message.content
            self.add_to_memory("assistant", assistant_reply)
            return assistant_reply
        except Exception as e:
            return f"请求出错: {str(e)}"

# 使用示例
agent = DialogAgent(api_key="your_api_key", role="旅行规划师", max_memory=4)
print(agent.respond("我想去日本旅行"))
print(agent.respond("预算大约 2 万元"))
print(agent.respond("对温泉感兴趣"))

OpenAI API 有调用频率限制（免费用户 3 次 / 分钟，付费用户更高）。在生产环境中需要：

实现请求队列和限流机制
添加重试逻辑（针对 5xx 错误）
监控 API 使用情况

import time
import backoff

@backoff.on_exception(backoff.expo, openai.error.RateLimitError)
def safe_completion(**kwargs):
    """带重试机制的 API 调用"""
    try:
        return openai.ChatCompletion.create(**kwargs)
    except openai.error.RateLimitError:
        print("达到速率限制，等待后重试...")
        time.sleep(60)
        raise

对于用户生成内容 (UGC) 场景，应该：