吴恩达ChatGPT提示词工程学习笔记：从原理到高效实践

15次阅读

共计 2212 个字符，预计需要花费 6 分钟才能阅读完成。

在实际使用大语言模型（LLM）时，开发者经常会遇到以下典型问题：

发散输出 ：当提示词过于模糊时（如 ” 写一篇关于人工智能的文章 ”），模型可能产生泛泛而谈或偏离主题的内容
意图偏差 ：复杂指令容易被误解（如 ” 分析数据并给出建议 ” 可能被拆解为独立任务）
格式失控 ：需要结构化输出时（如 JSON），模型可能返回自由文本或残缺格式
上下文丢失 ：在多轮对话中，模型可能 ” 遗忘 ” 早期设定的重要约束条件

这些问题的本质，在于没有建立有效的「人机通信协议」。就像与人类协作需要明确需求文档一样，与 LLM 交互也需要精心设计提示架构。

最基础的直接提问方式，适用于简单明确的单步任务：

response = ask_model("翻译这句话为法语:'Hello world'")

优点：实现简单，计算成本低
缺点：对复杂任务效果不稳定

通过提供输入输出示例来演示任务要求：

examples = """
输入: 今天天气真好 
输出: {"sentiment": "positive"}

输入: 这个产品太难用了
输出: {"sentiment": "negative"}
"""response = ask_model(f"{examples}\n 输入: 服务态度一般 \n 输出:")

优点：显著提升格式一致性
缺点：消耗更多 token，示例选择影响大

强制模型展示推理过程，适合数学 / 逻辑问题：

prompt = """
问题: 如果小明有 5 个苹果，吃掉 2 个后妈妈又买了 3 个，现在有几个？请一步步思考：1. 初始数量: 5
2. 吃掉后剩余: 5 - 2 = 3
3. 新增数量: 3
4. 最终总数: 3 + 3 = 6
"""

优点：提升复杂问题正确率
缺点：响应内容冗长

通过身份限定控制输出风格：

system_msg = """
你是一位资深 Python 工程师，回答需满足：1. 优先给出可直接运行的代码
2. 解释不超过 3 句话
3. 使用专业术语但避免冗长
"""

对复杂指令进行显式分步：

task = """
请按步骤完成：1. 分析该段文本的情感倾向
2. 提取出现频率最高的名词
3. 用 markdown 表格呈现结果

文本: {user_input}
"""

使用特殊标记限定输出结构：

prompt = """
生成 3 个产品名称，要求：1. 包含 "智能" 前缀
2. 反映环保理念
3. 返回 JSON 格式

模板:
```json
{"names": ["string", "string", "string"]
}

“””


## 生产级代码示例

带异常处理的 OpenAI API 调用实现：```python
import openai
from typing import Optional, Dict
import time
import json

def safe_completion(
    prompt: str,
    max_retries: int = 3,
    timeout: int = 30,
    **kwargs
) -> Optional[Dict]:
    """带重试机制的模型调用"""
    retry_delay = 5
    for attempt in range(max_retries):
        try:
            response = openai.ChatCompletion.create(
                model="gpt-3.5-turbo",
                messages=[{"role": "user", "content": prompt}],
                temperature=0.7,
                max_tokens=1024,
                request_timeout=timeout,
                **kwargs
            )
            return json.loads(response.choices[0].message.content)
        except Exception as e:
            print(f"Attempt {attempt + 1} failed: {str(e)}")
            if attempt < max_retries - 1:
                time.sleep(retry_delay)
    return None