实战指南：如何高效创建API调用ChatGPT的完整解决方案

16次阅读

没有评论

共计 1714 个字符，预计需要花费 5 分钟才能阅读完成。

在集成 ChatGPT API 时，开发者常遇到几类典型问题：

认证流程繁琐：OpenAI 的 API 密钥管理、请求签名等步骤容易因配置错误导致 401 未授权错误。
响应时间波动：尤其在免费层或高并发场景下，API 响应可能因服务器负载出现显著延迟。
错误处理复杂：包括速率限制（429 错误）、内容过滤（400 错误）等需要针对性处理的异常场景。
上下文管理困难：多轮对话需维护会话状态，自行拼接 prompt 易出错。

REST API：
优点：实现简单，HTTP 协议兼容性广，适合一次性问答场景
缺点：长对话需反复建立连接，Header 重复传输增加开销
WebSocket：
优点：长连接减少握手开销，适合实时流式响应（如逐字输出）
缺点：需额外维护连接状态，服务器资源占用更高

推荐方案：常规业务场景优先使用 REST API，仅在需要流式响应时选择 WebSocket。

所有请求需在 Header 中包含：

Authorization: Bearer YOUR_API_KEY
Content-Type: application/json

关键参数说明：

model: 指定模型版本（如 gpt-3.5-turbo）
messages: 对话历史数组，每个对象包含 role(user/assistant) 和content
temperature: 控制生成随机性（0-2）

重点关注字段：

choices[0].message.content: AI 生成的文本
usage: 本次调用的 token 消耗统计

import openai
from tenacity import retry, stop_after_attempt, wait_exponential

# 初始化客户端（推荐环境变量管理 API_KEY）openai.api_key = os.getenv('OPENAI_API_KEY')

@retry(stop=stop_after_attempt(3), wait=wait_exponential(multiplier=1, min=4, max=10))
def chat_completion(messages, model="gpt-3.5-turbo", temperature=0.7):
    try:
        response = openai.ChatCompletion.create(
            model=model,
            messages=messages,
            temperature=temperature
        )
        return response.choices[0].message.content
    except openai.error.RateLimitError:
        # 此处可加入降级策略
        raise
    except openai.error.APIError as e:
        # 记录错误日志
        print(f"API Error: {e}")
        raise

# 使用示例
messages = [{"role": "system", "content": "你是一个有帮助的助手"},
    {"role": "user", "content": "推荐三本提高编程能力的书"}
]
print(chat_completion(messages))