ChatGPT开发实战：从API调用到生产环境部署的全流程指南

17次阅读

共计 1711 个字符，预计需要花费 5 分钟才能阅读完成。

ChatGPT API（Application Programming Interface）为开发者提供了将先进语言模型集成到各类应用的便捷通道。在自动化客服场景中，它能实现 7 ×24 小时的多语言智能应答；对开发者而言，代码生成 (Code Generation) 功能可自动补全重复性代码片段；内容创作领域则能快速生成营销文案或产品描述。这些能力大幅降低了 AI 技术的使用门槛。

中文混合文本的 token 计数常与实际不符（如 1 个汉字可能消耗 2 个 token）
未预计算对话历史导致请求超长被截断

上下文 (Context) 未正确维护造成 ” 记忆 ” 断裂
用户意图识别因历史消息缺失而失效

分块接收的响应数据 (Streaming Response) 拼接时出现乱码
前端未正确处理部分响应导致显示异常

import openai
import asyncio
from tenacity import retry, stop_after_attempt

@retry(stop=stop_after_attempt(3))
async def chat_completion(prompt):
    try:
        response = await openai.ChatCompletion.acreate(
            model="gpt-3.5-turbo",
            messages=[{"role": "user", "content": prompt}],
            stream=True,
            max_tokens=500
        )
        async for chunk in response:
            yield chunk['choices'][0]['delta'].get('content', '')
    except openai.error.RateLimitError:
        await asyncio.sleep(2)
        raise

const {OpenAI} = require('openai');
const openai = new OpenAI(process.env.OPENAI_KEY);

const streamResponse = async (prompt) => {
  const stream = await openai.chat.completions.create({
    model: "gpt-3.5-turbo",
    messages: [{role: "user", content: prompt}],
    stream: true,
  });

  for await (const chunk of stream) {process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
};

请求类型	平均延迟(1KB 响应)
同步调用	1200ms
流式响应	400ms 首包

max_tokens=100 时：$0.002/ 请求
max_tokens=500 时：$0.01/ 请求

def sanitize_input(text):
    patterns = [r'\d{4}-\d{4}-\d{4}-\d{4}', r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b']
    for pattern in patterns:
        text = re.sub(pattern, '[REDACTED]', text)
    return text