从零搭建ChatGPT应用：新手开发者的完整避坑指南

13次阅读

共计 2589 个字符，预计需要花费 7 分钟才能阅读完成。

API 版本混淆 ：OpenAI API 频繁迭代，不同版本间参数差异大（如/v1/chat/completions 与旧版终结点）。新手常因文档查阅不仔细导致调用失败。
Token 计算错误：GPT 模型按 token 计费，但中文 / 英文 token 化规则不同（如中文通常 1 字 =1.5token）。未正确统计容易导致预算超支或对话截断。
对话记忆丢失：默认 API 无状态，若不主动管理上下文，多轮对话会失去连贯性。自行实现时又容易遇到上下文窗口（如 GPT-3.5 的 4096token 限制）溢出的问题。

直接调用 API
优点：灵活可控，适合简单场景；学习曲线平缓
缺点：需自行处理对话状态、token 计数等底层逻辑
使用 LangChain 等框架
优点：内置记忆管理、文档检索等高级功能；社区支持丰富
缺点：抽象层带来性能损耗；定制化需深入理解框架

建议：从直接 API 入手掌握基本原理，复杂场景再引入框架

# 创建虚拟环境（建议 Python 3.8+）python -m venv chatgpt_env
source chatgpt_env/bin/activate  # Linux/Mac
chatgpt_env\Scripts\activate    # Windows

# 安装依赖
pip install openai tiktoken httpx

import openai
from typing import Optional, Dict

class ChatGPTClient:
    def __init__(self, api_key: str, model: str = "gpt-3.5-turbo"):
        self.client = openai.AsyncOpenAI(api_key=api_key)
        self.model = model

    async def ask(self, prompt: str) -> Optional[str]:
        try:
            response = await self.client.chat.completions.create(
                model=self.model,
                messages=[{"role": "user", "content": prompt}],
                timeout=10  # 防止长时间挂起
            )
            return response.choices[0].message.content
        except Exception as e:
            print(f"API 调用失败: {type(e).__name__}: {e}")
            return None

import tiktoken

class DialogueManager:
    def __init__(self, max_tokens: int = 3000):
        self.history = []
        self.encoder = tiktoken.encoding_for_model("gpt-3.5-turbo")
        self.max_tokens = max_tokens

    def add_message(self, role: str, content: str) -> bool:
        new_msg = {"role": role, "content": content}
        new_tokens = len(self.encoder.encode(content))

        if self._count_tokens() + new_tokens > self.max_tokens:
            return False  # 触发截断

        self.history.append(new_msg)
        return True

    def _count_tokens(self) -> int:
        return sum(len(self.encoder.encode(msg["content"])) for msg in self.history)

async def stream_response(prompt: str):
    stream = await client.chat.completions.create(
        model="gpt-3.5-turbo",
        messages=[{"role": "user", "content": prompt}],
        stream=True
    )

    async for chunk in stream:
        content = chunk.choices[0].delta.content
        if content:
            print(content, end="", flush=True)

性能对比：
– 常规请求：平均延迟 1.2s（完整响应返回时间）
– 流式请求：首字延迟降至 400ms，适合实时交互场景

推荐组合方案：
1. 前置过滤：调用 API 前用正则过滤明显违规词
2. 后置检查：对 API 返回内容进行二次扫描
3. 动态替换：将敏感词替换为无害占位符（如[REDACTED]）