如何用ChatGPT快速入门AI开发：从零搭建你的第一个智能对话应用

12次阅读

共计 3033 个字符，预计需要花费 8 分钟才能阅读完成。

ChatGPT API 是基于 GPT 模型的对话接口，核心机制包括：

Token 机制：
输入文本会被拆分为 token（如 ”Hello” 可能被拆为 1 个 token，而长单词可能拆分为多个）
计费和处理速度都与 token 数量直接相关
中文通常 1 个汉字 =1~2 个 token
上下文管理：
每次 API 调用需携带完整对话历史
系统不会自动记忆前序对话
典型实现方式是将所有消息放入一个列表顺序传递

对话连贯性丢失：忘记携带历史消息导致 AI” 失忆 ”
响应延迟过高：未使用 streaming 模式导致长时间等待
意外 API 消耗：未设置 max_tokens 导致生成内容过长

创建虚拟环境：

python -m venv chatgpt_env
source chatgpt_env/bin/activate  # Linux/Mac
chatgpt_env\Scripts\activate    # Windows

安装必要包：
```
pip install openai python-dotenv
```
在项目根目录创建 .env 文件存储 API 密钥：
```
OPENAI_API_KEY=sk-your-key-here
```

import openai
from dotenv import load_dotenv
import os
import time

load_dotenv()
openai.api_key = os.getenv("OPENAI_API_KEY")

def chat_completion_with_retry(messages, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = openai.ChatCompletion.create(
                model="gpt-3.5-turbo",
                messages=messages,
                temperature=0.7,
                max_tokens=150
            )
            return response.choices[0].message.content
        except Exception as e:
            if attempt == max_retries - 1:
                raise
            wait_time = 2 ** attempt  # 指数退避
            time.sleep(wait_time)
            print(f"Retry {attempt + 1} after error: {str(e)}")

# 示例对话
conversation = [{"role": "system", "content": "你是一个有帮助的助手"},
    {"role": "user", "content": "推荐北京的美食"}
]

response = chat_completion_with_retry(conversation)
print(response)

class ConversationManager:
    def __init__(self, system_prompt=None):
        self.history = []
        if system_prompt:
            self.history.append({"role": "system", "content": system_prompt})

    def add_user_message(self, content):
        self.history.append({"role": "user", "content": content})

    def get_response(self):
        response = chat_completion_with_retry(self.history)
        self.history.append({"role": "assistant", "content": response})
        return response

    def show_history(self):
        for msg in self.history:
            print(f"{msg['role']}: {msg['content']}")

# 使用示例
manager = ConversationManager("你是一个美食向导")
manager.add_user_message("北京有什么特色小吃？")
print(manager.get_response())
manager.add_user_message("这些小吃一般在哪些区域比较集中？")
print(manager.get_response())
manager.show_history()

# 非 streaming 模式（传统方式）start = time.time()
response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[{"role": "user", "content": "用 300 字介绍 AI"}],
    max_tokens=300
)
print(f"传统模式延迟: {time.time() - start:.2f}s")

# Streaming 模式
start = time.time()
response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[{"role": "user", "content": "用 300 字介绍 AI"}],
    max_tokens=300,
    stream=True
)

# 模拟逐字显示
for chunk in response:
    if chunk.choices[0].delta.get("content"):
        pass  # 实际应用中可以在这里实时显示内容
print(f"\nStreaming 模式延迟: {time.time() - start:.2f}s")

测试结果示例：
– 传统模式：2.3s 收到完整响应
– Streaming 模式：0.8s 开始接收内容

设置过小：回答被截断（如设为 50 时，复杂问题可能只返回半句话）
设置过大：浪费 token 且可能收到冗余内容
建议：根据问题复杂度动态调整（简单问答 100-150，长文生成 300-500）

from openai.moderation import create

def check_safety(text):
    response = create(input=text)
    if response.results[0].flagged:
        return "抱歉，我无法处理这个请求"
    return text

safe_response = check_safety(manager.get_response())