国内无限制使用ChatGPT的工程实践：自建代理与API转发方案

12次阅读

没有评论

共计 2785 个字符，预计需要花费 7 分钟才能阅读完成。

国内开发者直接调用 ChatGPT API 面临三个核心问题：

IP 封锁 ：OpenAI 对大部分国内云厂商 IP 段实施封锁，直接请求返回 403 错误
网络延迟 ：国际带宽波动导致 API 响应时间超过 10 秒，影响用户体验
合规风险 ：未经备案的跨境数据传输可能违反网络安全法

典型业务影响包括：

智能客服系统无法稳定获取 AI 回复
自动化写作工具频繁出现服务中断
需要额外开发降级方案增加维护成本

优点：
无需维护基础设施
按调用次数计费成本低
缺点：
冷启动时延高达 500ms~2s
需要处理云厂商自身的网络审查

优点：
完全掌控网络链路
可定制安全策略
缺点：
需承担服务器固定成本
存在 IP 被封锁风险

优点：
即开即用
提供 IP 池轮换
缺点：
有数据泄露风险
难以审计日志

最终选择 ：采用香港 / 日本区域的 VPS 搭建自主可控的反向代理，平衡延迟（平均 200ms）与成本（约 $5/ 月）。

server {
    listen 443 ssl;
    server_name api.yourdomain.com;

    # SNI 伪装为常见云服务域名
    ssl_server_name_hiding on;
    ssl_server_name cloudflare.com;

    ssl_protocols TLSv1.3;
    ssl_certificate /etc/letsencrypt/live/api.yourdomain.com/fullchain.pem;
    ssl_certificate_key /etc/letsencrypt/live/api.yourdomain.com/privkey.pem;

    location /v1/chat/completions {
        proxy_pass https://api.openai.com;
        proxy_ssl_server_name on;
        proxy_set_header Host api.openai.com;

        # 关键优化参数
        proxy_connect_timeout 60s;
        proxy_read_timeout 300s;
        keepalive_timeout 75s;  # 高于 TCP 默认 60s 防连接重建
    }
}

采用 HMAC-SHA256 实现请求合法性校验：

import hmac
import hashlib

def generate_signature(secret_key, payload):
    return hmac.new(secret_key.encode(),
        payload.encode(),
        hashlib.sha256
    ).hexdigest()

# 客户端调用示例
signature = generate_signature(
    "YOUR_SECRET_KEY", 
    json.dumps({"model": "gpt-4"})
)
headers = {"X-Signature": signature}

强制 TLS1.3 协议
启用 OCSP Stapling 减少握手延迟
双向证书认证（mTLS）配置示例：

ssl_client_certificate /path/to/ca.crt;
ssl_verify_client on;

import aiohttp
import asyncio
from tenacity import retry, stop_after_attempt, wait_exponential

@retry(stop=stop_after_attempt(3),
    wait=wait_exponential(multiplier=1, min=2, max=10)
)
async def chat_completion(prompt):
    async with aiohttp.ClientSession() as session:
        try:
            async with session.post(
                "https://api.yourdomain.com/v1/chat/completions",
                json={"model": "gpt-3.5-turbo", "messages": [{"role": "user", "content": prompt}]},
                headers={"Authorization": "Bearer YOUR_KEY"},
                timeout=aiohttp.ClientTimeout(total=30)
            ) as resp:
                return await resp.json()
        except aiohttp.ClientError as e:
            print(f"Request failed: {str(e)}")
            raise

version: '3'
services:
  nginx-proxy:
    image: nginx:1.25-alpine
    ports:
      - "443:443"
    volumes:
      - ./nginx.conf:/etc/nginx/nginx.conf
      - ./certs:/etc/letsencrypt
    deploy:
      resources:
        limits:
          memory: 512M
    logging:
      driver: "json-file"
      options:
        max-size: "10m"
        max-file: "3"

基于 Redis 的令牌桶算法实现：

from redis import Redis
from datetime import timedelta

r = Redis()

def check_quota(user_id):
    key = f"quota:{user_id}"
    current = r.incr(key)
    if current == 1:
        r.expire(key, timedelta(hours=1))
    return current <= 100  # 每小时 100 次

维护多个 VPS 实例
通过 DNS 负载均衡实现自动切换
失败请求触发 Health Check 机制

控制并发请求数（建议 <5/ 秒）
监控 X -RateLimit-Reset 响应头
实现指数退避重试

Nginx Lua 脚本示例：

location /v1/chat/completions {
    access_by_lua_block {local body = ngx.req.get_body_data()
        if string.find(body, "信用卡") then
            ngx.exit(403)
        end
    }
}

未来可结合本地化部署的 LLM（如 ChatGLM3）实现混合调度：