ESP32接入ChatGPT实战：低成本构建边缘AI对话系统

1次阅读

共计 2340 个字符，预计需要花费 6 分钟才能阅读完成。

嵌入式设备集成 AI 服务时常常面临三大挑战：

内存限制：ESP32 的 520KB SRAM 在解析大型 JSON 响应时极易耗尽，导致系统崩溃
网络不稳定：边缘设备的 Wi-Fi 信号波动会中断长对话，需要智能重连机制
API 成本控制：ChatGPT 按 token 计费，不当的请求设计可能导致意外费用飙升

特性	ESP32-WROOM	STM32H743	Raspberry Pi Pico
无线连接	内置 Wi-Fi/BT	需外接模块	需外接模块
内存容量	520KB SRAM	1MB SRAM	264KB SRAM
NLP 处理能力	依赖云端	可跑微型本地模型	仅适合简单文本处理
开发便利性	Arduino/IDF 支持完善	需配置 LLVM 工具链	MicroPython 生态好

#include <WiFiClientSecure.h>

const char* root_ca = \
"-----BEGIN CERTIFICATE-----\n" \
"MIIDdzCCAl+gAwIBAgIEAgAAuTANBgkqhkiG9w0BAQUFADBaMQswCQYDVQQGEwJJ\n" \
/* 省略完整 CA 证书 */
"-----END CERTIFICATE-----";

WiFiClientSecure client;

void setup() {client.setCACert(root_ca); // 必须设置否则连接失败
  client.setTimeout(10000);  // 10 秒超时
}

使用 ArduinoJson 的 DynamicJsonDocument 时，初始大小建议设为 512 字节
通过 serializedLength() 预计算实际需要空间
采用两阶段解析：先获取元数据，再按需分配

DynamicJsonDocument doc(512); // 初始小内存块
deserializeJson(doc, payload);
size_t neededSize = doc.memoryUsage();
if(neededSize > 512) {doc.garbageCollect();
  doc = DynamicJsonDocument(neededSize); // 精确重分配
  deserializeJson(doc, payload);
}

/**
 * @brief 发送对话请求到 ChatGPT
 * @param question 用户输入文本
 * @param max_tokens 响应最大 token 数(建议 150-200)
 * @return String API 返回的 JSON 响应
 */
String askGPT(String question, int max_tokens=200) {
  String response;

  if(WiFi.status() != WL_CONNECTED) {WiFi.reconnect(); // 自动重连
    delay(2000);
  }

  HTTPClient https;
  https.begin(client, "https://api.openai.com/v1/chat/completions");
  https.addHeader("Content-Type", "application/json");
  https.addHeader("Authorization", "Bearer YOUR_API_KEY");

  String payload = "{\"model\":\"gpt-3.5-turbo\",\"messages\":[{\"role\":\"user\",\"content\":\"" 
                  + question + "\"}],\"max_tokens\":"+ max_tokens +"}";

  int httpCode = https.POST(payload);

  if(httpCode == HTTP_CODE_OK) {response = https.getString();
  } else {Serial.printf("[HTTP] Error: %s\n", https.errorToString(httpCode).c_str());
  }

  https.end();
  return response;
}

工作模式	电流消耗(mA)	恢复时间(ms)
持续连接	85	–
Light Sleep	15	120
Modem Sleep	25	80
每次请求后断开	<5	1500

预建立连接池减少 SSL 握手时间
启用 HTTP Keep-Alive
使用 streamPayload 逐步处理响应

实现令牌桶算法控制请求频率

错误码 429 时自动退避重试

void handleRateLimit() {
  static unsigned long last_call = 0;
  const int MIN_INTERVAL = 2000; // 2 秒间隔

  while(millis() - last_call < MIN_INTERVAL) {delay(100);
  }
  last_call = millis();}