Node.js 开发者的 OpenAI 与 ChatGPT 插件实战指南：从零搭建到生产环境部署

2次阅读

共计 6577 个字符，预计需要花费 17 分钟才能阅读完成。

在当今快速发展的技术环境中，智能对话和内容生成功能已成为许多应用的核心需求。无论是构建智能客服系统、自动化内容生成工具，还是开发个性化的用户体验，OpenAI 和 ChatGPT 的能力都能为开发者提供强大的支持。

然而，直接调用 OpenAI 的 API 存在一些明显的缺陷：

维护成本高 ：原生 API 调用需要开发者自行处理各种细节，如认证、请求构造和响应解析。
缺乏复用性 ：每次调用都需要重复编写相似的代码，缺乏模块化和复用性。
扩展性差 ：随着业务需求的变化，原生 API 调用难以灵活扩展和定制。

在开始实现之前，我们先对比几种常见的 OpenAI/ChatGPT 集成方案：

方案类型	学习曲线	扩展性	TypeScript 支持	社区支持
官方 SDK	低	中	优秀	优秀
社区插件	中	高	良好	良好
自研方案	高	极高	优秀	无

首先，安装 OpenAI 的官方 Node.js SDK：

npm install openai

接下来，我们演示一个完整的聊天补全流程：

const {Configuration, OpenAIApi} = require('openai');

const configuration = new Configuration({apiKey: process.env.OPENAI_API_KEY,});

const openai = new OpenAIApi(configuration);

async function completeChat(messages) {
  try {
    const response = await openai.createChatCompletion({
      model: 'gpt-3.5-turbo',
      messages: messages,
      temperature: 0.7,
    });
    return response.data.choices[0].message.content;
  } catch (error) {console.error('Error completing chat:', error);
    throw error;
  }
}

// 示例调用
const messages = [{ role: 'system', content: 'You are a helpful assistant.'},
  {role: 'user', content: 'What is the capital of France?'},
];

completeChat(messages)
  .then(response => console.log(response))
  .catch(error => console.error(error));

为了提升代码的复用性和可维护性，我们可以封装一个 ChatGPT 插件类：

class ChatGPTPlugin {
  /**
   * @param {string} apiKey - OpenAI API key
   * @param {Object} options - Configuration options
   */
  constructor(apiKey, options = {}) {this.configuration = new Configuration({ apiKey});
    this.openai = new OpenAIApi(this.configuration);
    this.defaultOptions = {
      model: 'gpt-3.5-turbo',
      temperature: 0.7,
      maxTokens: 1000,
      ...options,
    };
    this.conversationHistory = [];}

  /**
   * Add a message to the conversation history
   * @param {string} role - 'system', 'user', or 'assistant'
   * @param {string} content - Message content
   */
  addMessage(role, content) {this.conversationHistory.push({ role, content});
  }

  /**
   * Get completion from ChatGPT
   * @param {string} userMessage - User's input message
   * @param {Object} options - Override default options
   * @returns {Promise<string>} - Assistant's response
   */
  async getCompletion(userMessage, options = {}) {
    try {this.addMessage('user', userMessage);

      const response = await this.openai.createChatCompletion({
        ...this.defaultOptions,
        ...options,
        messages: this.conversationHistory,
      });

      const assistantMessage = response.data.choices[0].message.content;
      this.addMessage('assistant', assistantMessage);

      return assistantMessage;
    } catch (error) {console.error('ChatGPT completion error:', error);
      throw error;
    }
  }

  /**
   * Handle streaming response (for real-time interactions)
   * @param {string} userMessage - User's input message
   * @param {Function} onData - Callback for each data chunk
   * @param {Object} options - Override default options
   */
  async getStreamingCompletion(userMessage, onData, options = {}) {
    try {this.addMessage('user', userMessage);

      const response = await this.openai.createChatCompletion(
        {
          ...this.defaultOptions,
          ...options,
          messages: this.conversationHistory,
          stream: true,
        },
        {responseType: 'stream'}
      );

      response.data.on('data', data => {
        const lines = data
          .toString()
          .split('\n')
          .filter(line => line.trim() !== '');

        for (const line of lines) {const message = line.replace(/^data: /, '');
          if (message === '[DONE]') {return;}

          try {const parsed = JSON.parse(message);
            const content = parsed.choices[0].delta.content;
            if (content) {onData(content);
            }
          } catch (error) {console.error('Error parsing streaming message:', error);
          }
        }
      });

      response.data.on('end', () => {
        // Update conversation history with full response
        // This would require collecting all chunks
      });
    } catch (error) {console.error('Streaming completion error:', error);
      throw error;
    }
  }
}

// 示例用法
const chatGPT = new ChatGPTPlugin(process.env.OPENAI_API_KEY);

chatGPT.addMessage('system', 'You are a helpful assistant.');
chatGPT
  .getCompletion('What is the capital of France?')
  .then(response => console.log(response));

OpenAI API 有速率限制，我们需要实现指数退避算法来处理限速错误：

async function withRetry(fn, maxRetries = 3, initialDelay = 1000) {
  let retries = 0;
  let delay = initialDelay;

  while (retries < maxRetries) {
    try {return await fn();
    } catch (error) {if (error.response && error.response.status === 429) {
        retries++;
        if (retries >= maxRetries) {throw error;}

        const waitTime = delay * Math.pow(2, retries - 1);
        console.log(`Rate limited. Retrying in ${waitTime}ms...`);
        await new Promise(resolve => setTimeout(resolve, waitTime));
      } else {throw error;}
    }
  }
}

// 使用示例
await withRetry(() => chatGPT.getCompletion('Hello'));

在处理用户输入时，我们应该过滤敏感信息：

function filterSensitiveData(text) {
  const patterns = [
    // Credit card numbers
    /\b(?:\d[ -]*?){13,16}\b/g,
    // Social Security Numbers (US)
    /\b\d{3}[-]?\d{2}[-]?\d{4}\b/g,
    // Email addresses
    /\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b/g,
    // Phone numbers
    /\b(?:\+?\d{1,3}[-]?)?(?:\(\d{3}\)|\d{3})[-]?\d{3}[-]?\d{4}\b/g,
  ];

  let filteredText = text;
  patterns.forEach(pattern => {filteredText = filteredText.replace(pattern, '[REDACTED]');
  });

  return filteredText;
}

记录 tokens 消耗和其他重要指标：

class MetricsTracker {constructor() {
    this.metrics = {
      totalRequests: 0,
      totalTokens: 0,
      successfulRequests: 0,
      failedRequests: 0,
      rateLimitedRequests: 0,
    };
  }

  trackRequest() {this.metrics.totalRequests++;}

  trackSuccess(tokensUsed) {
    this.metrics.successfulRequests++;
    this.metrics.totalTokens += tokensUsed;
  }

  trackFailure(error) {
    this.metrics.failedRequests++;
    if (error.response && error.response.status === 429) {this.metrics.rateLimitedRequests++;}
  }

  getMetrics() {
    return {
      ...this.metrics,
      avgTokensPerRequest: this.metrics.totalTokens / Math.max(1, this.metrics.successfulRequests),
      successRate: this.metrics.successfulRequests / Math.max(1, this.metrics.totalRequests),
    };
  }
}

// 集成到 ChatGPTPlugin
class ChatGPTPlugin {constructor(apiKey, options = {}) {
    // ... existing code ...
    this.metrics = new MetricsTracker();}

  async getCompletion(userMessage, options = {}) {this.metrics.trackRequest();
    try {
      const response = await this.openai.createChatCompletion({
        ...this.defaultOptions,
        ...options,
        messages: this.conversationHistory,
      });

      const tokensUsed = response.data.usage.total_tokens;
      this.metrics.trackSuccess(tokensUsed);

      // ... rest of the method ...
    } catch (error) {this.metrics.trackFailure(error);
      throw error;
    }
  }
}

OpenAI 服务可能会有冷启动延迟。可以通过以下方式缓解：

在应用启动时发送一个简单的预热请求
保持长连接（对于高频应用）
实现连接池

当对话历史超过模型的最大 tokens 限制时，可以采用以下策略：

优先保留最近的对话
必要时总结或压缩早期对话内容
实现滑动窗口只保留最近的 N 条消息

function sanitizePrompt(prompt) {
  // Remove any attempts to override system instructions
  const forbiddenPatterns = [
    /ignore previous instructions/g,
    /from now on/g,
    /as a (?:different|new) (?:persona|character)/g,
  ];

  let sanitized = prompt;
  forbiddenPatterns.forEach(pattern => {sanitized = sanitized.replace(pattern, '');
  });

  return sanitized.trim();}

graph TD
    A[Client Application] -->|HTTP Request| B[API Gateway]
    B --> C[Authentication]
    C --> D[Request Validation]
    D --> E[ChatGPT Plugin]
    E --> F[OpenAI API]
    E --> G[Rate Limiting]
    E --> H[Monitoring]
    F --> E
    E --> D
    D --> B
    B --> A