Java集成ChatGPT实战指南：从API调用到生产环境部署

2次阅读

没有评论

共计 2329 个字符，预计需要花费 6 分钟才能阅读完成。

ChatGPT 在业务场景中能快速实现智能客服自动应答、辅助内容创作生成、以及提供个性化推荐服务，大幅提升用户体验和运营效率。其强大的自然语言处理能力，让开发者可以轻松构建智能对话系统，而无需从零训练模型。

在 Java 中调用 OpenAI API 主要有三种方式：

RestTemplate：Spring 传统同步客户端，简单易用但性能较差，不支持响应式编程
WebClient：Spring 5+ 的响应式 HTTP 客户端，支持非阻塞 IO 和流式处理，适合高并发场景
第三方 SDK：如 OpenAI-Java 等封装库，API 更友好但可能滞后于官方更新

对于新项目推荐使用 WebClient，特别是需要处理流式响应时。现有 Spring MVC 项目可以先用 RestTemplate 快速验证。

首先在 application.yml 中配置 API 密钥（不要硬编码在代码中）：

openai:
  api-key: ${OPENAI_API_KEY}  # 从环境变量读取
  endpoint: https://api.openai.com/v1

使用 Spring Security 的加密机制存储密钥，或集成 Vault 等密钥管理服务
创建配置类封装 API 访问基础参数：

@Configuration
@RequiredArgsConstructor
public class OpenAIConfig {
    private final Environment env;

    @Bean
    public OpenAIClient openAIClient() {return OpenAIClient.builder()
            .apiKey(env.getProperty("openai.api-key"))
            .build();}
}

处理 RateLimit 的关键是实现指数退避重试。以下是 WebClient 实现示例：

public Mono<ChatCompletion> createCompletionWithRetry(ChatRequest request) {return webClient.post()
        .uri("/chat/completions")
        .bodyValue(request)
        .retrieve()
        .bodyToMono(ChatCompletion.class)
        .retryWhen(Retry.backoff(3, Duration.ofSeconds(1))
            .filter(ex -> ((OpenAIException)ex).getStatusCode() == 429)
            .onRetryExhaustedThrow((retryBackoffSpec, retrySignal) -> {log.error("API 请求超过重试次数");
                return new ServiceUnavailableException();}));
}

使用 WebFlux 处理服务器推送事件(SSE)：

@GetMapping(path = "/stream", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public Flux<String> streamChat(@RequestParam String message) {return webClient.post()
        .uri("/chat/completions")
        .bodyValue(createStreamRequest(message))
        .accept(MediaType.TEXT_EVENT_STREAM)
        .retrieve()
        .bodyToFlux(String.class)
        .timeout(Duration.ofSeconds(30))
        .onErrorResume(e -> {log.error("流式请求异常", e);
            return Flux.just("【服务暂不可用】");
        });
}

中文大约 1token= 2 个字符，英文 1token≈4 个字符
max_tokens必须小于模型上限（如 gpt-3.5-turbo 是 4096）
推荐使用官方 tiktoken 库预先计算：

int tokens = TokenCalculator.estimateTokens(prompt);
if(tokens > 3500) {throw new PromptTooLongException();
}

采用滑动窗口保留最近 N 条对话
对历史消息进行摘要压缩
考虑外存缓存长期对话上下文

服务端校验 Moderation API：

public boolean containsUnsafeContent(String text) {return openAIClient.moderations(text)
        .getResults().stream()
        .anyMatch(ModerationResult::isFlagged);
}