Claude在线使用实战：从API集成到生产环境最佳实践

1次阅读

没有评论

共计 5556 个字符，预计需要花费 14 分钟才能阅读完成。

在集成 Claude API 时，开发者常遇到以下几个典型挑战：

长对话上下文管理：Claude 对上下文长度有限制，如何有效管理多轮对话的上下文，避免超出 token 限制是个难题。
流式响应解析 ：处理 SSE(Server-Sent Events) 格式的流式响应需要特殊处理，很多开发者不熟悉这种协议。
token 限制规避：当对话内容较长时，如何智能地截断或总结历史消息以避免超出 token 限制。
认证复杂性：JWT 认证流程相对复杂，特别是处理 token 刷新机制时容易出错。
生产环境稳定性：在真实生产环境中，需要处理网络波动、API 限流等各种异常情况。

更灵活的控制权，可以根据需求定制各种功能
避免 SDK 可能带来的额外依赖和版本兼容问题
更适合需要深度定制化的场景

更简单的集成方式，减少样板代码
通常内置了最佳实践和错误处理机制
文档和社区支持更完善

对于大多数生产环境应用，特别是需要快速上线的项目，建议使用官方 SDK。而对于需要高度定制化或特殊功能集成的场景，可以考虑直接调用 API。

import requests
import jwt
import time
from datetime import datetime, timedelta

class ClaudeAPIClient:
    def __init__(self, api_key, api_secret):
        self.api_key = api_key
        self.api_secret = api_secret
        self.base_url = "https://api.claude.ai/v1"
        self.token_expiry = None
        self.access_token = None

    def _generate_jwt(self):
        """生成 JWT token"""
        now = datetime.utcnow()
        payload = {
            'iss': self.api_key,
            'iat': now,
            'exp': now + timedelta(minutes=30)
        }
        return jwt.encode(payload, self.api_secret, algorithm='HS256')

    def _ensure_valid_token(self):
        """确保 token 有效"""
        if not self.access_token or datetime.utcnow() >= self.token_expiry:
            self.access_token = self._generate_jwt()
            self.token_expiry = datetime.utcnow() + timedelta(minutes=29)

    def make_request(self, endpoint, method='GET', data=None):
        """通用请求方法"""
        self._ensure_valid_token()
        headers = {'Authorization': f'Bearer {self.access_token}',
            'Content-Type': 'application/json'
        }
        url = f"{self.base_url}/{endpoint}"

        try:
            response = requests.request(
                method,
                url,
                headers=headers,
                json=data,
                timeout=30
            )
            response.raise_for_status()
            return response.json()
        except requests.exceptions.RequestException as e:
            print(f"API 请求失败: {e}")
            raise

const EventSource = require('eventsource');

class ClaudeStreamHandler {constructor(streamUrl, apiToken) {
        this.streamUrl = streamUrl;
        this.apiToken = apiToken;
        this.eventSource = null;
    }

    startStream(onData, onComplete, onError) {
        const headers = {'Authorization': `Bearer ${this.apiToken}`
        };

        const options = {headers: headers};

        this.eventSource = new EventSource(this.streamUrl, options);

        this.eventSource.onmessage = (event) => {
            try {const data = JSON.parse(event.data);
                onData(data);
            } catch (err) {onError(err);
            }
        };

        this.eventSource.onerror = (err) => {if (err.status === 401) {console.error('认证失败，请检查 API token');
            }
            onError(err);
            this.close();};

        this.eventSource.addEventListener('done', () => {onComplete();
            this.close();});
    }

    close() {if (this.eventSource) {this.eventSource.close();
            this.eventSource = null;
        }
    }
}

class ConversationManager:
    def __init__(self, max_tokens=4000, summary_threshold=0.8):
        self.history = []
        self.max_tokens = max_tokens
        self.summary_threshold = summary_threshold  # 当 token 使用量达到 80% 时触发总结
        self.current_token_count = 0

    def add_message(self, role, content, token_count):
        """添加消息到对话历史"""
        if self.current_token_count + token_count > self.max_tokens:
            self._compress_history()

        self.history.append({'role': role, 'content': content})
        self.current_token_count += token_count

    def _compress_history(self):
        """压缩对话历史"""
        # 这里应该实现一个智能的总结算法
        # 简化示例：保留最近的 3 条消息并添加总结
        if len(self.history) <= 3:
            return

        summary = "Previous conversation summarized:" + \
                 ";".join([msg['content'][:50] + "..." for msg in self.history[:-3]])

        self.history = [{'role': 'system', 'content': summary}
        ] + self.history[-3:]

        # 重新计算 token 数 (这里应该是调用实际的 token 计数函数)
        self.current_token_count = len(summary) // 4  # 近似计算
        for msg in self.history[1:]:
            self.current_token_count += len(msg['content']) // 4

    def get_current_context(self):
        """获取当前对话上下文"""
        return self.history.copy()

指数退避重试：对于暂时性错误(如 5xx 错误)，使用指数退避算法进行重试
超时设置：为不同 API 端点设置合理的超时时间
断路器模式：当错误率超过阈值时，暂时停止请求以避免雪崩效应

def make_request_with_retry(self, endpoint, method='GET', data=None, max_retries=3):
    """带重试机制的请求方法"""
    self._ensure_valid_token()
    headers = {'Authorization': f'Bearer {self.access_token}',
        'Content-Type': 'application/json'
    }
    url = f"{self.base_url}/{endpoint}"

    for attempt in range(max_retries + 1):
        try:
            response = requests.request(
                method,
                url,
                headers=headers,
                json=data,
                timeout=30
            )

            if response.status_code == 429:  # Rate limited
                retry_after = int(response.headers.get('Retry-After', 5))
                time.sleep(retry_after)
                continue

            response.raise_for_status()
            return response.json()

        except requests.exceptions.RequestException as e:
            if attempt == max_retries:
                raise

            wait_time = min(2 ** attempt, 10)  # 指数退避，最大 10 秒
            time.sleep(wait_time)

from collections import deque
import time

class RateLimiter:
    def __init__(self, max_requests, window_seconds):
        self.max_requests = max_requests
        self.window_seconds = window_seconds
        self.request_times = deque()

    def acquire(self):
        now = time.time()

        # 移除窗口外的请求记录
        while self.request_times and \
              now - self.request_times[0] > self.window_seconds:
            self.request_times.popleft()

        if len(self.request_times) >= self.max_requests:
            oldest = self.request_times[0]
            wait_time = self.window_seconds - (now - oldest)
            time.sleep(wait_time)
            now = time.time()  # 更新 now，因为 sleep 了

            # 再次检查
            while self.request_times and \
                  now - self.request_times[0] > self.window_seconds:
                self.request_times.popleft()

        self.request_times.append(now)
        return True

输入过滤：在发送给 API 前检查并移除敏感信息
输出过滤：对 API 返回的内容进行二次检查
日志脱敏：确保日志中不记录敏感信息

def sanitize_input(text):
    """简单的敏感信息过滤"""
    sensitive_patterns = [r'\b\d{3}-\d{2}-\d{4}\b',  # SSN
        r'\b\d{16}\b',             # 信用卡号
        r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'  # 邮箱
    ]

    for pattern in sensitive_patterns:
        text = re.sub(pattern, '[REDACTED]', text)

    return text