网站skill功能架构设计与实现：从技术选型到性能优化

14次阅读

共计 2049 个字符，预计需要花费 6 分钟才能阅读完成。

网站 skill 功能常见于需要实时交互的场景，比如：

游戏连招系统 ：玩家连续释放技能时需保证时序和状态一致性
在线教学演示 ：讲师操作需要实时同步给所有学员
协同编辑工具 ：多人协作时的操作冲突处理

面临的三大技术挑战：
1. 实时性要求 ：200ms 内完成状态同步
2. 状态一致性 ：避免技能释放冲突或重复计算
3. 高并发压力 ：万人同时在线的资源竞争问题

方案	延迟	服务端压力	适用场景
WebSocket	50-100ms	低	双向实时交互
SSE	200ms	中	服务端单向推送
Polling	500ms+	高	兼容性要求高的旧系统

最终选择 ：WebSocket + 二进制协议（比 JSON 节省 40% 带宽）

flowchart TD
    A[客户端] -->|WebSocket| B(Gateway)
    B --> C[消息队列]
    C --> D[Skill 服务集群]
    D -->|Redis PUB/SUB| B
    D --> E[(Redis 状态存储)]

关键流程：
1. 客户端通过 Gateway 建立长连接
2. 技能触发事件进入 Kafka 削峰
3. 服务集群消费消息并处理业务逻辑
4. 通过 Redis 发布结果到对应连接

// 使用 Redis Lua 保证原子性
const luaCheckCD = `
local cd = redis.call('GET', KEYS[1])
if not cd or tonumber(cd) < tonumber(ARGV[1]) then
    redis.call('SET', KEYS[1], ARGV[2], 'PX', ARGV[3])
    return 1
end
return 0
`

func CanCastSkill(userID string, skillID int) bool {key := fmt.Sprintf("cd:%s:%d", userID, skillID)
    now := time.Now().UnixMilli()

    res, _ := redis.Eval(luaCheckCD, []string{key}, 
        now,    // 当前时间戳
        now+3000, // 冷却结束时间
        3000    // 3 秒冷却
    ).Result()

    return res.(int64) == 1
}

# 使用 RedLock 算法
def acquire_lock(lock_name, ttl=3000):
    identifier = str(uuid.uuid4())
    retry = 3

    while retry > 0:
        if redis.setnx(lock_name, identifier):
            redis.pexpire(lock_name, ttl)
            return identifier
        elif not redis.ttl(lock_name):
            redis.pexpire(lock_name, ttl)

        time.sleep(0.1)
        retry -= 1

    return False

-- 技能释放次数限流脚本
local current = redis.call('INCR', KEYS[1])
if current == 1 then
    redis.call('EXPIRE', KEYS[1], ARGV[1])
end
return current <= tonumber(ARGV[2])

# 生产端
acks: all
retries: 3
compression.type: lz4

# 消费端
max.poll.records: 500
fetch.max.bytes: 10485760

客户端每 30 秒发送 PING
服务端连续 3 次未响应主动断开
断线时使用指数退避重连（1s,2s,4s…）

并发量	平均延迟	99 分位
1,000	68ms	122ms
5,000	153ms	314ms
10,000	277ms	503ms

使用 pprof 采样堆内存
重点关注 WebSocket 连接对象
设置连接数软限制（如 5000/ 节点）

// 基于 Hystrix 的配置
hystrix.ConfigureCommand("skill_cast", hystrix.CommandConfig{
    Timeout:               1000,
    MaxConcurrentRequests: 1000,
    ErrorPercentThreshold: 50,
    SleepWindow:           5000,
})