Agent Skill 推荐系统架构解析：从冷启动到实时个性化匹配

41次阅读

没有评论

共计 1601 个字符，预计需要花费 5 分钟才能阅读完成。

在构建 Agent 系统（如客服机器人、游戏 NPC）时，技能推荐面临三个典型痛点：

冷启动问题（Cold Start）：新用户或新技能缺乏历史交互数据，传统推荐方法失效
特征稀疏性（Sparse Features）：用户行为日志分散且维度高，难以提取有效特征
实时性要求（Real-time Constraint）：线上服务需在 100ms 内返回推荐结果，对架构设计提出严苛要求

基于规则（Rule-based）
优点：实现简单，可解释性强
缺点：无法适应复杂场景，维护成本高
协同过滤（Collaborative Filtering）
优点：能发现潜在关联，适合稀疏数据
缺点：冷启动场景表现差
深度学习（Deep Learning）
优点：特征提取能力强
缺点：训练成本高，实时推理延迟大

我们采用 特征工程 + 协同过滤 + 在线学习 的混合方案：

离线阶段：通过行为序列 Embedding 解决冷启动
在线阶段：结合实时特征进行动态调整
底层使用 Faiss 加速向量检索

# 用户行为序列 Embedding 生成示例
from typing import List, Dict
import numpy as np
from sklearn.decomposition import TruncatedSVD

def generate_embeddings(behavior_seqs: List[List[str]], n_components=32) -> Dict[str, np.ndarray]:
    """
    将离散行为序列转化为低维 Embedding
    :param behavior_seqs: 用户行为序列列表，如[["skill_a", "skill_b"], ["skill_c"]]
    :param n_components: 输出维度
    :return: {技能名: embedding 向量}的字典
    """
    # 构建共现矩阵
    vocab = list({s for seq in behavior_seqs for s in seq})
    cooccur = np.zeros((len(vocab), len(vocab)))

    for seq in behavior_seqs:
        for i in range(len(seq)):
            for j in range(i+1, min(i+5, len(seq))):  # 滑动窗口
                idx_i = vocab.index(seq[i])
                idx_j = vocab.index(seq[j])
                cooccur[idx_i][idx_j] += 1

    # 降维处理
    svd = TruncatedSVD(n_components=n_components)
    embeddings = svd.fit_transform(cooccur)

    return {skill: embeddings[i] for i, skill in enumerate(vocab)}

关键技巧：