如何高效测试skill脚本：从单元测试到集成测试的完整实践指南

13次阅读

共计 2387 个字符，预计需要花费 6 分钟才能阅读完成。

开发语音技能（skill）脚本时，测试环节往往会遇到几个典型挑战：

状态管理复杂 ：对话式应用需要维护上下文状态，测试时需模拟多轮交互的完整流程
外部依赖棘手 ：调用第三方 API（如天气服务、支付接口）时难以保证测试稳定性和速度
异步逻辑验证困难 ：事件驱动架构下，回调函数和 Promise 链的测试覆盖率常常不足
环境差异问题 ：本地开发环境与云端部署环境的配置差异导致测试结果不一致

框架	语言	优势	劣势	适用场景
Jest 29+	JS/TS	零配置、快照测试、并行执行	内存消耗较大	前端 /Node.js 项目
Mocha	JS/TS	灵活、丰富的插件生态	需要额外配置断言库	需要定制化的测试场景
Pytest	Python	参数化测试、夹具系统强大	异步支持稍弱	后端 / 数据处理脚本
unittest	Python	标准库内置	语法冗长	兼容性要求高的场景

处理外部依赖的几种常用方式：

Mock 对象 ：完全替换真实服务，适用于支付等关键接口

// 使用 Sinon.js 模拟 AWS 服务
const sinon = require('sinon');
const awsMock = sinon.stub(AWS, 'DynamoDB').returns({putItem: () => ({promise: () => Promise.resolve()})
});

Stub 服务 ：返回预设响应，适合天气 API 等只读接口

# pytest-mock 创建 HTTP 桩
def test_weather_api(mocker):
    mocker.patch('requests.get', return_value={"temp": 25})
    assert get_weather() == "当前温度 25 度"

容器化方案 ：使用 Docker Compose 启动真实依赖的测试版本

# docker-compose.test.yml
services:
  mock-payment:
    image: mock-server:latest
    ports:
      - "8080:8080"

// Jest 测试示例
describe('订单查询 handler', () => {it('应返回有效订单数据', async () => {
    const mockContext = {
      awsRequestId: 'test-id',
      getRemainingTimeInMillis: () => 5000};

    const result = await handler({
      userId: 'U123',
      orderId: 'O456'
    }, mockContext);

    expect(result).toHaveProperty('items');
    expect(result.items.length).toBeGreaterThan(0);
  });
});

# Pytest 参数化示例
import pytest

@pytest.mark.parametrize("input,expected", [("预约明天 10 点", {"intent": "book", "time": "10:00"}),
    ("取消订单", {"intent": "cancel"}),
])
def test_nlu_parsing(input, expected):
    result = parse_user_input(input)
    assert result["intent"] == expected["intent"]

使用 Locust 模拟高并发用户

from locust import HttpUser, task

class SkillUser(HttpUser):
    @task
    def query_order(self):
        self.client.post("/api", json={"query": "我的订单"})

关键指标监控：
90% 请求响应时间 < 500ms
错误率 < 0.1%
内存占用 < 300MB

输入验证测试：
特殊字符注入（SQL/XSS）
超长字符串攻击
权限检测：
越权访问其他用户数据
敏感接口未授权调用

未清理测试数据 ：

解决方案：使用 beforeEach/afterEach 钩子

beforeEach(() => {initTestDB(); // 每次测试前重置数据库
});

过度 Mock 导致失真 ：
解决方案：对核心业务逻辑保留真实调用
忽略异步操作 ：
解决方案：始终 await 异步调用，使用 Jest 的 async/await 支持
硬编码测试数据 ：

解决方案：使用 Faker.js 生成随机数据

const {faker} = require('@faker-js/faker');
const testUser = {name: faker.person.fullName(),
  email: faker.internet.email()};

忽略测试顺序依赖 ：
解决方案：使每个测试完全独立，使用 –runInBand 禁用并行

任务：使用 TDD 实现对话状态验证

先写测试：

def test_should_keep_context():
    # 第一轮对话
    state = handle_message({}, "我想订餐")
    assert state["intent"] == "food_order"

    # 第二轮对话
    new_state = handle_message(state, "披萨")
    assert new_state["food_type"] == "pizza"