从零构建智能对话系统：如何自己写Skill的工程实践

10次阅读

共计 3082 个字符，预计需要花费 8 分钟才能阅读完成。

每次想给项目加个智能对话功能时，总会遇到这些头疼问题：用户说 ” 我想订明天下午三点的会议室 ”，系统却理解成 ” 查询会议室 ”；多轮对话中突然问 ” 刚才说的价格是多少 ”，机器人直接懵掉；流量稍微大点服务就挂 … 这些正是自建对话技能要解决的三大核心问题：

意图识别歧义：自然语言的多义性导致 ” 打开空调 ” 可能被识别成 ” 开灯 ”
对话状态丢失：用户在多轮对话中跳转时上下文断裂
服务扩展性差：单机部署无法应对突发流量

经过多个项目实战，这个技术组合屡试不爽：

通信层：Flask 处理 HTTP 请求（轻量且易于扩展）
NLU 引擎：Rasa NLU 实现意图识别（支持自定义实体抽取）
状态管理：Redis 存储对话状态（毫秒级响应 + 持久化）
部署方案：Docker 容器化（一键环境复用）

from flask import Flask, request, jsonify
import redis

app = Flask(__name__)
r = redis.Redis(host='redis', port=6379, decode_responses=True)

@app.route('/webhook', methods=['POST'])
def handle_request():
    try:
        user_message = request.json.get('message')
        session_id = request.json.get('session_id')

        # 获取或初始化对话状态
        context = r.hgetall(f'dialog:{session_id}') or {
            'last_intent': None,
            'slots': {}}

        # 调用 NLU 服务（伪代码）nlu_result = call_nlu_service(user_message)

        # 状态更新与业务逻辑路由
        if nlu_result['intent'] == 'book_meeting':
            context['slots'].update(nlu_result['entities'])
            response = process_booking(context)
        elif nlu_result['intent'] == 'query_info':
            ...

        # 持久化状态
        r.hmset(f'dialog:{session_id}', context)
        return jsonify({'response': response})

    except Exception as e:
        app.logger.error(f"Error processing request: {str(e)}")
        return jsonify({'error': 'Internal server error'}), 500

创建 nlu.yml 训练数据：

version: "3.1"

nlu:
- intent: book_meeting
  examples: |
    - 预定 [明天](date) 的会议室
    - 我要预约 [下午三点](time) 的[302 房间](room)
    - 约个[周三](date)[小会议室](room_type)

- intent: query_info
  examples: |
    - 今天有哪些会议
    - 查看我的预定记录
    - 明天会议室使用情况

训练命令：

rasa train nlu --config config.yml --nlu nlu.yml --out ./models

class DialogStateMachine:
    def __init__(self, session_id):
        self.session_id = session_id
        self.states = {
            'INIT': self._handle_init,
            'CONFIRM': self._handle_confirm,
            'COMPLETE': self._handle_complete
        }
        self.current_state = 'INIT'

    def process(self, user_input):
        handler = self.states.get(self.current_state)
        return handler(user_input)

    def _handle_init(self, input):
        if 'time' not in input.slots:
            return "您想预约什么时间？", 'INIT'
        self.current_state = 'CONFIRM'
        return f"确认预约 {input.slots['time']} 的会议室吗？", 'CONFIRM'

    def _handle_confirm(self, input):
        if input.intent == 'affirm':
            self.current_state = 'COMPLETE'
            return "预约成功！", 'COMPLETE'
        return "请重新选择时间", 'INIT'

使用 Redis 事务处理并发状态更新
对关键操作加分布式锁

with r.lock(f'lock:{session_id}', timeout=5):
    current = r.hgetall(f'dialog:{session_id}')
    r.hmset(f'dialog:{session_id}', new_data)

# 每次请求时更新过期时间
r.expire(f'dialog:{session_id}', 1800)  # 30 分钟无活动则清除

# 定时任务清理过期会话
for key in r.scan_iter('dialog:*'):
    if r.ttl(key) == -2:  # 已过期
        r.delete(key)

import watchdog.events

class ModelHandler(watchdog.events.FileSystemEventHandler):
    def on_modified(self, event):
        if event.src_path.endswith('.tar.gz'):
            load_new_model(event.src_path)

observer = watchdog.observers.Observer()
observer.schedule(ModelHandler(), path='./models')
observer.start()

Web 服务部署

gunicorn -w 4 -b :5000 --access-logfile - app:app

根据 CPU 核心数设置 worker 数量（建议 2 *cores+1）

Redis 连接池配置

pool = redis.ConnectionPool(max_connections=50)
r = redis.Redis(connection_pool=pool)

内存监控方案

import psutil

def check_memory():
    process = psutil.Process()
    if process.memory_info().rss > 1_000_000_000:  # 1GB
        trigger_gc()

当我们需要动态添加 / 删除对话技能时，可以考虑：

使用 Python 的 importlib 动态加载模块
设计技能注册机制
通过 API 网关实现流量切换

你会怎么设计这套机制？欢迎在评论区分享你的方案。完整的示例代码已上传 GitHub（虚构链接）：
https://github.com/example/dialog-skill-framework

正文完

Rasa 智能对话系统自然语言处理

发表至：人工智能

2026年6月5日

0

深入解析Awesome ChatGPT Prompts：如何构建高效对话系统的技术实践

中科院ChatGPT学术优化实战指南：从零构建高效科研助手

LangChain实战：如何构建可执行Skill的开源AI Agent框架

智能体训练ChatGPT实战：从数据准备到模型调优的全流程指南

DeepSeek与ChatGPT新手入门指南：从技术选型到实战避坑

Agent Skill Token与RAG技术实战：从零构建智能对话系统的避坑指南

Claude大模型实战指南：从API调用到生产环境部署的最佳实践

Skill大模型新手入门指南：从零搭建到生产环境部署

从零开始构建你的第一个Skill：新手入门指南与实战避坑

从零构建智能对话系统：如何自己写Skill的工程实践

痛点直击：为什么自建对话技能这么难？

技术选型：稳准狠的解决方案

核心代码实现

对话路由控制器

Rasa NLU 模型训练

对话状态机实现

避坑指南：血泪经验总结

1. 异步消息安全

2. 对话超时设计

3. 模型热更新方案

性能优化三板斧

思考题：如何实现技能热插拔？

从零接入Claude Code：基于DeepSeek-v3.2与ModelScope/AnyRouter的中转服务实践指南

如何给小爱同学内置ChatGPT：从API对接到语音交互的完整实现方案

解决Mac上Claude代码地区不支持问题的实战指南

VSCode中集成ChatGPT的工程化实践：从插件配置到智能编码

如何用ChatGPT一键生成专业时序图、类图与流程图：技术选型与避坑指南

从零开始构建龙虾自定义Skill：新手避坑指南与实践教程

深入解析龙虾自定义Skill的实现原理与最佳实践

基于龙虾自定义Skill的高效开发实践：从设计到落地

深入解析龙虾的Skill：技术原理与实战应用

从零开始：龙虾技能安装（skill）的完整技术指南与避坑实践