大模型调用与Agent调用的本质区别：深入解析skill和mcp的实现机制

1次阅读

共计 1911 个字符，预计需要花费 5 分钟才能阅读完成。

在构建智能对话系统时，开发者经常困惑于 skill 和 mcp 的调用方式——到底是由大模型直接处理，还是通过 Agent 间接调用？这个问题看似简单，实则涉及到系统架构设计的核心逻辑。本文将带你深入解析这两种调用方式的本质区别，并通过实际代码示例和性能对比，帮助你做出更明智的设计决策。

大模型直接调用模式 ：
特点：输入文本直接发送给大模型，由模型完成意图识别、上下文理解和响应生成全流程
优势：实现简单，适合处理开放式对话
缺点：计算资源消耗大，难以精确控制输出格式
Agent 调用模式 ：
特点：由 Agent 系统先进行意图识别和任务分解，再决定调用哪些 skill/mcp
优势：更精确的任务路由，支持复杂业务流程
缺点：需要额外开发状态管理逻辑

graph TD
    A[用户输入] -->| 直接调用 | B(大模型)
    A -->|Agent 调用 | C[意图识别]
    C --> D{决策}
    D -->| 基础问答 | B
    D -->| 复杂任务 | E[Skill/MCP]

import openai
from typing import AsyncGenerator

async def direct_call(prompt: str) -> AsyncGenerator[str, None]:
    """
    大模型直接调用实现
    Args:
        prompt: 用户输入文本
    Yields:
        模型生成的响应片段
    """
    try:
        response = await openai.ChatCompletion.acreate(
            model="gpt-4",
            messages=[{"role": "user", "content": prompt}],
            stream=True
        )
        async for chunk in response:
            yield chunk['choices'][0]['delta'].get('content', '')
    except Exception as e:
        # 错误处理：记录日志并返回友好提示
        print(f"API 调用失败: {str(e)}")
        yield "服务暂时不可用，请稍后再试"

from enum import Enum

class SkillType(Enum):
    WEATHER = "weather"
    CALENDAR = "calendar"
    GENERAL = "general"

class DialogAgent:
    def __init__(self):
        self.state = {}

    async def route_intent(self, text: str) -> SkillType:
        """意图识别路由"""
        # 实际项目中应使用专业 NLU 模型
        if "天气" in text:
            return SkillType.WEATHER
        elif "日程" in text:
            return SkillType.CALENDAR
        return SkillType.GENERAL

    async def execute_skill(self, skill: SkillType, input_text: str):
        """根据类型调用不同 skill"""
        if skill == SkillType.WEATHER:
            return await self._weather_skill(input_text)
        # 其他 skill 处理...

    async def _weather_skill(self, location: str) -> str:
        """天气查询 skill 实现"""
        # 这里应该是调用天气 API 的代码
        return f"{location} 的天气是 25℃，晴朗"