从零实现快捷指令Siri接入ChatGPT：技术原理与实战指南

17次阅读

没有评论

共计 1801 个字符，预计需要花费 5 分钟才能阅读完成。

当前 Siri 原生功能存在两个关键限制阻碍 ChatGPT 的直接调用：

无官方 API 支持 ：截至 2023 年 8 月，Apple 未开放 Siri 与第三方 AI 服务的深度集成接口（来源：Apple Developer Documentation）
语音指令单向传输 ：系统级语音识别结果无法直接传递给外部应用（来源：iOS Security White Paper）

通过快捷指令的 URL Scheme 和 JavaScript 运行时特性，可以构建桥接层突破这些限制。

使用 JavaScript 的 Fetch API 封装请求，需特别注意：

请求头必须包含 Authorization: Bearer [API_KEY]
内容类型设置为 application/json
超时时间建议设为 10 秒（根据 OpenAI API 响应时间统计）

示例代码块：

// 从快捷指令输入获取用户语音转文本
const input = args.shortcutParameter;

const resp = await fetch('https://api.openai.com/v1/chat/completions', {
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
    'Authorization': `Bearer ${Keychain.get('openai_key')}`
  },
  body: JSON.stringify({
    model: "gpt-3.5-turbo",
    messages: [{role: "user", content: input}],
    temperature: 0.7
  }),
  timeout: 10000
});

if (!resp.ok) throw new Error(`API 请求失败: ${resp.status}`);
const data = await resp.json();
return data.choices[0].message.content;

创建 Shortcuts 时需要：

添加 ” 听写文本 ” 动作获取语音输入
使用 ” 运行 JavaScript” 动作执行 API 调用
通过 ” 显示结果 ” 动作输出 AI 回复

关键配置参数：

运行时选择 ”JavaScript”
启用 ” 显示运行时错误 ” 选项
输入类型设置为文本

推荐使用 iOS 钥匙串服务存储密钥，相比 UserDefaults 具有：

系统级加密保护（AES-256）
应用沙盒隔离
钥匙链同步时可选 iCloud 加密同步

配置代码示例：

// 存储密钥
Keychain.set('openai_key', 'sk-xxx...');

// 读取密钥时检查存在性
if (!Keychain.contains('openai_key')) {throw new Error('未配置 API 密钥');
}

通过两种方式防止滥用：

客户端限制 ：在 JavaScript 中添加时间戳检查，30 秒内重复请求直接返回缓存
服务端配置 ：利用 OpenAI 账号级的速率限制（免费用户 3 次 / 分钟，付费用户 60 次 / 分钟）

使用快捷指令变量保存上下文，每次请求携带历史记录：

const history = [...(args.queryParameters.history || []),
  {role: "user", content: input}
];

// 请求时包含完整对话历史
body: JSON.stringify({
  model: "gpt-3.5-turbo",
  messages: history,
  max_tokens: 150
})